thejarll commited on
Commit
0869270
·
verified ·
1 Parent(s): 5b798a1

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +12 -13
app.py CHANGED
@@ -44,6 +44,7 @@ def generar_embedding(texto):
44
  mask = inputs["attention_mask"].unsqueeze(-1).expand(last_hidden.size()).float()
45
  summed = torch.sum(last_hidden * mask, 1)
46
  counted = torch.clamp(mask.sum(1), min=1e-9)
 
47
  mean_pooled = summed / counted
48
  return mean_pooled.numpy()
49
 
@@ -71,18 +72,15 @@ def responder(pregunta):
71
  contexto_final = "\n\n".join(filtrados[:15]) if filtrados else "\n\n".join(result_chunks[:15])
72
 
73
  prompt = f"""
74
- Eres un abogado colombiano especializado en derecho de tránsito, policía y penal.
75
- Tu única fuente de información es el siguiente CONTEXTO LEGAL.
76
- No tienes permitido inventar artículos, leyes o consecuencias que no estén citadas o explícitas en el contexto.
77
-
78
- INSTRUCCIONES:
79
- - Fundamenta tu respuesta exclusivamente en el CONTEXTO LEGAL.
80
- - Si mencionas consecuencias, citas o artículos, deben estar explícitamente en el texto.
81
- - No incluyas enlaces web, imágenes, disclaimers institucionales ni logos.
82
- - No agregues conclusiones si no están fundamentadas.
83
- - Usa un lenguaje claro, profesional, breve y entendible para una persona sin conocimientos jurídicos.
84
- - Si no encuentras nada útil en el contexto, responde:
85
- "No encontré información suficiente en los documentos para responder esta pregunta."
86
 
87
  CONTEXTO LEGAL:
88
  {contexto_final}
@@ -93,12 +91,13 @@ PREGUNTA:
93
  RESPUESTA:
94
  """
95
 
 
96
  resultado = llm(
97
  prompt,
98
  max_new_tokens=500,
99
  temperature=0.4,
100
  top_p=0.9,
101
- repetition_penalty=1.3
102
  )[0]["generated_text"]
103
 
104
  if "RESPUESTA:" in resultado:
 
44
  mask = inputs["attention_mask"].unsqueeze(-1).expand(last_hidden.size()).float()
45
  summed = torch.sum(last_hidden * mask, 1)
46
  counted = torch.clamp(mask.sum(1), min=1e-9)
47
+
48
  mean_pooled = summed / counted
49
  return mean_pooled.numpy()
50
 
 
72
  contexto_final = "\n\n".join(filtrados[:15]) if filtrados else "\n\n".join(result_chunks[:15])
73
 
74
  prompt = f"""
75
+ Eres un asistente legal colombiano especializado en normas de tránsito, código de policía y código penal. Tu única fuente de información es el texto legal a continuación.
76
+
77
+ Instrucciones:
78
+ - Lee cuidadosamente el contexto legal proporcionado.
79
+ - Responde la pregunta basándote únicamente en ese contexto. No inventes información ni agregues artículos que no estén en el texto.
80
+ - No cites números de artículos a menos que estén explícitamente escritos en el contexto.
81
+ - No uses frases como “esperamos que esto sea útil”, “hasta luego” ni conclusiones formales.
82
+ - Si no encuentras información relevante, responde de forma clara: **"No encontré información suficiente en los documentos para responder esta pregunta."**
83
+ - Escribe de forma clara, concisa y orientada a una persona sin formación legal.
 
 
 
84
 
85
  CONTEXTO LEGAL:
86
  {contexto_final}
 
91
  RESPUESTA:
92
  """
93
 
94
+
95
  resultado = llm(
96
  prompt,
97
  max_new_tokens=500,
98
  temperature=0.4,
99
  top_p=0.9,
100
+ repetition_penalty=1.2
101
  )[0]["generated_text"]
102
 
103
  if "RESPUESTA:" in resultado: