Spaces:

km1lo
/

LEGALFAMI

Paused

App Files Files Community

km1lo commited on Jul 6

Commit

29e28a9

verified ·

1 Parent(s): 68c0ddf

Update app.py

Browse files

Files changed (1) hide show

app.py +52 -39

app.py CHANGED Viewed

@@ -8,13 +8,13 @@ Original file is located at
 """
 # -*- coding: utf-8 -*-
-from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 from sentence_transformers import SentenceTransformer, util
 import numpy as np
 import joblib
 import torch
 import gradio as gr
-from transformers import TextGenerationPipeline
 # === Cargar modelos entrenados ===
 modelo_riesgo = joblib.load("modelo_riesgo.pkl")
@@ -26,21 +26,18 @@ modelo_vector = SentenceTransformer("Snowflake/snowflake-arctic-embed-xs")
 # === Cargar modelo de lenguaje Mistral 7B Instruct ===
 model_id = "mistralai/Mistral-7B-Instruct-v0.1"
-tokenizer = AutoTokenizer.from_pretrained(model_id)
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
     torch_dtype=torch.bfloat16 if torch.cuda.is_available() else torch.float32,
     device_map="auto"
 )
-modelo_llm = TextGenerationPipeline(
-    model=model,
-    tokenizer=tokenizer,
-    max_new_tokens=1000,
-    temperature=0.2,
-    do_sample=False,
-)
 # === Frases prototipo para verificador semántico ===
 frases_fisica = [
     "Me golpeó con el puño cerrado", "Me pateó", "Me lanzó contra la pared",
@@ -63,7 +60,7 @@ def verificar_semantico(descripcion):
         tipos_detectados.append("sexual")
     return tipos_detectados
-# === FUNCIÓN PRINCIPAL MODIFICADA ===
 def predecir_con_recomendacion(edad, genero, hijos, convivencia_agresor, consumo_sustancias, apoyo_familiar, descripcion):
     # Codificar variables tabulares
     vector_tabular = np.array([
@@ -97,37 +94,53 @@ def predecir_con_recomendacion(edad, genero, hijos, convivencia_agresor, consumo
     tipos_combinados = list(set([tipo_violencia_pred] + tipos_semantico))
     tipos_str = ", ".join(tipos_combinados)
-    # PROMPT claro y detallado
-    prompt = f"""Eres un jurista colombiano experto en violencia intrafamiliar.
-Analiza este caso y redacta un Auto de Medida Provisional conforme a la Ley 575 de 2000, Ley 1257 de 2008 y Ley 2126 de 2021.
-Hechos del caso:
-Tipo de violencia: {tipos_str}
-Nivel de riesgo: {riesgo}
-Medida cautelar sugerida: {tipo_medida}
-Descripción detallada: {descripcion}
-Redacta con este formato:
-CONSIDERACIONES:
-- Hechos relevantes y valoración del riesgo.
-- Fundamentos jurídicos aplicables.
-- Justificación breve de cada literal del Artículo 5 aplicable.
-RESUELVE:
-PRIMERO: Admitir la solicitud.
-SEGUNDO: Ordenar las siguientes medidas (una por línea).
-TERCERO: Cúmplase y notifíquese.
-Limita tu respuesta a máximo 600 palabras, en estilo formal.
-"""
-    salida = modelo_llm(prompt)[0]["generated_text"]
-    auto_redactado = salida.strip()
     return tipos_str, riesgo, tipo_medida, auto_redactado
-# === Interfaz Gradio (idéntica) ===
 with gr.Blocks(theme=gr.themes.Soft()) as interfaz:
     gr.Markdown("<h1 style='text-align:center; color:#004aad;'>LEGALFAMI – Asistente Legal con Razonamiento Jurídico</h1>")
     gr.Markdown("Predice tipo de violencia, riesgo, medida cautelar y genera un Auto conforme a la Ley 575 Art.5.")

 """
 # -*- coding: utf-8 -*-
+from transformers import AutoTokenizer, AutoModelForCausalLM
 from sentence_transformers import SentenceTransformer, util
 import numpy as np
 import joblib
 import torch
 import gradio as gr
+import os
 # === Cargar modelos entrenados ===
 modelo_riesgo = joblib.load("modelo_riesgo.pkl")
 # === Cargar modelo de lenguaje Mistral 7B Instruct ===
 model_id = "mistralai/Mistral-7B-Instruct-v0.1"
+tokenizer = AutoTokenizer.from_pretrained(
+    model_id,
+    token=os.environ.get("HF_TOKEN")
+)
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
+    token=os.environ.get("HF_TOKEN"),
     torch_dtype=torch.bfloat16 if torch.cuda.is_available() else torch.float32,
     device_map="auto"
 )
 # === Frases prototipo para verificador semántico ===
 frases_fisica = [
     "Me golpeó con el puño cerrado", "Me pateó", "Me lanzó contra la pared",
         tipos_detectados.append("sexual")
     return tipos_detectados
+# === FUNCIÓN PRINCIPAL ===
 def predecir_con_recomendacion(edad, genero, hijos, convivencia_agresor, consumo_sustancias, apoyo_familiar, descripcion):
     # Codificar variables tabulares
     vector_tabular = np.array([
     tipos_combinados = list(set([tipo_violencia_pred] + tipos_semantico))
     tipos_str = ", ".join(tipos_combinados)
+    # Mensaje en formato chat
+    messages = [
+        {
+            "role": "system",
+            "content": "Eres un jurista colombiano experto en violencia intrafamiliar."
+        },
+        {
+            "role": "user",
+            "content": (
+                f"Analiza este caso y redacta un Auto de Medida Provisional conforme a la Ley 575 de 2000, Ley 1257 de 2008 y Ley 2126 de 2021.\n\n"
+                f"Hechos del caso:\n"
+                f"Tipo de violencia: {tipos_str}\n"
+                f"Nivel de riesgo: {riesgo}\n"
+                f"Medida cautelar sugerida: {tipo_medida}\n"
+                f"Descripción detallada: {descripcion}\n\n"
+                "Redacta con este formato:\n\n"
+                "CONSIDERACIONES:\n"
+                "- Hechos relevantes y valoración del riesgo.\n"
+                "- Fundamentos jurídicos aplicables.\n"
+                "- Justificación breve de cada literal del Artículo 5 aplicable.\n\n"
+                "RESUELVE:\n"
+                "PRIMERO: Admitir la solicitud.\n"
+                "SEGUNDO: Ordenar las siguientes medidas (una por línea).\n"
+                "TERCERO: Cúmplase y notifíquese.\n\n"
+                "Limita tu respuesta a máximo 600 palabras, en estilo formal."
+            )
+        }
+    ]
+    # Aplicar chat template
+    encoded = tokenizer.apply_chat_template(messages, return_tensors="pt").to(model.device)
+    # Generar salida
+    generated_ids = model.generate(
+        encoded,
+        max_new_tokens=1000,
+        do_sample=False,
+        temperature=0.2
+    )
+    # Decodificar
+    decoded = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
+    auto_redactado = decoded[0].strip()
     return tipos_str, riesgo, tipo_medida, auto_redactado
+# === Interfaz Gradio ===
 with gr.Blocks(theme=gr.themes.Soft()) as interfaz:
     gr.Markdown("<h1 style='text-align:center; color:#004aad;'>LEGALFAMI – Asistente Legal con Razonamiento Jurídico</h1>")
     gr.Markdown("Predice tipo de violencia, riesgo, medida cautelar y genera un Auto conforme a la Ley 575 Art.5.")