LEGALFAMI / app.py
km1lo's picture
Update app.py
14bfa03 verified
# -*- coding: utf-8 -*-
"""app.ipynb
Automatically generated by Colab.
Original file is located at
https://colab.research.google.com/drive/1WQ2YqAcXFp-14DglIYkV4rawVDSbyhCe
"""
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
from sentence_transformers import SentenceTransformer, util
import numpy as np
import joblib
import torch
import gradio as gr
from transformers import TextGenerationPipeline
# === Cargar modelos entrenados ===
modelo_riesgo = joblib.load("modelo_riesgo.pkl")
modelo_violencia = joblib.load("modelo_tipo_violencia.pkl")
modelo_medida = joblib.load("modelo_tipo_medida.pkl")
codificadores = joblib.load("codificadores_label_encoder.pkl")
modelo_vector = SentenceTransformer("Snowflake/snowflake-arctic-embed-xs")
# === Cargar modelo de lenguaje OpenHermes-2.5 ===
model_id = "teknium/OpenHermes-2.5-Mistral-7B"
tokenizer = AutoTokenizer.from_pretrained(model_id, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(
model_id,
trust_remote_code=True,
torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
device_map="auto"
)
modelo_llm = TextGenerationPipeline(
model=model,
tokenizer=tokenizer,
max_new_tokens=1000,
temperature=0.5,
do_sample=True,
)
# === Frases prototipo para verificador semántico ===
frases_fisica = [
"Me golpeó con el puño cerrado", "Me pateó", "Me lanzó contra la pared",
"Me estranguló", "Me fracturó una costilla", "Me tiró al piso violentamente"
]
frases_sexual = [
"Me obligó a tener relaciones sexuales", "Me tocó sin consentimiento",
"Me violó", "Me forzó a tener sexo", "Me agredió sexualmente"
]
embeds_fisica = modelo_vector.encode(frases_fisica)
embeds_sexual = modelo_vector.encode(frases_sexual)
# === Verificador semántico ===
def verificar_semantico(descripcion):
emb_desc = modelo_vector.encode(descripcion)
tipos_detectados = []
if max(util.cos_sim(emb_desc, embeds_fisica)[0]) > 0.7:
tipos_detectados.append("física")
if max(util.cos_sim(emb_desc, embeds_sexual)[0]) > 0.7:
tipos_detectados.append("sexual")
return tipos_detectados
# === FUNCIÓN PRINCIPAL MODIFICADA ===
def predecir_con_recomendacion(edad, genero, hijos, convivencia_agresor, consumo_sustancias, apoyo_familiar, descripcion):
# Codificar variables tabulares
vector_tabular = np.array([
int(edad),
int(hijos),
codificadores["genero"].transform([genero])[0],
0, 0, 0,
codificadores["convivencia_agresor"].transform([convivencia_agresor])[0],
codificadores["consumo_sustancias"].transform([consumo_sustancias])[0],
codificadores["apoyo_familiar"].transform([apoyo_familiar])[0]
])
# Vectorizar descripción
vector_desc = modelo_vector.encode([descripcion])[0]
entrada = np.concatenate([vector_tabular, vector_desc])
# Modelos clásicos
riesgo_cod = modelo_riesgo.predict([entrada])[0]
tipo_violencia_cod = modelo_violencia.predict([entrada])[0]
tipo_medida_cod = modelo_medida.predict([entrada])[0]
# Decodificación
riesgo = codificadores["riesgo"].inverse_transform([riesgo_cod])[0]
tipo_violencia_pred = codificadores["tipo_violencia"].inverse_transform([tipo_violencia_cod])[0]
tipo_medida = codificadores["tipo_medida"].inverse_transform([tipo_medida_cod])[0]
# Verificador semántico
tipos_semantico = verificar_semantico(descripcion)
# Unir modelo + semántico sin duplicados
tipos_combinados = list(set([tipo_violencia_pred] + tipos_semantico))
tipos_str = ", ".join(tipos_combinados)
# PROMPT legal ajustado con decisión motivada para Comisario
prompt = f"""[INSTRUCCIÓN]
Eres un Comisario/a de Familia en Colombia. Con base en los hechos relatados, el nivel de riesgo y el tipo de violencia identificado, debes emitir un Auto de Medida Provisional claro, completo y con redacción profesional jurídica.
Utiliza la siguiente estructura detallada:
1. **CONSIDERACIONES:**
- Realiza un resumen claro y detallado de los hechos narrados por la parte denunciante, destacando las circunstancias de tiempo, modo y lugar.
- Analiza el riesgo actual y el contexto familiar con referencias a la Ley 575 de 2000, Ley 1257 de 2008 y Ley 2126 de 2021.
- Cita expresamente los literales del Artículo 5 de la Ley 575 de 2000 (letras a-n) que resultan aplicables al caso.
- Justifica cada literal aplicado explicando detalladamente las razones jurídicas, la finalidad protectora de la medida y su proporcionalidad frente a los hechos denunciados.
2. **RESUELVE:**
- **PRIMERO:** Admitir la solicitud y avocar conocimiento, con mención expresa de la normativa que habilita esta decisión.
- **SEGUNDO:** Adoptar las medidas de protección, enumerando cada una de manera individual, describiendo su contenido y fundamento legal.
- **TERCERO:** Advertir al presunto agresor sobre las consecuencias legales de incumplir estas medidas, citando expresamente el Artículo 5 parágrafo 3 de la Ley 575 de 2000 y el Artículo 38 de la Ley 1257 de 2008.
- **CUARTO:** Disponer que cualquier cambio de domicilio deberá ser informado oportunamente al Juzgado competente, conforme a lo dispuesto en el Artículo 5 de la Ley 575 de 2000.
- **QUINTO:** Ordenar, en caso necesario, acompañamiento policial para hacer efectivas las medidas de protección y prevenir nuevos actos de violencia.
- **SEXTO:** Citar al presunto agresor a audiencia pública con el fin de tramitar el proceso y resolver sobre la confirmación, modificación o levantamiento de las medidas adoptadas, indicando que su inasistencia no suspende el procedimiento.
[DATOS DEL CASO]
- Tipos de violencia detectados: {tipos_str}
- Nivel de riesgo: {riesgo}
- Medida cautelar sugerida: {tipo_medida}
- Descripción del caso: {descripcion}
[OBJETIVO]
Redacta el Auto de Medida Provisional completo siguiendo estrictamente la estructura detallada, con lenguaje jurídico profesional y argumentos amplios que fundamenten cada decisión. Indica expresamente el año de cada ley citada. Limita la respuesta a máximo 600 tokens, priorizando claridad y rigor legal.
[RESPUESTA]
"""
respuesta = modelo_llm(prompt)[0]["generated_text"]
razonamiento = respuesta.split("[RESPUESTA]")[-1].strip()
return tipos_str, riesgo, tipo_medida, razonamiento
# === Interfaz Gradio (sin cambios) ===
with gr.Blocks(theme=gr.themes.Soft()) as interfaz:
gr.Markdown("<h1 style='text-align:center; color:#004aad;'>LEGALFAMI – Asistente Legal con Razonamiento Jurídico</h1>")
gr.Markdown("Predice tipo de violencia, riesgo, medida cautelar y genera una recomendación legal conforme a la Ley 575 Art.5.")
with gr.Row():
with gr.Column():
edad = gr.Slider(18, 65, value=30, label="Edad de la Víctima")
genero = gr.Radio(["F", "M"], label="Género")
hijos = gr.Slider(0, 5, step=1, value=1, label="Número de Hijos")
convivencia_agresor = gr.Radio(["sí", "no"], label="¿Convive con el Agresor?")
consumo_sustancias = gr.Radio(["sí", "no"], label="¿Hay Consumo de Sustancias?")
apoyo_familiar = gr.Radio(["sí", "no"], label="¿Tiene Apoyo Familiar?")
descripcion = gr.Textbox(lines=5, placeholder="Describa detalladamente el caso de violencia...", label="Descripción del Caso")
boton = gr.Button("🔍 Analizar Caso")
with gr.Column():
tipo_violencia_out = gr.Textbox(label="🛑 Tipo de Violencia Detectada", interactive=False)
riesgo_out = gr.Textbox(label="⚠️ Nivel de Riesgo Estimado", interactive=False)
medida_out = gr.Textbox(label="🧾 Tipo de Medida Cautelar Sugerida", interactive=False)
recomendacion_out = gr.Textbox(label="📋 Recomendación Legal Razonada", lines=12, interactive=False)
boton.click(
fn=predecir_con_recomendacion,
inputs=[edad, genero, hijos, convivencia_agresor, consumo_sustancias, apoyo_familiar, descripcion],
outputs=[tipo_violencia_out, riesgo_out, medida_out, recomendacion_out]
)
interfaz.launch()