Spaces:

DauroCamilo
/

chat-backend-test

Sleeping

App Files Files Community

DauroCamilo commited on May 27

Commit

b55152c

verified ·

1 Parent(s): 5078b39

microsoft/phi-2

Browse files

Files changed (1) hide show

main.py +48 -66

main.py CHANGED Viewed

@@ -1,71 +1,53 @@
-from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
-from typing import Dict, List
-import uuid
 app = FastAPI()
-# Estructura de datos en memoria
-salas: Dict[str, Dict] = {}
-# Modelos de datos
-class Mensaje(BaseModel):
-    usuario_id: str
-    texto: str
-class Jugador(BaseModel):
-    nombre: str
-@app.post("/sala")
-def crear_sala():
-    while True:
-        nueva_id = str(uuid.uuid4())[:8]
-        if nueva_id not in salas:
-            salas[nueva_id] = {
-                "mensajes": [],
-                "jugadores": {}
-            }
-            return {"ok": True, "sala_id": nueva_id}
-@app.post("/sala/{sala_id}/registrar")
-def registrar_usuario(sala_id: str, jugador: Jugador):
-    if sala_id not in salas:
-        raise HTTPException(status_code=404, detail="Sala no encontrada")
-    if len(salas[sala_id]["jugadores"]) >= 4:
-        raise HTTPException(status_code=409, detail="Sala llena")
-    usuario_id = str(uuid.uuid4())
-    salas[sala_id]["jugadores"][usuario_id] = jugador.nombre
-    return {"usuario_id": usuario_id, "nombre": jugador.nombre}
-@app.post("/sala/{sala_id}/mensaje")
-def enviar_mensaje(sala_id: str, mensaje: Mensaje):
-    if sala_id not in salas:
-        raise HTTPException(status_code=404, detail="Sala no encontrada")
-    if mensaje.usuario_id not in salas[sala_id]["jugadores"]:
-        raise HTTPException(status_code=403, detail="Usuario no registrado en la sala")
-    nombre = salas[sala_id]["jugadores"][mensaje.usuario_id]
-    salas[sala_id]["mensajes"].append({
-        "usuario": nombre,
-        "texto": mensaje.texto
-    })
-    return {"ok": True}
-@app.get("/sala/{sala_id}/mensajes")
-def obtener_mensajes(sala_id: str):
-    if sala_id not in salas:
-        raise HTTPException(status_code=404, detail="Sala no encontrada")
-    return salas[sala_id]["mensajes"]
-@app.get("/sala/{sala_id}/jugadores")
-def obtener_jugadores(sala_id: str):
-    if sala_id not in salas:
-        raise HTTPException(status_code=404, detail="Sala no encontrada")
-    jugadores = [
-        {"posicion": idx, "nombre": nombre}
-        for idx, (_, nombre) in enumerate(salas[sala_id]["jugadores"].items())
-    ]
-    return jugadores

+from fastapi import FastAPI
 from pydantic import BaseModel
+from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
+from fastapi.responses import StreamingResponse
+import torch
+import threading
 app = FastAPI()
+# Cargar modelo y tokenizer de Phi-2 (usa el modelo de Hugging Face Hub)
+model_id = "microsoft/phi-2"
+tokenizer = AutoTokenizer.from_pretrained(model_id)
+model = AutoModelForCausalLM.from_pretrained(model_id)
+# Modelo de entrada
+class ChatRequest(BaseModel):
+    message: str
+@app.post("/chat/stream")
+async def chat_stream(request: ChatRequest):
+    prompt = f"""Responde en español de forma clara y breve como un asistente IA.
+Usuario: {request.message}
+IA:"""
+    # Tokenizar entrada
+    inputs = tokenizer(prompt, return_tensors="pt")
+    input_ids = inputs["input_ids"]
+    attention_mask = inputs["attention_mask"]
+    # Streamer para obtener tokens generados poco a poco
+    streamer = TextIteratorStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
+    # Iniciar la generación en un hilo aparte
+    generation_kwargs = dict(
+        input_ids=input_ids,
+        attention_mask=attention_mask,
+        max_new_tokens=48,  # Puedes ajustar este valor para más/menos tokens
+        temperature=0.7,
+        top_p=0.9,
+        do_sample=True,
+        streamer=streamer,
+        pad_token_id=tokenizer.eos_token_id
+    )
+    thread = threading.Thread(target=model.generate, kwargs=generation_kwargs)
+    thread.start()
+    # StreamingResponse espera un generador que devuelva texto
+    async def event_generator():
+        for new_text in streamer:
+            yield new_text
+    return StreamingResponse(event_generator(), media_type="text/plain")