Spaces:

sarthak501
/

general-api

Sleeping

sarthak501 commited on Aug 5

Commit

1c18d40

verified ·

1 Parent(s): 54e8c97

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,30 +1,39 @@
 from fastapi import FastAPI, HTTPException
 from fastapi.middleware.cors import CORSMiddleware
 from pydantic import BaseModel
-import random
 app = FastAPI()
-# Enable CORS for JavaScript fetch usage across origins
 app.add_middleware(
     CORSMiddleware,
-    allow_origins=["*"],
     allow_credentials=False,
     allow_methods=["*"],
     allow_headers=["*"]
 )
 class QueryRequest(BaseModel):
     query: str
     echo: bool = False
 @app.post("/api/query")
-async def general_query(req: QueryRequest):
-    text = req.query.strip()
-    if not text:
         raise HTTPException(status_code=400, detail="Query must not be empty")
     if req.echo:
-        return {"response": text}
-    words = text.split()
-    random.shuffle(words)
-    return {"response": " ".join(words)}

 from fastapi import FastAPI, HTTPException
 from fastapi.middleware.cors import CORSMiddleware
 from pydantic import BaseModel
+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+import torch
 app = FastAPI()
 app.add_middleware(
     CORSMiddleware,
+    allow_origins=["*"],
     allow_credentials=False,
     allow_methods=["*"],
     allow_headers=["*"]
 )
+# Load FLAN-T5 model and tokenizer
+model_name = "google/flan-t5-base"  # or use "flan-t5-large" if space/resources allow
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
 class QueryRequest(BaseModel):
     query: str
     echo: bool = False
 @app.post("/api/query")
+async def generate_response(req: QueryRequest):
+    query = req.query.strip()
+    if not query:
         raise HTTPException(status_code=400, detail="Query must not be empty")
     if req.echo:
+        return {"response": query}
+    inputs = tokenizer(query, return_tensors="pt", truncation=True)
+    outputs = model.generate(**inputs, max_new_tokens=200)
+    generated = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    return {"response": generated}