Spaces:

Erigann
/

FreeSpace

Sleeping

Erigann commited on Jul 10

Commit

5fd90b5

verified ·

1 Parent(s): 04382d2

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,21 +2,26 @@ from transformers import AutoTokenizer, AutoModelForCausalLM
 import gradio as gr
 import torch
-# Загружаем модель Qwen локально
-tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-7B", trust_remote_code=True)
-model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-7B", device_map="auto", torch_dtype=torch.float16, trust_remote_code=True)
 def respond(message):
     inputs = tokenizer(message, return_tensors="pt").to(model.device)
-    outputs = model.generate(**inputs, max_new_tokens=200)
-    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    return response
-# Создаём интерфейс
 gr.Interface(
     fn=respond,
-    inputs=gr.Textbox(label="Ваше сообщение"),
-    outputs=gr.Textbox(label="Qwen отвечает"),
-    title="Qwen Прокси",
-    description="Это API-прокси для Janotaro.ai"
 ).launch()

 import gradio as gr
 import torch
+# Используем более лёгкую модель
+model_name = "Qwen/Qwen-1_8B"
+tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
+model = AutoModelForCausalLM.from_pretrained(
+    model_name,
+    device_map="auto",
+    torch_dtype=torch.float16,
+    trust_remote_code=True
+)
 def respond(message):
     inputs = tokenizer(message, return_tensors="pt").to(model.device)
+    outputs = model.generate(**inputs, max_new_tokens=150)
+    return tokenizer.decode(outputs[0], skip_special_tokens=True)
 gr.Interface(
     fn=respond,
+    inputs="text",
+    outputs="text",
+    title="Qwen Прокси для Janotaro.ai",
+    description="Работает на Qwen-1_8B"
 ).launch()