Spaces:

rocketmandrey
/

hugginface_larning

Runtime error

rocketmandrey commited on Jun 23

Commit

47d15fa

verified ·

1 Parent(s): 2dd3d54

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,39 +1,35 @@
 import os
 import gradio as gr
-from transformers import AutoConfig, AutoTokenizer, AutoModelForCausalLM
 HF_TOKEN = os.environ["HF_HUB_TOKEN"]
-# 1. Загружаем конфиг с доверительным исполнением кода
-config = AutoConfig.from_pretrained(
     "MeiGen-AI/MeiGen-MultiTalk",
-    trust_remote_code=True,     # 🚩 вот здесь
-    token=HF_TOKEN
 )
-# 2. Токенизатор
-tokenizer = AutoTokenizer.from_pretrained(
-    "MeiGen-AI/MeiGen-MultiTalk",
-    trust_remote_code=True,     # и здесь
-    token=HF_TOKEN
-)
-# 3. Модель
-model = AutoModelForCausalLM.from_pretrained(
-    "MeiGen-AI/MeiGen-MultiTalk",
-    config=config,
-    trust_remote_code=True,     # и здесь
-    token=HF_TOKEN
-)
-def generate(text):
-    inputs = tokenizer(text, return_tensors="pt").to(model.device)
-    out = model.generate(**inputs, max_new_tokens=100)
-    return tokenizer.decode(out[0], skip_special_tokens=True)
 iface = gr.Interface(
     fn=generate,
-    inputs="text",
-    outputs="text",
 )
-iface.launch()

 import os
+import torch
 import gradio as gr
+from diffusers import DiffusionPipeline
+import soundfile as sf
+# 1) Получаем токен из секретов
 HF_TOKEN = os.environ["HF_HUB_TOKEN"]
+# 2) Загружаем pipeline из репозитория MeiGen-MultiTalk
+pipe = DiffusionPipeline.from_pretrained(
     "MeiGen-AI/MeiGen-MultiTalk",
+    use_auth_token=HF_TOKEN,
+    torch_dtype=torch.float16
 )
+pipe = pipe.to("cuda") if torch.cuda.is_available() else pipe.to("cpu")
+# 3) Функция для генерации аудио
+def generate(prompt: str):
+    # Пример: если pipeline ожидает аргумент `text`
+    output = pipe(prompt).audios[0]
+    # Сохраняем временный WAV
+    sf.write("generated.wav", output, samplerate=pipe.unet.config.sample_rate)
+    return "generated.wav"
+# 4) Интерфейс Gradio
 iface = gr.Interface(
     fn=generate,
+    inputs=gr.Textbox(lines=2, placeholder="Введите текст..."),
+    outputs=gr.Audio(source="file", type="filepath"),
+    title="MeiGen-MultiTalk Demo"
 )
+if __name__ == "__main__":
+    iface.launch()