Spaces:

Emmylahot12
/

clone-tts

Runtime error

Emmylahot12 commited on May 8

Commit

9412e46

verified ·

1 Parent(s): d569fd6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,26 +1,22 @@
 import os
 from TTS.api import TTS
-from datasets import load_dataset, Audio
 import gradio as gr
-# Automatically accept Coqui license
 os.environ["COQUI_TOS_AGREED"] = "1"
-# Load dataset from Hugging Face
 dataset = load_dataset("Emmylahot12/nnamdi", split="train")
-dataset = dataset.cast_column("audio", Audio())
-# Validate audio exists
-if not dataset or not dataset[0]["audio"] or not dataset[0]["audio"]["path"]:
     raise ValueError("Dataset is empty or audio is missing")
-# Reference voice sample path
 voice_sample_path = dataset[0]["audio"]["path"]
-# Initialize TTS with XTTS v2 model (CPU mode)
 tts = TTS(model_name="tts_models/multilingual/multi-dataset/xtts_v2", gpu=False)
-# TTS synthesis function
 def synthesize(text, language="en"):
     output_path = "output.wav"
     tts.tts_to_file(
@@ -32,16 +28,12 @@ def synthesize(text, language="en"):
     return output_path
 # Gradio UI
-interface = gr.Interface(
     fn=synthesize,
     inputs=[
-        gr.Textbox(label="Enter Text"),
-        gr.Dropdown(choices=["en", "fr", "es", "de"], label="Language")
     ],
-    outputs=gr.Audio(label="Generated Speech"),
-    title="Nnamdi TTS - Powered by Coqui XTTS v2",
-    description="Custom voice from dataset: Emmylahot12/nnamdi"
-)
-if __name__ == "__main__":
-    interface.launch()

 import os
+from datasets import load_dataset
 from TTS.api import TTS
 import gradio as gr
+# Accept Coqui license automatically
 os.environ["COQUI_TOS_AGREED"] = "1"
+# Load your dataset and retrieve the voice sample path
 dataset = load_dataset("Emmylahot12/nnamdi", split="train")
+if dataset[0]["audio"] is None:
     raise ValueError("Dataset is empty or audio is missing")
 voice_sample_path = dataset[0]["audio"]["path"]
+# Initialize the TTS engine (CPU)
 tts = TTS(model_name="tts_models/multilingual/multi-dataset/xtts_v2", gpu=False)
+# Inference function
 def synthesize(text, language="en"):
     output_path = "output.wav"
     tts.tts_to_file(
     return output_path
 # Gradio UI
+gr.Interface(
     fn=synthesize,
     inputs=[
+        gr.Textbox(label="Enter text to synthesize"),
+        gr.Dropdown(["en", "fr", "es"], label="Language", value="en")
     ],
+    outputs=gr.Audio(label="Generated Audio"),
+    title="Nnamdi TTS App (XTTSv2)"
+).launch()