Spaces:

declare-lab
/

JAM

Running on Zero

hungchiayu commited on Dec 29, 2024

Commit

d6ae001

1 Parent(s): 5c8506d

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -31,11 +31,12 @@ def gradio_generate(prompt, output_format, steps, guidance,duration=10):
     # output_filename = f"{prompt.replace(' ', '_')}_{steps}_{guidance}"[:250] + ".wav"
     output_wave = output_wave.audios[0]
     output_filename = "temp.wav"
-    wavio.write(output_filename, output_wave, rate=16000, sampwidth=2)
-    if (output_format == "mp3"):
-        AudioSegment.from_wav("temp.wav").export("temp.mp3", format = "mp3")
-        output_filename = "temp.mp3"
     return output_filename
@@ -49,7 +50,7 @@ Generate audio using Tango2 by providing a text prompt. Tango2 was built from Ta
 input_text = gr.Textbox(lines=2, label="Prompt")
 output_format = gr.Radio(label = "Output format", info = "The file you can dowload", choices = ["mp3", "wav"], value = "wav")
 output_audio = gr.Audio(label="Generated Audio", type="filepath")
-denoising_steps = gr.Slider(minimum=10, maximum=100, value=25, step=1, label="Steps", interactive=True)
 guidance_scale = gr.Slider(minimum=1, maximum=10, value=3, step=0.1, label="Guidance Scale", interactive=True)
 duration_scale = gr.Slider(minimum=1, maximum=30, value=10, step=1, label="Duration", interactive=True)

     # output_filename = f"{prompt.replace(' ', '_')}_{steps}_{guidance}"[:250] + ".wav"
     output_wave = output_wave.audios[0]
     output_filename = "temp.wav"
+    torchaudio.save(output_filename, output_wave, sample_rate=44100)
+    #wavio.write(output_filename, output_wave, rate=44100, sampwidth=2)
+    #if (output_format == "mp3"):
+     #   AudioSegment.from_wav("temp.wav").export("temp.mp3", format = "mp3")
+      #  output_filename = "temp.mp3"
     return output_filename
 input_text = gr.Textbox(lines=2, label="Prompt")
 output_format = gr.Radio(label = "Output format", info = "The file you can dowload", choices = ["mp3", "wav"], value = "wav")
 output_audio = gr.Audio(label="Generated Audio", type="filepath")
+denoising_steps = gr.Slider(minimum=10, maximum=100, value=25, step=5, label="Steps", interactive=True)
 guidance_scale = gr.Slider(minimum=1, maximum=10, value=3, step=0.1, label="Guidance Scale", interactive=True)
 duration_scale = gr.Slider(minimum=1, maximum=30, value=10, step=1, label="Duration", interactive=True)