Spaces:

mrfakename
/

DMOSpeech2

Running on Zero

mrfakename commited on 6 days ago

Commit

d9c449e

1 Parent(s): 8517188

fix

Files changed (1) hide show

app.py CHANGED Viewed

@@ -117,8 +117,16 @@ def generate_speech(
     else:
         audio_np = generated_audio
-    if audio_np.ndim == 1:
-        audio_np = np.expand_dims(audio_np, axis=0)
     return (24000, audio_np)

     else:
         audio_np = generated_audio
+    # Ensure audio is properly normalized and in the correct format
+    if audio_np.ndim == 2 and audio_np.shape[0] == 1:
+        audio_np = audio_np.squeeze(0)  # Remove batch dimension if present
+    # Normalize audio to [-1, 1] range if needed
+    if np.abs(audio_np).max() > 1.0:
+        audio_np = audio_np / np.abs(audio_np).max()
+    # Ensure audio is in float32 format
+    audio_np = audio_np.astype(np.float32)
     return (24000, audio_np)