ebook2audiobookXTTS-dev-testing-grounds-3

Runtime error

drewThomasson commited on Oct 8, 2024

Commit

a58e968

verified ·

1 Parent(s): 7c8f8d8

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -576,6 +576,8 @@ def convert_chapters_to_audio_custom_model(chapters_dir, output_audio_dir, targe
                             print(f"Generating fragment: {fragment}...")
                             fragment_file_path = os.path.join(temp_audio_directory, f"{temp_count}.wav")
                             if custom_model:
                                 out = model.inference(fragment, language, gpt_cond_latent, speaker_embedding, temperature=0.7)
                                 torchaudio.save(fragment_file_path, torch.tensor(out["wav"]).unsqueeze(0), 24000)
                             else:
@@ -624,6 +626,8 @@ def convert_chapters_to_audio_standard_model(chapters_dir, output_audio_dir, tar
                             fragment_file_path = os.path.join(temp_audio_directory, f"{temp_count}.wav")
                             speaker_wav_path = target_voice_path if target_voice_path else default_target_voice_path
                             language_code = language if language else default_language_code
                             tts.tts_to_file(text=fragment, file_path=fragment_file_path, speaker_wav=speaker_wav_path, language=language_code)
                             temp_count += 1

                             print(f"Generating fragment: {fragment}...")
                             fragment_file_path = os.path.join(temp_audio_directory, f"{temp_count}.wav")
                             if custom_model:
+                                print(f"The TTS language code given is: {language}")
+                                print(f"The TTS text chunk is: {fragment} ")
                                 out = model.inference(fragment, language, gpt_cond_latent, speaker_embedding, temperature=0.7)
                                 torchaudio.save(fragment_file_path, torch.tensor(out["wav"]).unsqueeze(0), 24000)
                             else:
                             fragment_file_path = os.path.join(temp_audio_directory, f"{temp_count}.wav")
                             speaker_wav_path = target_voice_path if target_voice_path else default_target_voice_path
                             language_code = language if language else default_language_code
+                            print(f"The TTS language code given is: {language_code}")
+                            print(f"The TTS text chunk is: {fragment} ")
                             tts.tts_to_file(text=fragment, file_path=fragment_file_path, speaker_wav=speaker_wav_path, language=language_code)
                             temp_count += 1