Podcastking2

Running

App Files Files Community

gnosticdev commited on 16 days ago

Commit

15d0727

verified ·

1 Parent(s): 41484d1

Update conver.py

Browse files

Files changed (1) hide show

conver.py +10 -8

conver.py CHANGED Viewed

@@ -1,5 +1,5 @@
 from dataclasses import dataclass
-from typing import List, Tuple, Dict, Optional
 import os
 import re
 import httpx
@@ -81,7 +81,7 @@ class URLToAudioConverter:
         try:
             for i, turn in enumerate(conversation_json["conversation"]):
-                filename = output_dir / f"output_{i}.wav"
                 voice = voice_1 if i % 2 == 0 else voice_2
                 tmp_path, error = await self._generate_audio(turn["text"], voice)
@@ -106,7 +106,7 @@ class URLToAudioConverter:
         pitch_str = f"{pitch:+d}Hz"
         communicate = edge_tts.Communicate(text, voice_short_name, rate=rate_str, pitch=pitch_str)
-        with tempfile.NamedTemporaryFile(delete=False, suffix=".wav") as tmp_file:
             tmp_path = tmp_file.name
             await communicate.save(tmp_path)
@@ -125,10 +125,12 @@ class URLToAudioConverter:
         try:
             combined = AudioSegment.empty()
             for filename in filenames:
-                audio_segment = AudioSegment.from_wav(filename)
                 combined += audio_segment
-            combined.export(output_file, format="wav")
             # Limpieza de archivos temporales
             for filename in filenames:
@@ -154,12 +156,12 @@ class URLToAudioConverter:
             conversation_json, voice_1, voice_2
         )
-        final_output = os.path.join(folder_name, "combined_output.wav")
         self.combine_audio_files(audio_files, final_output)
         return final_output, conversation_text
     async def text_to_audio(self, text: str, voice_1: str, voice_2: str) -> Tuple[str, str]:
-        """Nuevo método para procesar texto directo"""
         conversation_json = self.extract_conversation(text)
         conversation_text = "\n".join(
             f"{turn['speaker']}: {turn['text']}" for turn in conversation_json["conversation"]
@@ -167,6 +169,6 @@ class URLToAudioConverter:
         audio_files, folder_name = await self.text_to_speech(
             conversation_json, voice_1, voice_2
         )
-        final_output = os.path.join(folder_name, "combined_output.wav")
         self.combine_audio_files(audio_files, final_output)
         return final_output, conversation_text

 from dataclasses import dataclass
+from typing import List, Tuple, Dict
 import os
 import re
 import httpx
         try:
             for i, turn in enumerate(conversation_json["conversation"]):
+                filename = output_dir / f"output_{i}.mp3"  # Cambiado a MP3
                 voice = voice_1 if i % 2 == 0 else voice_2
                 tmp_path, error = await self._generate_audio(turn["text"], voice)
         pitch_str = f"{pitch:+d}Hz"
         communicate = edge_tts.Communicate(text, voice_short_name, rate=rate_str, pitch=pitch_str)
+        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp_file:  # Cambiado a MP3
             tmp_path = tmp_file.name
             await communicate.save(tmp_path)
         try:
             combined = AudioSegment.empty()
             for filename in filenames:
+                # Leer como MP3
+                audio_segment = AudioSegment.from_file(filename, format="mp3")
                 combined += audio_segment
+            # Exportar como MP3
+            combined.export(output_file, format="mp3")
             # Limpieza de archivos temporales
             for filename in filenames:
             conversation_json, voice_1, voice_2
         )
+        final_output = os.path.join(folder_name, "combined_output.mp3")  # Cambiado a MP3
         self.combine_audio_files(audio_files, final_output)
         return final_output, conversation_text
     async def text_to_audio(self, text: str, voice_1: str, voice_2: str) -> Tuple[str, str]:
+        """Método para procesar texto directo"""
         conversation_json = self.extract_conversation(text)
         conversation_text = "\n".join(
             f"{turn['speaker']}: {turn['text']}" for turn in conversation_json["conversation"]
         audio_files, folder_name = await self.text_to_speech(
             conversation_json, voice_1, voice_2
         )
+        final_output = os.path.join(folder_name, "combined_output.mp3")  # Cambiado a MP3
         self.combine_audio_files(audio_files, final_output)
         return final_output, conversation_text