MultiAgent_System_for_Screenplay_Creation

Running

luke9705 commited on 20 days ago

Commit

e5ac056

1 Parent(s): 6a5d072

Enhance generate_audio function: Update parameters, add documentation, and implement audio generation using MusicGen

Files changed (1) hide show

app.py CHANGED Viewed

@@ -151,9 +151,30 @@ def generate_image(prompt: str, neg_prompt: str) -> Image.Image:
     return gr.Image(value=image, label="Generated Image")
 @tool
-def generate_audio(prompt: str, duration: int, sample: Optional[list[int, np.ndarray]] = None) -> gr.Component:
     """
     Generate audio from a text prompt using MusicGen.
     Args:
         prompt: The text prompt to generate the audio from.
         duration: Duration of the generated audio in seconds.
@@ -187,7 +208,8 @@ class Agent:
             model=client,
             tools=[DuckDuckGoSearchTool(max_results=5),
                    VisitWebpageTool(max_output_length=20000),
-                   generate_image,
                    generate_audio,
                    download_images,
                    transcribe_audio],

     return gr.Image(value=image, label="Generated Image")
 @tool
+def generate_audio(prompt: str, duration: int) -> gr.Component:
     """
     Generate audio from a text prompt using MusicGen.
+    Args:
+        prompt: The text prompt to generate the audio from.
+        duration: Duration of the generated audio in seconds.
+    Returns:
+        gr.Component: The generated audio as a Gradio Audio component.
+    """
+    client = Tool.from_space(
+        space_id="luke9705/MusicGen_custom",
+        token=os.environ.get('HF_TOKEN'),
+        name="Sound_Generator",
+        description="Generate music or sound effects from a text prompt using MusicGen."
+    )
+    sound = client(prompt, duration)
+    return gr.Audio(value=sound)
+@tool
+def generate_audio_from_sample(prompt: str, duration: int, sample: list[int, np.ndarray] = None) -> gr.Component:
+    """
+    Generate audio from a text prompt + audio sample using MusicGen.
     Args:
         prompt: The text prompt to generate the audio from.
         duration: Duration of the generated audio in seconds.
             model=client,
             tools=[DuckDuckGoSearchTool(max_results=5),
                    VisitWebpageTool(max_output_length=20000),
+                   generate_image,
+                   generate_audio_from_sample,
                    generate_audio,
                    download_images,
                    transcribe_audio],