Spaces:

Pycrolis
/

shrewd-agent

Sleeping

Pycrolis commited on May 24

Commit

508a421

1 Parent(s): ee92f11

feat(tool): add Wikipedia search tool

Files changed (3) hide show

ShrewdAgent.py CHANGED Viewed

@@ -15,6 +15,7 @@ from pydantic import SecretStr
 from tools.produce_classifier import produce_classifier
 from tools.web_page_information_extractor import web_page_information_extractor
 from tools.youtube_transcript import youtube_transcript
@@ -39,6 +40,7 @@ class ShrewdAgent:
     def __init__(self):
         self.tools = [
             TavilySearch(),
             web_page_information_extractor,
             youtube_transcript,
             produce_classifier,

 from tools.produce_classifier import produce_classifier
 from tools.web_page_information_extractor import web_page_information_extractor
+from tools.wikipedia_search import wikipedia_search
 from tools.youtube_transcript import youtube_transcript
     def __init__(self):
         self.tools = [
             TavilySearch(),
+            wikipedia_search,
             web_page_information_extractor,
             youtube_transcript,
             produce_classifier,

requirements.txt CHANGED Viewed

@@ -9,4 +9,5 @@ pydantic~=2.11.4
 html2text~=2025.4.15
 beautifulsoup4~=4.13.4
 readability-lxml~=0.8.4.1
-youtube-transcript-api~=1.0.3

 html2text~=2025.4.15
 beautifulsoup4~=4.13.4
 readability-lxml~=0.8.4.1
+youtube-transcript-api~=1.0.3
+wikipedia~=1.4.0

tools/wikipedia_search.py ADDED Viewed

+import wikipedia
+from langchain_core.tools import tool
+from loguru import logger
+@tool("wikipedia_search_tool", parse_docstring=True)
+def wikipedia_search(query: str) -> str:
+    """
+    Searches Wikipedia for the given query.
+    Args:
+        query (str): The search query to look up on Wikipedia.
+    Returns:
+        str: A formatted string with the search results, page title and url.
+    """
+    logger.info(f"use wikipedia_search_tool with param: {query}")
+    search_results = wikipedia.search(query, results=5)
+    if not search_results:
+        return "No results found for the query."
+    result_text = ""
+    try:
+        for i, title in enumerate(search_results, 1):
+            page = wikipedia.page(search_results[i - 1], auto_suggest=False)
+            result_text += f"{i}. [{title}]({page.url})\n"
+        return result_text
+    except wikipedia.DisambiguationError as e:
+        return f"Disambiguation page found. Possible matches:\n{'\n'.join(e.options)}"
+    except wikipedia.PageError as e:
+        return f"Page not found. Try another search term."
+    except Exception as e:
+        return f"An error occurred: {str(e)}"
+if __name__ == "__main__":
+    print(wikipedia_search.invoke("Mercedes Sosa discography"))