File size: 5,080 Bytes

23dd25f

import json
import re
from vllm.entrypoints.openai.protocol import (
    ExtractedToolCallInformation,
    FunctionCall,
    ToolCall,
)
from vllm.entrypoints.openai.tool_parsers.abstract_tool_parser import (
    ToolParser,
    ToolParserManager,
)
from vllm.logger import init_logger

logger = init_logger(__name__)


@ToolParserManager.register_module("mistral_v3_debug")
class MistralV3DebugToolParser(ToolParser):
    """
    Custom parser for Mistral v3 with detailed logging.
    Ensures OpenAI-compatible tool calls while debugging missing arguments.
    """

    def extract_tool_calls(
        self, model_output: str, request
    ) -> ExtractedToolCallInformation:
        """
        Extracts tool calls from model output using Mistral's special tokens.
        Accepts multiple calls in a comma-separated list, either with or
        without leading/trailing square brackets.
        """

        logger.info(f"🔍 Extracting tool calls from model output... | {repr(request)}")
        logger.info(f"Raw model output: {model_output}")

        try:
            # Find tool calls inside [TOOL_CALLS][ ... ]
            tool_call_match = re.search(
                r"\[TOOL_CALLS\]\[(.*?)\]", model_output, re.DOTALL
            )
            if not tool_call_match:
                logger.warning(
                    "⚠️ No valid [TOOL_CALLS] block found. Treating as normal content."
                )
                return ExtractedToolCallInformation(
                    tools_called=False, tool_calls=[], content=model_output
                )

            # Extract JSON snippet from inside [TOOL_CALLS][...]
            tool_call_json = tool_call_match.group(1).strip()
            logger.debug(f"📥 Extracted JSON snippet: {tool_call_json}")

            # Ensure valid JSON list format
            if not tool_call_json.startswith("["):
                logger.debug("🔧 Wrapping snippet with leading '['")
                tool_call_json = f"[{tool_call_json}"
            if not tool_call_json.endswith("]"):
                logger.debug("🔧 Wrapping snippet with trailing ']'")
                tool_call_json = f"{tool_call_json}]"

            logger.debug(f"📝 Final JSON to parse: {tool_call_json}")
            tool_call_data = json.loads(tool_call_json)

            # Ensure we have a list of tool calls
            if isinstance(tool_call_data, dict):
                logger.debug(
                    "👀 Detected single tool call dictionary; converting to a list."
                )
                tool_call_data = [tool_call_data]
            elif not isinstance(tool_call_data, list):
                logger.error(
                    "🚨 Tool call data is neither a list nor a valid object list. Returning as content."
                )
                return ExtractedToolCallInformation(
                    tools_called=False, tool_calls=[], content=model_output
                )

            tool_calls = []
            for i, tool_item in enumerate(tool_call_data):
                logger.debug(f"🛠️ Processing item {i}: {tool_item}")

                # Ensure each item is a dict with "name" and "arguments"
                if not isinstance(tool_item, dict):
                    logger.error(f"❌ Item {i} is not a JSON object. Skipping.")
                    continue

                name = tool_item.get("name", "unknown_tool")
                args = tool_item.get("arguments", {})

                # Ensure arguments is a dict
                if not isinstance(args, dict):
                    logger.error(
                        f"❌ Arguments for tool '{name}' are not a dict. Using empty dict."
                    )
                    args = {}

                # Convert arguments to a JSON string (for OpenAI-compatible function calls)
                arguments_json = json.dumps(args, ensure_ascii=False)
                logger.debug(f"✅ Parsed arguments for '{name}': {arguments_json}")

                # Build a single ToolCall object
                tool_calls.append(
                    ToolCall(
                        type="function",
                        id=f"call_{i}",
                        function=FunctionCall(name=name, arguments=arguments_json),
                    )
                )

            logger.info(f"✅ Successfully extracted {len(tool_calls)} tool call(s).")
            # We have recognized tool calls, so set content=None
            return ExtractedToolCallInformation(
                tools_called=True, tool_calls=tool_calls, content=None
            )

        except json.JSONDecodeError as e:
            logger.error(f"❌ Failed to parse tool calls JSON: {str(e)}")
            return ExtractedToolCallInformation(
                tools_called=False, tool_calls=[], content=model_output
            )

        except Exception as e:
            logger.exception("🔥 Unexpected error while parsing tool calls.")
            return ExtractedToolCallInformation(
                tools_called=False, tool_calls=[], content=model_output
            )