Expose complete response metadata from chat model via .invoke/.batch/.stream #16403

eyurtsev · 2024-01-22T19:45:53Z

Privileged issue

I am a LangChain maintainer, or was asked directly by a LangChain maintainer to create an issue here.

Issue Content

Impossible to access system_fingerprint from OpenAI responses.

see: #13170 (reply in thread)

The text was updated successfully, but these errors were encountered:

eyurtsev · 2024-01-22T19:46:00Z

cc @baskaryan

eyurtsev · 2024-01-22T19:46:59Z

Another discussion: #16030

Keiku · 2024-03-01T02:00:12Z

@eyurtsev Is there an update here? I'm having trouble with the lack of reproducibility of the output.

related to #16403 #17188

alex-ber · 2024-03-17T18:03:53Z

Inspired by #16030 (reply in thread)

class OpenAICallbackHandler:
    """Callback Handler that tracks OpenAI info."""

    total_tokens: int = 0
    prompt_tokens: int = 0
    completion_tokens: int = 0
    successful_requests: int = 0
    total_cost: float = 0.0
    system_fingerprint: str = ""
    
    def __init__(self) -> None:
        super().__init__()
        self._lock = threading.Lock()
        
         def __repr__(self) -> str:
            return (
            f"Tokens Used: {self.total_tokens}\n"
            f"\tPrompt Tokens: {self.prompt_tokens}\n"
            f"\tCompletion Tokens: {self.completion_tokens}\n"
            f"Successful Requests: {self.successful_requests}\n"
            f"Total Cost (USD): ${self.total_cost}"\n
           "f"system_filngerprint is {self.system_filngerprint}"
        )
        
        @property
    def always_verbose(self) -> bool:
        """Whether to call verbose callbacks even if verbose is False."""
        return True

    def on_llm_start(
        self, serialized: Dict[str, Any], prompts: List[str], **kwargs: Any
    ) -> None:
        """Print out the prompts."""
        pass

    def on_llm_new_token(self, token: str, **kwargs: Any) -> None:
        """Print out the token."""
        pass

    def on_llm_end(self, response: LLMResult, **kwargs: Any) -> None:
        """Collect token usage."""
        if response.llm_output is None:
            return None

        if "token_usage" not in response.llm_output:
            with self._lock:
                self.successful_requests += 1
            return None

        # compute tokens and cost for this request
        token_usage = response.llm_output["token_usage"]
        completion_tokens = token_usage.get("completion_tokens", 0)
        prompt_tokens = token_usage.get("prompt_tokens", 0)
        model_name = standardize_model_name(response.llm_output.get("model_name", ""))
        if model_name in MODEL_COST_PER_1K_TOKENS:
            completion_cost = get_openai_token_cost_for_model(
                model_name, completion_tokens, is_completion=True
            )
            prompt_cost = get_openai_token_cost_for_model(model_name, prompt_tokens)
        else:
            completion_cost = 0
            prompt_cost = 0

        # update shared state behind lock
        with self._lock:
            self.total_cost += prompt_cost + completion_cost
            self.total_tokens += token_usage.get("total_tokens", 0)
            self.prompt_tokens += prompt_tokens
            self.completion_tokens += completion_tokens
            self.system_fingerprint = response.llm_output.get("system_fingerprint", "")
            self.successful_requests += 1

    def __copy__(self) -> "OpenAICallbackHandler":
        """Return a copy of the callback handler."""
        return self

    def __deepcopy__(self, memo: Any) -> "OpenAICallbackHandler":
        """Return a deep copy of the callback handler."""
        return self

related to langchain-ai#16403 langchain-ai#17188

related to #16403 #17188

dosubot bot added Ɑ: models Related to LLMs or chat model modules 🤖:bug Related to a bug, vulnerability, unexpected error with an existing feature labels Jan 22, 2024

eyurtsev added 03 enhancement Enhancement of existing functionality and removed 🤖:bug Related to a bug, vulnerability, unexpected error with an existing feature labels Jan 22, 2024

This was referenced Mar 1, 2024

rfc: return full llm res #17188

Closed

core[patch]: generation info on msg #18592

Merged

baskaryan added a commit that referenced this issue Mar 12, 2024

core[minor]: generation info on msg (#18592)

e0e688a

related to #16403 #17188

bechbd pushed a commit to bechbd/langchain that referenced this issue Mar 29, 2024

core[minor]: generation info on msg (langchain-ai#18592)

b779f32

related to langchain-ai#16403 langchain-ai#17188

gkorland pushed a commit to FalkorDB/langchain that referenced this issue Mar 30, 2024

core[minor]: generation info on msg (langchain-ai#18592)

4e6f62f

related to langchain-ai#16403 langchain-ai#17188

hinthornw pushed a commit that referenced this issue Apr 26, 2024

core[minor]: generation info on msg (#18592)

e668f28

related to #16403 #17188

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Expose complete response metadata from chat model via .invoke/.batch/.stream #16403

Expose complete response metadata from chat model via .invoke/.batch/.stream #16403

eyurtsev commented Jan 22, 2024

eyurtsev commented Jan 22, 2024

eyurtsev commented Jan 22, 2024

Keiku commented Mar 1, 2024

alex-ber commented Mar 17, 2024

Expose complete response metadata from chat model via .invoke/.batch/.stream #16403

Expose complete response metadata from chat model via .invoke/.batch/.stream #16403

Comments

eyurtsev commented Jan 22, 2024

Privileged issue

Issue Content

eyurtsev commented Jan 22, 2024

eyurtsev commented Jan 22, 2024

Keiku commented Mar 1, 2024

alex-ber commented Mar 17, 2024