## Open AI_Agents_SDK_Model Settings

## اے آئی ایجنٹس ایس ڈی کے ماڈل سیٹنگز کھولیں۔

Models

The Agents SDK comes with out-of-the-box support for OpenAI models in two flavors:

* Recommended: the OpenAIResponsesModel, which calls OpenAI APIs using the new Responses API.

* The OpenAIChatCompletionsModel, which calls OpenAI APIs using the Chat Completions API.

ماڈلز

ایجنٹس SDK دو ذائقوں میں اوپن اے آئی ماڈلز کے لیے آؤٹ آف دی باکس سپورٹ کے ساتھ آتا ہے:

* تجویز کردہ: OpenAIresponsesModel، جو OpenAI APIs کو نئے Responses API کا استعمال کرتے ہوئے کال کرتا ہے۔

* OpenAIChatCompletionsModel، جو Chat Completions API کا استعمال کرتے ہوئے OpenAI APIs کو کال کرتا ہے۔

OpenAI models

When you don't specify a model when initializing an Agent, the default model will be used. The default is currently gpt-4.1, which offers a strong balance of predictability for agentic workflows and low latency.

If you want to switch to other models like gpt-5, follow the steps in the next section.

Default OpenAI model

If you want to consistently use a specific model for all agents that do not set a custom model, set the OPENAI_DEFAULT_MODEL environment variable before running your agents.

اوپن اے آئی ماڈلز

جب آپ ایجنٹ کو شروع کرتے وقت ماڈل کی وضاحت نہیں کرتے ہیں، تو ڈیفالٹ ماڈل استعمال کیا جائے گا۔ پہلے سے طے شدہ فی الحال gpt-4.1 ہے، جو ایجنٹی کام کے بہاؤ اور کم تاخیر کے لیے پیشین گوئی کا مضبوط توازن پیش کرتا ہے۔

اگر آپ دوسرے ماڈلز جیسے gpt-5 پر سوئچ کرنا چاہتے ہیں تو اگلے سیکشن میں دیے گئے مراحل پر عمل کریں۔

ڈیفالٹ اوپن اے آئی ماڈل

اگر آپ ان تمام ایجنٹوں کے لیے مستقل طور پر ایک مخصوص ماڈل استعمال کرنا چاہتے ہیں جو اپنی مرضی کے مطابق ماڈل سیٹ نہیں کرتے ہیں، تو اپنے ایجنٹوں کو چلانے سے پہلے OPENAI_DEFAULT_MODEL ماحولیاتی متغیر سیٹ کریں۔

GPT-5 Models

When you use any of GPT-5's reasoning models (gpt-5, gpt-5-mini, or gpt-5-nano) this way, the SDK applies sensible ModelSettings by default. Specifically, it sets both reasoning.effort and verbosity to "low". If you want to build these settings yourself, call agents.models.get_default_model_settings("gpt-5").

For lower latency or specific requirements, you can choose a different model and settings. To adjust the reasoning effort for the default model, pass your own ModelSettings:

GPT-5 ماڈلز

جب آپ اس طرح سے GPT-5 کے کسی بھی ریجننگ ماڈل (gpt-5، gpt-5-mini، یا gpt-5-nano) کا استعمال کرتے ہیں، تو SDK بطور ڈیفالٹ سمجھدار ماڈل سیٹنگز کا اطلاق کرتا ہے۔ خاص طور پر، یہ استدلال اور کوشش دونوں کو "کم" پر سیٹ کرتا ہے۔ اگر آپ ان ترتیبات کو خود بنانا چاہتے ہیں تو agents.models.get_default_model_settings("gpt-5") پر کال کریں۔

کم تاخیر یا مخصوص تقاضوں کے لیے، آپ ایک مختلف ماڈل اور ترتیبات کا انتخاب کر سکتے ہیں۔ پہلے سے طے شدہ ماڈل کے لیے استدلال کی کوشش کو ایڈجسٹ کرنے کے لیے، اپنی خود کی ModelSettings کو پاس کریں:

In [None]:
# Export OPENAI_DEFAULT_MODEL=gpt-5
# Python3 my_awesome_agent.py

from openai.types.shared import Reasoning
from agents import Agent, ModelSettings

my_agent = Agent(
    name="My Agent",
    instructions="You're a helpful agent.",
    model_settings=ModelSettings(reasoning=Reasoning(effort="minimal"), verbosity="low")
    # If OPENAI_DEFAULT_MODEL=gpt-5 is set, passing only model_settings works.
    # It's also fine to pass a GPT-5 model name explicitly:
    # model="gpt-5",
)

Specifically for lower latency, using either gpt-5-mini or gpt-5-nano model with reasoning.effort="minimal" will often return responses faster than the default settings. However, some built-in tools (such as file search and image generation) in Responses API do not support "minimal" reasoning effort, which is why this Agents SDK defaults to "low".

Non-GPT-5 Models

If you pass a non–GPT-5 model name without custom model_settings, the SDK reverts to generic ModelSettings compatible with any model.

Non-OpenAI Models

You can use most other non-OpenAI models via the LiteLLM integration. First, install the litellm dependency group:

خاص طور پر کم تاخیر کے لیے، یا تو gpt-5-mini یا gpt-5-nano ماڈل کو reasoning.effort="minimal" کے ساتھ استعمال کرنے سے اکثر ڈیفالٹ سیٹنگز سے زیادہ تیزی سے جوابات ملیں گے۔ تاہم، Responses API میں کچھ بلٹ ان ٹولز (جیسے فائل سرچ اور امیج جنریشن) "کم سے کم" استدلال کی کوشش کو سپورٹ نہیں کرتے ہیں، یہی وجہ ہے کہ یہ ایجنٹس SDK ڈیفالٹ "کم" ہے۔

غیر GPT-5 ماڈلز

اگر آپ اپنی مرضی کے مطابق ماڈل_سیٹنگز کے بغیر ایک غیر-GPT-5 ماڈل کا نام پاس کرتے ہیں، تو SDK کسی بھی ماڈل کے ساتھ ہم آہنگ عمومی ModelSettings میں واپس آجاتا ہے۔

غیر اوپن اے آئی ماڈلز

آپ LiteLLM انٹیگریشن کے ذریعے زیادہ تر دیگر غیر OpenAI ماڈلز استعمال کر سکتے ہیں۔ سب سے پہلے، litellm انحصار گروپ انسٹال کریں:

Then, use any of the supported models with the litellm/ prefix:

پھر، litellm/ prefix کے ساتھ کسی بھی معاون ماڈل کا استعمال کریں:

In [None]:
pip install "openai-agents[litellm]"

claude_agent = Agent(model="litellm/anthropic/claude-3-5-sonnet-20240620", ...)
gemini_agent = Agent(model="litellm/gemini/gemini-2.5-flash-preview-04-17", ...)

Other ways to use non-OpenAI models

You can integrate other LLM providers in 3 more ways (examples here):

1. Set_default_openai_client is useful in cases where you want to globally use an instance of 
   AsyncOpenAI as the LLM client. This is for cases where the LLM provider has an OpenAI compatible API endpoint, and you can set the base_url and api_key. See a configurable example in examples/model_providers/custom_example_global.py.

2. ModelProvider is at the Runner.run level. This lets you say "use a custom model provider 
   for all agents in this run". See a configurable example in examples/model_providers/custom_example_provider.py.

3. Agent.model lets you specify the model on a specific Agent instance. This enables you to 
   mix and match different providers for different agents. See a configurable example in examples/model_providers/custom_example_agent.py. An easy way to use most available models is via the LiteLLM integration.

4. In cases where you do not have an API key from platform.openai.com, we recommend disabling 
   tracing via set_tracing_disabled(), or setting up a different tracing processor.

غیر اوپن اے آئی ماڈلز استعمال کرنے کے دوسرے طریقے

آپ دوسرے LLM فراہم کنندگان کو مزید 3 طریقوں سے ضم کر سکتے ہیں (مثالیں یہاں):

1. Set_default_openai_client ان صورتوں میں مفید ہے جہاں آپ عالمی سطح پر ایک مثال استعمال کرنا چاہتے ہیں 
AsyncOpenAI بطور LLM کلائنٹ۔ یہ ان صورتوں کے لیے ہے جہاں LLM فراہم کنندہ کے پاس OpenAI مطابقت پذیر API اینڈ پوائنٹ ہے، اور آپ base_url اور api_key سیٹ کر سکتے ہیں۔ مثالوں/model_providers/custom_example_global.py میں قابل ترتیب مثال دیکھیں۔

2. ModelProvider Runner.run کی سطح پر ہے۔ یہ آپ کو یہ کہنے دیتا ہے کہ "کسٹم ماڈل فراہم کنندہ استعمال کریں۔ 
اس رن میں تمام ایجنٹوں کے لیے۔ مثالوں/model_providers/custom_example_provider.py میں قابل ترتیب مثال دیکھیں۔

3. Agent.model آپ کو ایک مخصوص ایجنٹ مثال پر ماڈل کی وضاحت کرنے دیتا ہے۔ یہ آپ کو قابل بناتا ہے۔ 
مختلف ایجنٹوں کے لیے مختلف فراہم کنندگان کو مکس اور میچ کریں۔ مثالوں/model_providers/custom_example_agent.py میں قابل ترتیب مثال دیکھیں۔ زیادہ تر دستیاب ماڈلز کو استعمال کرنے کا ایک آسان طریقہ LiteLLM انضمام کے ذریعے ہے۔

4. ایسے معاملات میں جہاں آپ کے پاس platform.openai.com سے API کلید نہیں ہے، ہم اسے غیر فعال کرنے کی تجویز کرتے ہیں۔ 
set_tracing_disabled() کے ذریعے ٹریس کرنا، یا ایک مختلف ٹریسنگ پروسیسر ترتیب دینا۔

Mixing and matching models

Within a single workflow, you may want to use different models for each agent. For example, you could use a smaller, faster model for triage, while using a larger, more capable model for complex tasks. When configuring an Agent, you can select a specific model by either:

1. Passing the name of a model.

2. Passing any model name + a ModelProvider that can map that name to a Model instance.

3. Directly providing a Model implementation.

اختلاط اور ملاپ کے ماڈل

ایک ہی ورک فلو کے اندر، آپ ہر ایجنٹ کے لیے مختلف ماڈل استعمال کرنا چاہیں گے۔ مثال کے طور پر، آپ ٹرائیج کے لیے ایک چھوٹا، تیز ماڈل استعمال کر سکتے ہیں، جبکہ پیچیدہ کاموں کے لیے ایک بڑا، زیادہ قابل ماڈل استعمال کر سکتے ہیں۔ ایجنٹ کی تشکیل کرتے وقت، آپ کسی مخصوص ماڈل کو منتخب کر سکتے ہیں:

1. ماڈل کا نام پاس کرنا۔

2. کسی بھی ماڈل کا نام + ایک ماڈل پرووائڈر پاس کرنا جو اس نام کو ماڈل مثال کے ساتھ نقشہ بنا سکے۔

3. براہ راست ایک ماڈل کا نفاذ فراہم کرنا۔

While our SDK supports both the OpenAIResponsesModel and the OpenAIChatCompletionsModel shapes, we recommend using a single model shape for each workflow because the two shapes support a different set of features and tools. If your workflow requires mixing and matching model shapes, make sure that all the features you're using are available on both.

اگرچہ ہمارا SDK OpenAIREsponsesModel اور OpenAIChatCompletionsModel دونوں شکلوں کو سپورٹ کرتا ہے، ہم ہر ورک فلو کے لیے ایک ماڈل کی شکل استعمال کرنے کی تجویز کرتے ہیں کیونکہ دونوں شکلیں خصوصیات اور ٹولز کے مختلف سیٹ کو سپورٹ کرتی ہیں۔ اگر آپ کے ورک فلو کو ماڈل کی شکلوں کو ملانے اور ملانے کی ضرورت ہے، تو یقینی بنائیں کہ آپ جو بھی خصوصیات استعمال کر رہے ہیں وہ دونوں پر دستیاب ہیں۔

In [None]:
from agents import Agent, Runner, AsyncOpenAI, OpenAIChatCompletionsModel
import asyncio

spanish_agent = Agent(
    name="Spanish agent",
    instructions="You only speak Spanish.",
    model="gpt-5-mini", 
)

english_agent = Agent(
    name="English agent",
    instructions="You only speak English",
    model=OpenAIChatCompletionsModel( 
        model="gpt-5-nano",
        openai_client=AsyncOpenAI()
    ),
)

triage_agent = Agent(
    name="Triage agent",
    instructions="Handoff to the appropriate agent based on the language of the request.",
    handoffs=[spanish_agent, english_agent],
    model="gpt-5",
)

async def main():
    result = await Runner.run(triage_agent, input="Hola, ¿cómo estás?")
    print(result.final_output)

When you want to further configure the model used for an agent, you can pass ModelSettings, which provides optional model configuration parameters such as temperature.

جب آپ کسی ایجنٹ کے لیے استعمال ہونے والے ماڈل کو مزید کنفیگر کرنا چاہتے ہیں، تو آپ ماڈل سیٹنگز پاس کر سکتے ہیں، جو اختیاری ماڈل کنفیگریشن پیرامیٹرز فراہم کرتی ہے جیسے درجہ حرارت۔

In [None]:
from agents import Agent, ModelSettings

english_agent = Agent(
    name="English agent",
    instructions="You only speak English",
    model="gpt-4.1",
    model_settings=ModelSettings(temperature=0.1),
)

Also, when you use OpenAI's Responses API, there are a few other optional parameters (e.g., user, service_tier, and so on). If they are not available at the top level, you can use extra_args to pass them as well.

اس کے علاوہ، جب آپ OpenAI کے Responses API کا استعمال کرتے ہیں، تو کچھ دوسرے اختیاری پیرامیٹرز ہوتے ہیں (جیسے صارف، service_tier، وغیرہ)۔ اگر وہ اوپر کی سطح پر دستیاب نہیں ہیں، تو آپ ان کو پاس کرنے کے لیے extra_args بھی استعمال کر سکتے ہیں۔

In [None]:
from agents import Agent, ModelSettings

english_agent = Agent(
    name="English agent",
    instructions="You only speak English",
    model="gpt-4.1",
    model_settings=ModelSettings(
        temperature=0.1,
        extra_args={"service_tier": "flex", "user": "user_12345"},
    ),
)

Common issues with using other LLM providers

Tracing client error 401

If you get errors related to tracing, this is because traces are uploaded to OpenAI servers, and you don't have an OpenAI API key. You have three options to resolve this:

1. Disable tracing entirely: set_tracing_disabled(True).

2. Set an OpenAI key for tracing: set_tracing_export_api_key(...). This API key will only be  
   used for uploading traces, and must be from platform.openai.com.

3. Use a non-OpenAI trace processor. See the tracing docs.

دوسرے LLM فراہم کنندگان کے استعمال کے ساتھ عام مسائل

کلائنٹ کی غلطی 401 کا سراغ لگانا

اگر آپ کو ٹریسنگ سے متعلق غلطیاں ملتی ہیں، تو اس کی وجہ یہ ہے کہ نشانات OpenAI سرورز پر اپ لوڈ کیے جاتے ہیں، اور آپ کے پاس OpenAI API کلید نہیں ہے۔ اس کو حل کرنے کے لیے آپ کے پاس تین اختیارات ہیں:

1. مکمل طور پر ٹریسنگ کو غیر فعال کریں: set_tracing_disabled(True)۔

2. ٹریسنگ کے لیے ایک OpenAI کلید سیٹ کریں: set_tracing_export_api_key(...)۔ یہ API کلید صرف ہوگی۔ 
نشانات کو اپ لوڈ کرنے کے لیے استعمال کیا جاتا ہے، اور پلیٹ فارم.openai.com سے ہونا چاہیے۔

3. ایک غیر اوپن اے آئی ٹریس پروسیسر استعمال کریں۔ ٹریسنگ دستاویزات دیکھیں۔

Responses API support

The SDK uses the Responses API by default, but most other LLM providers don't yet support it. You may see 404s or similar issues as a result. To resolve, you have two options:

1. Call set_default_openai_api("chat_completions"). This works if you are setting 
    OPENAI_API_KEY and OPENAI_BASE_URL via environment vars.

2. Use OpenAIChatCompletionsModel. There are examples here.

Structured outputs support

Some model providers don't have support for structured outputs. This sometimes results in an error that looks something like this:

جوابات API سپورٹ

SDK بطور ڈیفالٹ Responses API استعمال کرتا ہے، لیکن زیادہ تر LLM فراہم کرنے والے ابھی تک اس کی حمایت نہیں کرتے ہیں۔ اس کے نتیجے میں آپ کو 404s یا اسی طرح کے مسائل نظر آ سکتے ہیں۔ حل کرنے کے لیے، آپ کے پاس دو اختیارات ہیں:

1. کال کریں set_default_openai_api("chat_completions")۔ اگر آپ ترتیب دے رہے ہیں تو یہ کام کرتا ہے۔ 
OPENAI_API_KEY اور OPENAI_BASE_URL بذریعہ ماحولیات۔

2. OpenAIChatCompletionsModel استعمال کریں۔ یہاں مثالیں موجود ہیں۔

ساختی آؤٹ پٹ سپورٹ

کچھ ماڈل فراہم کنندگان کو سٹرکچرڈ آؤٹ پٹس کے لیے تعاون حاصل نہیں ہے۔ اس کے نتیجے میں بعض اوقات ایک غلطی ہوتی ہے جو کچھ اس طرح نظر آتی ہے:

In [None]:
BadRequestError: Error code: 400 - {'error': {'message': "'response_format.type' : value is not one of the allowed values ['text','json_object']", 'type': 'invalid_request_error'}}

This is a shortcoming of some model providers - they support JSON outputs, but don't allow you to specify the json_schema to use for the output. We are working on a fix for this, but we suggest relying on providers that do have support for JSON schema output, because otherwise your app will often break because of malformed JSON.

یہ کچھ ماڈل فراہم کنندگان کی کمی ہے - وہ JSON آؤٹ پٹ کو سپورٹ کرتے ہیں، لیکن آپ کو آؤٹ پٹ کے لیے استعمال کرنے کے لیے json_schema کی وضاحت کرنے کی اجازت نہیں دیتے ہیں۔ ہم اس کے حل پر کام کر رہے ہیں، لیکن ہم تجویز کرتے ہیں کہ ایسے فراہم کنندگان پر انحصار کریں جن کے پاس JSON اسکیما آؤٹ پٹ کے لیے سپورٹ ہے، کیونکہ بصورت دیگر آپ کی ایپ اکثر خراب JSON کی وجہ سے ٹوٹ جائے گی۔

Mixing models across providers

You need to be aware of feature differences between model providers, or you may run into errors. For example, OpenAI supports structured outputs, multimodal input, and hosted file search and web search, but many other providers don't support these features. Be aware of these limitations:

* Don't send unsupported tools to providers that don't understand them

* Filter out multimodal inputs before calling models that are text-only

* Be aware that providers that don't support structured JSON outputs will occasionally 
  produce invalid JSON.

فراہم کنندگان میں ماڈلز کو ملانا

آپ کو ماڈل فراہم کنندگان کے درمیان خصوصیت کے فرق سے آگاہ ہونے کی ضرورت ہے، ورنہ آپ غلطیوں کا شکار ہو سکتے ہیں۔ مثال کے طور پر، OpenAI سٹرکچرڈ آؤٹ پٹ، ملٹی موڈل ان پٹ، اور ہوسٹڈ فائل سرچ اور ویب سرچ کو سپورٹ کرتا ہے، لیکن بہت سے دوسرے فراہم کنندگان ان خصوصیات کو سپورٹ نہیں کرتے ہیں۔ ان حدود سے آگاہ رہیں:

* ایسے فراہم کنندگان کو غیر تعاون یافتہ ٹولز نہ بھیجیں جو انہیں نہیں سمجھتے ہیں۔

* صرف ٹیکسٹ والے ماڈلز کو کال کرنے سے پہلے ملٹی موڈل ان پٹس کو فلٹر کریں۔

* آگاہ رہیں کہ وہ فراہم کنندگان جو ساختی JSON آؤٹ پٹس کو سپورٹ نہیں کرتے ہیں کبھی کبھار ایسا کرتے ہیں۔ 
غلط JSON تیار کریں۔

Using Any Model Via Lite LLM / لائٹ ایل ایل ایم کے ذریعے کوئی بھی ماڈل استعمال کرنا

The LiteLLM integration is in beta. You may run into issues with some model providers, especially smaller ones. Please report any issues via Github issues and we'll fix quickly.

LiteLLM انضمام بیٹا میں ہے۔ آپ کو کچھ ماڈل فراہم کنندگان کے ساتھ مسائل کا سامنا کرنا پڑ سکتا ہے، خاص طور پر چھوٹے۔ براہ کرم گیتھب کے مسائل کے ذریعے کسی بھی مسئلے کی اطلاع دیں اور ہم اسے جلد ٹھیک کر دیں گے۔

LiteLLM is a library that allows you to use 100+ models via a single interface. We've added a LiteLLM integration to allow you to use any AI model in the Agents SDK.

LiteLLM ایک لائبریری ہے جو آپ کو ایک انٹرفیس کے ذریعے 100+ ماڈل استعمال کرنے کی اجازت دیتی ہے۔ ہم نے ایک LiteLLM انضمام شامل کیا ہے تاکہ آپ کو ایجنٹس SDK میں کسی بھی AI ماڈل کو استعمال کرنے کی اجازت دی جائے۔

Setup

You'll need to ensure litellm is available. You can do this by installing the optional litellm dependency group:

سیٹ اپ

آپ کو یہ یقینی بنانا ہوگا کہ litellm دستیاب ہے۔ آپ اختیاری litellm انحصار گروپ کو انسٹال کرکے ایسا کرسکتے ہیں:

pip install "openai-agents[litellm]"

Once Done, You Can Use Lite LLM Model In Any Agent. / ایک بار مکمل ہونے کے بعد، آپ کسی بھی ایجنٹ میں LitellmModel استعمال کر سکتے ہیں۔

Example

This is a fully working example. When you run it, you'll be prompted for a model name and API key. For example, you could enter:

* Openai/gpt-4.1 for the model, and your OpenAI API key

*. Anthropic/claude-3-5-sonnet-20240620 for the model, and your Anthropic API key

* etc

For a full list of models supported in LiteLLM, see the litellm providers docs.

مثال

یہ مکمل طور پر کام کرنے والی مثال ہے۔ جب آپ اسے چلاتے ہیں، تو آپ کو ایک ماڈل کا نام اور API کلید کے لیے کہا جائے گا۔ مثال کے طور پر، آپ درج کر سکتے ہیں:

* ماڈل کے لیے Openai/gpt-4.1، اور آپ کی OpenAI API کلید

* ماڈل کے لیے Anthropic/claude-3-5-sonnet-20240620، اور آپ کی Anthropic API کلید

*وغیرہ

LiteLLM میں تعاون یافتہ ماڈلز کی مکمل فہرست کے لیے، litellm فراہم کنندگان کی دستاویزات دیکھیں۔

In [None]:
from __future__ import annotations

import asyncio

from agents import Agent, Runner, function_tool, set_tracing_disabled
from agents.extensions.models.litellm_model import LitellmModel

@function_tool
def get_weather(city: str):
    print(f"[debug] getting weather for {city}")
    return f"The weather in {city} is sunny."


async def main(model: str, api_key: str):
    agent = Agent(
        name="Assistant",
        instructions="You only respond in haikus.",
        model=LitellmModel(model=model, api_key=api_key),
        tools=[get_weather],
    )

    result = await Runner.run(agent, "What's the weather in Tokyo?")
    print(result.final_output)


if __name__ == "__main__":
    # First try to get model/api key from args
    import argparse

    parser = argparse.ArgumentParser()
    parser.add_argument("--model", type=str, required=False)
    parser.add_argument("--api-key", type=str, required=False)
    args = parser.parse_args()

    model = args.model
    if not model:
        model = input("Enter a model name for Litellm: ")

    api_key = args.api_key
    if not api_key:
        api_key = input("Enter an API key for Litellm: ")

    asyncio.run(main(model, api_key))

Tracking usage data

If you want LiteLLM responses to populate the Agents SDK usage metrics, pass ModelSettings(include_usage=True) when creating your agent.

استعمال کے ڈیٹا کو ٹریک کرنا

اگر آپ چاہتے ہیں کہ LiteLLM جوابات ایجنٹوں کے SDK کے استعمال کے میٹرکس کو آباد کریں تو اپنا ایجنٹ بناتے وقت ModelSettings(include_usage=True) پاس کریں۔

In [None]:
from agents import Agent, ModelSettings
from agents.extensions.models.litellm_model import LitellmModel

agent = Agent(
    name="Assistant",
    model=LitellmModel(model="your/model", api_key="..."),
    model_settings=ModelSettings(include_usage=True),
)

With include_usage=True, LiteLLM requests report token and request counts through result.context_wrapper.usage just like the built-in OpenAI models.

Include_usage=True کے ساتھ، LiteLLM بلٹ ان OpenAI ماڈلز کی طرح result.context_wrapper.usage کے ذریعے رپورٹ ٹوکن اور گنتی کی درخواست کرتا ہے۔