ModelSettings

Settings to use when calling an LLM.

This class holds optional model configuration parameters (e.g. temperature, top_p, penalties, truncation, etc.).

Not all models/providers support all of these parameters, so please check the API documentation for the specific model and provider you are using.

ماڈل سیٹنگز

ایل ایل ایم کو کال کرتے وقت استعمال کرنے کی ترتیبات۔

یہ کلاس اختیاری ماڈل کنفیگریشن پیرامیٹرز رکھتی ہے (جیسے درجہ حرارت، top_p، جرمانے، تراشنا وغیرہ)۔

تمام ماڈلز/فراہم کنندگان ان تمام پیرامیٹرز کو سپورٹ نہیں کرتے ہیں، اس لیے براہ کرم اس مخصوص ماڈل اور فراہم کنندہ کے لیے API دستاویزات کو چیک کریں جسے آپ استعمال کر رہے ہیں۔

In [None]:
@dataclass
class ModelSettings:
    """Settings to use when calling an LLM.

    This class holds optional model configuration parameters (e.g. temperature,
    top_p, penalties, truncation, etc.).

    Not all models/providers support all of these parameters, so please check the API documentation
    for the specific model and provider you are using.
    """

    temperature: float | None = None
    """The temperature to use when calling the model."""

    top_p: float | None = None
    """The top_p to use when calling the model."""

    frequency_penalty: float | None = None
    """The frequency penalty to use when calling the model."""

    presence_penalty: float | None = None
    """The presence penalty to use when calling the model."""

    tool_choice: ToolChoice | None = None
    """The tool choice to use when calling the model."""

    parallel_tool_calls: bool | None = None
    """Controls whether the model can make multiple parallel tool calls in a single turn.
    If not provided (i.e., set to None), this behavior defers to the underlying
    model provider's default. For most current providers (e.g., OpenAI), this typically
    means parallel tool calls are enabled (True).
    Set to True to explicitly enable parallel tool calls, or False to restrict the
    model to at most one tool call per turn.
    """

    truncation: Literal["auto", "disabled"] | None = None
    """The truncation strategy to use when calling the model.
    See [Responses API documentation](https://platform.openai.com/docs/api-reference/responses/create#responses_create-truncation)
    for more details.
    """

    max_tokens: int | None = None
    """The maximum number of output tokens to generate."""

    reasoning: Reasoning | None = None
    """Configuration options for
    [reasoning models](https://platform.openai.com/docs/guides/reasoning).
    """

    verbosity: Literal["low", "medium", "high"] | None = None
    """Constrains the verbosity of the model's response.
    """

    metadata: dict[str, str] | None = None
    """Metadata to include with the model response call."""

    store: bool | None = None
    """Whether to store the generated model response for later retrieval.
    For Responses API: automatically enabled when not specified.
    For Chat Completions API: disabled when not specified."""

    include_usage: bool | None = None
    """Whether to include usage chunk.
    Only available for Chat Completions API."""

    # TODO: revisit ResponseIncludable | str if ResponseIncludable covers more cases
    # We've added str to support missing ones like
    # "web_search_call.action.sources" etc.
    response_include: list[ResponseIncludable | str] | None = None
    """Additional output data to include in the model response.
    [include parameter](https://platform.openai.com/docs/api-reference/responses/create#responses-create-include)"""

    top_logprobs: int | None = None
    """Number of top tokens to return logprobs for. Setting this will
    automatically include ``"message.output_text.logprobs"`` in the response."""

    extra_query: Query | None = None
    """Additional query fields to provide with the request.
    Defaults to None if not provided."""

    extra_body: Body | None = None
    """Additional body fields to provide with the request.
    Defaults to None if not provided."""

    extra_headers: Headers | None = None
    """Additional headers to provide with the request.
    Defaults to None if not provided."""

    extra_args: dict[str, Any] | None = None
    """Arbitrary keyword arguments to pass to the model API call.
    These will be passed directly to the underlying model provider's API.
    Use with caution as not all models support all parameters."""

    def resolve(self, override: ModelSettings | None) -> ModelSettings:
        """Produce a new ModelSettings by overlaying any non-None values from the
        override on top of this instance."""
        if override is None:
            return self

        changes = {
            field.name: getattr(override, field.name)
            for field in fields(self)
            if getattr(override, field.name) is not None
        }

        # Handle extra_args merging specially - merge dictionaries instead of replacing
        if self.extra_args is not None or override.extra_args is not None:
            merged_args = {}
            if self.extra_args:
                merged_args.update(self.extra_args)
            if override.extra_args:
                merged_args.update(override.extra_args)
            changes["extra_args"] = merged_args if merged_args else None

        return replace(self, **changes)

    def to_json_dict(self) -> dict[str, Any]:
        dataclass_dict = dataclasses.asdict(self)

        json_dict: dict[str, Any] = {}

        for field_name, value in dataclass_dict.items():
            if isinstance(value, BaseModel):
                json_dict[field_name] = value.model_dump(mode="json")
            else:
                json_dict[field_name] = value

        return json_dict

Temperature Class-Attribute Instance-Attribute

درجہ حرارت کی کلاس-انتساب مثال-خصوصیت

temperature: float | None = None

The Temperature To Use When Calling The Model.

ماڈل کو کال کرتے وقت استعمال کرنے کا درجہ حرارت۔

Top_P Class-Attribute Instance-Attribute

سرفہرست _ پی کلاس - انتساب مثال- وصف

top_p: float | None = None

The Top_P To Use When Calling The Model.

ماڈل کو کال کرتے وقت استعمال کرنے کے لیے ٹاپ_پی۔

Frequency_penalty Class-Attribute Instance-Attribute

تعدد_جرمانہ کلاس-انتساب مثال- خصوصیت

frequency_penalty: float | None = None

The Frequency Penalty To Use When Calling The Model.

ماڈل کو کال کرتے وقت استعمال کرنے کے لیے تعدد جرمانہ۔

Presence_Penalty Class-Attribute Instance-Attribute

موجودگی_پینلٹی کلاس-انتساب مثال-وصف

presence_penalty: float | None = None

The Presence Penalty To Use when Calling The Model.

ماڈل کو کال کرتے وقت استعمال کرنے کے لیے موجودگی کا جرمانہ۔

Tool_Choice Class-Attribute Instance-Attribute

ٹول_چوائس کلاس - انتساب مثال - خصوصیت

tool_choice: ToolChoice | None = None


The Tool choice To Use When Calling The Model.

ماڈل کو کال کرتے وقت استعمال کرنے کے لیے ٹول کا انتخاب۔

Parallel_Tool_Calls Class-Attribute Instance-Attribute

متوازی_ ٹول _ کلاس کو کال کرتا ہے۔

parallel_tool_calls: bool | None = None

Controls whether the model can make multiple parallel tool calls in a single turn. If not provided (i.e., set to None), this behavior defers to the underlying model provider's default. For most current providers (e.g., OpenAI), this typically means parallel tool calls are enabled (True). Set to True to explicitly enable parallel tool calls, or False to restrict the model to at most one tool call per turn.

کنٹرول کرتا ہے کہ آیا ماڈل ایک ہی موڑ میں متعدد متوازی ٹول کالز کر سکتا ہے۔ اگر فراہم نہیں کیا جاتا ہے (یعنی، کوئی نہیں پر سیٹ کیا جاتا ہے)، تو یہ رویہ بنیادی ماڈل فراہم کنندہ کے ڈیفالٹ سے موخر ہوجاتا ہے۔ زیادہ تر موجودہ فراہم کنندگان (جیسے، OpenAI) کے لیے، اس کا عام طور پر مطلب ہے کہ متوازی ٹول کالز فعال ہیں (True)۔ متوازی ٹول کالز کو واضح طور پر فعال کرنے کے لیے سچ پر سیٹ کریں، یا فی موڑ زیادہ سے زیادہ ایک ٹول کال تک ماڈل کو محدود کرنے کے لیے False پر سیٹ کریں۔

Truncation Class-Attribute Instance-Attribute

ٹرنکیشن کلاس-انتساب مثال-خصوصیت

truncation: Literal['auto', 'disabled'] | None = None

The truncation strategy to use when calling the model. See Responses API documentation for more details.

ماڈل کو کال کرتے وقت استعمال کرنے کے لیے تراشنے کی حکمت عملی۔ مزید تفصیلات کے لیے جوابات API دستاویزات دیکھیں۔

Max_Tokens Class-aAtribute Instance-Attribute

زیادہ سے زیادہ _ ٹوکن کلاس - انتساب مثال - وصف

max_tokens: int | None = None

The Maximum Number Of OutPut Tokens To Generate.

جنریٹ کرنے کے لیے آؤٹ پٹ ٹوکنز کی زیادہ سے زیادہ تعداد۔

Reasoning Class-Attribute Instance-Attribute

ریزننگ کلاس - انتساب مثال - خاصیت

reasoning: Reasoning | None = None

Configuration Options For Reasoning Models.

ریزننگ ماڈلز کے لیے ترتیب کے اختیارات۔

Verbosity Class-Attribute Instance-Attribute

وربوسٹی کلاس - انتساب مثال - وصف

verbosity: Literal['low', 'medium', 'high'] | None = None

Constrains The Verbosity Of The Model's Response.

ماڈل کے جواب کی لفظی صلاحیت کو محدود کرتا ہے۔

Metadata Class-Attribute Instance-Attribute

میٹا ڈیٹا کلاس- انتساب مثال- وصف

metadata: dict[str, str] | None = None

Metadata To Include With The Model Response Call.

ماڈل ریسپانس کال کے ساتھ شامل کرنے کے لیے میٹا ڈیٹا۔

Store Class-Attribute Instance-Attribute

اسٹور کلاس- انتساب مثال - انتساب

store: bool | None = None

Whether to store the generated model response for later retrieval. For Responses API: automatically enabled when not specified. For Chat Completions API: disabled when not specified.

آیا بعد میں بازیافت کے لیے تیار کردہ ماڈل کے جواب کو اسٹور کرنا ہے۔ جوابات API کے لیے: متعین نہ ہونے پر خود بخود فعال ہوجاتا ہے۔ چیٹ کی تکمیل کے لیے A P I : مخصوص نہ ہونے پر غیر فعال۔

Include_Usage Class-Attribute Instance-Attribute

شامل_ استعمال کی کلاس- وصف مثال- وصف

include_usage: bool | None = None

Whether to include usage chunk. Only available for Chat Completions API.

آیا استعمال کا حصہ شامل کرنا ہے۔ صرف چیٹ تکمیل API کے لیے دستیاب ہے۔

Response_Include Class-Attribute Instance-Attribute

جواب_ کلاس- وصف مثال- خصوصیت شامل کریں۔

response_include: list[ResponseIncludable | str] | None = (
    None
)

Additional output data to include in the model response. include parameter

ماڈل کے جواب میں شامل کرنے کے لیے اضافی آؤٹ پٹ ڈیٹا۔ پیرامیٹر شامل کریں

Top_Logprobs Class-Attribute Instance-Attribute

ٹاپ _ لاگ پروبس کلاس - انتساب مثال - انتساب

top_logprobs: int | None = None

Number of top tokens to return logprobs for. Setting this will automatically include "message.output_text.logprobs" in the response.

لاگ پروبس کو واپس کرنے کے لیے ٹاپ ٹوکنز کی تعداد۔ اسے ترتیب دینے سے جواب میں خود بخود "پیغام۔ آؤٹ پٹ _ ٹیکسٹ۔ لاگ پروبس" شامل ہو جائے گا۔

Extra_Query Class-Attribute Instance-Attribute

اضافی _ سوال کی کلاس - خصوصیت مثال - خصوصیت

extra_query: Query | None = None

Additional query fields to provide with the request. Defaults to None if not provided.

درخواست کے ساتھ فراہم کرنے کے لیے اضافی سوال کے فیلڈز۔ اگر فراہم نہ کیا گیا ہو تو ڈیفالٹس کوئی نہیں۔

Extra_Body Class-Attribute Instance-Attribute

اضافی _ باڈی کلاس- وصف مثال- وصف

extra_body: Body | None = None

Additional body fields to provide with the request. Defaults to None if not provided.

درخواست کے ساتھ فراہم کرنے کے لیے اضافی باڈی فیلڈز۔ اگر فراہم نہ کیا گیا ہو تو ڈیفالٹس کوئی نہیں۔

Extra_Headers Class-Attribute Instance-Attribute

اضافی _ ہیڈر کلاس - انتساب کی مثال - خصوصیت

extra_headers: Headers | None = None

Additional headers to provide with the request. Defaults to None if not provided.

درخواست کے ساتھ فراہم کرنے کے لیے اضافی ہیڈرز۔ اگر فراہم نہ کیا گیا ہو تو ڈیفالٹس کوئی نہیں۔

Extra_Args Class-Attribute Instance-Attribute

اضافی _ A r g s کلاس - انتساب مثال - وصف

extra_args: dict[str, Any] | None = None

Arbitrary keyword arguments to pass to the model API call. These will be passed directly to the underlying model provider's API. Use with caution as not all models support all parameters.

ماڈل API کال کو منتقل کرنے کے لیے صوابدیدی مطلوبہ الفاظ کے دلائل۔ یہ براہ راست بنیادی ماڈل فراہم کنندہ کے API کو بھیجے جائیں گے۔ احتیاط کے ساتھ استعمال کریں کیونکہ تمام ماڈل تمام پیرامیٹرز کی حمایت نہیں کرتے ہیں۔

Resolve / حل کریں۔

resolve(override: ModelSettings | None) -> ModelSettings

Produce a new ModelSettings by overlaying any non-None values from the override on top of this instance.

اس مثال کے اوپر اوور رائڈ سے کسی بھی غیر کوئی بھی قدر کو اوورلے کرکے ایک نئی ماڈل سیٹنگ تیار کریں۔