# Phi-4 Mini ONNX P√°rhuzamos Funkci√≥h√≠v√°s Oktat√≥anyag

Ez a jegyzet bemutatja, hogyan haszn√°lhat√≥ a Phi-4 Mini az ONNX Runtime GenAI-val p√°rhuzamos funkci√≥h√≠v√°sokhoz. A funkci√≥h√≠v√°s lehet≈ëv√© teszi, hogy a modell intelligensen k√ºls≈ë eszk√∂z√∂ket √©s API-kat h√≠vjon meg a felhaszn√°l√≥i k√©r√©sek alapj√°n.

## √Åttekint√©s

Ebben az oktat√≥anyagban megtanulhatod:
- Hogyan √°ll√≠tsd be a Phi-4 Mini-t az ONNX Runtime GenAI-val
- Hogyan defini√°lj funkci√≥s√©m√°kat rep√ºl≈ëjegyek √©s sz√°llod√°k foglal√°s√°hoz
- Hogyan haszn√°ld a Lark nyelvtant ir√°ny√≠tott gener√°l√°shoz struktur√°lt kimenet √©rdek√©ben
- Hogyan hajts v√©gre p√°rhuzamos funkci√≥h√≠v√°sokat √∂sszetett utaz√°si foglal√°si forgat√≥k√∂nyvekhez

## El≈ëfelt√©telek

Miel≈ëtt futtatn√°d ezt a jegyzetet, gy≈ëz≈ëdj meg r√≥la, hogy:
- Let√∂lt√∂tted a Phi-4 Mini ONNX modellt
- Telep√≠tetted az `onnxruntime-genai` csomagot
- Alapvet≈ë ismeretekkel rendelkezel a funkci√≥h√≠v√°s fogalm√°r√≥l


## 1. l√©p√©s: Sz√ºks√©ges k√∂nyvt√°rak import√°l√°sa

El≈ësz√∂r import√°ljuk a sz√ºks√©ges k√∂nyvt√°rakat a f√ºggv√©nyh√≠v√°s megval√≥s√≠t√°s√°hoz.


In [1]:
import json

In [2]:
import onnxruntime_genai as og

## 2. l√©p√©s: Modell be√°ll√≠t√°sa √©s konfigur√°l√°sa

Most be√°ll√≠tjuk a Phi-4 Mini ONNX modellt. √úgyelj arra, hogy a megadott √∫tvonalat cser√©ld ki a saj√°t modellk√∂nyvt√°rad el√©r√©si √∫tj√°ra.


In [None]:
# TODO: Replace with your actual Phi-4 Mini ONNX model path
# Download from: https://huggingface.co/microsoft/Phi-4-mini-onnx
path = 'Your phi-4-mini-onnx path'  # Update this path!

In [4]:
config = og.Config(path)

In [5]:
model = og.Model(config)

In [6]:
tokenizer = og.Tokenizer(model)
tokenizer_stream = tokenizer.create_stream()

## 3. l√©p√©s: A gener√°l√°si param√©terek be√°ll√≠t√°sa

√Åll√≠tsd be a gener√°l√°si param√©tereket, hogy szab√°lyozd a modell kimeneti viselked√©s√©t. Ezek a be√°ll√≠t√°sok biztos√≠tj√°k a determinisztikus √©s c√©lzott v√°laszokat a f√ºggv√©nyh√≠v√°sokhoz.


In [7]:
# Configure generation parameters for deterministic function calling
search_options = {}
search_options['max_length'] = 4096      # Maximum tokens to generate
search_options['temperature'] = 0.00001  # Very low temperature for deterministic output
search_options['top_p'] = 1.0            # Nucleus sampling parameter
search_options['do_sample'] = False       # Disable sampling for consistent results

## 4. l√©p√©s: El√©rhet≈ë funkci√≥k meghat√°roz√°sa

Itt hat√°rozzuk meg azokat a funkci√≥kat, amelyeket AI asszisztens√ºnk haszn√°lhat. Ebben a p√©ld√°ban k√©t utaz√°ssal kapcsolatos funkci√≥t defini√°lunk:
1. **booking_flight_tickets**: Rep√ºl≈ëjegyek foglal√°sa rep√ºl≈ëterek k√∂z√∂tt
2. **booking_hotels**: Sz√°llodai sz√°ll√°sfoglal√°s

A funkci√≥defin√≠ci√≥k az OpenAI funkci√≥h√≠v√°si s√©ma form√°tum√°t k√∂vetik.


In [8]:
tool_list = '[{"name": "booking_flight_tickets", "description": "booking flights", "parameters": {"origin_airport_code": {"description": "The name of Departure airport code", "type": "string"}, "destination_airport_code": {"description": "The name of Destination airport code", "type": "string"}, "departure_date": {"description": "The date of outbound flight", "type": "string"}, "return_date": {"description": "The date of return flight", "type": "string"}}}, {"name": "booking_hotels", "description": "booking hotel", "parameters": {"destination": {"description": "The name of the city", "type": "string"}, "check_in_date": {"description": "The date of check in", "type": "string"}, "checkout_date": {"description": "The date of check out", "type": "string"}}}]'

## 5. l√©p√©s: Nyelvtan-gener√°l√≥ seg√©df√ºggv√©nyek

Ezek a seg√©df√ºggv√©nyek a f√ºggv√©nydefin√≠ci√≥inkat Lark nyelvtan form√°tumba alak√≠tj√°k, amelyet az ONNX Runtime GenAI haszn√°l az ir√°ny√≠tott gener√°l√°shoz. Ez biztos√≠tja, hogy a modell √©rv√©nyes f√ºggv√©nyh√≠v√°sokat adjon vissza a megfelel≈ë JSON form√°tumban.


In [9]:
def get_lark_grammar(input_tools):
    tools_list = get_tools_list(input_tools)
    prompt_tool_input = create_prompt_tool_input(tools_list)
    if len(tools_list) == 1:
        # output = ("start: TEXT | fun_call\n" "TEXT: /[^{](.|\\n)*/\n" " fun_call: <|tool_call|> %json " + json.dumps(tools_list[0]))
        output = ("start: TEXT | fun_call\n" "TEXT: /[^{](.|\\n)*/\n" " fun_call: <|tool_call|> %json " + json.dumps(convert_tool_to_grammar_input(tools_list[0])))
        return prompt_tool_input, output
    else:
        return prompt_tool_input, "start: TEXT | fun_call \n TEXT: /[^{](.|\n)*/ \n fun_call: <|tool_call|> %json {\"anyOf\": [" + ','.join([json.dumps(tool) for tool in tools_list]) + "]}"


In [10]:
def get_tools_list(input_tools):
    # input_tools format: '[{"name": "fn1", "description": "fn details", "parameters": {"p1": {"description": "details", "type": "string"}}},
    # {"fn2": 2},{"fn3": 3}]'
    tools_list = []
    try:
        tools_list = json.loads(input_tools)
    except json.JSONDecodeError:
        raise ValueError("Invalid JSON format for tools list, expected format: '[{\"name\": \"fn1\"},{\"name\": \"fn2\"}]'")
    if len(tools_list) == 0:
        raise ValueError("Tools list cannot be empty")
    return tools_list

In [11]:
def create_prompt_tool_input(tools_list):
    tool_input = str(tools_list[0])
    for tool in tools_list[1:]:
        tool_input += ',' + str(tool)
    return tool_input

In [12]:
def convert_tool_to_grammar_input(tool):
    param_props = {}
    required_params = []
    for param_name, param_info in tool.get("parameters", {}).items():
        param_props[param_name] = {
            "type": param_info.get("type", "string"),
            "description": param_info.get("description", "")
        }
        required_params.append(param_name)
    output_schema = {
        "description": tool.get('description', ''),
        "type": "object",
        "required": ["name", "parameters"],
        "additionalProperties": False,
        "properties": {
            "name": { "const": tool["name"] },
            "parameters": {
                "type": "object",
                "properties": param_props,
                "required": required_params,
                "additionalProperties": False
            }
        }
    }
    if len(param_props) == 0:
        output_schema["required"] = ["name"]
    return output_schema

In [13]:
get_lark_grammar(tool_list)

("{'name': 'booking_flight_tickets', 'description': 'booking flights', 'parameters': {'origin_airport_code': {'description': 'The name of Departure airport code', 'type': 'string'}, 'destination_airport_code': {'description': 'The name of Destination airport code', 'type': 'string'}, 'departure_date': {'description': 'The date of outbound flight', 'type': 'string'}, 'return_date': {'description': 'The date of return flight', 'type': 'string'}}},{'name': 'booking_hotels', 'description': 'booking hotel', 'parameters': {'destination': {'description': 'The name of the city', 'type': 'string'}, 'check_in_date': {'description': 'The date of check in', 'type': 'string'}, 'checkout_date': {'description': 'The date of check out', 'type': 'string'}}}",
 'start: TEXT | fun_call \n TEXT: /[^{](.|\n)*/ \n fun_call: <|tool_call|> %json {"anyOf": [{"name": "booking_flight_tickets", "description": "booking flights", "parameters": {"origin_airport_code": {"description": "The name of Departure airport c

## 6. l√©p√©s: A nyelvtan gener√°l√°s tesztel√©se

Tesztelj√ºk a nyelvtan gener√°l√≥ funkci√≥inkat, hogy l√°ssuk, hogyan alak√≠tj√°k √°t az eszk√∂zdefin√≠ci√≥inkat a megfelel≈ë form√°tumba.


In [14]:
prompt_tool_input, guidance_input = get_lark_grammar(tool_list)

## 7. l√©p√©s: Rendszerprompt √©s gener√°tor el≈ëk√©sz√≠t√©se

Most elk√©sz√≠tj√ºk azt a rendszerpromptot, amely t√°j√©koztatja a modellt az el√©rhet≈ë eszk√∂z√∂kr≈ël, √©s be√°ll√≠tjuk a gener√°tort az ir√°ny√≠tott gener√°l√°si param√©terekkel.


In [15]:
# Define the system prompt that introduces the assistant and its capabilities
system_prompt = "You are a helpful assistant with these tools."

In [16]:
# Format the system message with tools information
messages = f"""[{{"role": "system", "content": "{system_prompt}", "tools": "{prompt_tool_input}"}}]"""

In [17]:
# Apply chat template to format the system prompt properly
tokenizer_input_system_prompt = tokenizer.apply_chat_template(messages=messages, add_generation_prompt=False)

In [18]:
tokenizer_input_system_prompt

"<|system|>You are a helpful assistant with these tools.<|tool|>{'name': 'booking_flight_tickets', 'description': 'booking flights', 'parameters': {'origin_airport_code': {'description': 'The name of Departure airport code', 'type': 'string'}, 'destination_airport_code': {'description': 'The name of Destination airport code', 'type': 'string'}, 'departure_date': {'description': 'The date of outbound flight', 'type': 'string'}, 'return_date': {'description': 'The date of return flight', 'type': 'string'}}},{'name': 'booking_hotels', 'description': 'booking hotel', 'parameters': {'destination': {'description': 'The name of the city', 'type': 'string'}, 'check_in_date': {'description': 'The date of check in', 'type': 'string'}, 'checkout_date': {'description': 'The date of check out', 'type': 'string'}}}<|/tool|><|end|><|endoftext|>"

In [19]:
input_tokens = tokenizer.encode(tokenizer_input_system_prompt)

In [20]:
input_tokens = input_tokens[:-1]

In [21]:
system_prompt_length = len(input_tokens)

## 8. l√©p√©s: Gener√°tor inicializ√°l√°sa ir√°ny√≠tott gener√°l√°ssal

Most l√©trehozzuk a gener√°tort az √°ltalunk be√°ll√≠tott param√©terekkel, √©s alkalmazzuk a Lark nyelvtant az ir√°ny√≠tott gener√°l√°shoz.


In [22]:
# Create generator parameters and apply search options
params = og.GeneratorParams(model)
params.set_search_options(**search_options)

In [23]:
# Apply Lark grammar for guided generation to ensure valid function call format
params.set_guidance("lark_grammar", guidance_input)

In [24]:
generator = og.Generator(model, params)

In [25]:
generator.append_tokens(input_tokens)

## 9. l√©p√©s: P√°rhuzamos f√ºggv√©nyh√≠v√°sok tesztel√©se

Most tesztelj√ºk a be√°ll√≠t√°sunkat egy √∂sszetett utaz√°si foglal√°si helyzetben, amely t√∂bb f√ºggv√©ny h√≠v√°s√°t ig√©nyli.


In [26]:
# Complex travel booking request that requires both flight and hotel booking
text = "book flight ticket from Beijing to Paris(using airport code) in 2025-12-04 to 2025-12-10 , then book hotel from 2025-12-04 to 2025-12-10 in Paris"

In [27]:
# Format user message and apply chat template
messages = f"""[{{"role": "user", "content": "{text}"}}]"""

# Apply Chat Template for user input
user_prompt = tokenizer.apply_chat_template(messages=messages, add_generation_prompt=True)
input_tokens = tokenizer.encode(user_prompt)
generator.append_tokens(input_tokens)

In [28]:
user_prompt

'<|user|>book flight ticket from Beijing to Paris(using airport code) in 2025-12-04 to 2025-12-10 , then book hotel from 2025-12-04 to 2025-12-10 in Paris<|end|><|assistant|>'

### Funkci√≥h√≠v√°sok gener√°l√°sa

A modell most struktur√°lt funkci√≥h√≠v√°sokat fog gener√°lni a felhaszn√°l√≥i k√©r√©s alapj√°n. Az ir√°ny√≠tott gener√°l√°snak k√∂sz√∂nhet≈ëen a kimenet √©rv√©nyes JSON form√°tumban lesz, amely k√∂zvetlen√ºl v√©grehajthat√≥.

**V√°rhat√≥ kimenet**: A modellnek a k√∂vetkez≈ë funkci√≥h√≠v√°sokat kell gener√°lnia:
1. `booking_flight_tickets` Peking (PEK) √©s P√°rizs (CDG) k√∂z√∂tti r√©szletekkel
2. `booking_hotels` P√°rizsi sz√°ll√°s r√©szletekkel

Futtassa az al√°bbi cell√°t az √©l≈ë gener√°l√°s megtekint√©s√©hez:


In [29]:
# Generate tokens one by one and stream the output
while not generator.is_done():
    generator.generate_next_token()
    new_token = generator.get_next_tokens()[0]
    print(tokenizer_stream.decode(new_token), end='', flush=True)

[{"name": "booking_flight_tickets", "arguments": {"origin_airport_code": "PEKK", "destination_airport_code": "CDG", "departure_date": "2025-12-04", "return_date": "2025-12-10"}}, {"name": "booking_hotels", "arguments": {"destination": "Paris", "check_in_date": "2025-12-04", "checkout_date": "2025-12-10"}}]

## K√∂vetkeztet√©s

üéâ **Gratul√°lunk!** Sikeresen megval√≥s√≠tottad a p√°rhuzamos f√ºggv√©nyh√≠v√°st Phi-4 Mini seg√≠ts√©g√©vel az ONNX Runtime GenAI haszn√°lat√°val.

### Amit megtanult√°l:

1. **Modell be√°ll√≠t√°sa**: Hogyan konfigur√°ld a Phi-4 Mini modellt az ONNX Runtime GenAI-val
2. **F√ºggv√©nyek defini√°l√°sa**: Hogyan hat√°rozd meg a f√ºggv√©nyek s√©m√°it AI f√ºggv√©nyh√≠v√°sokhoz
3. **Ir√°ny√≠tott gener√°l√°s**: Hogyan haszn√°ld a Lark grammatik√°t struktur√°lt kimenet gener√°l√°s√°hoz
4. **P√°rhuzamos f√ºggv√©nyh√≠v√°sok**: Hogyan kezeld az √∂sszetett k√©r√©seket, amelyek t√∂bb f√ºggv√©nyh√≠v√°st ig√©nyelnek

### F≈ë el≈ëny√∂k:

- ‚úÖ **Struktur√°lt kimenet**: Az ir√°ny√≠tott gener√°l√°s biztos√≠tja az √©rv√©nyes JSON f√ºggv√©nyh√≠v√°sokat
- ‚úÖ **P√°rhuzamos feldolgoz√°s**: T√∂bb f√ºggv√©nyh√≠v√°s kezel√©se egyetlen k√©r√©sben
- ‚úÖ **Magas teljes√≠tm√©ny**: Az ONNX Runtime optimaliz√°lt k√∂vetkeztet√©st biztos√≠t
- ‚úÖ **Rugalmas s√©ma**: K√∂nnyen hozz√°adhat√≥ vagy m√≥dos√≠that√≥ f√ºggv√©nydefin√≠ci√≥k

### Forr√°sok:

- [Phi-4 Mini Dokument√°ci√≥](https://huggingface.co/microsoft/Phi-4-mini-onnx)
- [ONNX Runtime GenAI Dokument√°ci√≥](https://onnxruntime.ai/docs/genai/)
- [F√ºggv√©nyh√≠v√°si legjobb gyakorlatok](https://platform.openai.com/docs/guides/function-calling)



---

**Felel≈ëss√©gkiz√°r√°s**:  
Ez a dokumentum az [Co-op Translator](https://github.com/Azure/co-op-translator) AI ford√≠t√°si szolg√°ltat√°s seg√≠ts√©g√©vel lett leford√≠tva. B√°r t√∂reksz√ºnk a pontoss√°gra, k√©rj√ºk, vegye figyelembe, hogy az automatikus ford√≠t√°sok hib√°kat vagy pontatlans√°gokat tartalmazhatnak. Az eredeti dokumentum az eredeti nyelv√©n tekintend≈ë hiteles forr√°snak. Kritikus inform√°ci√≥k eset√©n javasolt professzion√°lis, emberi ford√≠t√°st ig√©nybe venni. Nem v√°llalunk felel≈ëss√©get a ford√≠t√°s haszn√°lat√°b√≥l ered≈ë f√©lre√©rt√©sek√©rt vagy t√©ves √©rtelmez√©sek√©rt.
