## Importa le librerie necessarie
Importa le librerie PyTorch e transformers necessarie per caricare e utilizzare il modello Phi-4.


In [None]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

## Imposta il Seed Casuale
Imposta il seed casuale per garantire risultati riproducibili tra diverse esecuzioni.


In [None]:
torch.random.manual_seed(0)

## Caricare il modello Phi-4-mini-flash-reasoning e il tokenizer
Carica il modello Microsoft Phi-4-mini-flash-reasoning e il relativo tokenizer da Hugging Face. Il modello verrà caricato su CUDA per un'inferenza più veloce.


In [None]:
model_id = "microsoft/Phi-4-mini-flash-reasoning"
model = AutoModelForCausalLM.from_pretrained(
   model_id,
   device_map="cuda",
   torch_dtype="auto",
   trust_remote_code=True,
)
tokenizer = AutoTokenizer.from_pretrained(model_id)

## Preparare il Messaggio di Input
Crea un messaggio di conversazione con un problema matematico relativo a un'equazione quadratica e formattalo utilizzando il modello di chat.


In [None]:
messages = [{
   "role": "user",
   "content": "How to solve 3*x^2+4*x+5=1?"
}]   
inputs = tokenizer.apply_chat_template(
   messages,
   add_generation_prompt=True,
   return_dict=True,
   return_tensors="pt",
)

## Genera Risposta
Genera una risposta dal modello utilizzando parametri specifici come temperatura e top_p per controllare la casualità nell'output.


In [None]:
outputs = model.generate(
   **inputs.to(model.device),
   max_new_tokens=32768,
   temperature=0.6,
   top_p=0.95,
   do_sample=True,
)

## Decodifica dell'Output in Testo
Converti le sequenze di token generate in testo leggibile, escludendo i token di input originali per mostrare solo la risposta del modello.


In [None]:
outputs = tokenizer.batch_decode(outputs[:, inputs["input_ids"].shape[-1]:])


---

**Disclaimer**:  
Questo documento è stato tradotto utilizzando il servizio di traduzione automatica [Co-op Translator](https://github.com/Azure/co-op-translator). Sebbene ci impegniamo per garantire l'accuratezza, si prega di notare che le traduzioni automatiche possono contenere errori o imprecisioni. Il documento originale nella sua lingua nativa dovrebbe essere considerato la fonte autorevole. Per informazioni critiche, si raccomanda una traduzione professionale effettuata da un esperto umano. Non siamo responsabili per eventuali fraintendimenti o interpretazioni errate derivanti dall'uso di questa traduzione.
