<img src="img/open-ai-logo.png" width=180>

Le API di OpenAI permettono di integrare i modelli linguistici avanzati in applicazioni e servizi.
La Chat Completion API, accessibile attraverso il client `openai`, è una delle più utilizzate e versatili.

La struttura base di una chiamata è composta da:

1. **Inizializzazione**:
```python
client = OpenAI(api_key='your_api_key')
```

2. **Richiesta**:
```python
response = client.chat.completions.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "..."},
        {"role": "user", "content": "..."}
    ]
)
```

I parametri chiave includono:
- `model`: specifica il modello da utilizzare (es. "gpt-3.5-turbo", "gpt-4o-mini", ...)
- `messages`: lista di messaggi che formano il contesto della conversazione
- `temperature`: controlla la creatività delle risposte (0.0-2.0)
- `max_tokens`: limita la lunghezza della risposta

Ogni messaggio nella lista `messages` ha un `role` che può essere:
- `system`: imposta il comportamento generale del modello
- `user`: contiene l'input dell'utente
- `assistant`: contiene le risposte precedenti del modello

La risposta può essere recuperata direttamente con:
```python
response.choices[0].message.content
```

Questa API è particolarmente efficace per:
- Generazione di testo
- Analisi del contenuto
- Conversazioni strutturate
- Assistenza nella programmazione
- Elaborazione del linguaggio naturale

La versione più recente dell'API (openai>=1.0.0) utilizza questa sintassi moderna, che sostituisce la precedente versione con la sintassi `openai.Completion.create()`.

In [1]:
import os
from openai import OpenAI  # pip install openai

In [2]:
# Inizializza il client OpenAI con la tua API key
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

In [3]:
# Crea una chat completion
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Sei un assistente utile e amichevole."},
        {"role": "user", "content": "Qual è la capitale dell'Italia?"}
    ]
)

In [4]:
# Stampa della risposta
print(response.choices[0].message.content)
print("-" * 80)
print(response)

La capitale dell'Italia è Roma.
--------------------------------------------------------------------------------
ChatCompletion(id='chatcmpl-CW2kluHT5girVSRLOxIFO5AdHS3Ot', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content="La capitale dell'Italia è Roma.", refusal=None, role='assistant', annotations=[], audio=None, function_call=None, tool_calls=None))], created=1761753115, model='gpt-4o-mini-2024-07-18', object='chat.completion', service_tier='default', system_fingerprint='fp_560af6e559', usage=CompletionUsage(completion_tokens=8, prompt_tokens=30, total_tokens=38, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=0, audio_tokens=0, reasoning_tokens=0, rejected_prediction_tokens=0), prompt_tokens_details=PromptTokensDetails(audio_tokens=0, cached_tokens=0)))


### Demo utilizzo API OpenAI
------------------------
Creazione di un piccolo assistente per lo sviluppo che può:
* Analizzare il codice e fornire suggerimenti di miglioramento
* Generare test unitari
* Creare documentazione automatica

In [5]:
class CodeHelper:
    def __init__(self):
        self.client = OpenAI(api_key=os.getenv('OPENAI_API_KEY'))

    def get_assistance(self, code: str, task: str) -> str:
        prompts = {
            'review': "Fai una code review di questo codice Python. Evidenzia problemi e suggerisci miglioramenti:\n",
            'test': "Genera test unitari pytest per questo codice:\n",
            'docs': "Genera documentazione in stile Google per questo codice:\n"
        }

        response = self.client.chat.completions.create(
            model="gpt-4o-mini",
            messages=[
                {"role": "system", "content": "Sei un esperto sviluppatore Python."},
                {"role": "user", "content": f"{prompts.get(task, 'Analizza questo codice:')}```python\n{code}\n```"}
            ],
            temperature=0.7
        )

        return response.choices[0].message.content

In [6]:
helper = CodeHelper()

sample_code = """
def calculate_average(numbers):
    return sum(numbers) / len(numbers)
"""

# Ottieni diversi tipi di assistenza
code_review = helper.get_assistance(sample_code, 'review')
unit_tests = helper.get_assistance(sample_code, 'test')
documentation = helper.get_assistance(sample_code, 'docs')

In [7]:
print("code_review\n", "-" * 80, "\n", code_review, "\n\n")
print("unit_tests\n", "-" * 80, "\n", unit_tests, "\n\n")
print("documentation\n", "-" * 80, "\n", documentation, "\n\n")

code_review
 -------------------------------------------------------------------------------- 
 Ecco alcuni suggerimenti per migliorare il codice fornito:

1. **Gestione dell'eccezione ZeroDivisionError**: Attualmente la funzione non gestisce il caso in cui la lista di numeri passata come argomento sia vuota. Se la lista è vuota, si genererà un'eccezione ZeroDivisionError. È consigliabile aggiungere una gestione dell'eccezione per questo caso.

2. **Controllo del tipo di input**: Potresti voler aggiungere una validazione per assicurarti che l'input passato alla funzione sia una lista di numeri. Questo può essere fatto controllando il tipo di input utilizzando `isinstance(numbers, list)` e verificando che tutti gli elementi siano numeri.

3. **Arrotondamento dell'output**: Poiché la divisione potrebbe produrre un numero decimale, potresti voler arrotondare il risultato restituito dalla funzione. Ad esempio, `round(sum(numbers) / len(numbers), 2)` arrotonderebbe il risultato a due cifre 

# <img src="img/ollama.png" width=80> &nbsp; Ollama

Ollama ([https://ollama.com/](https://ollama.com/)) è un server HTTP locale che permette di eseguire modelli linguistici di grandi dimensioni (LLM) sul proprio computer.

Offre un'interfaccia semplice per scaricare, avviare e interagire con diversi modelli open source.

### Comandi principali
(da shell/prompt dei comandi)
- `ollama serve`: Avvia il server Ollama in background, necessario per utilizzare i modelli. Il server resta in ascolto sulla porta 11434 di default.
- `ollama pull <nome_modello>`: Scarica un modello specifico dal registry di Ollama. Ad esempio `ollama pull llama2` scaricherà il modello Llama 2

### Modelli disponibili

Ollama mette a disposizione una libreria di modelli pre-addestrati consultabile all'indirizzo [ollama.com/library](https://ollama.com/library).

Ogni modello ha requisiti hardware differenti in termini di RAM e spazio su disco, specificati nella pagina di dettaglio del modello.

In [8]:
from ollama import chat  # pip install ollama
from ollama import ChatResponse

response: ChatResponse = chat(model='llama3.2', messages=[
  {
    'role': 'user',
    'content': "Cos'è un Large Language Model?",
  },
])
print(response['message']['content'])

print(response.message.content)

Un Large Language Model (LLM) è un tipo di modello di intelligenza artificiale sviluppato utilizzando tecniche di apprendimento automatico per processare e analizzare grandi quantità di dati linguistici. Questi modelli sono progettati per imparare a riconoscere pattern, relazioni e strutture semantiche nella lingua naturale.

Gli LLM possono essere utilizzati per una vasta gamma di applicazioni, tra cui:

1. **Risposta alle domande**: gli LLM possono essere utilizzati per generare risposte ai quesiti e alla richiesta dei dati.
2. **Traduzione linguistica**: gli LLM possono essere utilizzati per tradurre testi da una lingua all'altra.
3. **Generazione di contenuti**: gli LLM possono essere utilizzati per creare nuove storie, articoli e altri tipi di contenuto.
4. **Analisi del linguaggio naturale**: gli LLM possono essere utilizzati per analizzare i dati linguistici per scopi come la sentiment analysis o la classificazione dei testi.

Gli LLM sono progettati in modo da essere capaci di:

# <img src="img/lm-studio-logo.png" width=48> &nbsp; &nbsp; LM Studio

**LM Studio** è un software progettato per eseguire modelli di linguaggio di grandi dimensioni (LLM) localmente sul proprio computer, garantendo privacy e controllo sui dati.

È possibile scaricarlo e installarlo da qui: [https://lmstudio.ai/](https://lmstudio.ai/)

#### Caratteristiche principali:
* Esecuzione locale
* Privacy: consente di utilizzare LLM senza che i dati vengano inviati a server esterni, mantenendo tutte le informazioni localmente
* Interfaccia utente: offre un'interfaccia intuitiva per interagire con i modelli tramite una chat, permettendo conversazioni multi-turno
* Compatibilità con modelli: supporta vari formati di modelli come .gguf, inclusi quelli provenienti da Hugging Face, come Llama, Mistral e Gemma
* Server di inferenza locale: può essere configurato per funzionare come un server HTTP locale, simile all'API di OpenAI, permettendo agli sviluppatori di integrare LLM nelle proprie applicazioni senza dipendere da servizi cloud
* Personalizzazione dei parametri: si possono regolare parametri come temperatura, lunghezza del contesto e penalità di frequenza per ottimizzare le risposte del modello

In [9]:
client = OpenAI(base_url="http://localhost:1234/v1", api_key="lm-studio")  # da notare che usiamo lo stesso connettore usato per i modelli OpenAI in cloud

In [10]:
client.chat.completions.create(
    model="lmstudio-community/Llama-3.2-3B-Instruct-GGUF",
    messages=[
    {"role": "system", "content": "Rispondi con una sola frase. Inizia le risposte con ""Eccomi, sono Gino, """},
    {"role": "user", "content": "Cosa sono gli Embeddings?"}
    ],
    temperature=0.6,
    max_tokens=200
)

ChatCompletion(id='chatcmpl-578kakj16akc2h6wvmxvq', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content=" Eccomi, sono Gino, gli embeddings sono rappresentazioni matematiche che permettono di tradurre dati multivariati in spazi più basici e comprensibili, come ad esempio vettori, utili per applicazioni come la ricerca di somiglianze, l'apprendimento automatico e le reti neurali.", refusal=None, role='assistant', annotations=None, audio=None, function_call=None, tool_calls=[]))], created=1761753214, model='llama-3.2-3b-instruct', object='chat.completion', service_tier=None, system_fingerprint='llama-3.2-3b-instruct', usage=CompletionUsage(completion_tokens=76, prompt_tokens=42, total_tokens=118, completion_tokens_details=None, prompt_tokens_details=None), stats={})

In [11]:
# demo chat con memoria conversazionale

import json

history = [
    {"role": "system", "content": "Act as a Machine Learning expert who inserts a reference to the Data Driven Mindset in every conversation. Always answer in Italian."},
    {"role": "user", "content": "Ciao, come si fanno le lasagne al forno?"},
]

while True:
    completion = client.chat.completions.create(
        model="lmstudio-community/Llama-3.2-3B-Instruct-GGUF",
        messages=history,
        temperature=0.7,
        stream=True,
    )

    new_message = {"role": "assistant", "content": ""}

    for chunk in completion:
        if chunk.choices[0].delta.content:
            print(chunk.choices[0].delta.content, end="", flush=True)
            new_message["content"] += chunk.choices[0].delta.content

    history.append(new_message)

    # sequenze di escape ANSI per modificare il colore del testo nei terminali
    gray_color = "\033[90m"
    reset_color = "\033[0m"

    print(f"{gray_color}\n\n{'-'*20} memoria conversazionale {'-'*20}\n")
    print(json.dumps(history, indent=2))
    print(f"\n{'-'*55}\n\n{reset_color}")

    print()
    history.append({"role": "user", "content": input("> ")})

 Ciao! Per fare le lasagne al forno, bisogna seguire una serie di passaggi che richiedono un certo livello di organizzazione e pianificazione, proprio come la gestione dei dati in modo efficiente è fondamentale per il successo della nostra macchina da calcolatore. Come dicevamo, le lasagne al forno sono un piatto classico italiano che richiede una preparazione dettagliata. Ecco i passaggi da seguire:

1.  Preparare la salsa di pomodoro: inizia con una base solida, come nella gestione dei dati in modo strutturato e organizzato.
2.  Cottura della carne e della verdura: come nella selezione delle feature rilevanti per l'analisi, è fondamentale scegliere le giuste varietà di ingredienti per ottenere un risultato soddisfacente.
3.  Preparazione del composto di lasagne: assicurati che ogni strato sia ben equilibrato, come nella gestione delle variabili di input per il modello di machine learning.
4.  Assemblaggio e cottura delle lasagne: come la iterazione nel processo di apprendimento, è es

KeyboardInterrupt: Interrupted by user