# **Setup**

### Conda-Forge

- **Installazione**

https://conda-forge.org/

In caso non si volesse avere l'enviroment già attivato nel terminale:
```bash
conda config --set auto_activate_base false
```

- **Creazione nuovo enviroment**

    ```bash
    conda create --name llm_env python=3.10
    ```

- **Attivazione enviroment**

    ```bash
    conda activate llama_env
    ```

- **Disattivazione enviroment**

    ```bash
    conda deactivate llama_env
    ```

### Installazione dipendenze progetto

- **pip**

    ```bash
    conda install pip
    ```


- **[Llama Index](https://www.llamaindex.ai/)**

    ```bash
    pip install llama-index
    ```

    ```bash
    pip install llama-index-llms-ollama

    ```


- **[Gradio](https://www.gradio.app/)**
    ```bash
    pip install gradio
    ```

## [Ollama](https://ollama.com/)

### Install models

```bash
ollama pull <model:version>
```

**Models**

```bash
ollama pull llama3.1:8b
```

```bash
ollama pull llama3.2:3b
```

```bash
# versione da usare per le lezioni
ollama pull llama3.2:1b
```

```bash
ollama pull llama3.1:8b-instruct-q4_0
```

### Run models

```bash
ollama run <model:version>
```


```bash
ollama serve <model:version>
```

### Remove models

```bash
ollama rm <model:version>
```

## **Simple Chat**

https://docs.llamaindex.ai/en/stable/api_reference/llms/ollama/

In [1]:
from llama_index.llms.ollama import Ollama

In [8]:
SIMPLE_CHAT_TEMPLATE = """Question: {question}"""

def simple_chat(question: str = "", temperature: float = 0., top_p: float = 0.):
    """
    Args:

        @ question (string): passa il testo immesso da un utente al modell.

        @ temperature (float): incide sulla capacità di un llm di scegliere l
                               la successione di parole.

    Return:
       @ (string): risposta del modello linguistico.
    """



    model = Ollama(model="llama3.2:1b", 
                   temperature=temperature,
                   top_p=top_p)


    return model.complete(question)

## **Introduzione al Prompt Engineering**

Il Prompt Engineering consiste nella progettazione di testi specializzati (prompt) finalizzati a guidare i modelli di machine learning nella produzione di output accurati.
Ogni risultato può essere condizionato da un prompt sulla base della loro lunghezza, struttura, ordine e rilevanza ai fini  dell'attività da svolgere.

Volendo fare un elenco delle potenziali attività in cui viene impiegato:
1. traduzioni
2. gestione delle informazioni
3. assistenza vocale
4. generazione di codice
5. sintesi di testi


### Parole Chiave

Gli llm come ChatGpt sono particolarmente reattivi all'uso di alcune paore chiave.


|          |            |           |             |            |
|:---:     |:---:       |:---:      |:---:        |:---:       |
| Genera   | Sintetizza | Traduci   | Classifica  | Identifica |
| Descrivi | Predici    | Consiglia | Analizza    | Valuta     |
| Compara  | Contrasta  | Elenca    | Definisci   | Spiega     |
| Estrai   | Trova      | Misura    | Categorizza | Seleziona  |
| Ordina   | Recupera   | Raggruppa | Riconosci   | Organizza  |

### Parametrizzazione

Ogni llm si fonda sulla costruzione di una rete neurale. Questo complesso sistema matematcio non è direttamewnte accessibile in un modello pre-addestrato. Tuttavia è sempre possibile intervenire su alcuni parametri, in modo da influenzarne l'output.

**Temperatura:** Determina il grado di casualità nel modo in cui un llm sceglie la successione di token.
Più bassa è la temperatura, più deterministici sono i risultati. Mentre valori più alti (il range va da 0 a 1), aumentano la probabilità di avere composizioni di parole sempre diverse.
Ne consegue che: per la generazione di documentazione è meglio avere una temperatura prossima allo zero. Invece se vogliamo ottenere testi più "creativi", conviene avere valori più vicini al massimo consentito.

**Top_p:** Tecnica chiamata anche campionamento del nucleo.
Se la temperatura sceglie la casalità con cui viene scelto il prosismo token,  questo metodo modifica la selezione dinamica del numero di parole da considerare per ogni fase delle previsioni del modello.
Valori bassi portano a risultati più sicuri e più mirati. Valori più alti, permettono una selezione più ampia di parole, portando a risultati più diversificati.

In [12]:
response = simple_chat("the rose is a flower", temperature=0., top_p=0.)
print(response)

The rose is indeed a beautiful and iconic flower. It's one of the most recognizable and beloved flowers in the world, known for its stunning appearance, delicate scent, and rich history. Roses have been cultivated for thousands of years, with evidence of their existence dating back to ancient civilizations in Egypt, Greece, and Rome.

Roses come in a wide range of colors, each with its own unique characteristics and meanings. Red roses are often associated with love and romance, while pink roses symbolize appreciation and gratitude. White roses represent purity and innocence, while yellow roses signify friendship and joy.

In addition to their beauty, roses have also played an important role in various cultures and traditions. In ancient Greece, roses were considered a symbol of Aphrodite, the goddess of love. In Victorian England, roses were used as a symbol of love and devotion during the era of Queen Victoria.

Today, roses are still widely cultivated and enjoyed around the world, w

In [13]:
print(simple_chat(f"translate in italian: {response}"))

Ecco la traduzione in italiano:

La rosa è effettivamente una bellissima e iconica fiora. È uno dei più riconoscibili e amati fiori del mondo, noto per la sua impressionante apparizione, il suo profumo delicato e la sua storia ricca. Le rose sono state coltivate per migliaia di anni, con prove storiche dell'esistenza che risalgono alle antiche civiltà egizie, greche e rome.

Le rose vengono in diverse colori, ciascuno con le sue caratteristiche uniche e significati. Le rose rosse sono spesso associate alla passione e all'amore, mentre le rose rosse simboleggiano l'apprezzamento e la gratitudine. Le rose bianche rappresentano purezza e innocenza, mentre le rose gialle significano amicizia e gioia.

Inoltre, le rose hanno anche avuto un ruolo importante in molte culture e tradizioni. In Grecia antica, le rose erano considerate una simbologia dell'Afrodite, la dea della passione. In Inghilterra vittoriana, le rose furono utilizzate come simbolo di amore e dedizione durante l'epoca di Regi

Dall'esempio è evidente come un llm tenda sempre a completare il testo con una serie di parole cha hanno senso in base al contsto definito dal prompt.
Minore è il numero di dettagli nel contenuto del testo, più grande sarà l'insieme di completamenti possibili.

In [16]:
print(simple_chat("Completa la frase: la rosa è un fiore ", temperature=1., top_p=1.))

con forma de fiore e colori dolci, una delle più belle e simboliche del mondo, rappresenta l'amore.


In [17]:
print(simple_chat("Completa la frase con una spiegazione scientifca: la rosa è un fiore ", temperature=0., top_p=0.))

La rosa è un fiore composto da diverse parti che lavorano insieme per produrre i fiori. Ecco una spiegazione scientifica:

* La pianta rosa (Rosa spp.) è un albero erbaceo che produce fiori, foglie e frutta.
* I fiori della rosa sono composti da petali, centrotipici e estremi. I petali sono le parti più grandi e sono disposti in cerchi circumpuntari intorno all'asse centrale del fiore.
* I centrotipici sono le parti centrali dei petali, che si trovano tra i due poli di petali. Sono responsabili della formazione della pianta e dell'individuazione delle piante.
* I estremi dei petali sono le parti più piccole e sono disposti in cerchi circumpuntari intorno all'asse centrale del fiore. Sono responsabili della produzione di olio essenziale e di altri composti chimici.

La rosa è un fiore diofilo, cioè che produce i fiori attraverso una serie di processi biologici complessi. Ecco uno dei principali processi:

* La pianta rosa inizia a produrre i fiori quando la temperatura del clima è suffi

### Componenti di un Prompt

Come i linguaggi di programmazione hanno costrutti deputati ad astrarre determinati paradigmi, così il prompt engineering ha dei componenti finalizzati a sintetizzare le varie tipologie di istruzione.

- **SYSTEM**: L'insieme delle parti di prompt.

- **PROMPT GUARD**: Un'istruzione da inserire come prima istruzione per limitare le risposte del modello.

- **CONTEXT**: Serve ad indirizzare il modello e contine l'insieme di informazioni utili a restringere e definire lo spazio all'interno del quale vengono selezionati i token.

- **INSTRUCTION**: Indica il compito specifico che il modello deve seguire. In generale riguarda una ***keyword*** da inserire ad inizio prompt e che determina la finalità stessa di tutto il prompt.


- **INPUT**: La frase immessa dall'utente su cui orientare l'output. Può esserlo ad esempio, una domanda per cui si vuole ottenere una risposta più o meno precisa.


- **OUTPUT**: Definisce il modo in cui il modello deve restituire l'output.

Ogni Language Model ha il suo ***manuale di stile***

- [OpenAi](https://www.llama.com/docs/how-to-guides/prompting/)

- [LLama](https://www.llama.com/docs/how-to-guides/prompting/)

| N.B: In generale l'inglese è il linguaggio che performa meglio nel prompt engineering.