# **Generative AI**

La *Generative AI* si riferisce a quegli algoritmi di intelligenza artificiale capaci di generare nuovi contenuti a partire da dati esistenti.

I *Large Language Model* (LLM) sono un sottoinsieme della Generative AI specializzati nella generazione e comprensione del linguaggio natuale.

## **Struttura di una Gen AI**

* *Modelli Open*: accessibili al pubblico e possono essere utilizzati o modificati liberamente.

* *Third-Party*: sviluppati e gestiti da organizzazioni che possono imporre restrizione sull'uso.

* *Input Types*: formato di dati che il modello può accettare.

* *Dimensions*: dimensione del modello in termini di numero di parametri o larghezza dei layers.

* *Agents*: componenti software che interagiscono con il modello per eseguire compiti specifici.

* *Istruct*: istruzioni specifiche nell'elaborazione di risposte

* *Fine-Tuning*: processo di addestramento di un modello pre-addestrato su un dataset specifico per migliorare le prestazioni in compiti specifici.

* *Quantized Models*: modelli quantizzati utilizzano una precisione inferiore per i calcoli, permettendo di ridurre l'uso della memoria e migliorare le prestazioni di inferenza.

* *Prompting*: processo di formulazione di domande o comandi al modelli in modo che generi le risposte desiderate; principalmente servono:
    - funzione
    - esempio
    - contesto

- `load_model_and_tokenizer`

## **Retrieval-Augumented Generation (RAG)**

La *RAG* è un framework che combina modelli di generazione del linguaggio con tecniche di recupero delle informazioni. Questo approccio permette di generare risposte più pertinenti e contestualizzate, principalmente per rispondere a domande o di fornire informazioni dettagliate su argomenti specifici.

La RAG combina due approcci fondamentali:

* *Retrieval* (Recupero di informazioni): questo passaggio comporta il recupero di informazioni rilevanti da una base di conoscenza o da un insieme di documenti preesistenti. Viene utilizzato un modello di "retrieval" per trovare documenti o parti di testi rilevanti in risposta a una determinata domanda o input.

* *Augmented Generation* (Generazione aumentata): dopo aver recuperato le informazioni, queste vengono integrate dal modello di generazione di linguaggio, che utilizza le informazioni ottenute per creare una risposta più accurata e contestualizzata.

Componenti della RAG:

* *Hugging Face Transformers*: framework opensource per il processamento del linguaggio naturale.

* *Tokenizer*: converte il testo in una sequenza di token (parole o sotto-parole) che possono essere eleborati dal modello.

* *Retriever*: modulo che cerca documenti o informazioni rilevanti basati sull'input fornito.

* `RagTokenizer.from_pretrained`: carica un tokenizer pre-addestrato per la tokenizzazione del testo di input

* `RagSequenceForGeneration.from_pretrained`: carica un modello di generazione del linguaggio pre-addestrato

* `tokenizer(input_text, return_tensors="pt")`

### 1.Caricamento del Tokenizer, Retriever e Modello di Generazione

In [1]:
from transformers import RagTokenizer, RagRetriever, RagSequenceForGeneration

In [2]:
# Carica il tokenizer, il retriever e il modello di generazione
tokenizer=RagTokenizer.from_pretrained("facebook/rag-token-nq")
retriever=RagRetriever.from_pretrained("facebook/rag-token-nq", index_name="exact", use_dummy_dataset=True, trust_remote_code=True)
model=RagSequenceForGeneration.from_pretrained("facebook/rag-token-nq")

The tokenizer class you load from this checkpoint is not the same type as the class this function is called from. It may result in unexpected tokenization. 
The tokenizer class you load from this checkpoint is 'RagTokenizer'. 
The class this function is called from is 'DPRQuestionEncoderTokenizer'.
The tokenizer class you load from this checkpoint is not the same type as the class this function is called from. It may result in unexpected tokenization. 
The tokenizer class you load from this checkpoint is 'RagTokenizer'. 
The class this function is called from is 'DPRQuestionEncoderTokenizerFast'.
The tokenizer class you load from this checkpoint is not the same type as the class this function is called from. It may result in unexpected tokenization. 
The tokenizer class you load from this checkpoint is 'RagTokenizer'. 
The class this function is called from is 'BartTokenizer'.
The tokenizer class you load from this checkpoint is not the same type as the class this function is called fr

ValueError: The repository for wiki_dpr contains custom code which must be executed to correctly load the dataset. You can inspect the repository content at https://hf.co/datasets/wiki_dpr.
Please pass the argument `trust_remote_code=True` to allow custom code to be run.

### 2. Tokenizzazione

In [None]:
# Testo di input
input_text="Spiega il paradigma di programmazione orientata agli oggetti"

In [None]:
# Tokenizzazione dell'input
input_ids=tokenizer(input_text, return_tensors="pt").input_ids

### 3. Recupero delle informazioni

In [None]:
# Recupero delle informazioni rilevanti
retriever_outputs=retriever(input_ids, return_tensors="pt")

In [None]:
#Generazione della risposta
generated_ids=model.generate(input_ids, context_input_ids=retriever_outputs['context_input_ids'])

In [None]:
# Decodifica della risposta
output_text=tokenizer.batch_decode(generated_ids,skip_special_tokens=True)[0]

In [None]:
print(output_text)