### **Cos'è LangChain?**
> LangChain è un framework per lo sviluppo di applicazioni alimentate da modelli di linguaggio.

**~~TL~~DR**: LangChain rende più semplici le parti complicate del lavoro e della costruzione di modelli di intelligenza artificiale. Ciò avviene in due modi:

1. **Integrazione** - Porta dati esterni, come i tuoi file, altre applicazioni e dati API, ai tuoi modelli di linguaggio.
2. **Agentività** - Consente ai tuoi modelli di linguaggio di interagire con l'ambiente tramite la presa di decisioni. Utilizza i modelli di linguaggio per aiutarti a decidere quale azione intraprendere successivamente.

### **Perché LangChain?**
1. **Componenti** - LangChain facilita la sostituzione di astrazioni e componenti necessari per lavorare con modelli di linguaggio.

2. **Chain personalizzate** - LangChain fornisce supporto integrato per l'utilizzo e la personalizzazione di 'catene' - una serie di azioni concatenate.

3. **Velocità 🚢** - Questo team è incredibilmente veloce nel rilascio. Sarai sempre aggiornato sulle ultime funzionalità dei modelli di linguaggio.

4. **Community 👥** - Supporto meraviglioso tramite Discord e comunità, incontri, hackathon, ecc.


In [2]:
openai_api_key='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'

# Componenti LangChain

## Schema di input
### **Text**
Il modo di interagire con i modelli utilizzando il linguaggio naturale


In [3]:
# Possiamo lavorare con testi semplici
my_text = "Che giorno viene dopo Venerdì?"

### **Chat Messages**
Simili al testo, ma specificati con un tipo di messaggio (System, Human, AI)

* **System** - Contesto di sfondo utile che indica all'AI cosa fare
* **Human** - Messaggi che intendono rappresentare l'utente
* **AI** - Messaggi che mostrano ciò a cui l'AI ha risposto

Per ulteriori informazioni, consulta la [documentazione](https://platform.openai.com/docs/guides/chat/introduction) di OpenAI.


In [4]:
from langchain.schema import HumanMessage, SystemMessage, AIMessage

history = [
    SystemMessage(content="You are an helpful chatbot that helps a user to remember the days of the week"),
    HumanMessage(content=my_text),
]

### **Documents**
Un oggetto che contiene un pezzo di testo e metadati (ulteriori informazioni su quel testo)

In [5]:
from langchain.schema import Document
Document(page_content="Lorem ipsum dolor sit amet, consectetur adipiscing elit.",
         metadata={
             'id' : 42,
             'source' : "https://www.loremipsum.com",
             'create_time' : "2021-01-01 12:00:00",
         })

Document(page_content='Lorem ipsum dolor sit amet, consectetur adipiscing elit.', metadata={'id': 42, 'source': 'https://www.loremipsum.com', 'create_time': '2021-01-01 12:00:00'})

## Models - The interface to the AI brains

###  **Language Model**
Un modello di linguaggio è un modello che prende in input una stringa di testo e restituisce una stringa di testo.

In [6]:
from langchain.llms import OpenAI

llm = OpenAI(openai_api_key=openai_api_key)

In [7]:
llm(my_text)

'\nSabato'

### **Chat Model**
Un modello di chat è un modello che prende in input una serie di messaggi e restituisce un messaggio di output

In [8]:
from langchain.chat_models import ChatOpenAI

chat = ChatOpenAI(temperature=1, openai_api_key=openai_api_key)

In [9]:
chat(history)

AIMessage(content='Dopo Venerdì viene Sabato.', additional_kwargs={}, example=False)

### **Text Embedding Model**
Un modello di embedding di testo è un modello che prende in input una stringa di testo e restituisce un vettore (una serie di numeri che rappresentano il significato semantico del testo).
Principalmente utilizzato quando si confrontano due stringe di testo insieme.

In [10]:
from langchain.embeddings import OpenAIEmbeddings

embeddings = OpenAIEmbeddings(openai_api_key=openai_api_key)

In [11]:
text = "Sono un appassionato di tecnologia e mi piace leggere libri di fantascienza."

In [12]:
text_embedding = embeddings.embed_query(text)
print (f"Your embedding is length {len(text_embedding)}")
print (f"Here's a sample: {text_embedding[:5]}...")

Your embedding is length 1536
Here's a sample: [-0.005089135840535164, -0.003936416003853083, 0.00033378295483998954, -0.03288930654525757, -0.026169195771217346]...


Proviamo a vedere la distanza del testo tra altre due stringhe di testo:

In [13]:
! pip install scipy -q

You should consider upgrading via the '/home/cerma/.virtualenvs/django_langchain_env/bin/python3 -m pip install --upgrade pip' command.[0m[33m
[0m

In [14]:
from scipy import spatial
text_embedding_1 = embeddings.embed_query('Mi piace leggere libri di fantascienza.')
text_embedding_2 = embeddings.embed_query('Non riesco veramente a capire come funziona la tecnologia.')

result_1 = 1 - spatial.distance.cosine(text_embedding, text_embedding_1)
result_2 = 1 - spatial.distance.cosine(text_embedding, text_embedding_2)

print (f"Similarity between text and text_1: {result_1}")
print (f"Similarity between text and text_2: {result_2}")

Similarity between text and text_1: 0.9378914064178732
Similarity between text and text_2: 0.8337985643713537


## Prompts - Testo generalmente utilizzato per dare istruzioni al tuo modello

### **Prompt**
Cosa dirai al tuo modello.

In [15]:
from langchain.llms import OpenAI

llm = OpenAI( openai_api_key=openai_api_key)

prompt = """
Today is Monday, tomorrow is Wednesday.

What is wrong with that statement?
"""

llm(prompt)

'\nThe statement is incorrect; tomorrow is Tuesday.'

### **Prompt Template**
Un oggetto che aiuta a creare prompt basati su una combinazione di input utente, altre informazioni non statiche e una stringa di modello fissa.

Come se fosse una [f-string](https://realpython.com/python-f-strings/) in python ma per i prompt.

In [16]:
from langchain.llms import OpenAI
from langchain import PromptTemplate

llm = OpenAI(model_name="text-davinci-003", openai_api_key=openai_api_key)

# Notice "location" below, that is a placeholder for another value later
template = """
I really want to travel to {location}. What should I do there?

Respond in one short sentence
"""

prompt = PromptTemplate(
    input_variables=["location"],
    template=template,
)

final_prompt = prompt.format(location='Rome')

print (f"Final Prompt: {final_prompt}")
print ("-----------")
print (f"LLM Output: {llm(final_prompt)}")

Final Prompt: 
I really want to travel to Rome. What should I do there?

Respond in one short sentence

-----------
LLM Output: Visit the Colosseum, the Roman Forum, and the Pantheon to experience the city's iconic historical sites.


## Chains 

Cobinazione di diverse chiamate LLM e azioni automatiche.

Ex: Summary #1, Summary #2, Summary #3 > Final Summary

Guarda [questo video](https://www.youtube.com/watch?v=f9_BWhCI4Zo&t=2s) che spiega i diversi tipi di summarization chains.

Esisrono diverse [tipi di chains](https://python.langchain.com/en/latest/modules/chains/how_to_guides.html), cerca di vedere quali sono le migliori per il tuo caso d'uso. 

Noi ne useremo due:

### 1. Simple Sequential Chains

Chains semplici in cui l'output di un LLM viene utilizzato come input in un altro. Buono per suddividere i compiti (e mantenere il tuo LLM focalizzato).

In [17]:
from langchain.llms import OpenAI
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate
from langchain.chains import SimpleSequentialChain

llm = OpenAI(temperature=1, openai_api_key=openai_api_key)

In [18]:
template = """Your job is to come up with a classic dish from the area that the users suggests.
% USER LOCATION
{user_location}

YOUR RESPONSE:
"""
prompt_template = PromptTemplate(input_variables=["user_location"], template=template)

# 'location' chain
location_chain = LLMChain(llm=llm, prompt=prompt_template)

In [19]:
# Proviamo la prima chain

location_chain.run("Rome")

'Spaghetti alla Carbonara, a classic Roman dish made with spaghetti, pancetta, egg, and Parmesan cheese.'

In [20]:
# Possibilità di fare batchin in input
input_list = [
    {"user_location": "Paris"},
    {"user_location": "Berlin"},
    {"user_location": "Lisbon"}
]

location_chain.apply(input_list)

[{'text': 'Steak Frites. This popular French dish is traditionally prepared with sirloin steak, French fries, and a simple sauce such as Béarnaise or red wine sauce.'},
 {'text': 'Sauerbraten, a classic German roast that has been marinated in vinegar and spices, is a popular dish in Berlin.'},
 {'text': 'Caldeirada de peixe (Fish Stew). This traditional Portuguese dish from Lisbon is made with a mix of fish, potatoes, onions and other vegetables, all cooked together in a tomato-based sauce.'}]

In [21]:
template = """Given a meal, give a short and simple recipe on how to make that dish at home.
% MEAL
{user_meal}

YOUR RESPONSE:
"""
prompt_template = PromptTemplate(input_variables=["user_meal"], template=template)

# 'meal' chain
meal_chain = LLMChain(llm=llm, prompt=prompt_template)

In [22]:
overall_chain = SimpleSequentialChain(chains=[location_chain, meal_chain], verbose=True)

In [23]:
review = overall_chain.run("Rome")



[1m> Entering new  chain...[0m
[36;1m[1;3m
One classic dish from Rome is carbonara, which is made from egg, black pepper, guanciale or pancetta, cheese, and pasta.[0m
[33;1m[1;3m
Carbonara Recipe:

Ingredients: 
- 4 ounces guanciale or pancetta, diced
- 1 clove garlic, minced 
- 4 eggs
- 1/2 cup freshly grated Parmesan cheese 
- 1/2 teaspoon black pepper 
- 1 pound of spaghetti or bucatini 

Instructions: 
1. Bring a large pot of salted water to a boil.

2. Heat a skillet over medium heat and add the guanciale. Cook until the fat renders and the pork is crispy. 

3. Add the garlic and sauté for 1 minute.

4. In a bowl, whisk together the eggs, Parmesan, and pepper.

5. Add the pasta to the boiling water and cook until al dente, about 8 minutes.

6. Reserve 1/2 cup of the cooking water, then drain the pasta.

7. Put the pasta back in the pot and add the egg mixture and the guanciale.

8. Stir with a wooden spoon, adding the reserved cooking water as needed to create a creamy sa

### 2. Summarization Chain
Chain già implementata che summarizza facilmente lunghi documenti numerosi e ottieni un riassunto. Guarda [questo video](https://www.youtube.com/watch?v=f9_BWhCI4Zo) per altri tipi di chain oltre a map-reduce.

In [24]:
! pip install tiktoken -q

You should consider upgrading via the '/home/cerma/.virtualenvs/django_langchain_env/bin/python3 -m pip install --upgrade pip' command.[0m[33m
[0m

In [25]:
from langchain.chains.summarize import load_summarize_chain
from langchain.document_loaders import TextLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter

loader = TextLoader('./very_long_document.txt')
documents = loader.load()

# Prepara lo splitter
text_splitter = RecursiveCharacterTextSplitter(chunk_size=700, chunk_overlap=50)

# Dividi il documento in chunks
texts = text_splitter.split_documents(documents)

# Ci sta un po' di complessità in questa riga. Ti consiglio di guardare il video sopra per maggiori dettagli
chain = load_summarize_chain(llm, chain_type="map_reduce", verbose=True)
res = chain.run(texts)



[1m> Entering new  chain...[0m


[1m> Entering new  chain...[0m
Prompt after formatting:
[32;1m[1;3mWrite a concise summary of the following:


"Giuseppe Lippi
Le origini della Fondazione
Come è nato il più famoso ciclo fantascientifico
di tutti i tempi
Apparso sul n. 1203 di Urania (18 aprile 1993)
È il mattino del 1° agosto 1941; a New York, nella Settima Avenue, un giovanotto
di belle speranze sale i gradini del palazzo Street & Smith, la vecchia casa editrice
specializzata in pulp magazines che pubblica Astounding Science Fiction (ex
Astounding Stories). Il giovanotto ha un appuntamento col signor Campbell, sì, John
W. Campbell jr., conferma all’usciere mentre attende impaziente il pass.
Attraversa quindi alcuni corridoi, e finalmente (dopo la visione di una magica"


CONCISE SUMMARY:[0m
Prompt after formatting:
[32;1m[1;3mWrite a concise summary of the following:


"stanza in cui sono accumulati, in tanti pacchetti, gli Astounding del mese dopo!),
accede all’ufficio del


[1m> Finished chain.[0m


[1m> Entering new  chain...[0m


[1m> Entering new  chain...[0m
Prompt after formatting:
[32;1m[1;3mWrite a concise summary of the following:


" Questa storia narra l'inizio della Fondazione di Isaac Asimov, uno dei più famosi cicli fantascientifici di tutti i tempi. Narra le vicende di Giuseppe Lippi che una mattina del 1941 giunge nella Settima Avenue a New York, presso la vecchia casa editrice Street & Smith. Il protagonista giovanotto ha un appuntamento con John W. Campbell jr. e dopo essersi guardato intorno riesce a portare a termine la sua missione.


Isaac Asimov, una promettente nuova autore che ha già venduto cinque racconti, si reca agli appuntamenti con il signor Campbell di Astounding - il re del pulp di fantascienza - per le vere e proprie story conferences. Quando è li, Asimov dimentica completamente il mondo esterno ed è concentrato unicamente su Astounding, su Campbell e i racconti in fieri da discuss. I fatti si svolgono nell'agosto

In [26]:
import pprint
pprint.pprint(res)

('\n'
 'Isaac Asimov\'s "Foundation Trilogy" is a story set in the 1950s during the '
 'golden age of publisher Astounding, exploring faster than light travel and '
 'introducing the new concept of Psicostoria. It follows protagonist figure '
 'with extraordinary psi powers, the Mule, as he works to help restore order '
 'to the galaxy. The story ends with the publication of "Foundation: '
 'Asimov\'s" by Hari Seldon.')
