# LangChain 

LangChain is a framework for developing applications powered by language models. 

For the purpose of this project, LangChain is used to exploit the power of agents.
More precisely, an agent is a chain in which a LLM, given a high-level directive and a set of tools, repeatedly decides an action, executes the action and observes the outcome until the high-level directive is complete.

Through a friendly interface build with *Gradio*, you can see how the agent answers to your questions.

For example, you can ask about explanations of some laboratory analyses, i.e. "*Che cos'è la calcitonina?*"


#### Loading libraries

In [1]:
import warnings
warnings.filterwarnings("ignore")

In [2]:
#pip install langchain wikipedia openai tika gradio
#pip install google-search-results

In [3]:
import openai
from langchain.agents import create_csv_agent
from langchain.llms import OpenAI
from tika import parser
from typing import List
from langchain.utilities import WikipediaAPIWrapper
from langchain.agents import load_tools
from langchain.agents import initialize_agent, Tool
from langchain.agents import AgentType
from langchain.memory import ConversationBufferMemory
from langchain.tools import WikipediaQueryRun
from langchain.tools import DuckDuckGoSearchRun
import re
import os
import pprint
import pandas as pd
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain import LLMMathChain, SerpAPIWrapper
from langchain.utilities import GoogleSerperAPIWrapper

### Tool customization and priorities definition

Setting keys for OpenAI and Google Serper API

In [4]:
os.environ["OPENAI_API_KEY"] = "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" #key OpenIA
os.environ["SERPER_API_KEY"] = "6cbca10ed20f5b9f40cadb843c086af948c1a7e8" #key serper.dev 

In [5]:
google_search = GoogleSerperAPIWrapper()

In [6]:
search = WikipediaAPIWrapper(lang='it') 

A list of tools is provided to the agent.

 Each tool is defined by a name, function and its description which helps the agent to determine the tool use.

In [7]:
#customized tool, emphasizing priorities.
tools = [
    Tool(
        name = "Wikipedia Search", #wikipedia
        func=search.run,
        description="A Search Engine. Use this to answer questions only related to healthcare." 
         "Give priority to this."
         "Input should be a query.",
    ),
    Tool(
        name="Search",
        func= google_search.run, #google serper
        description="Use this to answer questions only related to healthcare." 
         "Use this to answer questions about current or recent events."
         "Input should be a query.",
    ),
    Tool(
        name="No answer", #my function
        func=lambda x: "Non mi è consentito rispondere a questo tipo di domande perché non sono legate all'ambito sanitario.", 
        description="Use this to answer questions not related to healthcare. Input should be a query.",
    )
]

memory = ConversationBufferMemory(memory_key="chat_history")



The agent decides which tool - if any - to use. 

It is defined in the following way:

In [8]:
#agent construction
agent = initialize_agent(tools,  OpenAI(temperature=0), memory = memory, 
                         agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
                         verbose=True, max_iterations = 5)


The temperature is set to 0; lower temperature values encourage more factual and concise responses.
The agent uses the ReAct framework to determine which tool to use based solely on the tool’s description.

**Prompt Engineering** to guide the output generation.

In [9]:
prompt_ita = PromptTemplate( 
    input_variables=["domanda"],
    template="Istruzione: Usa massimo 2 - 3 frasi per rispondere a domande relative alla sanità.\n"
     "Contesto: Sei un agente AI per fornire informazioni generali all'utente legati all'ambito sanitario. Ricorda che non puoi effettuare prenotazioni o azioni simili.\n" 
     "Domanda: {domanda}\n",

)

#### Using wikipedia for definitions

In [10]:
print(prompt_ita.format(domanda = "Mi dai una definizione di calcitonina?"))

Istruzione: Usa massimo 2 - 3 frasi per rispondere a domande relative alla sanità.
Contesto: Sei un agente AI per fornire informazioni generali all'utente legati all'ambito sanitario. Ricorda che non puoi effettuare prenotazioni o azioni simili.
Domanda: Mi dai una definizione di calcitonina?



In [11]:
agent.run(prompt_ita.format(domanda = "Mi dai una definizione di calcitonina?")) 



[1m> Entering new AgentExecutor chain...[0m


[32;1m[1;3m La calcitonina è un ormone peptidico prodotto dalle cellule C delle ghiandole paratiroidi.
Action: Wikipedia Search
Action Input: Calcitonina[0m
Observation: [36;1m[1;3mPage: Calcitonina
Summary: La calcitonina è un ormone costituito da un polipeptide di 32 aminoacidi che viene prodotto, negli esseri umani, dalle cellule parafollicolari della tiroide (note anche come cellule C, da clear, chiaro, per la loro scarsa colorabilità al microscopio ottico rispetto ai tireociti), dalle cellule K dell'epitelio respiratorio e in molti altri animali dall'Ultimopharyngeal body (ghiandola associata all'ultimo arco branchiale).

La principale funzione della calcitonina è l'abbassamento della concentrazione di calcio nel sangue (Ca2+), contrasta gli effetti dell'ormone paratiroideo paratormone (PTH). Tale meccanismo di regolazione del calcio è stato riscontrato nei pesci, rettili, uccelli e mammiferi. A differenza degli studi sugli animali la sua importanza negli esseri umani non è s

"La calcitonina è un ormone peptidico prodotto dalle cellule C delle ghiandole paratiroidi, che ha come principale funzione l'abbassamento della concentrazione di calcio nel sangue (Ca2+). Agisce anche a livello renale, stimolando l'eliminazione tubulare di calcio. La sua produzione è regolata dall'ormone tireostimolante (TSH) secreto dalla ghiandola pituitaria anteriore, che a sua volta è regolata dall'ormone di rilascio della tireotropina (TRH) prodotto dall'ipotalamo. La calcitonina è anche correlata al peptide CGRP (Calcitonin Gene Related Peptide), un peptide vasodilatatore che può intervenire nella trasmissione del dolore."

#### Using wikipedia to provide definition and explain the purpose of the analysis

In [12]:
print(prompt_ita.format(domanda = "Che cos'è l'emocromo e perchè devo fare le analisi di sangue dell'emocromo?"))

Istruzione: Usa massimo 2 - 3 frasi per rispondere a domande relative alla sanità.
Contesto: Sei un agente AI per fornire informazioni generali all'utente legati all'ambito sanitario. Ricorda che non puoi effettuare prenotazioni o azioni simili.
Domanda: Che cos'è l'emocromo e perchè devo fare le analisi di sangue dell'emocromo?



In [13]:
agent.run(prompt_ita.format(domanda = "Che cos'è l'emocromo e perchè devo fare le analisi di sangue dell'emocromo?")) 



[1m> Entering new AgentExecutor chain...[0m


[32;1m[1;3m Devo trovare informazioni sull'emocromo e su perché è importante farlo.
Action: Wikipedia Search
Action Input: Emocromo[0m
Observation: [36;1m[1;3mPage: Emocromo
Summary: L'emocromo (abbreviazione comunemente usata per esame emocromocitometrico, dalle parole greche haima: sangue, khroma: colore, kytos: cellula, e metron: misura; riferite al colore e alla quantità delle cellule del sangue), o emogramma, è un esame di laboratorio sul sangue; esso determina la quantità degli elementi corpuscolati (leucociti o globuli bianchi, eritrociti o globuli rossi, e trombociti o piastrine), i livelli dell'ematocrito (HCT), e dell'emoglobina (Hb), nonché altri parametri del sangue.
In inglese l'esame è detto complete blood count (CBC): "conta completa del sangue", in francese hémogramme e in spagnolo hemograma o biometría hemática ("biometria ematica").
Il sangue prelevato viene conservato a temperatura ambiente in una provetta contenente un anticoagulante (EDTA, citrato, ecc.). Succ

"L'emocromo è un esame di laboratorio sul sangue che determina la quantità degli elementi corpuscolati (leucociti o globuli bianchi, eritrociti o globuli rossi, e trombociti o piastrine), i livelli dell'ematocrito (HCT), e dell'emoglobina (Hb), nonché altri parametri del sangue. È importante farlo perché può aiutare a diagnosticare malattie come la leucemia mielomonocitica giovanile."

In [14]:
agent.run(prompt_ita.format(domanda = "Quali sono i valori normali di emocromo per una donna sana?"))



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m Cerco informazioni sui valori normali di emocromo per una donna sana.
Action: Wikipedia Search
Action Input: Valori normali di emocromo per una donna sana[0m
Observation: [36;1m[1;3mPage: COVID-19
Summary: La COVID-19 (acronimo dell'inglese COronaVIrus Disease 19), conosciuta anche come malattia respiratoria acuta da SARS-CoV-2 o malattia da coronavirus 2019, è una malattia infettiva respiratoria causata dal virus denominato SARS-CoV-2 appartenente alla famiglia dei coronavirus.
Il termine "COVID" viene impropriamente e ormai largamente usato al maschile come sinonimo del virus stesso, sebbene invece si riferisca alla patologia da causata da esso. 
I primi casi accertati sono stati riscontrati in Cina. Al 9 settembre 2021 il suo tasso di letalità apparente (CFR) è del 2,06%. Il tasso di letalità per infezione (IFR, che include tutti gli infetti, anche coloro che contraggono la COVID ma non fanno un test in cui risultano p

'I valori normali di emocromo per una donna sana sono: emoglobina (Hb) 12-16 g/dl, eritrociti/μl (RBC) 4,2-5,4 x 106, volume corpuscolare medio (MCV) 81-99 fl, emoglobina corpuscolare media (MCH) 26-32 pg.'

In [15]:
agent.run(prompt_ita.format(domanda = "Sono una donna con valori dell'emocromo oltre il 50%. Cosa vuol dire?"))



[1m> Entering new AgentExecutor chain...[0m


[32;1m[1;3m Devo trovare informazioni sui valori dell'emocromo.
Action: Wikipedia Search
Action Input: Valori dell'emocromo[0m
Observation: [36;1m[1;3mPage: Emocromo
Summary: L'emocromo (abbreviazione comunemente usata per esame emocromocitometrico, dalle parole greche haima: sangue, khroma: colore, kytos: cellula, e metron: misura; riferite al colore e alla quantità delle cellule del sangue), o emogramma, è un esame di laboratorio sul sangue; esso determina la quantità degli elementi corpuscolati (leucociti o globuli bianchi, eritrociti o globuli rossi, e trombociti o piastrine), i livelli dell'ematocrito (HCT), e dell'emoglobina (Hb), nonché altri parametri del sangue.
In inglese l'esame è detto complete blood count (CBC): "conta completa del sangue", in francese hémogramme e in spagnolo hemograma o biometría hemática ("biometria ematica").
Il sangue prelevato viene conservato a temperatura ambiente in una provetta contenente un anticoagulante (EDTA, citrato, ecc.). Successivame

"Un valore dell'emocromo oltre il 50% indica una condizione di policitemia, cioè una produzione eccessiva di globuli rossi. Questo può essere causato da alcune malattie come la leucemia mieloide cronica, che richiede un trattamento specifico."

#### Using google search when wikipedia is not enough

In [16]:
agent.run(prompt_ita.format(domanda = "Cosa sono le analisi ALTRE TRAZIONI CUTANEE DEGLI ARTI?")) 



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m Devo trovare informazioni su questo argomento.
Action: Wikipedia Search
Action Input: Analisi ALTRE TRAZIONI CUTANEE DEGLI ARTI[0m
Observation: [36;1m[1;3mNo good Wikipedia Search Result was found[0m
Thought:[32;1m[1;3m Proverò a cercare informazioni su un motore di ricerca.
Action: Search
Action Input: Analisi ALTRE TRAZIONI CUTANEE DEGLI ARTI[0m
Observation: [33;1m[1;3mTrazioni cutanee degli arti ... nell'ambito della navigazione, oltre che per effettuare l'analisi e il monitoraggio della Sua interazione con il sito. Il paziente ortopedico sottoposto a trazione necessita di un'assistenza specifica in base al tipo e alla sede della frattura, ... Definizione del termine medico Altre Trazioni Cutanee degli Arti : Si tratta dell'uso di opportuni apparecchi per eseguire la trazione, ... Missing: Analisi | Must include:Analisi. Le lesioni vascolari degli arti inferiori vengono definite come quelle ferite cutanee ad ezio

"Le analisi ALTRE TRAZIONI CUTANEE DEGLI ARTI sono l'uso di opportuni apparecchi per eseguire la trazione, al fine di determinare l'emodinamica del microcircolo cutaneo. Possono essere utilizzate per trattare lesioni vascolari degli arti inferiori, fratture e altre correzioni forzate di deformità."

#### Using customised tool for no answering.

In [17]:
agent.run(prompt_ita.format(domanda = "Consigliami la migliore pizzeria di Milano"))



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m La domanda non è correlata alla sanità, quindi non posso usare Wikipedia Search o Search.
Action: No answer
Action Input: Consigliami la migliore pizzeria di Milano[0m
Observation: [38;5;200m[1;3mNon mi è consentito rispondere a questo tipo di domande perché non sono legate all'ambito sanitario.[0m
Thought:[32;1m[1;3m Ho capito che non posso rispondere a questa domanda.
Final Answer: Non posso rispondere a questa domanda perché non è correlata alla sanità.[0m

[1m> Finished chain.[0m


'Non posso rispondere a questa domanda perché non è correlata alla sanità.'

### Interface - gradio


In [18]:
import gradio as gr

In [19]:
def output(input):
  question = prompt_ita.format(domanda = input)
  return agent.run(prompt_ita.format(domanda = input)) 

In [20]:
bot = gr.Interface(
    fn=output,
    inputs=gr.Textbox(lines=2, placeholder="Sono un chabot in ambito sanitario, specializzato in analisi mediche e prestazioni specialistiche ambulatoriali. Dimmi come posso aiutarti. Ricorda che è sempre meglio fare riferimento a un medico professionista."),
    outputs="text",
)
bot.launch()

Running on local URL:  http://127.0.0.1:7860

To create a public link, set `share=True` in `launch()`.




In [21]:
memory.load_memory_variables({})

{'chat_history': "Human: Istruzione: Usa massimo 2 - 3 frasi per rispondere a domande relative alla sanità.\nContesto: Sei un agente AI per fornire informazioni generali all'utente legati all'ambito sanitario. Ricorda che non puoi effettuare prenotazioni o azioni simili.\nDomanda: Mi dai una definizione di calcitonina?\n\nAI: La calcitonina è un ormone peptidico prodotto dalle cellule C delle ghiandole paratiroidi, che ha come principale funzione l'abbassamento della concentrazione di calcio nel sangue (Ca2+). Agisce anche a livello renale, stimolando l'eliminazione tubulare di calcio. La sua produzione è regolata dall'ormone tireostimolante (TSH) secreto dalla ghiandola pituitaria anteriore, che a sua volta è regolata dall'ormone di rilascio della tireotropina (TRH) prodotto dall'ipotalamo. La calcitonina è anche correlata al peptide CGRP (Calcitonin Gene Related Peptide), un peptide vasodilatatore che può intervenire nella trasmissione del dolore.\nHuman: Istruzione: Usa massimo 2 - 