# LangChain 

LangChain is a framework for developing applications powered by language models. 

For the purpose of this project, LangChain is used to exploit the power of agents.
More precisely, an agent is a chain in which a LLM, given a high-level directive and a set of tools, repeatedly decides an action, executes the action and observes the outcome until the high-level directive is complete.

Through a friendly interface build with *Gradio*, you can see how the agent answers to your questions.

For example, you can ask about explanations of some laboratory analyses, i.e. "*Che cos'è la calcitonina?*"


#### Loading libraries

In [1]:
import warnings
warnings.filterwarnings("ignore")

In [2]:
# pip install langchain wikipedia duckduckgo-search openai tika
# pip install google-search-results

In [2]:
import openai
from langchain.agents import create_csv_agent
from langchain.llms import OpenAI
from tika import parser
from typing import List
from langchain.utilities import WikipediaAPIWrapper
from langchain.agents import load_tools
from langchain.agents import initialize_agent, Tool
from langchain.agents import AgentType
from langchain.memory import ConversationBufferMemory
from langchain.tools import WikipediaQueryRun
from langchain.tools import DuckDuckGoSearchRun
import re
import os
import pprint
import pandas as pd
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain import LLMMathChain, SerpAPIWrapper
from langchain.utilities import GoogleSerperAPIWrapper

### Tool customization and priorities definition

Setting keys for OpenAI and Google Serper API

In [3]:
os.environ["OPENAI_API_KEY"] = "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" #key OpenIA
os.environ["SERPER_API_KEY"] = "6cbca10ed20f5b9f40cadb843c086af948c1a7e8" #key serper.dev 

In [4]:
google_search = GoogleSerperAPIWrapper()

In [5]:
search = WikipediaAPIWrapper(lang='it') 

A list of tools is provided to the agent.

 Each tool is defined by a name, function and its description which helps the agent to determine the tool use.

In [6]:
#customized tool, emphasizing priorities.
tools = [
    Tool(
        name = "Wikipedia Search", #wikipedia
        func=search.run,
        description="A Search Engine. Use this to answer questions only related to healthcare." 
         "Give priority to this."
         "Input should be a query.",
    ),
    Tool(
        name="Search",
        func= google_search.run, #google serper
        description="Use this to answer questions only related to healthcare." 
         "Use this to answer questions about current or recent events."
         "Input should be a query.",
    ),
    Tool(
        name="No answer", #my function
        func=lambda x: "Non mi è consentito rispondere a questo tipo di domande perché non sono legate all'ambito sanitario.", 
        description="Use this to answer questions not related to healthcare. Input should be a query.",
    )
]

memory = ConversationBufferMemory(memory_key="chat_history")



The agent decides which tool - if any - to use. 

It is defined in the following way:

In [7]:
#agent construction
agent = initialize_agent(tools,  OpenAI(temperature=0), memory = memory, 
                         agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
                         verbose=True, max_iterations = 5)


The temperature is set to 0; lower temperature values encourage more factual and concise responses.
The agent uses the ReAct framework to determine which tool to use based solely on the tool’s description.

**Prompt Engineering** to guide the output generation.

In [33]:
prompt_ita = PromptTemplate( 
    input_variables=["domanda"],
    template="Istruzione: Usa 2 - 3 frasi per rispondere a domande relative alla sanità.\n"
     "Contesto: Sei un agente AI per fornire informazioni generali all'utente legati all'ambito sanitario. Ricorda che non puoi effettuare prenotazioni o azioni simili.\n" 
     "Domanda: {domanda}\n",

)

In [28]:
# prompt_ita = PromptTemplate( 
#     input_variables=["domanda"],
#     template="Sei un chatbot AI nel settore sanitario per fornire informazioni generali sulle varie prestazioni ambulatoriali e sui loro scopi.\n"
#      "Usa 2 -3 frasi.\n"
#      "Ricorda che non puoi effettuare prenotazioni o azioni simili.\n" 
#      "Domanda: {domanda}\n",

)

#### Using wikipedia for definitions

In [34]:
print(prompt_ita.format(domanda = "Mi dai una definizione di calcitonina?"))

Istruzione: Usa 2 - 3 frasi per rispondere a domande relative alla sanità.
Contesto: Sei un agente AI per fornire informazioni generali all'utente legati all'ambito sanitario. Ricorda che non puoi effettuare prenotazioni o azioni simili.
Domanda: Mi dai una definizione di calcitonina?



In [35]:
agent.run(prompt_ita.format(domanda = "Mi dai una definizione di calcitonina?")) 



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m La calcitonina è un ormone peptidico prodotto dalle cellule C delle ghiandole paratiroidi.
Action: Wikipedia Search
Action Input: Calcitonina[0m
Observation: [36;1m[1;3mPage: Calcitonina
Summary: La calcitonina è un ormone costituito da un polipeptide di 32 aminoacidi che viene prodotto, negli esseri umani, dalle cellule parafollicolari della tiroide (note anche come cellule C, da clear, chiaro, per la loro scarsa colorabilità al microscopio ottico rispetto ai tireociti), dalle cellule K dell'epitelio respiratorio e in molti altri animali dall'Ultimopharyngeal body (ghiandola associata all'ultimo arco branchiale).

La principale funzione della calcitonina è l'abbassamento della concentrazione di calcio nel sangue (Ca2+), contrasta gli effetti dell'ormone paratiroideo paratormone (PTH). Tale meccanismo di regolazione del calcio è stato riscontrato nei pesci, rettili, uccelli e mammiferi. A differenza degli studi sugli anim

"La calcitonina è un ormone peptidico prodotto dalle cellule C delle ghiandole paratiroidi, che ha come principale funzione l'abbassamento della concentrazione di calcio nel sangue (Ca2+), contrastando gli effetti dell'ormone paratiroideo paratormone (PTH). Inoltre, la calcitonina agisce anche a livello renale, stimolando l'eliminazione tubulare di calcio. Attualmente, non ha nessuna indicazione terapeutica accertata. Il CGRP (acronimo dall'inglese Calcitonin Gene Related Peptide, peptide correlato al gene della calcitonina) è un peptide composto da 37 amminoacidi ed è prodotto tramite lo splicing alternativo della calcitonina, un gene localizzato sul cromosoma 11."

#### Using wikipedia to provide definition and explain the purpose of the analysis

In [36]:
print(prompt_ita.format(domanda = "Che cos'è l'emocromo e perchè devo fare le analisi di sangue dell'emocromo?"))

Istruzione: Usa 2 - 3 frasi per rispondere a domande relative alla sanità.
Contesto: Sei un agente AI per fornire informazioni generali all'utente legati all'ambito sanitario. Ricorda che non puoi effettuare prenotazioni o azioni simili.
Domanda: Che cos'è l'emocromo e perchè devo fare le analisi di sangue dell'emocromo?



In [37]:
agent.run(prompt_ita.format(domanda = "Che cos'è l'emocromo e perchè devo fare le analisi di sangue dell'emocromo?")) 



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m Devo trovare informazioni sull'emocromo e su perché è importante farlo.
Action: Wikipedia Search
Action Input: Emocromo[0m
Observation: [36;1m[1;3mPage: Emocromo
Summary: L'emocromo (abbreviazione comunemente usata per esame emocromocitometrico, dalle parole greche haima: sangue, khroma: colore, kytos: cellula, e metron: misura; riferite al colore e alla quantità delle cellule del sangue), o emogramma, è un esame di laboratorio sul sangue; esso determina la quantità degli elementi corpuscolati (leucociti o globuli bianchi, eritrociti o globuli rossi, e trombociti o piastrine), i livelli dell'ematocrito (HCT), e dell'emoglobina (Hb), nonché altri parametri del sangue.
In inglese l'esame è detto complete blood count (CBC): "conta completa del sangue", in francese hémogramme e in spagnolo hemograma o biometría hemática ("biometria ematica").
Il sangue prelevato viene conservato a temperatura ambiente in una provetta contenen

"L'emocromo è un esame di laboratorio sul sangue che determina la quantità degli elementi corpuscolati (leucociti o globuli bianchi, eritrociti o globuli rossi, e trombociti o piastrine), i livelli dell'ematocrito (HCT), e dell'emoglobina (Hb), nonché altri parametri del sangue. È importante farlo perché può aiutare a diagnosticare malattie come la leucemia mielomonocitica giovanile, oltre a fornire informazioni utili sullo stato di salute generale."

#### Using google search when wikipedia is not enough

In [38]:
agent.run(prompt_ita.format(domanda = "Cosa sono le analisi ALTRE TRAZIONI CUTANEE DEGLI ARTI?")) 



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m Devo trovare informazioni su cosa sono le analisi ALTRE TRAZIONI CUTANEE DEGLI ARTI.
Action: Wikipedia Search
Action Input: Analisi ALTRE TRAZIONI CUTANEE DEGLI ARTI[0m
Observation: [36;1m[1;3mNo good Wikipedia Search Result was found[0m
Thought:[32;1m[1;3m Devo cercare informazioni su un altro motore di ricerca
Action: Search
Action Input: Analisi ALTRE TRAZIONI CUTANEE DEGLI ARTI[0m
Observation: [33;1m[1;3mTrazioni cutanee degli arti ... nell'ambito della navigazione, oltre che per effettuare l'analisi e il monitoraggio della Sua interazione con il sito. Il paziente ortopedico sottoposto a trazione necessita di un'assistenza specifica in base al tipo e alla sede della frattura, ... Definizione del termine medico Altre Trazioni Cutanee degli Arti : Si tratta dell'uso di opportuni apparecchi per eseguire la trazione, ... Missing: Analisi | Must include:Analisi. IV stadio: Perdita cutanea a tutto spessore con vasta d

"Le analisi ALTRE TRAZIONI CUTANEE DEGLI ARTI sono l'uso di opportuni apparecchi per eseguire la trazione, che viene effettuata nell'ambito della navigazione, oltre che per effettuare l'analisi e il monitoraggio della Sua interazione con il sito. Queste analisi sono utilizzate per trattare le lesioni vascolari degli arti inferiori, come quelle ferite cutanee ad eziologia vascolare venosa, arteriosa e/o mista."

#### Using customised tool for no answering.

In [39]:
agent.run(prompt_ita.format(domanda = "Consigliami la migliore pizzeria di Milano"))



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m La domanda non è correlata alla sanità, quindi non posso usare Wikipedia Search o Search.
Action: No answer
Action Input: Consigliami la migliore pizzeria di Milano[0m
Observation: [38;5;200m[1;3mNon mi è consentito rispondere a questo tipo di domande perché non sono legate all'ambito sanitario.[0m
Thought:[32;1m[1;3m Ho capito che non posso rispondere a questa domanda.
Final Answer: Non posso rispondere a questa domanda perché non è correlata alla sanità.[0m

[1m> Finished chain.[0m


'Non posso rispondere a questa domanda perché non è correlata alla sanità.'

### Interface - gradio


In [None]:
# !pip install gradio

In [40]:
import gradio as gr

In [41]:
def output(input):
  question = prompt_ita.format(domanda = input)
  return agent.run(prompt_ita.format(domanda = input)) 

In [42]:
bot = gr.Interface(
    fn=output,
    inputs=gr.Textbox(lines=2, placeholder="Sono un chabot in ambito sanitario, specializzato in analisi mediche e prestazioni specialistiche ambulatoriali. Dimmi come posso aiutarti. Ricorda che è sempre meglio fare riferimento a un medico professionista."),
    outputs="text",
)
bot.launch()

Running on local URL:  http://127.0.0.1:7860

To create a public link, set `share=True` in `launch()`.






[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m Devo fornire informazioni generali sull'ambito sanitario, ma non posso prenotare un'analisi di sangue.
Action: No answer
Action Input: Puoi prenotarmi un analisi di sangue di emocromo a milano?[0m
Observation: [38;5;200m[1;3mNon mi è consentito rispondere a questo tipo di domande perché non sono legate all'ambito sanitario.[0m
Thought:[32;1m[1;3m Devo fornire informazioni generali sull'ambito sanitario.
Action: Wikipedia Search
Action Input: Analisi di sangue[0m
Observation: [36;1m[1;3mPage: Sangue
Summary: Il sangue è un tessuto fluido presente negli animali dotati di apparato circolatorio, quindi anche nell'uomo; esso ha colore rosso (quello più chiaro è arterioso, quello più scuro venoso) e sapore ferroso, dovuto alla presenza del metallo in forma ossidata (+2).  Assolve numerose funzioni essenziali, in primo luogo il trasporto di ossigeno e nutrienti alle cellule dell'organismo e la parallela rimozione da esse d