## Prompt + LLM

The most common and valuable composition is taking:

PromptTemplate / ChatPromptTemplate -> LLM / ChatModel -> OutputParser

Almost any other chains you build will use this building block.

### PromptTemplate + LLM
<hr>

The simplest composition is just combing a prompt and model to create a chain that takes user input, adds it to a prompt, passes it to a model, and returns the raw model input.

Note, you can mix and match PromptTemplate/ChatPromptTemplates and LLMs/ChatModels as you like here.

In [None]:
from langchain.prompts import ChatPromptTemplate
from langchain.chat_models import ChatOpenAI

prompt = ChatPromptTemplate.from_template("tell me a joke about {foo}")
model = ChatOpenAI()
chain = prompt | model

In [None]:
chain.invoke({"foo": "dogs"})

Often times we want to attach kwargs that'll be passed to each model call. Here's a few examples of that:

### Attaching Stop Sequences

In [None]:
chain = prompt | model.bind(stop=["\n"])

In [None]:
chain.invoke({"foo": "bears"})

### <mark>Attaching Function Call information</mark>

In [None]:
functions = [
    {
      "name": "joke",
      "description": "A joke",
      "parameters": {
        "type": "object",
        "properties": {
          "setup": {
            "type": "string",
            "description": "The setup for the joke"
          },
          "punchline": {
            "type": "string",
            "description": "The punchline for the joke"
          }
        },
        "required": ["setup", "punchline"]
      }
    }
  ]
chain = prompt | model.bind(function_call= {"name": "joke"}, functions=functions)

In [None]:
chain.invoke({"foo": "bears"}, config={})

## PromptTemplate + LLM + OutputParser
<hr>
We can also add in an output parser to easily transform the raw LLM/ChatModel output into a more workable format

In [None]:
from langchain.schema.output_parser import StrOutputParser

chain = prompt | model | StrOutputParser()

Notice that this now returns a string - a much more workable format for downstream tasks

In [None]:
chain.invoke({"foo": "bears"})

### Functions Output Parser

When you specify the function to return, you may just want to parse that directly

In [None]:
from langchain.output_parsers.openai_functions import JsonOutputFunctionsParser

chain = (
    prompt 
    | model.bind(function_call= {"name": "joke"}, functions=functions) 
    | JsonOutputFunctionsParser()
)

In [None]:
chain.invoke({"foo": "bears"})

In [None]:
from langchain.output_parsers.openai_functions import JsonKeyOutputFunctionsParser

chain = (
    prompt 
    | model.bind(function_call= {"name": "joke"}, functions=functions) 
    | JsonKeyOutputFunctionsParser(key_name="punchline")
)

In [None]:
chain.invoke({"foo": "bears"})

### Simplifying input
<hr>
To make invocation even simpler, we can add a RunnableMap to take care of creating the prompt input dict for us:

In [None]:
from langchain.schema.runnable import RunnableMap, RunnablePassthrough

map_ = RunnableMap(foo=RunnablePassthrough())
chain = (
    map_ 
    | prompt
    | model.bind(function_call= {"name": "joke"}, functions= functions) 
    | JsonOutputFunctionsParser()
)

In [None]:
chain.invoke("bears")

Since we're composing our map with another Runnable, we can even use some syntactic sugar and just use a dict:

In [None]:
chain = (
    {"foo": RunnablePassthrough()} 
    | prompt
    | model.bind(function_call= {"name": "joke"}, functions= functions) 
    | JsonKeyOutputFunctionsParser(key_name="setup")
)

In [None]:
chain.invoke("bears")

## RAG
<hr>
Let's look at adding in a retrieval step to a prompt and LLM, which adds up to a "retrieval-augmented generation" chain <mark> yes!!! </mark>

In [None]:
from operator import itemgetter

from langchain.prompts import ChatPromptTemplate
from langchain.chat_models import ChatOpenAI
from langchain.embeddings import OpenAIEmbeddings
from langchain.schema.output_parser import StrOutputParser
from langchain.schema.runnable import RunnablePassthrough, RunnableLambda
from langchain.vectorstores import FAISS

In [None]:
vectorstore = FAISS.from_texts(["A União Europeia (UE) é uma união económica e política de 27 Estados-membros independentes situados principalmente na Europa"], embedding=OpenAIEmbeddings())
retriever = vectorstore.as_retriever()

template = """Responda à pergunta com base apenas no seguinte contexto:
{contexto}

Pergunta: {pergunta}
"""
prompt = ChatPromptTemplate.from_template(template)

model = ChatOpenAI()

In [None]:
chain = (
    {"contexto": retriever, "pergunta": RunnablePassthrough()} 
    | prompt 
    | model 
    | StrOutputParser()
)

In [None]:
chain.invoke("quantos estados membro tem a UE?")

In [None]:
template = """Responda à pergunta com base apenas no seguinte contexto:
{contexto}

Pergunta: {pergunta}

Responda no seguinte idioma: {linguagem}
"""
prompt = ChatPromptTemplate.from_template(template)

chain = {
    "contexto": itemgetter("pergunta") | retriever, 
    "pergunta": itemgetter("pergunta"), 
    "linguagem": itemgetter("linguagem")
} | prompt | model | StrOutputParser()

In [None]:
chain.invoke({"pergunta": "O que é a União Europeia (UE)", "linguagem": "francês"})

### Em Ingles

In [None]:
from operator import itemgetter

from langchain.prompts import ChatPromptTemplate
from langchain.chat_models import ChatOpenAI
from langchain.embeddings import OpenAIEmbeddings
from langchain.schema.output_parser import StrOutputParser
from langchain.schema.runnable import RunnablePassthrough, RunnableLambda
from langchain.vectorstores import FAISS

In [None]:
vectorstore = FAISS.from_texts(["harrison worked at kensho"], embedding=OpenAIEmbeddings())
retriever = vectorstore.as_retriever()

template = """Answer the question based only on the following context:
{context}

Question: {question}
"""
prompt = ChatPromptTemplate.from_template(template)

model = ChatOpenAI()

In [None]:
chain = (
    {"context": retriever, "question": RunnablePassthrough()} 
    | prompt 
    | model 
    | StrOutputParser()
)

In [None]:
chain.invoke("where did harrison work?")

## Conversational Retrieval Chain
<hr>
We can easily add in conversation history. This primarily means adding in chat_message_history

In [None]:
from langchain.schema.runnable import RunnableMap
from langchain.schema import format_document

In [None]:
from langchain.prompts.prompt import PromptTemplate

_template = """Dada a conversa a seguir e uma pergunta de acompanhamento, reformule a pergunta de acompanhamento para ser uma pergunta independente, em seu idioma original.

Chat History:
{chat_history}
Follow Up Input: {pergunta}
Standalone question:"""
CONDENSE_QUESTION_PROMPT = PromptTemplate.from_template(_template)

In [None]:
template = """Responda à pergunta com base apenas no seguinte contexto:
{contexto}

Pergunta: {pergunta}
"""
ANSWER_PROMPT = ChatPromptTemplate.from_template(template)

In [None]:
DEFAULT_DOCUMENT_PROMPT = PromptTemplate.from_template(template="{page_content}")

def _combine_documents(docs, document_prompt = DEFAULT_DOCUMENT_PROMPT, document_separator="\n\n"):
    doc_strings = [format_document(doc, document_prompt) for doc in docs]
    return document_separator.join(doc_strings)

In [None]:
from typing import Tuple, List

def _format_chat_history(chat_history: List[Tuple]) -> str:
    buffer = ""
    for dialogue_turn in chat_history:
        human = "Human: " + dialogue_turn[0]
        ai = "Assistant: " + dialogue_turn[1]
        buffer += "\n" + "\n".join([human, ai])
    return buffer

In [None]:
_inputs = RunnableMap(
    standalone_question=RunnablePassthrough.assign(
        chat_history=lambda x: _format_chat_history(x['chat_history'])
    ) | CONDENSE_QUESTION_PROMPT | ChatOpenAI(temperature=0) | StrOutputParser(),
)

_context = {
    "contexto": itemgetter("standalone_question") | retriever | _combine_documents,
    "pergunta": lambda x: x["standalone_question"]
}

conversational_qa_chain = _inputs | _context | ANSWER_PROMPT | ChatOpenAI()

In [None]:
conversational_qa_chain.invoke({
    "pergunta": "O que é a União Europeia (UE)?",
    "chat_history": [],
})

In [None]:
conversational_qa_chain.invoke({
    "pergunta": "Qual é o objetivo da UE?",
    "chat_history": [("Quem escreveu este notebook?", "Daniel")],
})

### With <mark>Memory and returning source documents</mark>

isso mostra como usar a memória com o acima. Para a memória, precisamos gerenciar isso fora da memória. Para devolver os documentos recuperados, basta passá-los até o fim.

In [None]:
from operator import itemgetter
from langchain.memory import ConversationBufferMemory

In [None]:
memory = ConversationBufferMemory(return_messages=True, output_key="resposta", input_key="pergunta")

In [None]:
# 1. Primeiro adicionamos uma etapa para carregar a memória
# Isso adiciona uma chave de "memória" ao objeto de entrada
loaded_memory = RunnablePassthrough.assign(
    chat_history=RunnableLambda(memory.load_memory_variables) | itemgetter("history"),
)

In [None]:
# 2. Agora calculamos a questão independente
standalone_question = {
    "standalone_question": {
        "pergunta": lambda x: x["pergunta"],
        "chat_history": lambda x: _format_chat_history(x['chat_history'])
    } | CONDENSE_QUESTION_PROMPT | ChatOpenAI(temperature=0) | StrOutputParser(),
}

In [None]:
# 3. Agora recuperamos os documentos
retrieved_documents = {
    "docs": itemgetter("standalone_question") | retriever,
    "pergunta": lambda x: x["standalone_question"]
}

In [None]:
# 4. Agora construímos as entradas para o prompt final
final_inputs = {
    "contexto": lambda x: _combine_documents(x["docs"]),
    "pergunta": itemgetter("pergunta")
}

In [None]:
# 5. E por fim, fazemos a parte que retorna as respostas
answer = {
    "resposta": final_inputs | ANSWER_PROMPT | ChatOpenAI(),
    "docs": itemgetter("docs"),
}

In [None]:
# 6. E agora juntamos tudo!
final_chain = loaded_memory | standalone_question | retrieved_documents | answer

In [None]:
# 7. E agora podemos invocar o modelo!
inputs = {"pergunta": "quando foi formada a UE?"}
result = final_chain.invoke(inputs)
result

In [None]:
# Observe que a memória não salva automaticamente
# Isso será melhorado no futuro
# Por enquanto você precisa salvá-lo sozinho

memory.save_context(inputs, {"resposta": result["resposta"].content})

In [None]:
memory.load_memory_variables({})

## <mark>Multiple chains</mark>

Runnables can easily be used to string together multiple Chains



In [None]:
from operator import itemgetter

from langchain.chat_models import ChatOpenAI
from langchain.prompts import ChatPromptTemplate
from langchain.schema import StrOutputParser

In [None]:
prompt1 = ChatPromptTemplate.from_template("De qual cidade a {person} e?")
prompt2 = ChatPromptTemplate.from_template("De que país é a cidade {city}? responda em {language}")

model = ChatOpenAI()

chain1 = prompt1 | model | StrOutputParser()

chain2 = {"city": chain1, "language": itemgetter("language")} | prompt2 | model | StrOutputParser()

chain2.invoke({"person": "obama", "language": "spanish"})

In [None]:
from langchain.schema.runnable import RunnableMap, RunnablePassthrough

prompt1 = ChatPromptTemplate.from_template("gerar uma {attribute} cor. Retorne o nome da cor e nada mais:")
prompt2 = ChatPromptTemplate.from_template("o que é uma fruta de cor: {color}. Retorne o nome da fruta e nada mais:")
prompt3 = ChatPromptTemplate.from_template("o que é um país com uma bandeira que tem a cor: {color}. Retorne o nome do país e nada mais:")
prompt4 = ChatPromptTemplate.from_template("Qual é a cor {fruit} e a bandeira de {country}?")

model_parser = model | StrOutputParser()

color_generator = {"attribute": RunnablePassthrough()} | prompt1 | {"color": model_parser}
color_to_fruit = prompt2 | model_parser
color_to_country = prompt3 | model_parser
question_generator = color_generator | {"fruit": color_to_fruit, "country": color_to_country} | prompt4

In [None]:
question_generator.invoke("warm")

In [None]:
prompt = question_generator.invoke("warm")
model.invoke(prompt)

### <mark>Branching and Merging</mark>

Você pode querer que a saída de um componente seja processada por 2 ou mais outros componentes. RunnableMaps permite dividir ou bifurcar a cadeia para que vários componentes possam processar a entrada em paralelo. Posteriormente, outros componentes podem juntar ou mesclar os resultados para sintetizar uma resposta final. Este tipo de cadeia cria um gráfico de computação semelhante ao seguinte:

In [None]:
planner = (
    ChatPromptTemplate.from_template(
        "Generate an argument about: {input}"
    )
    | ChatOpenAI()
    | StrOutputParser()
    | {"base_response": RunnablePassthrough()}
)

arguments_for = (
    ChatPromptTemplate.from_template(
        "List the pros or positive aspects of {base_response}"
    )
    | ChatOpenAI()
    | StrOutputParser()
)
arguments_against =  (
    ChatPromptTemplate.from_template(
        "List the cons or negative aspects of {base_response}"
    )
    | ChatOpenAI()
    | StrOutputParser()
)

final_responder = (
    ChatPromptTemplate.from_messages(
        [
            ("ai", "{original_response}"),
            ("human", "Pros:\n{results_1}\n\nCons:\n{results_2}"),
            ("system", "Generate a final response given the critique"),
        ]
    )
    | ChatOpenAI()
    | StrOutputParser()
)

chain = (
    planner 
    | {
        "results_1": arguments_for,
        "results_2": arguments_against,
        "original_response": itemgetter("base_response"),
    }
    | final_responder
)

In [None]:
chain.invoke({"input": "scrum"})

## Querying a SQL DB

Podemos replicar nosso SQLDatabaseChain com Runnables.

In [1]:
from langchain.prompts import ChatPromptTemplate

template = """Com base no esquema da tabela abaixo, escreva uma consulta SQL que responda à pergunta do usuário:
{schema}

Pergunta: {pergunta}
Consulta SQL:"""
prompt = ChatPromptTemplate.from_template(template)

In [2]:
from langchain.utilities import SQLDatabase

In [3]:
connection_uri = "mssql+pyodbc://sa:data2030works@172.18.144.1,1433/DataDocAI?driver=ODBC Driver 17 for SQL Server"
db = SQLDatabase.from_uri(connection_uri)

In [4]:
def get_schema(_):
    return db.get_table_info()

In [5]:
def run_query(query):
    return db.run(query)

In [6]:
from langchain.chat_models import ChatOpenAI
from langchain.schema.output_parser import StrOutputParser
from langchain.schema.runnable import RunnablePassthrough

model = ChatOpenAI(temperature=0, model="gpt-3.5-turbo-16k")

sql_response = (
        RunnablePassthrough.assign(schema=get_schema)
        | prompt
        | model.bind(stop=["\nSQLResult:"])
        | StrOutputParser()
    )

In [7]:
sql_response.invoke({"pergunta": "Quantas viagens foram realizadas para o destino RIO DE JANEIRO por WENDERSON FERREIRA BARBOSA DA SILVA?"})

"SELECT COUNT(*) \nFROM TB_CONSULTA_DIARIA_PASSAGENS_VI \nWHERE DESTINO = 'RIO DE JANEIRO' \nAND PES_NOME = 'WENDERSON FERREIRA BARBOSA DA SILVA'"

In [8]:
template = """Com base no esquema da tabela abaixo, pergunta, consulta SQL e resposta SQL, escreva a resposta para o usuário em linguagem natural:
{schema}

Pergunta: {pergunta}
Consulta SQL: {query}
Resposta SQL: {response}"""

prompt_response = ChatPromptTemplate.from_template(template)

In [9]:
full_chain = (
    RunnablePassthrough.assign(query=sql_response) 
    | RunnablePassthrough.assign(
        schema=get_schema,
        response=lambda x: db.run(x["query"]),
    )
    | prompt_response 
    | model
)

In [10]:
full_chain.invoke({"pergunta": "Quantas viagens foram realizadas para o destino RIO DE JANEIRO por WENDERSON FERREIRA BARBOSA DA SILVA?"})

AIMessage(content='Foram realizadas 14 viagens para o destino RIO DE JANEIRO por WENDERSON FERREIRA BARBOSA DA SILVA.')

## Use RunnableParallel/RunnableMap

RunnableParallel (também conhecido como RunnableMap) facilita a execução de vários Runnables em paralelo e o retorno da saída desses Runnables como um mapa.

In [11]:
from langchain.chat_models import ChatOpenAI
from langchain.prompts import ChatPromptTemplate
from langchain.schema.runnable import RunnableParallel


model = ChatOpenAI()
joke_chain = ChatPromptTemplate.from_template("conte-me uma piada sobre {topic}") | model
poem_chain = ChatPromptTemplate.from_template("escreva um poema de 2 versos sobre {topic}") | model

map_chain = RunnableParallel(joke=joke_chain, poem=poem_chain)

map_chain.invoke({"topic": "urso"})

{'joke': AIMessage(content='Claro! Lá vai:\n\nPor que o urso não usa celular?\nPorque ele tem garras, não dedos!'),
 'poem': AIMessage(content='Pelos grossos, imponente,\nO urso reina na floresta selvagem.')}

## Manipulating outputs/inputs
<hr>
Os mapas podem ser úteis para manipular a saída de um Runnable para corresponder ao formato de entrada do próximo Runnable em uma sequência.

In [12]:
from langchain.embeddings import OpenAIEmbeddings
from langchain.schema.output_parser import StrOutputParser
from langchain.schema.runnable import RunnablePassthrough
from langchain.vectorstores import FAISS

vectorstore = FAISS.from_texts(["Harrison trabalhou na Kensho"], embedding=OpenAIEmbeddings())
retriever = vectorstore.as_retriever()
template = """Responda à pergunta com base apenas no seguinte contexto:
{context}

Question: {question}
"""
prompt = ChatPromptTemplate.from_template(template)

retrieval_chain = (
    {"context": retriever, "question": RunnablePassthrough()} 
    | prompt 
    | model 
    | StrOutputParser()
)

retrieval_chain.invoke("onde Harrison trabalhou?")

'Harrison trabalhou na Kensho.'

Aqui, espera-se que a entrada para o prompt seja um mapa com as chaves "contexto" e "pergunta". A entrada do usuário é apenas a questão. Portanto, precisamos obter o contexto usando nosso recuperador e passar a entrada do usuário na chave "pergunta".

Observe que ao compor um RunnableMap quando outro Runnable nem precisamos agrupar nosso dicionário na classe RunnableMap - a conversão de tipo é feita para nós.

### Parallelism

RunnableMaps também são úteis para executar processos independentes em paralelo, uma vez que cada Runnable no mapa é executado em paralelo. Por exemplo, podemos ver que nossos anteriores joke_chain, poema_chain e map_chain têm aproximadamente o mesmo tempo de execução, embora map_chain execute os outros dois.

In [13]:
joke_chain.invoke({"topic": "urso"})

AIMessage(content='Claro, aqui está uma piada sobre urso:\n\nPor que os ursos nunca são convidados para festas?\nPorque eles sempre chegam com a "cara" de quem vai comer tudo!')

In [14]:
poem_chain.invoke({"topic": "urso"})

AIMessage(content='No frio da floresta, \nO urso reina em festa.')

In [15]:
map_chain.invoke({"topic": "urso"})

{'joke': AIMessage(content='Claro! Aqui está uma piada sobre urso:\n\nPor que o urso não usa cartão de crédito?\n\nPorque ele já tem um montão de ursos-dinheiro!'),
 'poem': AIMessage(content='Urso majestoso, na floresta a vagar,\nImponência selvagem, a natureza a encantar.')}

## Route between multiple Runnables

Este caderno aborda como fazer roteamento na LangChain Expression Language.

O roteamento permite criar cadeias não determinísticas onde a saída de uma etapa anterior define a próxima etapa. O roteamento ajuda a fornecer estrutura e consistência em torno das interações com LLMs.

Existem duas maneiras de realizar o roteamento:

- Usando um RunnableBranch.

- Escrever uma função de fábrica personalizada que recebe a entrada de uma etapa anterior e retorna um executável. 

É importante ressaltar que isso deve retornar um executável e NÃO realmente executado.
Ilustraremos ambos os métodos usando uma sequência de duas etapas, onde a primeira etapa classifica uma pergunta de entrada como sendo sobre LangChain, Anthropic ou Other e, em seguida, encaminha para uma cadeia de prompts correspondente.

### Using a RunnableBranch
<hr>
Um RunnableBranch é inicializado com uma lista de pares (condição, executável) e um executável padrão. Ele seleciona qual ramificação passando para cada condição a entrada com a qual é invocada. Ele seleciona a primeira condição a ser avaliada como True e executa o executável correspondente a essa condição com a entrada.

Se nenhuma condição fornecida corresponder, ele executa o executável padrão.

Aqui está um exemplo de como fica em ação:

In [16]:
from langchain.prompts import PromptTemplate
from langchain.chat_models import ChatAnthropic
from langchain.schema.output_parser import StrOutputParser

Primeiro, vamos criar uma cadeia que identificará as perguntas recebidas como sendo sobre LangChain, Anthropic ou Other:

In [17]:
chain = PromptTemplate.from_template("""Dada a pergunta do usuário abaixo, classifique-a como sendo sobre `LangChain`, `Anthropic` ou `Other`.
                                     
Não responda com mais de uma palavra.

<question>
{question}
</question>

Classification:""") | ChatAnthropic() | StrOutputParser()

ValidationError: 1 validation error for ChatAnthropic
__root__
  Did not find anthropic_api_key, please add an environment variable `ANTHROPIC_API_KEY` which contains it, or pass  `anthropic_api_key` as a named parameter. (type=value_error)

## Querying a SQL DB

We can replicate our SQLDatabaseChain with Runnables.

In [None]:
import pyodbc

In [None]:
from langchain.prompts import ChatPromptTemplate

template = """Based on the table schema below, write a SQL query that would answer the user's question:
{schema}

Question: {question}
SQL Query:"""
prompt = ChatPromptTemplate.from_template(template)

In [None]:
from langchain.utilities import SQLDatabase

In [None]:
connection_uri = "mssql+pyodbc://sa:data2030works@172.18.144.1,1433/DataDocAI?driver=ODBC Driver 17 for SQL Server"
engine = create_engine(connection_uri)

In [None]:
db = SQLDatabase(engine)

In [None]:
def get_schema(_):
    return db.get_table_info()

In [None]:
def run_query(query):
    return db.run(query)

In [None]:
from langchain.chat_models import ChatOpenAI #ok
from langchain.schema.output_parser import StrOutputParser
from langchain.schema.runnable import RunnablePassthrough

model = ChatOpenAI()

sql_response = (
        RunnablePassthrough.assign(schema=get_schema)
        | prompt
        | model.bind(stop=["\nSQLResult:"])
        | StrOutputParser()
    )

In [None]:
sql_response.invoke({"question": "How many trips ALESSANDRO DA VEIGA TEIXEIRA KNAUFT has made to Rio de Janeiro?"})

## Just connecting

In [None]:
import io
import pyodbc

In [None]:
from urllib.parse import quote

In [None]:
from langchain.llms.openai import OpenAI

In [None]:
import sqlalchemy as db
from sqlalchemy import create_engine, text


In [None]:
password = "xxxxx"
encoded_password = quote(password)

In [None]:
from langchain.agents import create_sql_agent
from langchain.agents.agent_toolkits import SQLDatabaseToolkit
from langchain.agents import AgentExecutor

from langchain.sql_database import SQLDatabase

from dotenv import load_dotenv # pip install load-dotenv
load_dotenv()

#import psycopg2 # pip install psycopg-binary

In [None]:
connection_uri = "mssql+pyodbc://sa:data2030works@172.18.144.1,1433/DataDocAI?driver=ODBC Driver 17 for SQL Server"
engine = create_engine(connection_uri)