# LLMs

Modelos de Linguagem Graandes (LLMs, na sigla em inglês) são um componente central do LangChain. O LangChain não fornece seus próprios LLMs, mas sim oferece uma interface padrão para interagir com diversos LLMs diferentes. Para ser específico, essa interface é uma que recebe como entrada uma string e retorna uma string.

Existem muitos provedores de LLMs (OpenAI, Cohere, Hugging Face, etc) - a classe LLM é projetada para fornecer uma interface padrão para todos eles.

In [8]:
from dotenv import load_dotenv
load_dotenv()

from langchain.llms import OpenAI

llm = OpenAI(model='gpt-3.5-turbo-instruct')

  llm = OpenAI(model='gpt-3.5-turbo-instruct')


### Chamando a LLM

In [3]:
question = 'Tell a brief story about learning how to program'
for text in llm.stream(question):
    print(text, end='')



Samantha had always been fascinated by technology and computers. She spent hours tinkering with gadgets and exploring different software programs. As she grew older, she became more and more interested in how these programs were created and decided to learn how to code.

At first, Samantha was overwhelmed by the seemingly complex world of programming. She didn't know where to start or what language to learn. But with determination, she began reading books and watching online tutorials. She started with the basics of HTML and CSS, slowly building her knowledge and skills.

As she continued to learn, Samantha faced challenges and encountered errors in her code. But she didn't give up. She would spend hours debugging and troubleshooting, determined to find a solution. Over time, she started to understand the logic behind programming and could write simple programs on her own.

Samantha's hard work paid off when she landed an internship at a software company. There, she had the opportuni

### Chamadas simultâneas

In [4]:
questions = [
    'What is sky?',
    'What is Earth?',
    'What are stars?'
]

llm.batch(questions)

["\n\nSky is the atmosphere or outer space seen from the Earth. It is the area above the Earth's surface that appears to be blue during the day and black at night. The sky is made up of gases, including oxygen and nitrogen, as well as particles such as water vapor, dust, and pollutants. The sky also contains clouds, which are formed by water droplets or ice crystals suspended in the atmosphere. The sky provides a backdrop for celestial bodies such as the sun, moon, and stars. ",
 "\n\nEarth is the third planet from the Sun and the only known planet to support life. It has a diverse ecosystem with a variety of plants, animals, and microorganisms. It is a terrestrial planet with a solid surface and is primarily composed of rock and minerals. It has a thin atmosphere that protects life from harmful radiation and regulates the planet's temperature. Earth is also known for its vast oceans, which cover about 71% of its surface. It rotates on its axis, causing day and night, and orbits around

### ChatModels

ChatModels são um componente central do LangChain. 

Um modelo de chat é um modelo de linguagem que utiliza mensagens de chat como entradas e retorna mensagens de chat como saídas (ao invés de usar texto puro).

O LangChain possui integrações com vários provedores de modelos (OpenAI, Cohere, Hugging Face, etc.) e expõe uma interface padrão para interagir com todos esses modelos.

In [6]:
from langchain_openai import ChatOpenAI

chat = ChatOpenAI(model='gpt-3.5-turbo-0125')

In [8]:
from langchain_core.messages import HumanMessage, SystemMessage

messages = [
    SystemMessage(content='You are an assistant that tells jokes'),
    HumanMessage(content='Quanto é 1 + 1?')
]

answer = chat.invoke(messages)

In [9]:
print(answer.content)

Depende, se for em um mundo matemático, é 2. Mas se for em um mundo onde um pato está perto de outro pato, a resposta é "quack quack"!


In [10]:
answer.response_metadata

{'token_usage': {'completion_tokens': 45,
  'prompt_tokens': 27,
  'total_tokens': 72,
  'completion_tokens_details': {'accepted_prediction_tokens': 0,
   'audio_tokens': 0,
   'reasoning_tokens': 0,
   'rejected_prediction_tokens': 0},
  'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
 'model_name': 'gpt-3.5-turbo-0125',
 'system_fingerprint': None,
 'finish_reason': 'stop',
 'logprobs': None}

In [11]:
# Usando streams

from langchain_core.messages import HumanMessage, SystemMessage

messages = [
    SystemMessage(content='You are an assistant that tells jokes'),
    HumanMessage(content='Quanto é 1 + 1?')
]

for text in chat.stream(messages):
    print(text.content, end = '')


Depende, estamos falando de matemática ou de um jogo de adivinhação? Porque se for matemática, a resposta é 2. Mas se for um jogo de adivinhação, a resposta poderia ser "onze" se você juntar os dois números!

Existem 5 tipos de mensagens diferentes:
 - HumanMessage: representa uma mensagem do usuário. Geralmente consiste apenas de conteúdo.
 - AIMessage: representa uma mensagem do modelo. Pode ter additional_kwargs incluídos - por exemplo, tool_calls se estiver usando chamadas de ferramentas da OpenAI.
 - SystemMessage: representa uma mensagem do sistema, que indica ao modelo como se comportar. Geralmente consiste apenas de conteúdo. Nem todo modelo suporta isso.
 - FunctionMessage: representa o resultado de uma chamada de função. Além do papel e conteúdo, esta mensagem tem um parâmetro de nome que transmite o nome da função que foi chamada para produzir este resultado.
 - ToolMessage: representa o resultado de uma chamada de ferramenta. Isso é diferente de uma FunctionMessage a fim de corresponder aos tipos de mensagens de função e ferramenta da OpenAI. Além do papel e conteúdo, essa mensagem tem um parâmetro tool_call_id que transmite o id da chamada à ferramenta que foi feita para produzir esse resultado.

### Prompt Few-Shot

In [4]:
from langchain_openai import ChatOpenAI

chat = ChatOpenAI()

In [5]:
from langchain_core.messages import HumanMessage, AIMessage

messages = [
    HumanMessage(content='How much is 1 + 1?'),
    AIMessage(content='2'),
    HumanMessage(content='How much is 10 * 5?'),
    AIMessage(content='50'),
    HumanMessage(content='How much is 10 + 3?'),
]

chat.invoke(messages)

AIMessage(content='13', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 2, 'prompt_tokens': 52, 'total_tokens': 54, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-02421162-b6ed-4c41-894a-50044c094279-0', usage_metadata={'input_tokens': 52, 'output_tokens': 2, 'total_tokens': 54, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

## Utilizando outros modelos

In [2]:
from langchain_community.chat_models.huggingface import ChatHuggingFace
from langchain_community.llms.huggingface_endpoint import HuggingFaceEndpoint

In [4]:
model = 'mistralai/Mixtral-8x7B-Instruct-v0.1'

llm = HuggingFaceEndpoint(repo_id=model)
chat = ChatHuggingFace(llm=llm)

In [5]:
from langchain_core.messages import HumanMessage, AIMessage

messages = [
    HumanMessage(content='How much is 1 + 1?'),
    AIMessage(content='2'),
    HumanMessage(content='How much is 10 * 5?'),
    AIMessage(content='50'),
    HumanMessage(content='How much is 10 + 3?'),
]

chat.invoke(messages)

AIMessage(content=' 13. The sum of 10 and 3 is 13.', additional_kwargs={}, response_metadata={}, id='run-f3ccd200-a853-49a2-9b2f-ced044b8c48f-0')

A estrutura de chat_model utiliza a estrutura de LLM como backend

In [13]:
import langchain

langchain.debug = True
chat.invoke(messages)
langchain.debug = False

[32;1m[1;3m[llm/start][0m [1m[llm:ChatOpenAI] Entering LLM run with input:
[0m{
  "prompts": [
    "System: You are an assistant that tells jokes\nHuman: Quanto é 1 + 1?"
  ]
}
[36;1m[1;3m[llm/end][0m [1m[llm:ChatOpenAI] [0ms] Exiting LLM run with output:
[0m{
  "generations": [
    [
      {
        "text": "Depende, em que base você está contando? Em base 2, 1 + 1 = 10!",
        "generation_info": {
          "finish_reason": "stop",
          "logprobs": null
        },
        "type": "ChatGeneration",
        "message": {
          "lc": 1,
          "type": "constructor",
          "id": [
            "langchain",
            "schema",
            "messages",
            "AIMessage"
          ],
          "kwargs": {
            "content": "Depende, em que base você está contando? Em base 2, 1 + 1 = 10!",
            "additional_kwargs": {
              "refusal": null
            },
            "response_metadata": {
              "token_usage": {
                "com

## Caching

### Cache em memória

In [9]:
from langchain_openai.chat_models import ChatOpenAI

chat = ChatOpenAI(model='gpt-3.5-turbo-0125')

In [10]:
from langchain_core.messages import HumanMessage, SystemMessage

messages = [
    SystemMessage(content='You are an assistant that tells jokes'),
    HumanMessage(content='Quanto é 1 + 1?')
]

In [11]:
from langchain.cache import InMemoryCache
from langchain.globals import set_llm_cache

set_llm_cache(InMemoryCache())

Executando pela primeira vez

In [15]:
%%time

chat.invoke(messages)

CPU times: total: 0 ns
Wall time: 0 ns


AIMessage(content='Depende, em que base você está contando? Em base 2, 1 + 1 = 10!', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 26, 'prompt_tokens': 27, 'total_tokens': 53, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-d057a4f7-4cb2-4041-8494-da3200a57a53-0', usage_metadata={'input_tokens': 27, 'output_tokens': 26, 'total_tokens': 53, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

### Cache SQLite

In [16]:
from langchain.cache import SQLiteCache
from langchain.globals import set_llm_cache

set_llm_cache(SQLiteCache(database_path='files/langchain_cache_db.sqlite'))

In [17]:
%%time

chat.invoke(messages)

CPU times: total: 0 ns
Wall time: 685 ms


AIMessage(content='Depende, estás a falar de matemática ou de amor? Porque, se for matemática, é 2. Mas se for amor, é 11!', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 39, 'prompt_tokens': 27, 'total_tokens': 66, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-faff50d0-3c1d-4b51-b231-d8f149fa5778-0', usage_metadata={'input_tokens': 27, 'output_tokens': 39, 'total_tokens': 66, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

Executando novamente

In [18]:
%%time

chat.invoke(messages)

CPU times: total: 93.8 ms
Wall time: 87.4 ms


AIMessage(content='Depende, estás a falar de matemática ou de amor? Porque, se for matemática, é 2. Mas se for amor, é 11!', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 39, 'prompt_tokens': 27, 'total_tokens': 66, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-faff50d0-3c1d-4b51-b231-d8f149fa5778-0', usage_metadata={'input_tokens': 27, 'output_tokens': 39, 'total_tokens': 66, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

## Prompt Templates

Um prompt para um modelo de linguagem é um conjunto de instruções ou entradas fornecidas por um usuário para guiar a resposta do modelo, ajudando-o a entender o contexto e gerar uma saída baseada em linguagem relevante e coerente, como responder a perguntas, completar frases ou participar de uma conversa.

In [19]:
from langchain_openai.llms import OpenAI

llm = OpenAI()

In [32]:
prompt_template = PromptTemplate.from_template('''
    Answer the following question from the user using up to {n_words} words:
    {question}
''', partial_variables={'n_words': 50})

In [29]:
print(prompt_template.format(n_words= 100, question='What is a black hole?'))


    Answer the following question from the user using up to 100 words:
    What is a black hole?



## Composing prompts | Unindo múltiplos prompts

In [36]:
from langchain_openai.llms import OpenAI

template_word_count = PromptTemplate.from_template('''
    Answer the question using up to {n_words} words.                                                
''')

template_language = PromptTemplate.from_template('''
    Return the answer in {language} language.                                                  
''')

final_template = template_word_count + template_language + 'Answer the question following the instructions: {question}'

final_template

PromptTemplate(input_variables=['language', 'n_words', 'question'], input_types={}, partial_variables={}, template='\n    Answer the question using up to {n_words} words.                                                \n\n    Return the answer in {language} language.                                                  \nAnswer the question following the instructions: {question}')

In [38]:
prompt = final_template.format(n_words=10, language='english', question='What is a star?')

llm.invoke(prompt)

'\n\nA star is a luminous sphere of plasma held together by its own gravity.'

In [39]:
print(prompt)


    Answer the question using up to 10 words.                                                

    Return the answer in english language.                                                  
Answer the question following the instructions: What is a star?


## Templates para Chat

In [40]:
from langchain.prompts import ChatPromptTemplate

chat_template = ChatPromptTemplate.from_template('This is my question: {question}')

chat_template.format_messages(question='Who am I?')

[HumanMessage(content='This is my question: Who am I?', additional_kwargs={}, response_metadata={})]

In [44]:
from langchain.prompts import ChatPromptTemplate

chat_template = ChatPromptTemplate.from_messages([
    ('system', 'You are a funny assistant and your name is {assistant_name}'),
    ('human', 'Hi, how are you?'),
    ('ai', 'Better now! How can I help you?'),
    ('human', '{question}')
])

chat_template

ChatPromptTemplate(input_variables=['assistant_name', 'question'], input_types={}, partial_variables={}, messages=[SystemMessagePromptTemplate(prompt=PromptTemplate(input_variables=['assistant_name'], input_types={}, partial_variables={}, template='You are a funny assistant and your name is {assistant_name}'), additional_kwargs={}), HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=[], input_types={}, partial_variables={}, template='Hi, how are you?'), additional_kwargs={}), AIMessagePromptTemplate(prompt=PromptTemplate(input_variables=[], input_types={}, partial_variables={}, template='Better now! How can I help you?'), additional_kwargs={}), HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['question'], input_types={}, partial_variables={}, template='{question}'), additional_kwargs={})])

In [45]:
chat_template.format_messages(assistant_name='Asimov', question='What is your name?')

[SystemMessage(content='You are a funny assistant and your name is Asimov', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='Hi, how are you?', additional_kwargs={}, response_metadata={}),
 AIMessage(content='Better now! How can I help you?', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='What is your name?', additional_kwargs={}, response_metadata={})]

In [46]:
from langchain_openai.chat_models import ChatOpenAI

chat = ChatOpenAI()

chat.invoke(chat_template.format_messages(assistant_name='Asimov', question='What is your name?'))

AIMessage(content='My name is Asimov, your friendly neighborhood assistant! How can I make you smile today?', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 21, 'prompt_tokens': 51, 'total_tokens': 72, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-74310a13-5435-446c-ab54-f947899bea82-0', usage_metadata={'input_tokens': 51, 'output_tokens': 21, 'total_tokens': 72, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [48]:
chat.invoke(chat_template.format_messages(assistant_name='Asimov', question='What is the meaning of life?'))

AIMessage(content="The meaning of life is a question that has puzzled humans for centuries. Some say it's to seek happiness, others say it's to find fulfillment or purpose. As for me, I'm just here to provide assistance and a little bit of humor along the way!", additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 54, 'prompt_tokens': 53, 'total_tokens': 107, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-da10047a-dd58-4f26-8640-acf4c4d0dc96-0', usage_metadata={'input_tokens': 53, 'output_tokens': 54, 'total_tokens': 107, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

## Templates de Few-Shot Prompting para LLMs

In [56]:
exemplos = [
    {"pergunta": "Quem viveu mais tempo, Muhammad Ali ou Alan Turing?", 
     "resposta": 
     """São necessárias perguntas de acompanhamento aqui: Sim. 
Pergunta de acompanhamento: Quantos anos Muhammad Ali tinha quando morreu? 
Resposta intermediária: Muhammad Ali tinha 74 anos quando morreu. 
Pergunta de acompanhamento: Quantos anos Alan Turing tinha quando morreu? 
Resposta intermediária: Alan Turing tinha 41 anos quando morreu. 
Então a resposta final é: Muhammad Ali 
""", 
    }, 
    {"pergunta": "Quando nasceu o fundador do craigslist?", 
     "resposta": 
"""São necessárias perguntas de acompanhamento aqui: Sim. 
Pergunta de acompanhamento: Quem foi o fundador do craigslist? 
Resposta intermediária: O craigslist foi fundado por Craig Newmark. 
Pergunta de acompanhamento: Quando nasceu Craig Newmark? 
Resposta intermediária: Craig Newmark nasceu em 6 de dezembro de 1952. 
Então a resposta final é: 6 de dezembro de 1952 
""", 
    }, 
    {"pergunta": "Quem foi o avô materno de George Washington?",
     "resposta": 
"""São necessárias perguntas de acompanhamento aqui: Sim. 
Pergunta de acompanhamento: Quem foi a mãe de George Washington? 
Resposta intermediária: A mãe de George Washington foi Mary Ball Washington. 
Pergunta de acompanhamento: Quem foi o pai de Mary Ball Washington? 
Resposta intermediária: O pai de Mary Ball Washington foi Joseph Ball. 
Então a resposta final é: Joseph Ball 
""", 
    },
    {"pergunta": "Os diretores de Jaws e Casino Royale são do mesmo país?", 
     "resposta": 
"""São necessárias perguntas de acompanhamento aqui: Sim. 
Pergunta de acompanhamento: Quem é o diretor de Jaws? 
Resposta Intermediária: O diretor de Jaws é Steven Spielberg. 
Pergunta de acompanhamento: De onde é Steven Spielberg? 
Resposta Intermediária: Estados Unidos. 
Pergunta de acompanhamento: Quem é o diretor de Casino Royale? 
Resposta Intermediária: O diretor de Casino Royale é Martin Campbell. 
Pergunta de acompanhamento: De onde é Martin Campbell? 
Resposta Intermediária: Nova Zelândia. 
Então a resposta final é: Não 
""",
    },
]

In [57]:
from langchain.prompts.few_shot import FewShotPromptTemplate

from langchain.prompts.prompt import PromptTemplate

example_prompt = PromptTemplate(
    input_variables=['pergunta', 'resposta'],
    template='Pergunta {pergunta}\n{resposta}'
)

example_prompt.format(**exemplos[0])


'Pergunta Quem viveu mais tempo, Muhammad Ali ou Alan Turing?\nSão necessárias perguntas de acompanhamento aqui: Sim. \nPergunta de acompanhamento: Quantos anos Muhammad Ali tinha quando morreu? \nResposta intermediária: Muhammad Ali tinha 74 anos quando morreu. \nPergunta de acompanhamento: Quantos anos Alan Turing tinha quando morreu? \nResposta intermediária: Alan Turing tinha 41 anos quando morreu. \nEntão a resposta final é: Muhammad Ali \n'

In [58]:
prompt = FewShotPromptTemplate(
    examples = exemplos,
    example_prompt = example_prompt,
    suffix = 'Pergunta: {input}',
    input_variables = ['input']
)

In [59]:
print(prompt.format(input='Quem fez mais gols, Romário ou Pelé?'))

Pergunta Quem viveu mais tempo, Muhammad Ali ou Alan Turing?
São necessárias perguntas de acompanhamento aqui: Sim. 
Pergunta de acompanhamento: Quantos anos Muhammad Ali tinha quando morreu? 
Resposta intermediária: Muhammad Ali tinha 74 anos quando morreu. 
Pergunta de acompanhamento: Quantos anos Alan Turing tinha quando morreu? 
Resposta intermediária: Alan Turing tinha 41 anos quando morreu. 
Então a resposta final é: Muhammad Ali 


Pergunta Quando nasceu o fundador do craigslist?
São necessárias perguntas de acompanhamento aqui: Sim. 
Pergunta de acompanhamento: Quem foi o fundador do craigslist? 
Resposta intermediária: O craigslist foi fundado por Craig Newmark. 
Pergunta de acompanhamento: Quando nasceu Craig Newmark? 
Resposta intermediária: Craig Newmark nasceu em 6 de dezembro de 1952. 
Então a resposta final é: 6 de dezembro de 1952 


Pergunta Quem foi o avô materno de George Washington?
São necessárias perguntas de acompanhamento aqui: Sim. 
Pergunta de acompanhamento: 

In [61]:
llm.invoke(prompt.format(input='Quem fez mais gols, Romário ou Pelé?'))

' \nSão necessárias perguntas de acompanhamento aqui: Não. \nEntão a resposta final é: Pelé'

## Template de Few-Shot Prompting para Chat

In [62]:
from langchain_openai.chat_models import ChatOpenAI

chat = ChatOpenAI()

In [66]:
from langchain.prompts.few_shot import FewShotChatMessagePromptTemplate

from langchain.prompts import ChatPromptTemplate

example_prompt = ChatPromptTemplate.from_messages(
    [('human', '{pergunta}'),
     ('ai', '{resposta}')]
)

print(example_prompt.format_messages(**exemplos[0]))

[HumanMessage(content='Quem viveu mais tempo, Muhammad Ali ou Alan Turing?', additional_kwargs={}, response_metadata={}), AIMessage(content='São necessárias perguntas de acompanhamento aqui: Sim. \nPergunta de acompanhamento: Quantos anos Muhammad Ali tinha quando morreu? \nResposta intermediária: Muhammad Ali tinha 74 anos quando morreu. \nPergunta de acompanhamento: Quantos anos Alan Turing tinha quando morreu? \nResposta intermediária: Alan Turing tinha 41 anos quando morreu. \nEntão a resposta final é: Muhammad Ali \n', additional_kwargs={}, response_metadata={})]


In [77]:
few_show_template = FewShotChatMessagePromptTemplate(
    examples=exemplos,
    example_prompt=example_prompt
)

prompt_template = ChatPromptTemplate.from_messages(
    [few_show_template,
    ('human', '{input}')]
)

prompt = prompt_template.format_messages(input='Quem fez mais gols, Romário ou Pelé?')


In [75]:
chat.invoke(prompt)

AIMessage(content='Pelé marcou mais gols ao longo de sua carreira do que Romário. Pelé é considerado um dos maiores artilheiros da história do futebol, com mais de 1.000 gols marcados em jogos oficiais e amistosos. Romário, por sua vez, também teve uma carreira de sucesso e marcou muitos gols, mas não alcançou a marca impressionante de Pelé.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 98, 'prompt_tokens': 538, 'total_tokens': 636, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-bd224c08-619a-421c-8643-64e7ba044ca9-0', usage_metadata={'input_tokens': 538, 'output_tokens': 98, 'total_tokens': 636, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_deta

## Output Parsers

Os analisadores de saída são responsáveis por pegar a saída de um LLM e transformá-la em um formato mais adequado. Isso é muito útil quando você está usando LLMs para gerar qualquer forma de dados estruturados.

Digamos que temos a seguinte review de um produto:

> "Este soprador de folhas é incrível. Ele tem quatro configurações: sopro de vela, brisa suave, cidade ventosa e tornado. Chegou em dois dias, bem a tempo para o presente de aniversário da minha esposa. Acho que minha esposa gostou tanto que ficou sem palavras. Até agora, fui o único a usá-lo, e tenho usado em todas as manhãs alternadas para limpar as folhas do nosso gramado. É um pouco mais caro do que os outros sopradores de folhas disponíveis no mercado, mas acho que vale a pena pelas características extras."

E eu quero que o modelo de linguagem processe esta review para estruturá-la no seguinte formato:

```python
{
    "presente": true,
    "dias_entrega": 2,
    "percepcao_de_valor": ["um pouco mais caro do que os outros sopradores de folhas disponíveis no mercado"]
}
```

In [78]:
from langchain.output_parsers import ResponseSchema
from langchain.output_parsers import StructuredOutputParser

In [82]:
schema_presente = ResponseSchema(
    name='presente',
    type='bool',
    description='O item foi comprado para alguém? True caso verdadeiro e False caso falso ou não tenha a informação'
)

schema_entrega = ResponseSchema(
    name='dias_entrega',
    type='int',
    description='Quantos dias para a entrega chegar? Se a resposta não for encontrada, retorne -1'
)

schema_valor = ResponseSchema(
    name='percepcao_de_valor',
    type='list',
    description='Extraia qualquer frase sobre o valor ou preço do produto. Retorne como uma lista de Python'
)

response_schema = [schema_presente, schema_entrega, schema_valor]

output_parser = StructuredOutputParser.from_response_schemas(response_schema)

schema_formatado = output_parser.get_format_instructions()
print(schema_formatado)

The output should be a markdown code snippet formatted in the following schema, including the leading and trailing "```json" and "```":

```json
{
	"presente": bool  // O item foi comprado para alguém? True caso verdadeiro e False caso falso ou não tenha a informação
	"dias_entrega": int  // Quantos dias para a entrega chegar? Se a resposta não for encontrada, retorne -1
	"percepcao_de_valor": list  // Extraia qualquer frase sobre o valor ou preço do produto. Retorne como uma lista de Python
}
```


In [86]:
from langchain.prompts import ChatPromptTemplate

review_cliente = '''
    Este soprador de folhas é incrível. Ele tem quatro configurações: sopro de vela, brisa suave, cidade ventosa e tornado. Chegou em dois dias, bem a tempo para o presente de aniversário da minha esposa. Acho que minha esposa gostou tanto que ficou sem palavras. Até agora, fui o único a usá-lo, e tenho usado em todas as manhãs alternadas para limpar as folhas do nosso gramado. É um pouco mais caro do que os outros sopradores de folhas disponíveis no mercado, mas acho que vale a pena pelas características extras.
'''

review_template = ChatPromptTemplate.from_template('''
    Para o texto a seguir, extraia as seguintes informações:
    
    presente, dias_entrega e percepcao_de_valor
    
    Texto: {review}           
    
    {schema}                        
''', partial_variables={'schema': schema_formatado})

analise = review_template.format_messages(review=review_cliente)

In [88]:
from langchain_openai.chat_models import ChatOpenAI

chat = ChatOpenAI()
resposta = chat.invoke(analise)
print(resposta.content)

```json
{
	"presente": true,
	"dias_entrega": 2,
	"percepcao_de_valor": ["É um pouco mais caro do que os outros sopradores de folhas disponíveis no mercado, mas acho que vale a pena pelas características extras."]
}
```


In [89]:
resposta_json = output_parser.parse(resposta.content)

In [90]:
resposta_json['presente']

True

In [91]:
resposta_json['dias_entrega']

2

In [92]:
resposta_json['percepcao_de_valor']

['É um pouco mais caro do que os outros sopradores de folhas disponíveis no mercado, mas acho que vale a pena pelas características extras.']