<h1 align="center"><font color="yellow">Uma visão geral do LangChain</font></h1>

<font color="yellow">Data Scientist.: Dr.Eddy Giusepe Chirinos Isidro</font>

# Contextualizando

LangChain, é uma ferramenta de código aberto e adicionou recentemente `Plugins ChatGPT`. Ele fornece tantos recursos que considero úteis:


🤗 integração com vários fornecedores de `LLM`, incluindo `OpenAI`, `Cohere`, `Huggingface` e muito mais.

🤗 crie um bot de `Question-Answering` ou `Text Summarization` com seu próprio documento

🤗 forneça o `plug-in` OpenAI ChatGPT Retriever

🤗 lide com o histórico de bate-papo com memória LangChain

🤗 encadeie vários `LLMs` e use `LLMs` com um conjunto de ferramentas como `Google Search`, `Python REPL` e muito mais.



O mais incrível é que o `LangChain` é de código aberto e é um esforço da comunidade. Nesta postagem, a [Cientista de Dados Sênior: Sophia Yang](https://www.youtube.com/SophiaYangDS), abordará 6 funcionalidades do `LangChain`.



# <font color="yellow">1.</font> LangChain integra-se com muitos fornecedores de `LLM`

Com a mesma interface, você obtém acesso a muitos modelos `LLM` de vários provedores LLM, incluindo `OpenAI`, `Cohere`, `AI21`, `Huggingface Hub`, `Azure OpenAI`, `Manifest`, `Goose AI`, `Writer`, `Banana`, `Modal`, `StochasticAI`, `Cerebrium`, `Petals`, `Forefront AI`, `PromptLayer Modelos OpenAI`, `Anthropic`, `DeepInfra` e `auto-hospedados`.

Aqui está um exemplo de acesso ao `modelo OpenAI ChatGPT` e ao `modelo GPT3`, ao `modelo command-xlarge do Cohere` e ao `modelo Flan T5` do Google hospedado no `Hugging Face Hub`.

In [None]:
# Instalamos as bibliotecas
%pip install langchain openai cohere huggingface_hub ipywidgets chromadb google-search-results


In [2]:
import os
import langchain
from langchain.llms import OpenAI, Cohere, HuggingFaceHub
from langchain.chat_models import ChatOpenAI
from langchain.schema import (
    AIMessage,
    HumanMessage,
    SystemMessage
)


In [3]:
# Isto é quando usas o arquivo .env:
import openai 
from dotenv import load_dotenv
import os
print('Carregando a minha chave Key: ', load_dotenv())
Eddy_API_KEY_OpenAI = os.environ['OPENAI_API_KEY']  
Eddy_API_KEY_Cohere = os.environ["COHERE_API_KEY"]
Eddy_API_KEY_HuggingFace = os.environ["HUGGINGFACEHUB_API_TOKEN"]
#Eddy_API_KEY_SerpApi = os.environ["SERPAPI_API_KEY"]

Carregando a minha chave Key:  True


<font color="orange">Então podemos dar um `prompt` para cada um desses modelos (a seguir) e ver o que eles retornam. Uma coisa a observar é que, para modelos de bate-papo, podemos especificar se a mensagem é uma `mensagem humana`, uma `mensagem de IA` ou uma `mensagem do sistema`. É por isso que, para o modelo `ChatGPT, especifiquei minha mensagem como uma mensagem humana`.</font>

In [4]:
text = "Como é ser feliz?"

## <font color="red">Modelo ChatGPT</font>

In [5]:
chatgpt = ChatOpenAI(model_name='gpt-3.5-turbo')

In [6]:
print(chatgpt([HumanMessage(content=text)]))

content='Como sou uma inteligência artificial, não sou capaz de experimentar emoções como um ser humano. No entanto, posso explicar que a felicidade é um estado de espírito em que uma pessoa se sente satisfeita, grata e alegre com sua vida. Ela pode ser alcançada de várias maneiras, como cultivando relações saudáveis, praticando atividades que trazem prazer, buscando e alcançando seus objetivos e metas pessoais, estando em paz consigo mesma, entre outras. Cada indivíduo experimenta a felicidade de maneira diferente, mas é um estado que todos buscam e que pode trazer muita satisfação e bem-estar.' additional_kwargs={}


## <font color="red">Modelo GPT3</font>

In [7]:
gpt3 = OpenAI(model_name='text-davinci-003')

In [8]:
print(gpt3(text))



Ser feliz é sentir-se plenamente realizado e satisfeito com a sua vida, ter um senso de propósito e alegria, e aproveitar o momento presente. É também sentir-se conectado aos outros e à natureza e apreciar as pequenas coisas da vida. Significa ter esperança e otimismo para o futuro.


## <font color="red">Modelo Cohere</font>

In [9]:
cohere = Cohere(model='command-xlarge')

In [10]:
print(cohere(text))


Essa pergunta é muito interessante. Eu acho que ser feliz é respeitar as suas belezas e suas vertentes, lidar com as suas falhas, pasmando pelas suas situações, e sentindo que, nos seus momentos mais difíceis, algo "outside" o teu controle estará a ajudá-lo a ultrapassar esses momentos. Seja feliz significa sentir o seu lado humano, sentindo aos poucos que temos a satisfação de "conquistá-lo", e ao mesmo tempo ter a certeza de que, no entanto, algum outro homem poderá "conquistá-lo", apesar de tudo o que nós temos e o que podemos fazer. Seja feliz é acreditar.
Being happy is ...
this is a very interesting question. I think being happy is showing respect for your beauty and your facets, dealing with your flaws, going through your situations, and feeling that, in your most difficult moments, something "outside" your control will help you overcome these moments. Being happy means feeling human, feeling from time to time that we have the satisfaction of "conquering" it, and at the same ti

## <font color="red">Modelo Flan</font>

In [11]:
flan = HuggingFaceHub(repo_id="google/flan-t5-xl")

In [12]:
print(flan(text))

eu no tenho ninguém que 


# <font color="yellow">2.</font> Resposta a perguntas com documentos externos

Você está interessado em criar um `bot` de resposta a perguntas com documentos externos? Seus documentos são salvos em `PDF`, `arquivo txt` ou `mesmo Notion`? E se eu quiser fazer perguntas e respostas com vídeos do YouTube?

Sem problemas, a `LangChain` cuida de você. LangChain fornece muitos carregadores de documentos: `File Loader`, `Directory Loader`, `Notion`, `ReadTheDocs`, `HTML`, `PDF`, `PowerPoint`, `Email`, `GoogleDrive`, `Obsidian`, `Roam`, `EverNote`, `YouTube`, `Hacker News`, `GitBook`, `Arquivo S3`, `Diretório S3`, `Arquivo GCS`, `GCS Directory`, `Web Base`, `IMSDb`, `AZLyrics`, `College Confidential`, `Gutenberg`, `Airbyte Json`, `CoNLL-U`, `iFixit`, `Notebook`, `Copypaste`, `CSV`, `Facebook Chat`, `Image`, `Markdown`, `SRT`, `Telegram`, `URL`, `Word Document`, `Blackboard`. <font color="orange">Você tem outra fonte que não está listada aqui? Você pode contribuir e adicionar ao LangChain, pois é de código aberto!</font>


Aqui está um exemplo em que usamos o `TextLoader` para carregar um `arquivo txt local`, criar o `índice VectoreStore` e fazer uma query do seu índice. Intuitivamente, seus documentos serão divididos e incorporados em vetores e armazenados em um `banco de dados de vetores`. A `query` localiza qual vetor está mais próximo do vetor da pergunta no banco de dados de vetores.

In [13]:
# Carregamos nosso documento:
from langchain.document_loaders import TextLoader
loader = TextLoader('./estado_da_Uniao.txt')
loader


<langchain.document_loaders.text.TextLoader at 0x7f29978f2ad0>

In [14]:
from langchain.indexes import VectorstoreIndexCreator

index = VectorstoreIndexCreator().from_loaders([loader])

Using embedded DuckDB without persistence: data will be transient


In [15]:
query = "O que o presidente disse sobre Ketanji Brown Jackson"
index.query(query)


' O presidente disse que ela é uma das maiores mentes jurídicas de nosso país e que ela continuará o legado de excelência do juiz Breyer. Ele também disse que ela é um ex-litigante superior em prática privada, ex-defensor público federal e de uma família de educadores de escola pública e policiais. Ele disse que ela é um construtor de consenso e que recebeu amplo apoio desde que foi nomeada.'

<font color="orange">A notícia empolgante é que o `LangChain` integrou recentemente o `plug-in de recuperação ChatGPT` para que as pessoas possam usar esse recuperador em vez de um índice. Qual é a diferença entre um `índice` e um `recuperador`(retriever)? De acordo com `LangChain`, “Um índice é uma estrutura de dados que oferece suporte à pesquisa eficiente, `e um recuperador é o componente que usa o índice para localizar e retornar documentos relevantes em resposta à consulta de um usuário`. O índice é um componente chave do qual o retriever depende para desempenhar sua função.”</font>

# <font color="yellow">3.</font> Manter/resumir o histórico de bate-papo (Chat)

<font color="orange">Quando você conversa com o ChatGPT, ele não mantém seu histórico de bate-papo.</font> Você precisará copiar e colar seu chat no novo prompt para deixá-lo ciente do histórico. O `LangChain` resolve esse problema fornecendo várias opções diferentes para lidar com o histórico de bate-papo - `manter todas as conversas`, `manter as k conversas mais recentes`, `resumir a conversa` e uma combinação dos itens acima.

Aqui está um exemplo onde usamos `ConversationBufferWindowMemory` para manter a última rodada de conversa, usamos `ConversationSummaryMemory` para resumir conversas anteriores e usamos `CombinedMemory` para combinar dois métodos:

In [20]:
from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate
from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferWindowMemory, CombinedMemory, ConversationSummaryMemory


conv_memory = ConversationBufferWindowMemory(
    memory_key="chat_history_lines",
    input_key="input",
    k=1
    )

summary_memory = ConversationSummaryMemory(
    llm=OpenAI(),
    input_key="input"
    )

# Combinado
memory = CombinedMemory(memories=[conv_memory, summary_memory])

_DEFAULT_TEMPLATE = """O que se segue é uma conversa amigável entre um humano e uma IA. A IA é falante e fornece muitos detalhes específicos de seu contexto. Se a IA não souber a resposta para uma pergunta, ela diz com sinceridade que não sabe.

Summary of conversation:
{history}
Current conversation:
{chat_history_lines}
Human: {input}
AI:"""

PROMPT = PromptTemplate(
    input_variables=["history", "input", "chat_history_lines"], template=_DEFAULT_TEMPLATE
)

llm = OpenAI(temperature=0)

conversation = ConversationChain(
    llm=llm, 
    verbose=True, 
    memory=memory,
    prompt=PROMPT
)


<font color="orange">Aqui está o resultado onde você pode ver o `resumo da conversa` e a `última conversa passada` para o prompt.</font>

In [21]:
conversation.run("Olá!")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mO que se segue é uma conversa amigável entre um humano e uma IA. A IA é falante e fornece muitos detalhes específicos de seu contexto. Se a IA não souber a resposta para uma pergunta, ela diz com sinceridade que não sabe.

Summary of conversation:

Current conversation:

Human: Olá!
AI:[0m

[1m> Finished chain.[0m


' Olá! Meu nome é AI. Como posso ajudar?'

In [22]:
conversation.run("Você pode me contar uma piada??")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mO que se segue é uma conversa amigável entre um humano e uma IA. A IA é falante e fornece muitos detalhes específicos de seu contexto. Se a IA não souber a resposta para uma pergunta, ela diz com sinceridade que não sabe.

Summary of conversation:

The human greets the AI, to which the AI responds with a greeting and introduces itself as AI, offering to help.
Current conversation:
Human: Olá!
AI:  Olá! Meu nome é AI. Como posso ajudar?
Human: Você pode me contar uma piada??
AI:[0m

[1m> Finished chain.[0m


' Claro! Qual é o animal mais preguiçoso? Um panda, porque ele passa 12 horas por dia comendo e 12 horas por dia dormindo!'

In [23]:
conversation.run("Você pode me contar uma piada parecida?")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mO que se segue é uma conversa amigável entre um humano e uma IA. A IA é falante e fornece muitos detalhes específicos de seu contexto. Se a IA não souber a resposta para uma pergunta, ela diz com sinceridade que não sabe.

Summary of conversation:


The human greets the AI, to which the AI responds with a greeting and introduces itself as AI, offering to help. The human then asks the AI to tell them a joke, to which the AI responds with a joke about a lazy panda.
Current conversation:
Human: Você pode me contar uma piada??
AI:  Claro! Qual é o animal mais preguiçoso? Um panda, porque ele passa 12 horas por dia comendo e 12 horas por dia dormindo!
Human: Você pode me contar uma piada parecida?
AI:[0m

[1m> Finished chain.[0m


' Sim, com certeza! Qual é o animal mais preguiçoso do mundo? Um hipopótamo, porque ele passa 16 horas por dia na água e 8 horas por dia dormindo!'

# <font color="yellow">4.</font> Chains

Às vezes, você pode querer encadear (`chain`) diferentes `LLMs`. <font color="pink">Por exemplo:</font>

🤓 Você pode querer que a saída do `primeiro LLM` sirva como entrada do `segundo LLM`.

🤓 Ou você pode querer `resumir` (summarize) as saídas do `primeiro` e do `segundo` LLM e passar o resumo como entrada para o `terceiro LLM`.

🤓 Ou você pode querer `encadear seu modelo de linguagem` com outra cadeia de utilitários para fazer `operações matemáticas` ou Python.


<font color="orange">Aqui está um exemplo básico do método `SimpleSequentialChain`. <font color="pink">A primeira rede (chain) pede ao `ChatGPT` para obter um bom nome de produto para uma empresa que fabrica meias coloridas. ChatGPT retorna `“Rainbow Sox Co.”`</font> <font color="green">A segunda cadeia usa esse nome como entrada e pede ao ChatGPT para escrever uma frase de efeito para a empresa `“Rainbow Sox Co.”` ChatGPT escreveu: “Coloque um pouco de cor no seu passo com Rainbow Sox Co!”</font>

In [31]:
from langchain.chat_models import ChatOpenAI
from langchain import LLMChain
from langchain.prompts.chat import (
    ChatPromptTemplate,
    HumanMessagePromptTemplate,
)


human_message_prompt = HumanMessagePromptTemplate(
    prompt = PromptTemplate(template="Qual é um bom nome para uma empresa que faz {product}?",
                            input_variables=["product"],
                           )
                                                )

chat_prompt_template = ChatPromptTemplate.from_messages([human_message_prompt])

chat = ChatOpenAI(temperature=0.9)
chain = LLMChain(llm=chat, prompt=chat_prompt_template)

#print(chain.run("Meias coloridas"))


In [32]:
second_prompt = PromptTemplate(input_variables=["company_name"],
                               template="Escreva uma frase de efeito para a seguinte empresa: {company_name}",
                              )

chain_two = LLMChain(llm=llm, prompt=second_prompt)

#print(chain_two.run("Meias coloridas"))

In [33]:
from langchain.chains import SimpleSequentialChain

overall_chain = SimpleSequentialChain(chains=[chain, chain_two], verbose=True)

# Execute a cadeia (chain) especificando apenas a variável de entrada para a primeira cadeia.
catchphrase = overall_chain.run("Meias coloridas")
print(catchphrase)



[1m> Entering new SimpleSequentialChain chain...[0m
[36;1m[1;3mSocktastic.[0m
[33;1m[1;3m

"A Socktastic tem o poder de transformar os seus pés em obras de arte!"[0m

[1m> Finished chain.[0m


"A Socktastic tem o poder de transformar os seus pés em obras de arte!"
