## O que é LangChain

- Desenvolvido por Harrison Chase.
- Lançado em 2022

**LangChain** é uma estrutura (framework) open source desenvolvida para facilitar o desenvolvimento de aplicativos e pipelines que integram modelos de linguagem de grande porte (LLMs) com outras fontes de dados e componentes de software. 

O objetivo principal do LangChain é ajudar desenvolvedores a criar aplicações complexas que podem usar modelos de linguagem de maneira eficiente e interagir com fontes de dados externas, como bancos de dados, APIs, e outros tipos de dados dinâmicos.

O LangChain permite ao desenvolvedor criar um ambiente centralizado para construir aplicações LLMs e integrá-los ao seu sistema. 




#### Componentes Fundamentais:

- **Models (Modelos):** LangChain serve como uma interface padrão que permite interações com uma ampla gama de Grandes Modelos de Linguagem (LLMs).

- **Chains (Cadeias):** Como seu nome implica, _cadeias_ são o núcleo dos fluxos de trabalho do LangChain. Combinam LLMs com outros componentes, criando aplicativos por meio da execução de uma sequência de funções.

- **Prompts (Instruções):** Os prompts são as instruções apresentadas a um LLM. Geralmente, a "arte" de redigir prompts que efetivamente entregam o contexto necessário para que o LLM interprete a entrada e a saída da estrutura da maneira mais útil para você é chamada de engenharia de prompt.

- **Indexes (Índices):** Para realizar determinadas tarefas, as LLMs precisarão acessar fontes de dados externas específicas não incluídas em seu conjunto de dados de treinamento, como documentos internos, e-mails ou conjuntos de dados. LangChain refere-se coletivamente a essa documentação externa como “índices"."

- **Memory (Memória):** Por padrão, os LLMs não têm memória de longo prazo de conversas anteriores (a menos que o histórico do chat seja usado como entrada para uma consulta). O LangChain soluciona esse problema com utilitários simples para adicionar memória a um sistema, com opções que vão desde a retenção total de todas as conversas até a retenção de um resumo da conversa até a retenção das _n_ trocas mais recentes.

- **Agents/Tools (Agentes/Ferramentas):** Os agentes do LangChain podem usar um determinado modelo LLM como um "mecanismo de raciocínio" para determinar quais ações tomar. Ao criar uma cadeia para um agente, as entradas contêm:

	- uma lista de ferramentas disponíveis para serem aproveitadas.
	- entrada do usuário (como prompts e consultas).
	- quaisquer etapas relevantes executadas anteriormente.


#### Prompt Engineering
Engenharia de prompts é o processo de projetar e otimizar prompts para tarefas de processamento de linguagem natural. Envolve selecionar os prompts corretos, ajustar seus parâmetros e avaliar seu desempenho. A engenharia de prompts é crucial para alcançar alta precisão e eficiência em modelos de PLN.



#### LCEL (LangChain Expression Language)

Como falamos anteriormente, os Runnables são os unidades básicas de trabalho do LangChain, ou seja, é um protocolo que implementa as interfaces de `invoke`, `stream` e `batch` bem como suas variantes assíncronas. 

Além disso, o LangChain implementa a forma declarativa de compor cadeias utilizando o operador pipe "|".

Vantagens de utilizar a forma declarativa:

- **Suporte de streaming de primeira classe**: Quando você constrói suas cadeias com LCEL, você obtém o melhor time-to-first-token possível (tempo decorrido até que o primeiro pedaço de saída saia).
- **Suporte assíncrono**: Qualquer cadeia construída com LCEL pode ser chamada tanto com a API síncrona quanto com a API assíncrona. Isso permite usar o mesmo código para protótipos e em produção, com ótimo desempenho e a capacidade de lidar com muitas solicitações simultâneas no mesmo servidor.
- **Execução paralela otimizada**.
- **Novas tentativas e fallbacks**: você consegue configurar novas tentativas e fallbacks para qualquer parte da sua cadeia LCEL.
- **Acessar resultados intermediários**: Para cadeias mais complexas, geralmente é muito útil acessar os resultados de etapas intermediárias antes mesmo que a saída final seja produzida.
- **Esquemas de entrada e saída**: Os esquemas de entrada e saída fornecem a cada cadeia LCEL esquemas Pydantic e JSONSchema inferidos da estrutura da sua cadeia.

Cada componente é conectado usando o operador pipe "|" (ou usando `.pipe()`) , ou seja, ele cria a arquitetura de pipeline, onde a saída de uma função (ou componente) é tratado como entrada de proxima função (ou, componente), permitindo criar uma cadeia (chain) sequencial de ações.

Grande parte dos componentes do LangChain segue o protocolo `Runnable` (executáveis) que automaticamente implementa as interfaces de `invoke`, `stream` e `batch` bem como suas variantes assincronas.

O `Runnables` é a unidade de trabalhado do LangChain ou seja, uma vez que o componente é criado usando como base os '`Runnables`' , este componente adquire a capacidade de  ser invocado, agrupado, transmitido, transformado e composto. 

Vantagem de usar a linguagem LCEL (LangChain Expression Language): maneira declarativa de encadear componentes do LangChain:
- Código Limpo
- Fácil Manutenção
- Simplicidade    

#### Exemplo 1: Criando o prompt simples

Podem reparar que o texto abaixo, irá dar continuídade ao Hino Nacional Brasileiro.
Se não responder, é porque o modelo não tem conhecimento do hino, ou algum problema de configuração


In [None]:

import os
from openai import AzureOpenAI
from dotenv import load_dotenv


# Carrega as variáveis de ambiente do arquivo .env
load_dotenv()

llm = AzureOpenAI()

deployment=os.environ['AZURE_OPENAI_DEPLOYMENT'] 


# Função para obter uma resposta do modelo
# Esta função envia um prompt para o modelo e retorna a resposta
def get_completion(prompt):
    messages = [{"role": "user", "content": prompt}]
    response = llm.chat.completions.create(
        model=deployment,
        messages=messages,
        temperature=0, #  this is the degree of randomness of the model's output
        max_tokens=1024
    )
    return response.choices[0].message.content

### 1. Primeiro, defina o texto que você quer usar no prompt
# Aqui, vamos usar um trecho do Hino Nacional Brasileiro
text = f"""
Ouviram do Ipiranga às margens plácidas
"""

### 2. Usar o texto no prompt
# O prompt é uma string que será enviada ao modelo
# Aqui, estamos formatando o texto dentro de um bloco de código para que o modelo entenda que é um texto a ser completado
prompt = f"""
```{text}```
"""

## 3. Executar a função para obter a resposta do modelo
# A função get_completion envia o prompt para o modelo e retorna a resposta
response = get_completion(prompt)
print(response)
 


#### Exemplo:  Resumo

In [None]:
text = f"""
Júpiter é o quinto planeta a partir do Sol e o maior do Sistema Solar.  \
É um gigante gasoso com uma massa equivalente a um milésimo da do Sol,  \
mas duas vezes e meia maior do que a de todos os outros planetas do Sistema Solar juntos. \
Júpiter é um dos objetos mais brilhantes visíveis a olho nu no céu noturno,  \
e é conhecido pelas civilizações antigas desde antes do início da história registrada.  \
Seu nome é uma homenagem ao deus romano Júpiter. Quando visto da Terra,  \
Júpiter pode ser tão brilhante que sua luz refletida é capaz de projetar sombras visíveis,  \
e é, em média, o terceiro objeto natural mais brilhante no céu noturno, depois da Lua e de Vênus.
"""

## Set the prompt
prompt = f"""
Resuma o conteúdo fornecido para um aluno do terceiro ano.
```{text}```
"""

## Run the prompt
response = get_completion(prompt)
print(response)

#### Exemplo: Complemento
 

In [None]:
prompt = "Complete a frase: Era uma vez um"
messages = [{"role": "user", "content": prompt}]  
# make completion
completion = llm.chat.completions.create(model=deployment, messages=messages)

# print response
print(completion.choices[0].message.content)

#### Exemplo: Complemento

In [None]:
question = input("Faça perguntas sobre a linguagem SOLID ao seu colega de estudo:")
prompt = f"""
Você é um especialista na linguagem em orientação ao objetos e com amblo conhecimento em SOLID.

Sempre que certas perguntas forem feitas, você precisa fornecer uma resposta no formato abaixo.

- Conceito
- Código de exemplo mostrando a implementação do conceito
- Explicação do exemplo e de como o conceito é implementado para melhor compreensão do usuário.

Forneça a resposta para a pergunta: {question}
"""
messages = [{"role": "user", "content": prompt}]  

completion = llm.chat.completions.create(model=deployment, messages=messages)

print(completion.choices[0].message.content)


#### Rodando modelo localmente

Vamos agora fazer um teste rodando o ollama local utilizando um container docker


```bash

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

docker exec -it ollama bash
ollama pull llama3.2

 
```


In [None]:
! curl http://localhost:11434/api/generate -d '{"model": "llama3.2", "prompt":"Quem é Linux Torvald?"}'


In [None]:
! curl http://localhost:11434/api/chat -d '{ "model": "llama3.2", "messages": [ { "role": "user", "content": "Por que o céu é azul?" }]}'

In [None]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_ollama.llms import OllamaLLM

OllamaLLM(  
     base_url="http://localhost:11434",  
     model = "llama3.2",  # nome do modelo que deseja tem em sua máquina
     temperature = 0.3,  
     num_predict = 1000, # numero máximo de tokens
 )

template = """
Você é um especialista em música brasileira e tem amplo conhecimento sobre letras de músicas.

Trecho da música: {question}

Resposta: Dê continuidade a música e o final conte seu histórico."""

prompt = ChatPromptTemplate.from_template(template)

model = OllamaLLM(model = "llama3.2") 

chain = prompt | model

response = chain.invoke({"question": "Ouviram do Ipiranga às margens plácidas"})
print(response)

Utilizando a versão via chat model

In [None]:
from langchain_ollama import ChatOllama

chat = ChatOllama(model="llama3.2")

response = chat.invoke("Conte uma piada")
print(response.content)

In [None]:
from langchain_core.messages import HumanMessage, SystemMessage

messages = [
    SystemMessage(content="Você é um assistente útil."),
    HumanMessage(content="O que acontece quando uma força imparável encontra um objeto inamovível?")
]

response = chat.invoke(messages)
print(response.content)

In [None]:
from langchain_core.messages import HumanMessage, SystemMessage

messages = [
    SystemMessage(content="Você é um assistente útil."),
    HumanMessage(content="Por que o céu é azul?")
]

response_stream = chat.stream(messages)
for stream in response_stream:
    print(stream.content, end='', flush=True)

Agora vamos apagar o container para não ficar ocupando espaço


```bash
docker container stop ollama
docker container rm ollama
```