# Configuração inicial
É preciso definir as API Keys no arquivo ".env" antes de iniciar.
**Não divulge as informações que estão no seu arquivo ".env"**

In [7]:
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI
from dotenv import load_dotenv,find_dotenv
import os

load_dotenv(find_dotenv())

True

### Prompt Templates
São "templates de prompts", onde podemos utilizar textos pré montados e também podemos incluir variaveis para substituir no momento da chamada da LLM

In [8]:
prompt = ChatPromptTemplate.from_template("Me conte uma piada sobre {assunto}")
model = ChatOpenAI(model="gpt-3.5-turbo")
output_parser = StrOutputParser()

chain = (prompt | model | output_parser)

pr1 = chain.invoke({"assunto": "sorvete"})
pr2 = chain.invoke({"assunto": "carro"})
pr3 = chain.invoke({"assunto": "futebol"})

print(pr1)
print('-----------')
print(pr2)
print('-----------')
print(pr3)

Por que o sorvete foi ao psicólogo?
Porque ele estava derretendo de tristeza!
-----------
Por que o carro foi ao psicólogo?

Porque ele estava com problemas de freio e não conseguia parar de chorar!
-----------
Por que o jogador de futebol foi ao médico?
Porque estava com bola no pé!


### Tipos de Prompt
Quando utilizamos as LLMs no formato de CHAT, existem 3 tipos de prompts  
**AIMessage** = Mensagem que mostra o que a IA irá responder  
**HumamMessage** = Mensagem que representa a intenção do usuario  
**SystemMessage** = Context de background explicando o que a IA precisa fazer  

Podemos utilizar estes 3 tipos para influenciar a resposta da LLM

In [9]:
tipos_promptp =[
    (
        "system",
        "A resposta do usuário sempre deverá ser um JSON com os atributos pergunta: PERGUNTA FEITA, piada: PIADA GERADA e não deve conter quebras de linha"
     ),
    (
        "human",
        "Me conte uma piada sobre {assunto}"
    )
    ]

chat_prompt = ChatPromptTemplate.from_messages(tipos_promptp)

model = ChatOpenAI(model="gpt-3.5-turbo")
output_parser = StrOutputParser()

chain = chat_prompt | model | output_parser

pr1 = chain.invoke({"assunto": "sorvete"})
pr2 = chain.invoke({"assunto": "carro"})
pr3 = chain.invoke({"assunto": "futebol"})

print(pr1)
print('-----------')
print(pr2)
print('-----------')
print(pr3)


{
    "pergunta": "Me conte uma piada sobre sorvete",
    "piada": "Por que o sorvete foi ao psicólogo? Porque ele tinha casquinha de chocolate!"
}
-----------
{
    "pergunta": "Me conte uma piada sobre carro",
    "piada": "Por que o carro foi ao hospital? Porque ele estava com pneumonia!"
}
-----------
{
    "pergunta": "Me conte uma piada sobre futebol",
    "piada": "Por que o jogador de futebol foi expulso da escola? Porque ele chutou a canela do professor!"
}


### Document Loaders
Quando vamos construir uma aplicação para ler os documentos, primeiro é preciso carregar estes documentos e para cada tipo de documento existe uma forma diferente.

#### CSV

In [10]:
from langchain_community.document_loaders.csv_loader import CSVLoader
salarioCSV = CSVLoader(file_path='./CSVs/salarios.csv', csv_args={
    'delimiter': ';',
    'quotechar': '"',
}, source_column="Nome")

salarios = salarioCSV.load()
print(salarios)

[Document(page_content='Nome: Lucas Souza\nsalario: 1000\ndata de admissao: 01/01/2022\ndata de nascimento: 29/08/1992\ncargo: Diretor', metadata={'source': 'Lucas Souza', 'row': 0}), Document(page_content='Nome: Mateus Sampaio\nsalario: 8000\ndata de admissao: 01/05/2023\ndata de nascimento: 26/11/1989\ncargo: Programador', metadata={'source': 'Mateus Sampaio', 'row': 1}), Document(page_content='Nome: Edvaldo José\nsalario: 20000\ndata de admissao: 01/01/2020\ndata de nascimento: 27/11/1956\ncargo: Gerente', metadata={'source': 'Edvaldo José', 'row': 2})]


#### PDF

In [11]:
from langchain_community.document_loaders import PyPDFLoader

dayoff = PyPDFLoader("./PDFs/Day Off.pdf")
ferias = PyPDFLoader("./PDFs/Orientações do Programa Férias e CO.pdf")
dsr = PyPDFLoader("./PDFs/Programa Descanso Remunerado.pdf")
gympass = PyPDFLoader("./PDFs/Programa Gympass.pdf")
dayoffLoader = dayoff.load_and_split()
feriasLoader = ferias.load_and_split()
dsrLoader = dsr.load_and_split()
gympassLoader = gympass.load_and_split()
print(dayoffLoader)
print(len(dayoffLoader))
print('--------')
print(feriasLoader)
print(len(feriasLoader))
print('--------')
print(dsrLoader)
print(len(dsrLoader))
print('--------')
print(gympassLoader)
print(len(gympassLoader))

[Document(page_content='Day OFF  [Qualidade de Vida]  \nO objetivo é cuidar de quem cuida do negócio . \nO intuito é conceder um período de descanso e proporcionar bem -estar físico e mental a todos os prestadores \ne colaboradores da CIA.  \n \n \n• Os Prestadores de Serviços e colaboradores  serão presenteados com um voucher IF OOD no valor de \nR$ 100,00 pa ra utilizar como desejar n o aplicativo . O Voucher será en viado no d ia do aniversário \ncom o c ódigo de utilização;  \n \n•  Os Prestadores de Serviços e colaboradores  aniversariantes, terão direito a um dia de descanso no \nmês de  aniversário  (deve ser alinhado com gestor  de cada área) .', metadata={'source': './PDFs/Day Off.pdf', 'page': 0})]
1
--------
[Document(page_content='Férias e Co [Qualidade de Vida]  \nO intuito é incentivar um período de descanso e proporcionar bem -estar físico e mental a todos os \nprestadores e colaboradores da CIA, com acesso a passagens e hospedagens com valores reduzidos.  \n \nRegras pa

#### WEB

In [12]:
from langchain_community.document_loaders import WebBaseLoader
cargos = WebBaseLoader("https://docs.compliancecapitalhumano.com.br/docs/cor/009_fpgf0001")

cargosLoader = cargos.load()
print(cargosLoader)
print(len(cargosLoader))



[Document(page_content='Manual do módulo corporativo · Compliance Capital HumanoCompliance Capital HumanoDocsSuporte›Folha de pagamentoGeralManual de introdução ao sistema HCMGlobalEmpresa usuáriaAgência bancáriaPlano de contas contábilHistórico padrãoDirecionadores contábeisPlano de centro de custosImportação da foto do trabalhadorFolha de pagamentoParâmetros da FolhaCargosCaracterísticas (especificações)ConvêniosSindicatosRubricas x empresa para contabilizaçãoTipos de afastamentosManual do módulo corporativoFPGF0001 - Cargos. Esta programa tem por finalidade explicar detalhadamente como fazer o cadastro de cargos.\nTodos os campos a serem informados possui uma ajuda (help) explicando detalhadamente o que significa e como informá-lo. Para obter essa ajuda, clique com o mouse sobre o nome do campo que aparecerá uma janela com as informações do respectivo campo.\nPré-requisito.\nFPGF0127 - Cadastro de CBO. Antes de iniciar o cadastro abaixo verifique se o CBO do cargo que vai cadastrar 

### Text Splitters
Após carregar os documentos, é preciso quebrar os textos em pedaços menores para ficar mais fácil a busca pelos conteúdos.  
Existem diversas formas de fazer este Text Splitter e para cada caso deve ser usar o método mais apropriado  

In [13]:
from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(
    # Set a really small chunk size, just to show.
    chunk_size=300,
    chunk_overlap=20
)

daySplits = text_splitter.split_documents(dayoffLoader)
feriasSplits = text_splitter.split_documents(feriasLoader)
dsrSplits = text_splitter.split_documents(dsrLoader)
gympasSplits = text_splitter.split_documents(gympassLoader)
cargosSplits = text_splitter.split_documents(cargosLoader)

print(daySplits)
print(len(daySplits))
print("----------")
print(feriasSplits)
print(len(feriasSplits))
print("----------")
print(dsrSplits)
print(len(dsrSplits))
print("----------")
print(gympasSplits)
print(len(gympasSplits))
print("----------")
print(cargosSplits)
print(len(cargosSplits))


[Document(page_content='Day OFF  [Qualidade de Vida]  \nO objetivo é cuidar de quem cuida do negócio . \nO intuito é conceder um período de descanso e proporcionar bem -estar físico e mental a todos os prestadores \ne colaboradores da CIA.', metadata={'source': './PDFs/Day Off.pdf', 'page': 0}), Document(page_content='• Os Prestadores de Serviços e colaboradores  serão presenteados com um voucher IF OOD no valor de \nR$ 100,00 pa ra utilizar como desejar n o aplicativo . O Voucher será en viado no d ia do aniversário \ncom o c ódigo de utilização;', metadata={'source': './PDFs/Day Off.pdf', 'page': 0}), Document(page_content='•  Os Prestadores de Serviços e colaboradores  aniversariantes, terão direito a um dia de descanso no \nmês de  aniversário  (deve ser alinhado com gestor  de cada área) .', metadata={'source': './PDFs/Day Off.pdf', 'page': 0})]
3
----------
[Document(page_content='Férias e Co [Qualidade de Vida]  \nO intuito é incentivar um período de descanso e proporcionar bem 

### Embedings
Embeding é a tecnica de converter os textos em numeros para pode carregar os documentos nos banco de dados vetoriais para fazer as pesquisas

In [14]:
from langchain_openai import OpenAIEmbeddings
embeddings_model = OpenAIEmbeddings()

print(daySplits[0].page_content)

embedded_query = embeddings_model.embed_query(daySplits[0].page_content)
embedded_query[:10]

Day OFF  [Qualidade de Vida]  
O objetivo é cuidar de quem cuida do negócio . 
O intuito é conceder um período de descanso e proporcionar bem -estar físico e mental a todos os prestadores 
e colaboradores da CIA.


[-0.012815953173455687,
 -0.0009917508975812394,
 0.024065362292801196,
 -0.028494901616136013,
 -0.013025276287830498,
 0.022647369765799917,
 -0.009385761079695036,
 -0.0025591391955400765,
 0.007717931978130839,
 -0.004527448326716703]

### Vectorstore
Para armazenar os embeddings a melhor forma é utilizar um banco de dados vetorial  
Existem diversos tipos de banco de dados de vetores  
Chroma, Qudrant, FAISS

In [15]:
from langchain_community.vectorstores import Chroma

db = Chroma()
data = db.get()

for rec in data['ids']:
    db.delete(rec)

db = Chroma.from_documents(salarios, OpenAIEmbeddings())
db = Chroma.from_documents(daySplits, OpenAIEmbeddings())
db = Chroma.from_documents(feriasSplits, OpenAIEmbeddings())
db = Chroma.from_documents(dsrSplits, OpenAIEmbeddings())
db = Chroma.from_documents(gympasSplits, OpenAIEmbeddings())
db = Chroma.from_documents(cargosSplits, OpenAIEmbeddings())

print(db._collection.count())

40


#### Busca no Vectorstore

In [16]:
query = "Como pedir o gympass"
similarity = db.similarity_search(query)
for rec in similarity:
    print("Conteudo: "+rec.page_content)
    print("Source: '"+rec.metadata['source']+"'")
    print("-------------")

print("---------------------------")
print("----------- MMR ----------------")

mmr = db.max_marginal_relevance_search(query)
for rec in mmr:
    print("Conteudo: "+rec.page_content)
    print("Source: '"+rec.metadata['source']+"'")
    print("-------------")
#print(docs.count())

Conteudo: qualidade de vida Gympass . O intuito é estimular a pratica de atividades que melhor se encaixa com o perfil 
de cada colaborador e proporcionar bem -estar físico e mental a todos onde quer que esteja com custos 
reduzidos.
Source: './PDFs/Programa Gympass.pdf'
-------------
Conteudo: • O pagamento do plano é cobrado diretamente no seu cartão de crédito com até 75% de desconto do 
valor de mercado da mensalidade convencional das academias, devido ao nosso convênio empresarial, 
onde a Compliance subsidia um percentual para cada plano dispon ível no programa Gympass.
Source: './PDFs/Programa Gympass.pdf'
-------------
Conteudo: Gympass e identifica -lo como colaborador da empresa Compliance;  
 
• Após 5 dias úteis do envio do formulário você estará ativo  como colaborador na base de dados do 
programa Gympass;  
 
• A partir de agora já está apto a baixar o aplicativo Gympass e efetuar o cadastro de usuário com o seu
Source: './PDFs/Programa Gympass.pdf'
-------------
Conteud

### Retrievers
Retrivers são funções que retornam uma lista de documentos, isso pode ser qualquer tipo de função, mas ela precisa passar como parâmetro de entrada uma pergunta não estruturada e retornar uma lista de documentos.
Os VectoreStores podem ser configurados para trabalhar como Retrivers

In [17]:
retriever = db.as_retriever()
docsRet = retriever.get_relevant_documents(query)

print(docsRet)

[Document(page_content='qualidade de vida Gympass . O intuito é estimular a pratica de atividades que melhor se encaixa com o perfil \nde cada colaborador e proporcionar bem -estar físico e mental a todos onde quer que esteja com custos \nreduzidos.', metadata={'page': 0, 'source': './PDFs/Programa Gympass.pdf'}), Document(page_content='• O pagamento do plano é cobrado diretamente no seu cartão de crédito com até 75% de desconto do \nvalor de mercado da mensalidade convencional das academias, devido ao nosso convênio empresarial, \nonde a Compliance subsidia um percentual para cada plano dispon ível no programa Gympass.', metadata={'page': 0, 'source': './PDFs/Programa Gympass.pdf'}), Document(page_content='Gympass e identifica -lo como colaborador da empresa Compliance;  \n \n• Após 5 dias úteis do envio do formulário você estará ativo  como colaborador na base de dados do \nprograma Gympass;  \n \n• A partir de agora já está apto a baixar o aplicativo Gympass e efetuar o cadastro de 

### Chains
Usando tudo junto

In [18]:
from langchain_core.runnables import RunnablePassthrough

template = """Responda a pergunta baseado somente no seguinte contexto:

{context}

Pergunta: {question}
"""
prompt = ChatPromptTemplate.from_template(template)


chain = (
    {"context": retriever, "question": RunnablePassthrough()}
    | prompt
    | model
    | StrOutputParser()
)

chain.invoke("Como solicitar o Gympass?")

'Para solicitar o Gympass, é necessário preencher um formulário disponibilizado pela empresa Compliance, identificando-se como colaborador da empresa. Após o envio do formulário, em até 5 dias úteis, o colaborador estará ativo na base de dados do programa Gympass e poderá baixar o aplicativo Gympass para efetuar o cadastro de usuário.'

### Memory
É possível adicionar uma "memoria" nos chats, pois a maioria das chamadas é RESTFULL, sem estado.  
A memory nada mais é que o acumulo das respostas anteriores que vai sendo adicionado no contexto do prompt

In [19]:
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.chat_history import BaseChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from operator import itemgetter

template =[
    (
        "system",
        """Responda a pergunta baseado somente no seguinte contexto
        {context}
        """
     ),
    MessagesPlaceholder(variable_name="history"),
    (
        "human",
        "{question}"
    )
    ]

prompt = ChatPromptTemplate.from_messages(template)

chain = ( 
         prompt
         | model
         | StrOutputParser()
)

store = {}

def get_session_history(session_id: str) -> BaseChatMessageHistory:
    if session_id not in store:
        store[session_id] = ChatMessageHistory()
    return store[session_id]

with_message_history = RunnableWithMessageHistory(
    chain,
    get_session_history,
    input_messages_key="question",
    history_messages_key="history",
)

docs = retriever.get_relevant_documents("Qual Cargo do Lucas?")

print(with_message_history.invoke(
    {"context": docs, "question":"Qual Cargo do Lucas?"},
    config={"configurable": {"session_id": "abc123"}},
))

print(with_message_history.invoke(
    {"context": docs, "question":"E o Salário?"},
    config={"configurable": {"session_id": "abc123"}},
))

O cargo do Lucas é Diretor.
O salário do Lucas é 1000.


Colocando o retriever dentro da Chain

In [20]:
from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.chat_history import BaseChatMessageHistory
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from operator import itemgetter

template =[
    (
        "system",
        """Responda a pergunta baseado somente no seguinte contexto
        {context}
        """
     ),
    MessagesPlaceholder(variable_name="history"),
    (
        "human",
        "{question}"
    )
    ]

prompt = ChatPromptTemplate.from_messages(template)

contextChain = itemgetter("question") | retriever 
first_step = RunnablePassthrough.assign(context=contextChain)
chain = (
    first_step
    | prompt
    | model
    | StrOutputParser()
)

store = {}

def get_session_history(session_id: str) -> BaseChatMessageHistory:
    if session_id not in store:
        store[session_id] = ChatMessageHistory()
    return store[session_id]

with_message_history = RunnableWithMessageHistory(
    chain,
    get_session_history,
    input_messages_key="question",
    history_messages_key="history",
)

print(with_message_history.invoke(
    {"context": retriever, "question":"Qual Cargo do Lucas?"},
    config={"configurable": {"session_id": "abc123"}},
))

print(with_message_history.invoke(
    {"context": retriever, "question":"E o Salário?"},
    config={"configurable": {"session_id": "abc123"}},
))

O cargo de Lucas é Diretor.
O salário de Lucas é 1000.


### Outro exemplo de Chain
No caso a baixo, vamos fazer um RAG que também retorna os documentos usados na pergunta

In [21]:
os.environ["LANGCHAIN_TRACING_V2"] = "false"
from langchain_core.runnables import RunnableParallel
from operator import itemgetter

template = """Responda a pergunta baseado somente no seguinte contexto:

{context}

Pergunta: {pergunta}
"""
prompt = ChatPromptTemplate.from_template(template)

chain = (
    RunnablePassthrough.assign(context=itemgetter("documentos"), question=itemgetter("pergunta"))
    | prompt
    | model
    | StrOutputParser()
)

abc = RunnableParallel(
    {"documentos": retriever, "pergunta": RunnablePassthrough()}
).assign(resposta=chain)

#abc.get_graph().print_ascii()
abc.invoke("Como solicitar o Gympass?")

{'documentos': [Document(page_content='qualidade de vida Gympass . O intuito é estimular a pratica de atividades que melhor se encaixa com o perfil \nde cada colaborador e proporcionar bem -estar físico e mental a todos onde quer que esteja com custos \nreduzidos.', metadata={'page': 0, 'source': './PDFs/Programa Gympass.pdf'}),
  Document(page_content='• O pagamento do plano é cobrado diretamente no seu cartão de crédito com até 75% de desconto do \nvalor de mercado da mensalidade convencional das academias, devido ao nosso convênio empresarial, \nonde a Compliance subsidia um percentual para cada plano dispon ível no programa Gympass.', metadata={'page': 0, 'source': './PDFs/Programa Gympass.pdf'}),
  Document(page_content='Gympass e identifica -lo como colaborador da empresa Compliance;  \n \n• Após 5 dias úteis do envio do formulário você estará ativo  como colaborador na base de dados do \nprograma Gympass;  \n \n• A partir de agora já está apto a baixar o aplicativo Gympass e efe

### Agents
A ideia central dos agentes é usar um modelo de linguagem para escolher uma sequência de ações a serem tomadas. Em cadeias, uma sequência de ações é pré-definida (no código). Nos agentes, um modelo de linguagem é utilizado como um motor de raciocínio para determinar quais ações tomar e em que ordem.

In [60]:
from langchain.pydantic_v1 import BaseModel, Field
from langchain.tools import BaseTool, StructuredTool, tool
from langchain_core.messages import HumanMessage
from langchain import hub
from langchain.agents import create_openai_functions_agent, AgentExecutor
from langchain.agents.output_parsers.openai_tools import OpenAIToolsAgentOutputParser


@tool
def get_workers(query: str) -> str:
    """Está ferramenta tem o objetivo de retornar dados de emprego (Cargo, salário e data de admissão) relacionadas a uma pessoa"""
    return "\n\n".join([doc.page_content for doc in salarios])+"\n"

@tool
def get_gympass(query: str) -> str:
    """Está ferramenta tem o objetivo de retornar todos os dados sobre o Gympass"""
    ret = "\n\n".join([doc.page_content for doc in gympasSplits])
    return ret+"\n"

@tool
def get_dayoff(query: str) -> str:
    """Está ferramenta tem o objetivo de Explicar sobre o funcionamento do DayOff"""
    ret = "\n\n".join([doc.page_content for doc in daySplits])
    return ret+"\n"

@tool
def get_feriasco(query: str) -> str:
    """Está ferramenta tem o objetivo de retornar dados sobre o beneficio Ferias & CO"""
    ret = "\n\n".join([doc.page_content for doc in feriasSplits])
    return ret+"\n"

@tool
def get_dsr(query: str) -> str:
    """Está ferramenta tem o objetivo de explicar e dar detalhes sobre o beneficio de Descanso Remunerado (DSR) para PJs"""
    ret = "\n\n".join([doc.page_content for doc in dsrSplits])
    return ret+"\n"

@tool
def get_cargos(query: str) -> str:
    """Está ferramenta tem o objetivo de retornar dados sobre como cadastrar cargos no sistema Compliance"""
    ret = "\n\n".join([doc.page_content for doc in cargosSplits])
    return ret+"\n"

tools = [get_workers, get_gympass, get_dayoff, get_feriasco, get_dsr, get_cargos]

prompt = hub.pull("hwchase17/openai-functions-agent")

agent = create_openai_functions_agent(model, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

agent_executor.invoke({"input": "Qual o cargo do Lucas e o salário do Edvaldo? e como faço para cadastrar cargos no Compliance?"})

{'input': 'Qual o cargo do Lucas e o salário do Edvaldo? e como faço para cadastrar cargos no Compliance?',
 'output': 'O cargo do Lucas é Diretor e o salário do Edvaldo é R$20.000. Para cadastrar cargos no Compliance, você pode seguir os seguintes passos:\n\n1. Acesse a tela de cadastro de cargos no Compliance.\n2. Clique no botão "Criar" para adicionar um novo cargo.\n3. Preencha os campos obrigatórios, como Código, Descrição, Situação, CBO e Valor do salário teto.\n4. Clique em "Criar" para salvar o registro do cargo.\n5. Para alterar ou excluir um cargo, clique no ícone "Lápis" na tela de relatório e faça as alterações necessárias.\n\nCaso tenha dúvidas sobre o preenchimento de algum campo, clique sobre o nome do campo para obter ajuda detalhada.'}