In [1]:
import os
from dotenv import load_dotenv

In [2]:
load_dotenv('./.env')
os.environ.get('PINECONE_ENV')

'gcp-starter'

## LangChain primeiros passos

In [11]:
from langchain.llms import OpenAI
llm = OpenAI(model_name='gpt-3.5-turbo-instruct', temperature=0.7, max_tokens=512)
print(llm)

[1mOpenAI[0m
Params: {'model_name': 'gpt-3.5-turbo-instruct', 'temperature': 0.7, 'top_p': 1, 'frequency_penalty': 0, 'presence_penalty': 0, 'n': 1, 'logit_bias': {}, 'max_tokens': 512}


In [12]:
output = llm('o que significa good clinical practices?')

In [13]:
print(output)



Good Clinical Practices (GCP) o Buenas Prácticas Clínicas es un conjunto de estándares éticos y de calidad que deben ser seguidos en la investigación clínica en seres humanos. Estas prácticas buscan garantizar la protección de los derechos, seguridad y bienestar de los participantes en estudios clínicos, así como la integridad y calidad de los datos obtenidos. Las GCP también establecen pautas para el diseño, conducción, registro y reporte de los estudios clínicos. Son un requisito obligatorio en la mayoría de los países y son reguladas por organismos internacionales como la Organización Mundial de la Salud (OMS) y la International Conference on Harmonisation (ICH). 


In [4]:
print(llm.get_num_tokens('o que significa good clinical practices'))

7


In [5]:
output = llm.generate(['... é a capital do Brasil', 'qual é a fórmula da área de um triangulo?'])

In [6]:
print(output.generations)

[[Generation(text='\n\nBrasília.', generation_info={'finish_reason': 'stop', 'logprobs': None})], [Generation(text='\n\nA área de um triângulo é dada pela fórmula A = (b.h)/2 , onde b = base e h = altura.', generation_info={'finish_reason': 'stop', 'logprobs': None})]]


In [7]:
output.generations[0][0].text

'\n\nBrasília.'

In [14]:
output = llm.generate(['escreva um slogan original para uma padaria especializada em cucas'] * 3)

In [15]:
for o in output.generations:
    print(o[0].text, end='')



"O sabor caseiro que vai conquistar seu paladar, só na nossa padaria de cucas artesanais."

"O sabor da tradição em cada fatia: venha provar as cucas da nossa padaria!"
"Venha provar a cuca mais gostosa da cidade na nossa padaria!"

## ChatModels: GPT-3.5-Turbo e GPT-4

In [17]:
from langchain.schema import(
    AIMessage,    #A ChatMessage coming from an AI/assistant
    HumanMessage, #A ChatMessage coming from a human/user
    SystemMessage #A ChatMessage coming from the system
)
from langchain.chat_models import ChatOpenAI

In [18]:
chat = ChatOpenAI(model='gpt-3.5-turbo', temperature=0.5, max_tokens=1024)
messages = [
    SystemMessage(content='Você é um especialista em bolos que responde tudo em português.'),
    HumanMessage(content='explique por que utilizamos ovo para fazer a massa.')
]
output = chat(messages)

In [19]:
print(output.content)

O ovo é um ingrediente essencial na maioria das receitas de massa de bolo. Ele desempenha várias funções importantes na preparação da massa:

1. Estrutura: As proteínas presentes no ovo, especialmente a clara, ajudam a fornecer estrutura para a massa do bolo. Quando as proteínas são batidas, elas se desdobram e formam uma rede que ajuda a reter o ar incorporado durante o processo de mistura. Isso resulta em uma massa mais leve e fofa.

2. Emulsificação: A gema do ovo contém lecitina, que é um emulsionante natural. A lecitina ajuda a combinar ingredientes que normalmente não se misturam facilmente, como água e óleo. Isso ajuda a criar uma massa homogênea e uniforme.

3. Umidade: O ovo contém uma quantidade significativa de água, que é liberada durante o cozimento. Isso ajuda a manter a massa úmida e macia, evitando que o bolo fique seco.

4. Sabor: O ovo também contribui para o sabor da massa. Ele adiciona um sabor suave e rico, além de ajudar a realçar os sabores dos outros ingrediente

## Prompt Templates

In [22]:
from langchain.prompts import PromptTemplate

In [25]:
template = """Você é um virologista experiente.
Escreva algumas frases em {idioma} sobre o vírus {virus} ."""

prompt = PromptTemplate(
    input_variables=['virus', 'idioma'],
    template=template
)
print(prompt)

input_variables=['idioma', 'virus'] template='Você é um virologista experiente.\nEscreva algumas frases em {idioma} sobre o vírus {virus} .'


In [27]:
from langchain.llms import OpenAI
llm = OpenAI(model='gpt-3.5-turbo-instruct', temperature=0.7)
output = llm(prompt.format(virus='HIV', idioma='Francês'))
print(output)



1. Le virus du SIDA est un rétrovirus qui attaque le système immunitaire humain.
2. Le VIH se transmet principalement par contact sanguin, sexuel ou de la mère à l'enfant pendant la grossesse.
3. Il n'existe pas encore de vaccin contre le VIH, mais des traitements antirétroviraux peuvent aider à contrôler la progression de la maladie.
4. Il est important de se faire dépister régulièrement pour le VIH, car un traitement précoce peut améliorer les chances de survie.
5. Le virus du SIDA est présent dans le monde entier, mais certaines populations sont plus touchées que d'autres, comme les personnes vivant avec le VIH, les travailleurs du sexe et les utilisateurs de drogues injectables.
6. Les recherches se poursuivent pour trouver un remède définitif contre le VIH, mais en attendant, la prévention reste la meilleure arme contre la propagation du virus.
7. Les personnes séropositives peuvent mener une vie saine et productive avec un traitement approprié et un soutien médical et social


## Simple Chains

In [28]:
from langchain.chat_models import ChatOpenAI
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

In [29]:
llm = ChatOpenAI(model='gpt-4', temperature=0.5)

template = """Você é um virologista experiente.
Escreva um resumo em {idioma} sobre o vírus {virus} ."""

prompt= PromptTemplate(
    input_variables=['virus', 'idioma'],
    template=template
)

chain = LLMChain(llm=llm, prompt=prompt)
output = chain.run({'virus': 'HIV', 'idioma': 'inglês'})

In [30]:
output

'The Human Immunodeficiency Virus (HIV) is a retrovirus that primarily infects components of the human immune system such as T-cells, macrophages, and dendritic cells. It directly and indirectly destroys CD4+ T cells, which leads to a weakened immune system and allows life-threatening opportunistic infections and cancers to thrive. HIV is transmitted through direct contact of a mucous membrane or the bloodstream with a bodily fluid containing the virus, such as blood, semen, vaginal fluid, preseminal fluid, and breast milk. \n\nThere are two types of HIV: HIV-1 and HIV-2. HIV-1 is the most widespread and pathogenic strain, while HIV-2 is less transmissible and usually less pathogenic. Both types are believed to have originated from the transfer of the virus from primates to humans. \n\nWithout treatment, the average survival time after infection with HIV is estimated to be 9 to 11 years. Antiretroviral therapy (ART) can slow the course of the disease and may lead to a near-normal life 

## Sequential Chains

In [31]:
from langchain.chat_models import ChatOpenAI
from langchain.prompts import PromptTemplate
from langchain.llms import OpenAI
from langchain.chains import LLMChain, SimpleSequentialChain

In [32]:
llm1 = OpenAI(model='gpt-3.5-turbo-instruct', temperature=0.7, max_tokens=1024)
prompt1 = PromptTemplate(
    input_variables=['conceito'],
    template="""Você é um cientista experiente e programador Python.
    Escreva uma função que implementa o conceito de {conceito}."""
)

chain1 = LLMChain(llm=llm1, prompt=prompt1)

# segunda chain

llm2 = ChatOpenAI(model='gpt-3.5-turbo', temperature=1.2)
prompt2 = PromptTemplate(
    input_variables=['function'],
    template="""Dada a função Python {function}, descreva como funciona da forma mais detalhada possível."""
)

chain2 = LLMChain(llm=llm2, prompt=prompt2)

overall_chain = SimpleSequentialChain(chains=[chain1, chain2], verbose=True)
output = overall_chain.run('regressão linear')



[1m> Entering new SimpleSequentialChain chain...[0m
[36;1m[1;3m

def criar_tupla(*args):
    return args

# Exemplo de uso:
minha_tupla = criar_tupla(1, 2, 3, "a", "b", "c")
print(minha_tupla) # (1, 2, 3, "a", "b", "c")
print(type(minha_tupla)) # <class 'tuple'>[0m
[33;1m[1;3mA função `criar_tupla` é definida com o uso do asterisco `*` no argumento `( *args)`. Isso permite que a função receba qualquer número de argumentos posicionais e os empacote em uma tupla chamada `args`.

Dentro da função, ela simplesmente retorna o valor da tupla `args`.

No exemplo de uso dado, a função `criar_tupla` é chamada com os argumentos 1, 2, 3, "a", "b", "c". Esses argumentos são empacotados em uma tupla, assim `args = (1, 2, 3, "a", "b", "c")`. Em seguida, essa tupla é atribuída à variável `minha_tupla`.

Ao imprimir `minha_tupla`, o resultado é `(1, 2, 3, "a", "b", "c")`, ou seja, todos os argumentos passados para a função estão presentes na tupla.

Em seguida, ao imprimir `type(minha_tupla)`

In [33]:
output

'A função `criar_tupla` é definida com o uso do asterisco `*` no argumento `( *args)`. Isso permite que a função receba qualquer número de argumentos posicionais e os empacote em uma tupla chamada `args`.\n\nDentro da função, ela simplesmente retorna o valor da tupla `args`.\n\nNo exemplo de uso dado, a função `criar_tupla` é chamada com os argumentos 1, 2, 3, "a", "b", "c". Esses argumentos são empacotados em uma tupla, assim `args = (1, 2, 3, "a", "b", "c")`. Em seguida, essa tupla é atribuída à variável `minha_tupla`.\n\nAo imprimir `minha_tupla`, o resultado é `(1, 2, 3, "a", "b", "c")`, ou seja, todos os argumentos passados para a função estão presentes na tupla.\n\nEm seguida, ao imprimir `type(minha_tupla)`, o resultado é `<class \'tuple\'>`. Isso confirma que `minha_tupla` é realmente uma instância da classe `tuple`, ou seja, uma tupla.\n\nDessa forma, a função `criar_tupla` permite que você crie uma tupla com um número variável de elementos, simplesmente passando esses element

## LangChain Agents

In [34]:
from langchain_experimental.agents.agent_toolkits import create_python_agent
from langchain_experimental.tools.python.tool import PythonAstREPLTool
from langchain.llms import OpenAI

In [35]:
llm = OpenAI(temperature=0)
agent_executor = create_python_agent(
    llm=llm,
    tool=PythonAstREPLTool(),
    verbose=True
)
agent_executor.run('calcule a raiz quadrada do fatorial de 20 e exiba com quatro casas decimais')



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m I need to calculate the square root of the factorial of 20
Action: python_repl_ast
Action Input: from math import factorial; print(f"{round(factorial(20)**0.5, 4)}")[0m
Observation: [36;1m[1;3m1559776268.6285
[0m
Thought:[32;1m[1;3m I now know the final answer
Final Answer: 1559776268.6285[0m

[1m> Finished chain.[0m


'1559776268.6285'

## Splitting e Embedding de texto

In [61]:
from langchain.text_splitter import RecursiveCharacterTextSplitter

with open('docs/CLT.txt') as f:
    clt = f.read()

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=10,
    length_function=len #geralmente se conta pelo numero de tokens
)

In [62]:
chunks = text_splitter.create_documents([clt])

In [63]:
chunks[0]

Document(page_content='CLT E A REFORMA TRABALHISTA: EVOLUÇÃO\n                                     NAS RELAÇÕES DE TRABALHO\n\n                                                                                                Eliezer de Queiroz Noleto1')

In [64]:
chunks[1].page_content

'Ao falarmos sobre a Consolidação das Leis do Trabalho (CLT), somos reme-\n          tidos ao período conhecido como Era Vargas. Editada no ano de 1943, a CLT resultou\n          da coletânea de inúmeras leis esparsas então existentes que disciplinavam aspectos\n          sobre direito individual do trabalho, direito coletivo, fiscalização do trabalho, direito\n          processual do trabalho, além de legislações específicas de determinadas profissões.\n                    Esse era o espírito do trabalho desenvolvido pela comissão constituída\n          para elaborar a CLT, evidenciado na exposição de motivos que acompanhou o\n          texto final do projeto. Segundo esse escrito, a consolidação nada mais é do que “a\n          fase própria da concatenação dos textos e da coordenação dos princípios, quando\n          já se denuncia primeiro o pensamento do sistema depois de haverem sido regu-'

In [65]:
len(chunks) #numero de vetores no banco de dados de vetor

1167

In [44]:
def embedding_cost(texts: list) -> None:
    import tiktoken
    enc = tiktoken.encoding_for_model('text-embedding-ada-002')
    total_tokens = sum([len(enc.encode(page.page_content)) for page in texts])
    print(f'Total de tokens: {total_tokens}')
    print(f'Custo de Embedding em USD: {total_tokens / 1000 * 0.0001:6f}')

In [66]:
embedding_cost(chunks)

Total de tokens: 257483
Custo de Embedding em USD: 0.025748


### Criando embeddings

In [46]:
from langchain.embeddings import OpenAIEmbeddings
embeddings = OpenAIEmbeddings()

In [68]:
vector = embeddings.embed_query(chunks[0].page_content)

In [69]:
#vector

In [70]:
import os
import pinecone
from langchain.vectorstores.pinecone import Pinecone

pinecone.init(api_key=os.environ.get('PINECONE_API_KEY'), environment=os.environ.get('PINECONE_ENV'))

In [71]:
indexes = pinecone.list_indexes()
indexes
#conta free só permite 1 indice. Caso queira remover os índices existentes:
for i in indexes:
    pinecone.delete_index(i)
    print('Feito!')

Feito!


In [72]:
index_name = 'descllm'
if index_name not in pinecone.list_indexes():
    pinecone.create_index(
        index_name,
        dimension=1536, #dimension: https://platform.openai.com/docs/guides/embeddings/second-generation-models
        metric='cosine' #algoritmo de similaridade
    )
    print('Feito!')

Feito!


In [73]:
vector_store = Pinecone.from_documents(chunks, embeddings, index_name=index_name)

### Conversando com os dados (busca por similaridade)

In [74]:
query = 'explique a remuneração das férias'
result = vector_store.similarity_search(query)
print(result)

[Document(page_content='tativos da respectiva categoria profissional, e pro-         da remuneração da tarefa na data da concessão\nvidenciará a afixação de aviso nos locais de tra-            das férias. (Parágrafo acrescido pelo Decreto-Lei nº 1.535,\nbalho. (Parágrafo acrescido pelo Decreto-Lei nº 1.535, de   de 13/4/1977)\n13/4/1977)                                                    § 3º Quando o salário for pago por percenta-\nArt. 140. Os empregados contratados há menos                gem, comissão ou viagem, apurar-se-á a média\nde 12 (doze) meses gozarão, na oportunidade,                percebida pelo empregado nos 12 (doze) meses\nférias proporcionais, iniciando-se, então, novo             que precederem à concessão das férias. (Parágrafo\nperíodo aquisitivo. (Artigo com redação dada pelo           acrescido pelo Decreto-Lei nº 1.535, de 13/4/1977)\nDecreto-Lei nº 1.535, de 13/4/1977)                           § 4º A parte do salário paga em utilidades será'), Document(page_c

In [75]:
for r in result:
    print(r.page_content)
    print('-' * 40)

tativos da respectiva categoria profissional, e pro-         da remuneração da tarefa na data da concessão
videnciará a afixação de aviso nos locais de tra-            das férias. (Parágrafo acrescido pelo Decreto-Lei nº 1.535,
balho. (Parágrafo acrescido pelo Decreto-Lei nº 1.535, de   de 13/4/1977)
13/4/1977)                                                    § 3º Quando o salário for pago por percenta-
Art. 140. Os empregados contratados há menos                gem, comissão ou viagem, apurar-se-á a média
de 12 (doze) meses gozarão, na oportunidade,                percebida pelo empregado nos 12 (doze) meses
férias proporcionais, iniciando-se, então, novo             que precederem à concessão das férias. (Parágrafo
período aquisitivo. (Artigo com redação dada pelo           acrescido pelo Decreto-Lei nº 1.535, de 13/4/1977)
Decreto-Lei nº 1.535, de 13/4/1977)                           § 4º A parte do salário paga em utilidades será
----------------------------------------
com redaç

### Gerando respostas com LLM

In [76]:
from langchain.chains import RetrievalQA
from langchain.chat_models import ChatOpenAI

In [77]:
llm = ChatOpenAI(model='gpt-3.5-turbo-16k', temperature=0.5)

retriever = vector_store.as_retriever(search_type='similarity', search_kwargs={'k': 3}) #k:3 retorna os 3 chunks mais semelhantes a consulta do usuario

chain = RetrievalQA.from_chain_type(llm=llm, chain_type='stuff', retriever=retriever) #stuff: usa todo o texto dos documentos no prompt

In [79]:
query = 'como funciona o décimo terceiro salário?'
resp = chain.run(query)
print(resp)

O décimo terceiro salário é um benefício garantido por lei aos trabalhadores brasileiros. Ele consiste no pagamento de uma gratificação equivalente a 1/12 avos da remuneração devida ao empregado em cada mês trabalhado no ano. Em outras palavras, o décimo terceiro salário corresponde a 1/12 do salário mensal para cada mês completo trabalhado.

Esse pagamento é feito em duas parcelas: a primeira até o dia 30 de novembro e a segunda até o dia 20 de dezembro. A primeira parcela corresponde a 50% do valor total do décimo terceiro salário e é paga sem descontos. Já a segunda parcela corresponde aos outros 50% e pode sofrer descontos referentes ao Imposto de Renda e à contribuição previdenciária, dependendo da faixa salarial do empregado.

É importante ressaltar que o décimo terceiro salário é um direito de todos os trabalhadores com carteira assinada, incluindo empregados domésticos, trabalhadores rurais, temporários e intermitentes. Além disso, é garantido também para empregados afastados p