## Instalando Dependências

In [None]:
%pip install chromadb
%pip install tiktoken
%pip install PyPDF2
%pip install llamaapi
%pip install langchain
%pip install langchain_ollama
%pip install langchain-experimental

# Introdução ao LangChain

## Importando Dependências

In [83]:
from langchain.vectorstores import Chroma
from langchain.text_splitter import CharacterTextSplitter
from langchain.document_loaders import TextLoader
from langchain_ollama.llms import OllamaLLM
from langchain_ollama import OllamaEmbeddings
from langchain.chains import RetrievalQA

from PyPDF2 import PdfReader

## Função auxiliar para extração de arquivos

In [54]:
doc = PdfReader('document.pdf')

with open('document.txt', 'w', encoding='utf-8') as f:
  full_text = ""

  for page in doc.pages:
    full_text += page.extract_text()

  f.write(full_text)

with open('document.txt', 'r', encoding='utf-8') as f:
  text = f.read()

In [97]:
loader = TextLoader("document.txt")
documents = loader.load()

## Tokeniza os textos

In [78]:
text_splitter = CharacterTextSplitter(chunk_size=512, chunk_overlap=24)
texts = text_splitter.split_documents(documents)

## Embedding e Vectorstores

In [93]:
embeddings = OllamaEmbeddings(model="nomic-embed-text")
docsearch = Chroma.from_documents(texts, embeddings)

## Chain

In [94]:
qa = RetrievalQA.from_chain_type(llm=OllamaLLM(model="llama2"), chain_type="stuff", retriever=docsearch.as_retriever())

## Resultado

In [96]:
query = "Quando foi desenvolvido o marco civil da internet no Brasil?"
qa.run(query)

'O marco civil da internet no Brasil foi desenvolvido em 2013, através do Projeto de Lei nº 2.126/2011, que foi approveitado pela Câmara dos Deputados em 2014.\n\nEm 28 de maio de 2013, o Senado Federal realizou uma discussão sobre o marco legal para a internet no Brasil, com a presença do presidente Dilma Rousseff. Nesse dia, também foi discutida a necessidade de um marco civil para garantir a liberdade e a segurança na Internet no país.\n\nNo entanto, o processo de criação do marco civil da internet no Brasil começou em 2011, quando foi apresentado o Projeto de Lei nº 2.126/2011, que buscava estabelecer normas para a Internet no Brasil. O projeto foi aprovado pela Câmara dos Deputados em 2014 e é considerado uma das principais leis da internet no país.'