In [2]:
# https://docs.cohere.com/docs/chat-on-langchain
# https://www.pinecone.io/learn/refine-with-rerank/

import os
from langchain_cohere import CohereEmbeddings
import openai
from dotenv import load_dotenv

current_dir = os.getcwd()
parent_dir = os.path.dirname(current_dir)
app_dir = os.path.join(parent_dir, "")
load_dotenv(os.path.join(app_dir, ".env"))
openai_api_key = os.getenv("OPENAI_API_KEY")
cohere_api_key = os.getenv("COHERE_API_KEY")
embed_model = "text-embedding-3-small"

In [3]:
# https://docs.cohere.com/docs/embed-on-langchain

#cohere_embeddings = CohereEmbeddings(cohere_api_key=os.getenv("COHERE_API_KEY"), model="embed-english-light-v3.0")
cohere_embeddings = CohereEmbeddings(cohere_api_key=os.getenv("COHERE_API_KEY"), model="embed-english-v3.0")
text = "This is a test document."
query_result = cohere_embeddings.embed_query(text)
print(query_result)
doc_result = cohere_embeddings.embed_documents([text])
print(doc_result)

[-0.030578613, -0.032836914, -0.02659607, -0.03173828, -0.06628418, 0.009254456, -0.06500244, 0.027374268, -0.029418945, 0.024795532, -0.06506348, 0.0074882507, -0.032928467, 0.0070648193, 0.013977051, -0.07299805, 0.02960205, 0.013473511, 0.015098572, 0.0051460266, 0.015335083, 0.020492554, -0.006378174, -0.012084961, -0.0057258606, -0.006416321, 0.01525116, 0.0104904175, -0.04043579, -0.04272461, 0.0027256012, 0.040863037, 0.020706177, 0.0357666, -0.02760315, 0.054779053, 0.0037517548, 0.0048828125, 0.010848999, 0.022827148, 0.025741577, -0.005432129, -0.012718201, -0.010429382, -0.030227661, -0.040924072, 0.052520752, 0.004337311, 0.013160706, 0.024978638, 0.022445679, 0.018508911, 0.008834839, 0.0345459, -0.01878357, 0.0017967224, -0.016830444, 0.041137695, 0.045074463, -0.031066895, -0.04031372, 0.03543091, 0.0206604, -0.00258255, -0.010261536, 0.0030879974, -0.03375244, -0.00818634, 0.042755127, -0.006702423, -0.02482605, -0.026550293, 0.052215576, -0.052459717, -0.036499023, -0.

In [4]:
from langchain_cohere import CohereRagRetriever
from langchain_cohere import ChatCohere
from langchain_core.documents import Document

cohere_chat_model = ChatCohere(cohere_api_key=os.getenv("COHERE_API_KEY"))
rag = CohereRagRetriever(llm=cohere_chat_model, connectors=[{"id": "web-search"}])
docs = rag.get_relevant_documents("Quem descobriu o Brasil?")

print(len(docs))
for doc in docs[:-1]:
    print(doc.metadata)
    print("\n\n" + doc.page_content)
    print("\n\n" + "-" * 30 + "\n\n")


  docs = rag.get_relevant_documents("Quem descobriu o Brasil?")


5
{'id': 'web-search_0', 'snippet': 'Índice Recentes Mais Lidas\n\nQuem descobriu o Brasil (realmente)\n\nLaura Aidar Formada em Comunicação\n\nA versão histórica oficial considera o explorador português Pedro Álvares Cabral (1467-1520) como o primeiro navegante a chegar em terras brasileiras, junto com uma frota de 13 navios e mais de mil marujos.\n\nSegundo documentos, o fato ocorreu no dia 22 de abril de 1500, 44 dias depois da saída das embarcações de Lisboa, em Portugal.\n\nPedro Álvares Cabral era o comandante dessa grande empreitada que começou com a missão de se chegar às Índias, mas que acabou por aportar em terras até então desconhecidas. \n\nO primeiro lugar avistado foi um morro, batizado de Monte Pascoal. No dia seguinte, 23 de abril, os europeus pisam em terra firme e fazem os primeiros contatos com os indígenas.\n\nO desembarque ocorreu em uma praia de areia branca, que corresponde hoje a Porto Seguro, no sul da Bahia. \n\nNa época, o lugar onde aportaram e mais um pedaç

In [5]:
answer = docs[-1].page_content
print(answer)
print("\n\n citações...")
citations = docs[-1].metadata['citations']
print(citations)

A versão histórica oficial considera o explorador português Pedro Álvares Cabral (1467-1520) como o primeiro navegante a chegar em terras brasileiras, junto com uma frota de 13 navios e mais de mil marujos.

Segundo documentos, o fato ocorreu no dia 22 de abril de 1500, 44 dias depois da saída das embarcações de Lisboa, em Portugal.

Pedro Álvares Cabral era o comandante dessa grande empreitada que começou com a missão de se chegar às Índias, mas que acabou por aportar em terras até então desconhecidas.

O primeiro lugar avistado foi um morro, batizado de Monte Pascoal. No dia seguinte, 23 de abril, os europeus pisam em terra firme e fazem os primeiros contatos com os indígenas.

O desembarque ocorreu em uma praia de areia branca, que corresponde hoje a Porto Seguro, no sul da Bahia.

Na época, o lugar onde aportaram e mais um pedaço da costa do nordeste brasileiro foi chamado de Ilha de Vera Cruz.

No entanto, há outras pesquisas que apontam os espanhóis Vicente Yáñez Pinzón (1462-151

In [6]:

rag = CohereRagRetriever(llm=cohere_chat_model, connectors=[])
user_query = "quem descobriu o Brasil ?"
docs = rag.get_relevant_documents(user_query)

for doc in docs[:-1]:
    print(doc.metadata)
    print("\n\n" + doc.page_content)
    print("\n\n" + "-" * 30 + "\n\n")

answer = docs[-1].page_content
print(answer)

citations = docs[-1].metadata['citations']
print(citations)

O Brasil foi oficialmente descoberto em 22 de abril de 1500 pelo explorador português Pedro Álvares Cabral. Ele liderou uma frota de 13 navios que partiu de Portugal com destino à Índia, mas acabou desviando-se de sua rota original e chegou ao que hoje é conhecido como Porto Seguro, no estado da Bahia.

A chegada de Cabral marcou o início da colonização portuguesa no Brasil, que durou até o século XIX. No entanto, é importante notar que a região já era habitada por diversos povos indígenas antes da chegada dos europeus.
None


In [8]:
# pip install wikipedia
from langchain.retrievers import WikipediaRetriever

wiki_retriever = WikipediaRetriever()
docs = wiki_retriever.get_relevant_documents(user_query)

for doc in docs[:-1]:
    print(doc.metadata)
    print("\n\n" + doc.page_content)
    print("\n\n" + "-" * 30 + "\n\n")

answer = docs[-1].page_content
print(answer)



{'title': 'Imperatriz Leopoldinense', 'summary': 'The samba school Imperatriz Leopoldinense was created on March 6, 1956 in the suburb of Ramos, in Rio de Janeiro.\nIt is named after Maria Leopoldina, archduchess of Austria and Empress of Brazil, consort of  Emperor Pedro I.\nImperatriz began its successful journey to victory in 1980 when it won the championship for the first time. Since then it won the first prize eight times.\nFrom 1992 to 2009, the school had a carnival as a teacher, artist, set designer and costume designer Rosa Magalhães, who has five titles to college.', 'source': 'https://en.wikipedia.org/wiki/Imperatriz_Leopoldinense'}


The samba school Imperatriz Leopoldinense was created on March 6, 1956 in the suburb of Ramos, in Rio de Janeiro.
It is named after Maria Leopoldina, archduchess of Austria and Empress of Brazil, consort of  Emperor Pedro I.
Imperatriz began its successful journey to victory in 1980 when it won the championship for the first time. Since then it

In [9]:
from langchain.agents import AgentExecutor
from langchain_cohere.chat_models import ChatCohere
from langchain_cohere.react_multi_hop.agent import create_cohere_react_agent
from langchain_community.tools.tavily_search import TavilySearchResults
from langchain_core.prompts import ChatPromptTemplate

internet_search = TavilySearchResults()
llm = ChatCohere(cohere_api_key=os.getenv("COHERE_API_KEY"))
question = "quem decsobriu o Brasil ?"
agent = create_cohere_react_agent(
    llm=llm,
    tools=[internet_search],
    prompt=ChatPromptTemplate.from_template("{question}"),
)
agent_executor = AgentExecutor(agent=agent, tools=[internet_search], verbose=False)

response = agent_executor.invoke({
    "question": question,
})

print(response.get("output"))
print("\n\n Citações....")
print(response.get("citations"))


O Brasil foi descoberto por Pedro Álvares Cabral, que chegou ao litoral sul do atual estado da Bahia em 22 de abril de 1500.

A expedição portuguesa, formada inicialmente com 13 embarcações, era liderada pelo capitão-mor Pedro Álvares Cabral. Os navegantes pensaram que o Brasil era uma ilha e, por esse motivo, o primeiro nome que lhe deram foi Ilha de Vera Cruz (vera, de verdade ou verdadeira), mas depois chamaram-lhe de Terra de Santa Cruz.

No entanto, há documentos que sugerem que o Brasil pode ter sido descoberto antes de 22 de abril de 1500. Por exemplo, o manuscrito Esmeraldo de Situ Orbis, do navegante português Duarte Pacheco Pereira (1460-1533), que menciona uma viagem em 1498 em que cita terras que podem fazer parte da costa litorânea da região do Amazonas e Maranhão.


 Citações....
[CohereCitation(start=28, end=41, text='Pedro Álvares', documents=[{'url': 'https://www.suapesquisa.com/historiadobrasil/descobrimento_resumo.htm', 'content': 'A chegada dos portugueses ao Brasil

In [10]:
# https://docs.cohere.com/docs/chat-on-langchain

#from langchain_community.chat_models import ChatCohere
from langchain_cohere import ChatCohere
from langchain_core.messages import AIMessage, HumanMessage

cohere_chat_model = ChatCohere(cohere_api_key=os.getenv("COHERE_API_KEY"))
current_message = [HumanMessage(content="qual capital da França?")]
print(cohere_chat_model(current_message))

print("\n\n")

current_message_and_history = [
    HumanMessage(content="qual a capital da França?"),
    AIMessage(content="Paris"),
    HumanMessage(content="Sugira um bom restaurante na cidade") ]
print(cohere_chat_model(current_message_and_history))

  print(cohere_chat_model(current_message))


content='A capital da França é Paris. É a cidade mais populosa do país, com uma população de 2.165.423 habitantes em 2021. Paris é um importante centro de política, economia, cultura, ciência e artes na Europa. A cidade é conhecida por sua arquitetura icônica, incluindo a Torre Eiffel, a Catedral de Notre-Dame e o Museu do Louvre.' additional_kwargs={'documents': None, 'citations': None, 'search_results': None, 'search_queries': None, 'is_search_required': None, 'generation_id': 'e576ab3a-2162-48d4-8292-69f7af6c60f5', 'token_count': {'input_tokens': 211.0, 'output_tokens': 83.0}} response_metadata={'documents': None, 'citations': None, 'search_results': None, 'search_queries': None, 'is_search_required': None, 'generation_id': 'e576ab3a-2162-48d4-8292-69f7af6c60f5', 'token_count': {'input_tokens': 211.0, 'output_tokens': 83.0}} id='run-23369cc1-2499-43d6-8beb-7f8cde84e710-0' usage_metadata={'input_tokens': 211, 'output_tokens': 83, 'total_tokens': 294}



content='Existem muitos restau