# RAG : Usando Pinecone como base de conocimiento

In [None]:
import pinecone
import os, getpass
import tiktoken

In [2]:
api_key = getpass.getpass("Ingresa tu API Key de Pinecone : ")

## Creando un index en Pinecone

In [3]:
env = "gcp-starter"
index_name = "knowledge-base-s3"
dimension = 1536

pinecone.init(api_key = api_key, environment = env)

if index_name not in pinecone.list_indexes():

    pinecone.create_index(
        index_name, 
        dimension = dimension
    )

    print("Index " + index_name + " creado con éxito en Pinecone")

Index knowledge-base-s3 creado con éxito en Pinecone


## Cargando y generando fragmentos de un archivo almacenado en bucket de AWS S3

In [4]:
from langchain.document_loaders import S3FileLoader
from langchain.text_splitter import CharacterTextSplitter

loader = S3FileLoader(
    "bigdata", 
    "book/1000cóctelesdetodoelmundo.pdf", #628 páginas
    aws_access_key_id = "AKIA6EMKHKC74ULG3635", 
    aws_secret_access_key = "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"
)

data = loader.load()

text_splitter = CharacterTextSplitter.from_tiktoken_encoder(
    chunk_size = 800, 
    chunk_overlap = 20
)

docs = text_splitter.split_documents(documents = data)

In [5]:
len(docs)

198

In [6]:
os.environ["OPENAI_API_KEY"] = getpass.getpass("Ingresa tu API Key de OpenAI : ")

## Cargando datos a Pinecone

In [7]:
from langchain.vectorstores import Pinecone
from langchain.embeddings.openai import OpenAIEmbeddings

embeddings = OpenAIEmbeddings()
docsearch = Pinecone.from_documents(docs, embeddings, index_name = index_name)

In [8]:
embed = OpenAIEmbeddings()

## Creación de VectorStore hacia Pinecone para la búsqueda semántica con LangChain

In [10]:
from langchain.vectorstores import Pinecone

text_field = "text"
index = pinecone.Index(index_name)

vectorstore = Pinecone(
    index, 
    embed.embed_query, 
    text_field
)

In [18]:
from langchain.chat_models import ChatOpenAI
from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate

template = """Responda a la pregunta basada en el siguiente contexto.
Si no puedes responder a la pregunta, usa la siguiente respuesta "No lo sé disculpa, puedes buscar la información en internet."

Contexto: 
{context}
Pregunta: {question}
Respuesta: 
"""

prompt = PromptTemplate(
    template = template, input_variables = ["context", "question"]
)

llm = ChatOpenAI(
    model_name = 'gpt-3.5-turbo',
    temperature = 0.0
)

qa = RetrievalQA.from_chain_type(
    llm = llm,
    chain_type = "stuff",
    retriever = vectorstore.as_retriever(), #Por defecto recupera los 4 documentos más relevantes as_retriever(search_kwargs={'k': 3 })
    verbose = True,
    chain_type_kwargs = {"prompt": prompt, "verbose": True}
)

In [17]:
qa.run("¿puedes recomendarme cócteles refrescantes? y por favor dame la receta para 2 personas de cóctel")



[1m> Entering new RetrievalQA chain...[0m




[1m> Entering new StuffDocumentsChain chain...[0m


[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mResponda a la pregunta basada en el siguiente contexto.
Si no puedes responder a la pregunta, usa la siguiente respuesta "No lo sé disculpa, puedes buscar la información en internet."

Contexto: 
En la coctelera, con abundante hielo triturado, vierta los ingredientes y agite enérgicamente durante un minuto. Sirva en flautas y adorne con algunas cerezas y un poco de seltz. Mezcle con una cuchara o una cañita.

Dalila cóctel

RELAJANTE

5/10 de jerez 2/10 de ron de Martinica 2/10 de coñac 1/10 de zumo de limón 1 golpe de bíter de naranja

Ponga todos los ingredientes en la coctelera junto con unos cubitos de hielo y agite durante unos segundos; a continuación, sirva y adorne con una oliva.

Dandolo cóctel RELAJANTE

5/10 de vermut clásico 4/10 de arak de Batavia 1/10 de Bénédictine

Agite todos los ingredientes en la coctelera con cubitos de hielo. Adorne

'Sí, puedo recomendarte algunos cócteles refrescantes. Aquí tienes dos opciones:\n\n1. Sylvia cóctel:\n- 7/10 de espumoso seco\n- 2/10 de yogur\n- 1/10 de zumo de melocotón\n\nVierta los ingredientes en los tumbler con algunos cubitos de hielo, agite con una cucharilla de mango largo y sirva.\n\n2. Vittorino cóctel:\n- 7/10 de zumo de pomelo\n- 2/10 de zumo de naranja\n- 0,5/10 de vodka\n- 0,5/10 de Grand Marnier\n\nMezcle los ingredientes en la coctelera con cubitos de hielo y sirva en vasos tumbler.\n\nRecuerda ajustar las cantidades de los ingredientes según la cantidad de cócteles que desees preparar. ¡Disfruta!'

## Eliminando index en Pinecone

In [19]:
pinecone.delete_index(index_name)