# Instalación de librerias necesarias

In [1]:
!pip install pinecone-client



In [2]:
!pip install -qU \
  transformers==4.31.0 \
  sentence-transformers==2.2.2 \
  datasets==2.14.0 \
  accelerate==0.21.0 \
  einops==0.6.1 \
  langchain==0.0.240 \
  xformers==0.0.20 \
  bitsandbytes==0.41.0

[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
langchain-core 0.2.8 requires langsmith<0.2.0,>=0.1.75, but you have langsmith 0.0.92 which is incompatible.[0m[31m
[0m

# Instalación de modelo de conversión a embbedings

In [3]:
from torch import cuda
from langchain.embeddings.huggingface import HuggingFaceEmbeddings

embed_model_id = 'sentence-transformers/all-MiniLM-L6-v2'

device = f'cuda:{cuda.current_device()}' if cuda.is_available() else 'cpu'

embed_model = HuggingFaceEmbeddings(
    model_name=embed_model_id,
    model_kwargs={'device': device},
    encode_kwargs={'device': device, 'batch_size': 32}
)


# Conexión y creación de base vectorial

In [4]:
import os
from pinecone import Pinecone

api_key = os.environ.get('PINECONE_API_KEY') or '766da731-6b5a-47ac-b1b4-cd4ed79e1d20'

pc = Pinecone(api_key=api_key)

In [5]:
from pinecone import ServerlessSpec

cloud = os.environ.get('PINECONE_CLOUD') or 'aws'
region = os.environ.get('PINECONE_REGION') or 'us-east-1'

spec = ServerlessSpec(cloud=cloud, region=region)

In [6]:
index_name = 'aeropuertomodel'

In [7]:
if index_name not in pc.list_indexes().names():
    pc.create_index(
        index_name,
        metric='cosine',
        spec=spec
    )
index = pc.Index(index_name)
index.describe_index_stats()

{'dimension': 384,
 'index_fullness': 0.0,
 'namespaces': {'': {'vector_count': 32}},
 'total_vector_count': 32}

# Importe de documentación

In [None]:
from datasets import load_dataset
import pandas as pd
df=pd.read_excel("reglamentos (2).xlsx")
data = df
data

Unnamed: 0,doi,chunk-id,chunk,id,title,summary,source,authors,categories,comment,journal_ref,primary_category,published,updated,references
0,0,0,Desde la puerta A12 hasta el área de reclamo d...,0,Desde la puerta A12 hasta el área de reclamo d...,x,x,x,x,x,x,x,x,x,x
1,1,1,Desde el área de reclamo de equipaje B hasta l...,1,Desde el área de reclamo de equipaje B hasta l...,x,x,x,x,x,x,x,x,x,x
2,2,2,Desde el área de seguridad hasta la sala VIP:\...,2,Desde el área de seguridad hasta la sala VIP,x,x,x,x,x,x,x,x,x,x
3,3,3,Desde la sala VIP hasta el área de seguridad:\...,3,Desde la sala VIP hasta el área de seguridad,x,x,x,x,x,x,x,x,x,x
4,4,4,Desde el estacionamiento P3 hasta la terminal ...,4,Desde el estacionamiento P3 hasta la terminal ...,x,x,x,x,x,x,x,x,x,x
5,5,5,Desde la terminal de vuelos internacionales ha...,5,Desde la terminal de vuelos internacionales ha...,x,x,x,x,x,x,x,x,x,x
6,6,6,Desde la zona de restaurantes hasta la puerta ...,6,Desde la zona de restaurantes hasta la puerta C9,x,x,x,x,x,x,x,x,x,x
7,7,7,Desde la puerta C9 hasta la zona de restaurant...,7,Desde la puerta C9 hasta la zona de restaurantes,x,x,x,x,x,x,x,x,x,x
8,8,8,Desde el mostrador de check-in hasta el contro...,8,Desde el mostrador de check-in hasta el contro...,x,x,x,x,x,x,x,x,x,x
9,9,9,Desde el control de pasaportes hasta el mostra...,9,Desde el control de pasaportes hasta el mostra...,x,x,x,x,x,x,x,x,x,x


In [None]:
batch_size = 32

for i in range(0, len(data), batch_size):
    i_end = min(len(data), i+batch_size)
    batch = data.iloc[i:i_end]
    ids = [f"{x['doi']}-{x['chunk-id']}" for i, x in batch.iterrows()]
    texts = [x['chunk'] for i, x in batch.iterrows()]
    embeds = embed_model.embed_documents(texts)
    metadata = [
        {'text': x['chunk'],
         'source': x['source'],
         'title': x['title']} for i, x in batch.iterrows()
    ]
    index.upsert(vectors=zip(ids, embeds, metadata))

In [8]:
index.describe_index_stats()

{'dimension': 384,
 'index_fullness': 0.0,
 'namespaces': {'': {'vector_count': 32}},
 'total_vector_count': 32}

# Instalación y aplicación de la IA llama2 al código

In [9]:
from torch import cuda, bfloat16
import transformers

model_id = 'meta-llama/Llama-2-7b-chat-hf'

device = f'cuda:{cuda.current_device()}' if cuda.is_available() else 'cpu'


bnb_config = transformers.BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type='nf4',
    bnb_4bit_use_double_quant=True,
    bnb_4bit_compute_dtype=bfloat16
)

hf_auth = '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'
model_config = transformers.AutoConfig.from_pretrained(
    model_id,
    use_auth_token=hf_auth
)

model = transformers.AutoModelForCausalLM.from_pretrained(
    model_id,
    trust_remote_code=True,
    config=model_config,
    quantization_config=bnb_config,
    device_map='auto',
    use_auth_token=hf_auth
)
model.eval()
print(f"Model loaded on {device}")

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

Model loaded on cuda:0


In [10]:
tokenizer = transformers.AutoTokenizer.from_pretrained(
    model_id,
    use_auth_token=hf_auth
)



In [11]:
generate_text = transformers.pipeline(
    model=model, tokenizer=tokenizer,
    return_full_text=True,
    task='text-generation',
    temperature=0.0,
    max_new_tokens=512,
    repetition_penalty=1.1
)

In [12]:
from langchain.llms import HuggingFacePipeline

llm = HuggingFacePipeline(pipeline=generate_text)

llm(prompt="what are the camera specs of the new iphone 15")

# Implementación del metodo Busqueda por Similaridad Coseno

In [13]:
import locale
locale.getpreferredencoding = lambda: "UTF-8"

In [14]:
%pip install --upgrade --quiet  langchain-pinecone langchain-openai langchain

In [15]:
from langchain_pinecone import PineconeVectorStore

text_field = 'text'

vectorstore = PineconeVectorStore(index, embed_model.embed_query, text_field)

In [16]:
query = 'como voy desde la sala vip hasta el area de seguridad '

vectorstore.similarity_search_by_vector_with_score(
            embed_model.embed_query(query), k=5
            )

[(Document(page_content='Desde la sala VIP hasta el área de seguridad:\n\nSal de la sala VIP y gira a la izquierda.\nBaja la escalera mecánica al primer piso.\nGira a la derecha y sigue recto hasta el control de seguridad.', metadata={'source': 'x', 'title': 'Desde la sala VIP hasta el área de seguridad'}),
  0.886431),
 (Document(page_content='Desde el área de seguridad hasta la sala VIP:\n\nUna vez pases el control de seguridad, gira a la izquierda.\nCamina recto hasta llegar a la escalera mecánica.\nSube la escalera mecánica al segundo piso.\nLa sala VIP estará a tu derecha, frente a la tienda de electrónica.', metadata={'source': 'x', 'title': 'Desde el área de seguridad hasta la sala VIP'}),
  0.864973247),
 (Document(page_content='Desde la oficina de información hasta el área de embarque E:\n\nSal de la oficina de información y gira a la derecha.\nCamina recto durante 100 metros y toma el ascensor al tercer piso.\nAl salir del ascensor, gira a la izquierda y sigue las señales has

# Creacion de cadena para generar la respuesta de acuerdo con modelo RAG

In [17]:
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate

query = 'como llego al area de reclamo de equipaje b desde la puerta a12'
query_vector = embed_model.embed_query(query)

results = vectorstore.similarity_search_by_vector_with_score(query_vector, k=1)

template = """You are an airport assistant chatbot. You have access to the following information:

{text}

Based on this information, provide the correct instructions and in a kind way acording to the prompt:
{question}
"""
prompt = PromptTemplate(template=template, input_variables=["text", "question"])

chain = LLMChain(
    llm=llm,
    prompt=prompt
)

context = " ".join([result[0].page_content for result in results])
question = "como llego al area de reclamo de equipaje b desde la puerta a12"
response = chain.run({"text": context, "question": question})

print(response)



"Welcome! To get to the baggage claim area from gate A12, please follow these steps:

1. Leave gate A12 and turn right.
2. Continue straight down the main passageway for 200 meters.
3. Turn left when you see the sign indicating baggage claim.
4. Follow the signs until you reach the baggage claim area B.

I hope this helps! Let me know if you have any questions or need further assistance."
