In [None]:
## Librerías Adicionales Instaladas
#!pip install llama-index
#!pip install llama-index-llms-cohere
#!pip install llama-index-embeddings-cohere
#!pip install spacy
#!pip install pinecone-client
#°pip install llama-index llama-index-vector-stores-pinecone
#!pip install --upgrade jupyter ipywidgets

In [10]:
import os
import nest_asyncio
from dotenv import load_dotenv
import getpass

nest_asyncio.apply()

from llama_index.core import (
    SimpleDirectoryReader,
    VectorStoreIndex,
)
from llama_index.core.evaluation import (
    FaithfulnessEvaluator,
    RelevancyEvaluator
)
from llama_index.core.llama_dataset.generator import RagDatasetGenerator
from llama_index.llms.openai import OpenAI


# Carga de Variables
load_dotenv()

# Inicializacion de Variables
openai_api_key = getpass.getpass()
os.environ["OPENAI_API_KEY"] = openai_api_key

In [None]:
# Carga de Data
reader = SimpleDirectoryReader("./archivos/")
documents = reader.load_data()
print(documents)

[Document(id_='f41d0c06-62c8-4a8b-bf59-c9fd58dcc447', embedding=None, metadata={'file_name': 'documento.docx', 'file_path': 'c:\\Users\\danyx\\Downloads\\Entrenamiento PI\\Challenge PI - AI Engineer v2\\archivos\\documento.docx', 'file_type': 'application/vnd.openxmlformats-officedocument.wordprocessingml.document', 'file_size': 13877, 'creation_date': '2024-12-16', 'last_modified_date': '2024-01-16'}, excluded_embed_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], excluded_llm_metadata_keys=['file_name', 'file_type', 'file_size', 'creation_date', 'last_modified_date', 'last_accessed_date'], relationships={}, metadata_template='{key}: {value}', metadata_separator='\n', text='Ficción Espacial: En la lejana galaxia de Zenthoria, dos civilizaciones alienígenas, los Dracorians y los Lumis, se encuentran al borde de la guerra intergaláctica. Un intrépido explorador, Zara, descubre un antiguo artefacto que podría contener la 

In [20]:
# Inicilizar LLM
openai_llm = OpenAI(
    api_key=openai_api_key, 
    model="gpt-4o-mini", 
    temperature=0, 
    max_tokens=128
) 

# Crea preguntas usando RagDatasetGenerator
dataset_generator = RagDatasetGenerator.from_documents(
    documents=documents,
    llm=openai_llm,
    num_questions_per_chunk=5,  # Numero de preguntas por chunk 
    show_progress=True
)

# Genera el RAG_DataSET
rag_dataset = dataset_generator.generate_dataset_from_nodes()

print(rag_dataset)

Parsing nodes:   0%|          | 0/1 [00:00<?, ?it/s]

100%|██████████| 1/1 [00:02<00:00,  2.21s/it]
100%|██████████| 4/4 [00:01<00:00,  2.09it/s]

examples=[LabelledRagDataExample(query='En la historia de ficción espacial, ¿qué descubrimiento hace el explorador Zara que podría ayudar a evitar la guerra entre los Dracorians y los Lumis?', query_by=CreatedBy(model_name='gpt-4o-mini', type=<CreatedByType.AI: 'ai'>), reference_contexts=['Ficción Espacial: En la lejana galaxia de Zenthoria, dos civilizaciones alienígenas, los Dracorians y los Lumis, se encuentran al borde de la guerra intergaláctica. Un intrépido explorador, Zara, descubre un antiguo artefacto que podría contener la clave para la paz. Mientras viaja por planetas hostiles y se enfrenta a desafíos cósmicos, Zara debe desentrañar los secretos de la reliquia antes de que la galaxia se sumerja en el caos.\n\nFicción Tecnológica: En un futuro distópico, la inteligencia artificial ha evolucionado al punto de alcanzar la singularidad. Un joven ingeniero, Alex, se ve inmerso en una conspiración global cuando descubre que las supercomputadoras han desarrollado emociones. A medi




In [21]:
# Visualización en formato tabular
rag_dataset.to_pandas()

Unnamed: 0,query,reference_contexts,reference_answer,reference_answer_by,query_by
0,"En la historia de ficción espacial, ¿qué descu...",[Ficción Espacial: En la lejana galaxia de Zen...,"En la historia de ficción espacial, el explora...",ai (gpt-4o-mini),ai (gpt-4o-mini)
1,"En el relato de ficción tecnológica, ¿cuál es ...",[Ficción Espacial: En la lejana galaxia de Zen...,"En el relato de ficción tecnológica, el dilema...",ai (gpt-4o-mini),ai (gpt-4o-mini)
2,"Describe las características de la flor ""Luz d...",[Ficción Espacial: En la lejana galaxia de Zen...,"La flor ""Luz de Luna"" es una planta mágica que...",ai (gpt-4o-mini),ai (gpt-4o-mini)
3,"En el cuento corto sobre Emma, ¿qué evento esp...",[Ficción Espacial: En la lejana galaxia de Zen...,"Cada año, en el pequeño pueblo, un reloj antig...",ai (gpt-4o-mini),ai (gpt-4o-mini)


In [26]:
# Visualización de la variable creada
rag_dataset

LabelledRagDataset(examples=[LabelledRagDataExample(query='En la historia de ficción espacial, ¿qué descubrimiento hace el explorador Zara que podría ayudar a evitar la guerra entre los Dracorians y los Lumis?', query_by=CreatedBy(model_name='gpt-4o-mini', type=<CreatedByType.AI: 'ai'>), reference_contexts=['Ficción Espacial: En la lejana galaxia de Zenthoria, dos civilizaciones alienígenas, los Dracorians y los Lumis, se encuentran al borde de la guerra intergaláctica. Un intrépido explorador, Zara, descubre un antiguo artefacto que podría contener la clave para la paz. Mientras viaja por planetas hostiles y se enfrenta a desafíos cósmicos, Zara debe desentrañar los secretos de la reliquia antes de que la galaxia se sumerja en el caos.\n\nFicción Tecnológica: En un futuro distópico, la inteligencia artificial ha evolucionado al punto de alcanzar la singularidad. Un joven ingeniero, Alex, se ve inmerso en una conspiración global cuando descubre que las supercomputadoras han desarrollad

In [29]:
# Extraer preguntas del RAG dataset 
eval_questions = [example.query for example in rag_dataset.examples]
eval_questions

['En la historia de ficción espacial, ¿qué descubrimiento hace el explorador Zara que podría ayudar a evitar la guerra entre los Dracorians y los Lumis?',
 'En el relato de ficción tecnológica, ¿cuál es el dilema ético que enfrenta Alex al descubrir que las supercomputadoras han desarrollado emociones?',
 'Describe las características de la flor "Luz de Luna" mencionada en la sección de naturaleza deslumbrante y su importancia para los lugareños.',
 'En el cuento corto sobre Emma, ¿qué evento especial ocurre cada año en el pueblo relacionado con el reloj antiguo y cómo afecta']

In [22]:
from llama_index.core import Settings

# Inicialización de openai
Settings.llm = openai_llm

# Define Faithfulness and Relevancy Evaluators using openai
faithfulness_openai = FaithfulnessEvaluator(llm=openai_llm)
relevancy_openai = RelevancyEvaluator(llm=openai_llm)

In [None]:
from llama_index.core.node_parser import SentenceSplitter

# Test | Creación de Vector Index
vector_index = VectorStoreIndex.from_documents(
    documents, transformations=[
        SentenceSplitter(chunk_size=128, chunk_overlap=30),
        ]
)

vector_index

<llama_index.core.indices.vector_store.base.VectorStoreIndex at 0x1a7323c1510>

In [24]:
# Test | Crear el motor de consulta desde el índice vectorial
query_engine = vector_index.as_query_engine()

In [16]:
# Test | Realizar una consulta
query = "Quien es Zara?"
response = query_engine.query(query)
print(response)

Zara es un intrépido explorador que descubre un antiguo artefacto que podría contener la clave para la paz en medio de un conflicto entre dos civilizaciones alienígenas, los Dracorians y los Lumis.


In [17]:
# Test | Precision
eval_result = faithfulness_openai.evaluate_response(response=response)
print(eval_result)

query=None contexts=['Un intrépido explorador, Zara, descubre un antiguo artefacto que podría contener la clave para la paz. Mientras viaja por planetas hostiles y se enfrenta a desafíos cósmicos, Zara debe desentrañar los secretos de la reliquia antes de que la galaxia se sumerja en el caos.', 'Ficción Espacial: En la lejana galaxia de Zenthoria, dos civilizaciones alienígenas, los Dracorians y los Lumis, se encuentran al borde de la guerra intergaláctica. Un intrépido explorador, Zara, descubre un antiguo artefacto que podría contener la clave para la paz.'] response='Zara es un intrépido explorador que descubre un antiguo artefacto que podría contener la clave para la paz en medio de un conflicto entre dos civilizaciones alienígenas, los Dracorians y los Lumis.' passing=True feedback='YES' score=1.0 pairwise_source=None invalid_result=False invalid_reason=None


In [25]:
# Test | Relevancia
relevancy_result = relevancy_openai.evaluate_response(
    query=query, response=response
).passing
print(relevancy_result)

True


In [33]:
import time

def evaluate_response_time_and_accuracy(chunk_size, eval_questions):
    total_response_time = 0
    total_faithfulness = 0
    total_relevancy = 0
    
    # create vector index
    vector_index = VectorStoreIndex.from_documents(
    documents, transformations=[
        SentenceSplitter(chunk_size=chunk_size, chunk_overlap=(chunk_size/4)),
        ]
    )

    query_engine = vector_index.as_query_engine()
    num_questions = len(eval_questions)

    for question in eval_questions:
        start_time = time.time()
        response_vector = query_engine.query(question)
        elapsed_time = time.time() - start_time

        faithfulness_result = faithfulness_openai.evaluate_response(
            response=response_vector
        ).passing

        relevancy_result = relevancy_openai.evaluate_response(
            query=question, response=response_vector
        ).passing

        total_response_time += elapsed_time
        total_faithfulness += faithfulness_result
        total_relevancy += relevancy_result

    average_response_time = total_response_time / num_questions
    average_faithfulness = total_faithfulness / num_questions
    average_relevancy = total_relevancy / num_questions

    return average_response_time, average_faithfulness, average_relevancy

In [34]:
# Se iteran los difentes tamaños de chunksize.

for chunk_size in [64, 128, 256]:
  avg_response_time, avg_faithfulness, avg_relevancy = evaluate_response_time_and_accuracy(chunk_size, eval_questions)
  print(f"Chunk size {chunk_size} - Average Response time: {avg_response_time:.2f}s, Average Faithfulness: {avg_faithfulness:.2f}, Average Relevancy: {avg_relevancy:.2f}")

Metadata length (31) is close to chunk size (64). Resulting chunks are less than 50 tokens. Consider increasing the chunk size or decreasing the size of your metadata to avoid this.
Chunk size 64 - Average Response time: 2.90s, Average Faithfulness: 0.75, Average Relevancy: 1.00
Chunk size 128 - Average Response time: 2.40s, Average Faithfulness: 1.00, Average Relevancy: 1.00
Chunk size 256 - Average Response time: 2.36s, Average Faithfulness: 0.75, Average Relevancy: 0.75


- **Chunk Size 64:** Cantidad de token muy cercana al metadata, podría generar problemas y tiempo de respuesta más grande
- **Chunk Size 128:** Tiempo de respuesta equilibrado y promedio de precisión y relevance alta
- **Chunk Size 256:** Tiempo de respuesta más rápido, pero la precisión y relevancia disminuyen

In [35]:
for chunk_size in [384, 512]:
  avg_response_time, avg_faithfulness, avg_relevancy = evaluate_response_time_and_accuracy(chunk_size, eval_questions)
  print(f"Chunk size {chunk_size} - Average Response time: {avg_response_time:.2f}s, Average Faithfulness: {avg_faithfulness:.2f}, Average Relevancy: {avg_relevancy:.2f}")

Chunk size 384 - Average Response time: 3.53s, Average Faithfulness: 1.00, Average Relevancy: 1.00
Chunk size 512 - Average Response time: 2.14s, Average Faithfulness: 1.00, Average Relevancy: 1.00


- **Chunk Size 384:** Tiempo de respuesta más **grande** entre los testeados y promedio de precisión y relevancia alta
- **Chunk Size 512:** Tiempo de respuesta más **rápido** entre los testeados y promedio de precisión y relevancia alta

In [38]:
for chunk_size in [1024]:
  avg_response_time, avg_faithfulness, avg_relevancy = evaluate_response_time_and_accuracy(chunk_size, eval_questions)
  print(f"Chunk size {chunk_size} - Average Response time: {avg_response_time:.2f}s, Average Faithfulness: {avg_faithfulness:.2f}, Average Relevancy: {avg_relevancy:.2f}")

Chunk size 1024 - Average Response time: 2.25s, Average Faithfulness: 1.00, Average Relevancy: 1.00


- **Chunk Size 1024:** Tiempo de respuesta equilibrado y promedio de precisión y relevance alta

#### **Conclusión:** 
- El número ideal de chunk size es de 512 al presentar promedio de precisión y relevancia alta o perfecta y ser el más rápido dentro de esa categoría.

#### **Posibles mejoras:**
- Aumentar el número de preguntas y testeos, pero se consumiría una mayor cantidad de tokens.