# Basic RAG Implementation

## Objective:
Implement a **RAG (Retrieval-Augmented Generation)** application that retrieves relevant documents from a static dataset and generates a response based on those documents.

## Task Description:
We need to answer some questions using a collection of documents. You'll build a **RAG application** to achieve this. Below are the steps:



¿Cuál es la misión principal de HistoriaCard?
¿Qué productos financieros ofrece HistoriaCard actualmente?
¿Cuáles son las características principales de la tarjeta de crédito HistoriaCard?
¿Cómo funciona el programa de recompensas de HistoriaCard?
¿Qué medidas de seguridad implementa HistoriaCard en su aplicación?
¿Cómo contribuye HistoriaCard a la educación financiera de sus usuarios?
¿Qué impacto social busca tener HistoriaCard en México?
¿Cuáles son los planes de expansión futuros de HistoriaCard?
¿Cómo utiliza HistoriaCard la inteligencia artificial en sus servicios?
¿Qué alianzas estratégicas ha establecido HistoriaCard?

In [75]:
import os
import json
import re
import nltk
from nltk.corpus import stopwords
from nltk.stem import SnowballStemmer
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
from langchain.prompts import PromptTemplate
import pandas as pd
from nltk import word_tokenize
pd.set_option('display.max_colwidth', None)

def get_documents_from_structure(file_path):
    with open(file_path, 'r', encoding='utf-8') as file:
        data = json.load(file)
    
    documents = []
    
    if "StructuredDocument" in data and "sections" in data["StructuredDocument"]:
        for section in data["StructuredDocument"]["sections"]:
            title = section.get("title", "")
            key_points = section.get("key_points", [])
            
            document = f"{title}: " + " ".join(key_points)
            documents.append(document)
    
    return documents

def calculate_precision_recall(keywords, response):
    keywords_set = set(keywords.lower().split(", "))
    response_set = set(word_tokenize(response.lower()))
    true_positives = keywords_set.intersection(response_set)
    precision = len(true_positives) / len(response_set) if len(response_set) > 0 else 0
    recall = len(true_positives) / len(keywords_set) if len(keywords_set) > 0 else 0
    return precision, recall

def calculate_cosine_similarity(response, expected):
    vectorizer = TfidfVectorizer().fit_transform([response, expected])
    vectors = vectorizer.toarray()
    cosine_sim = cosine_similarity([vectors[0]], [vectors[1]])[0][0]
    return cosine_sim

def exact_match(response, expected):
    return int(response.strip() == expected.strip())

def retrieve_embeddings_documents_df(collection, query, model, n_results=3):
    query_embedding = model.encode([query])
    results = collection.query(query_embeddings=query_embedding, n_results=n_results)
    documents = results['documents'][0]
    distances = results['distances'][0]
    df = pd.DataFrame({
        'Query': [query] * len(documents),
        'Document': documents,
        'Similarity Score': distances
    })
    return df.sort_values('Similarity Score', ascending=True).reset_index(drop=True)

def retrieve_tfidf_documents_df(
    data, query, document_vectors, vectorizer, pipeline, top_k=2
):
    query_cleaned = pipeline.transform(query)
    query_vector = vectorizer.transform([query_cleaned])
    similarity_scores = cosine_similarity(query_vector, document_vectors).flatten()

    top_indices = similarity_scores.argsort()[-top_k:][::-1]
    result = [(data[i], similarity_scores[i]) for i in top_indices]

    df = pd.DataFrame(result, columns=["Document", "Similarity Score"])
    return df

class TextPreprocessingPipeline:
    def __init__(self, language='spanish'):
        self.language = language
        self.stemmer = SnowballStemmer(language)
        self.stopwords = set(stopwords.words(language))
    
    def clean_text(self, text):
        text = text.lower()
        text = re.sub(r'[^a-záéíóúñü\s]', '', text)
        text = re.sub(r'\s+', ' ', text).strip()
        return text
    
    def remove_stopwords(self, text):
        words = text.split()
        words = [word for word in words if word not in self.stopwords]
        return ' '.join(words)
    
    def stem_text(self, text):
        words = text.split()
        stemmed_words = [self.stemmer.stem(word) for word in words]
        return ' '.join(stemmed_words)
    
    def transform(self, text):
        text = self.clean_text(text)
        text = self.remove_stopwords(text)
        text = self.stem_text(text)
        return text

def generate_prompt_from_df(df: pd.DataFrame, question: str) -> str:
    items = df['Document'].tolist()
    prompt_template = PromptTemplate(
        input_variables=["question", "items"],
        template="""
            Pregunta: {question}
            Contexto: {items}

            Instrucciones:
            1. Responde directamente a la pregunta basándote SOLO en el contexto proporcionado.
            2. Si el contexto no contiene información suficiente, unicamente contesta: "No puedo responder completamente a esta pregunta." nada mas.
            3. No inventes información ni hagas suposiciones más allá del contexto dado.
            4. Mantén un tono profesional y objetivo.

            Ejemplo:
            Pregunta: ¿Cuál es la tasa de interés de la tarjeta de crédito HistoriaCard?
            Contexto: ["La tarjeta de crédito HistoriaCard ofrece una tasa de interés anual del 24% al 36%, ajustada según el perfil crediticio del usuario.", "HistoriaCard proporciona herramientas financieras innovadoras y educativas."]
            Respuesta: En HistoriaCard ofrecemos una tasa de interés anual que va del 24% al 36%.
        """
    )
    return prompt_template.format(question=question, items="\n\n".join(items))

class PDFReader:
    def __init__(self, folder_path):
        self.folder_path = folder_path
    
    def read_pdfs(self, by_paragraph=False):
        all_texts = []
        for filename in os.listdir(self.folder_path):
            if filename.endswith(".pdf"):
                file_path = os.path.join(self.folder_path, filename)
                with open(file_path, "rb") as file:
                    reader = PyPDF2.PdfReader(file)
                    for page_num in range(len(reader.pages)):
                        page = reader.pages[page_num]
                        text = page.extract_text()
                        if text:
                            if by_paragraph:
                                paragraphs = text.split(".")
                                for paragraph in paragraphs:
                                    cleaned_paragraph = paragraph.strip()
                                    if cleaned_paragraph:
                                        all_texts.append(cleaned_paragraph + ".")
                            else:
                                all_texts.append(text.strip())
                        else:
                            all_texts.append("")
        return all_texts

file_path = "/Users/oscararmas/Desktop/StoriChallenge/documents/combined_document.json"
pdf_texts_dict = get_documents_from_structure(file_path)
QUERY_QUESTION = "¿Qué estrategias futuras tiene HistoriaCard para expandir su base de usuarios?"

In [76]:
pdf_texts_dict

['Introducción a HistoriaCard: HistoriaCard es una fintech mexicana fundada en 2018 Ofrece soluciones innovadoras y accesibles para consumidores mexicanos Enfoque en educación financiera, mejora del historial crediticio y manejo responsable de finanzas personales Visión y misión: transformar la vida financiera de sus clientes Construcción de un camino hacia la inclusión financiera y educación en México',
 'Préstamos Personales HistoriaCard: Montos de préstamo: Desde $10,000 hasta $100,000 MXN Plazos de pago: De 6 a 36 meses, con opción de pago anticipado sin penalización Tasa de interés competitiva basada en el perfil crediticio Sin comisiones por apertura, pequeñas comisiones por retraso Beneficios adicionales: Asesoría financiera personalizada y herramientas de planificación en la app',
 'Programa de Recompensas HistoriaCard: Canjeo de puntos por efectivo Descuentos en compras en comercios afiliados Canje de puntos por vuelos y hoteles Acceso a experiencias únicas con puntos',
 'Test

 ### 1. Data Preparation and Basic Retrieval (0.5 hours)
- **Start** with a small dataset of text documents (this will be provided).
- **Index** the documents using **TF-IDF** or **BM25** (sparse retrieval).
- **Implement** a basic function that takes a query and returns the **top-k relevant documents** from the dataset using **cosine similarity**.


In [77]:
# Number of documents:
len(pdf_texts_dict)

25

In [78]:
nltk.download('stopwords')
pipeline = TextPreprocessingPipeline(language='spanish')

# Clean the docs
documents_cleaned = [pipeline.transform(doc) for doc in pdf_texts_dict]

# Step 1: Indexing the documents using TF-IDF
vectorizer = TfidfVectorizer()
document_vectors = vectorizer.fit_transform(documents_cleaned)



[nltk_data] Downloading package stopwords to
[nltk_data]     /Users/oscararmas/nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


Ejemplo de consulta y recuperación de los documentos más relevantes:

In [79]:
top_k_documents_df = retrieve_tfidf_documents_df(pdf_texts_dict, QUERY_QUESTION, document_vectors, vectorizer, pipeline, top_k=3)



In [80]:
top_k_documents_df

Unnamed: 0,Document,Similarity Score
0,Proyecciones Futuras y Expansión: Planes de expansión nacional e internacional Desarrollo de nuevos productos financieros Estrategias para aumentar la base de usuarios Inversión en marketing digital y colaboraciones estratégicas,0.364781
1,Producto Futuro: Préstamos Personales HistoriaCard: Planificado para financiar proyectos importantes Diseñado para consolidar deudas o enfrentar emergencias imprevistas Enfoque en continuar mejorando el historial crediticio de los usuarios Características anticipadas (pendientes de detallar),0.156621
2,Soporte al Cliente HistoriaCard: Chat en vivo 24/7 Centro de ayuda con base de conocimientos Sistema de tickets para problemas complejos Llamadas de emergencia para situaciones urgentes,0.131637


### 2. Generation Mechanism (0.5 hours)
- **Use** a pre-trained language model (e.g., OpenAI models) to **generate responses** based on the retrieved documents.
- **Combine** the retrieved documents into a single input for the language model.


In [81]:
import google.generativeai as genai
import os

genai.configure(api_key="AIzaSyC4_NC-2eGpg7URKQQqGVQ4mGjZlimhQIQ")

In [82]:
model_geminis = genai.GenerativeModel("gemini-1.5-flash")

prompt = generate_prompt_from_df(top_k_documents_df, QUERY_QUESTION)

response = model_geminis.generate_content(prompt)
print(response.text)

No puedo responder completamente a esta pregunta. 



### 3. Enhanced Retrieval (0.5 hours)
- **Upgrade** the retrieval method to a more advanced technique, such as **dense retrieval** using **BERT embeddings** or similar.
- **Implement** a more efficient indexing method suitable for larger datasets, like **FAISS**, **Chroma**, or **Qdrant**.


In [87]:
from sentence_transformers import SentenceTransformer
import chromadb
from chromadb.utils import embedding_functions

model = SentenceTransformer('sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2')
paragraphs = pdf_texts_dict

embeddings = model.encode(paragraphs)

client = chromadb.PersistentClient()
collection = client.get_or_create_collection("document_embeddings_v3")

for i, (paragraph, embedding) in enumerate(zip(paragraphs, embeddings)):
    collection.add(
        documents=[paragraph],
        metadatas=[{"id": i}],
        ids=[str(i)],
        embeddings=[embedding.tolist()]
    )

print("Embeddings generados y almacenados en ChromaDB con éxito.")



Embeddings generados y almacenados en ChromaDB con éxito.


In [None]:
query_embedding = model.encode([QUERY_QUESTION])

results = collection.query(
    query_embeddings=query_embedding,
    n_results=3
)
for result in results['documents']:
    print(f"Documento similar: {result}")

In [12]:
df = retrieve_embeddings_documents_df(collection, QUERY_QUESTION, model)
df

Unnamed: 0,Query,Document,Similarity Score
0,¿Cómo utiliza HistoriaCard la inteligencia artificial en sus servicios?,Visión General de la App HistoriaCard: Interfaz intuitiva y completa para la gestión de finanzas Variedad de herramientas y recursos para control financiero,11.73594
1,¿Cómo utiliza HistoriaCard la inteligencia artificial en sus servicios?,Producto Futuro: Préstamos Personales HistoriaCard: Planificado para financiar proyectos importantes Diseñado para consolidar deudas o enfrentar emergencias imprevistas Enfoque en continuar mejorando el historial crediticio de los usuarios Características anticipadas (pendientes de detallar),12.394851
2,¿Cómo utiliza HistoriaCard la inteligencia artificial en sus servicios?,Seguridad y Tecnología en HistoriaCard: Cifrado de extremo a extremo Autenticación biométrica Sistemas de detección de fraudes con IA Alertas de seguridad en tiempo real Actualizaciones constantes de seguridad,12.767162


In [13]:
questions = [
    "¿Cuál es la misión principal de HistoriaCard?",
    "¿Qué productos financieros ofrece HistoriaCard actualmente?",
    "¿Cuáles son las características principales de la tarjeta de crédito HistoriaCard?",
    "¿Cómo funciona el programa de recompensas de HistoriaCard?",
    "¿Qué medidas de seguridad implementa HistoriaCard en su aplicación?",
    "¿Cómo contribuye HistoriaCard a la educación financiera de sus usuarios?",
    "¿Qué impacto social busca tener HistoriaCard en México?",
    "¿Cuáles son los planes de expansión futuros de HistoriaCard?",
    "¿Cómo utiliza HistoriaCard la inteligencia artificial en sus servicios?",
    "¿Qué alianzas estratégicas ha establecido HistoriaCard?"
]

In [14]:
for question in [
        "¿Cuál es la misión principal de HistoriaCard?", 
    ]:
    embeddings_retrieve = retrieve_embeddings_documents_df(collection, question, model)
    tfidf_retrieve = retrieve_tfidf_documents_df(pdf_texts_dict, QUERY_QUESTION, document_vectors, vectorizer, pipeline, top_k=3)

    prompt_tfidf = generate_prompt_from_df(tfidf_retrieve, question)
    prompt_embb = generate_prompt_from_df(embeddings_retrieve, question)
    response_tf_idf = model_geminis.generate_content(prompt_tfidf)
    response_emb = model_geminis.generate_content(prompt_embb)
print(f"Q: {question} | EMB: {response_emb.text} | TF-IDF: {response_tf_idf.text}")

Q: ¿Cuál es la misión principal de HistoriaCard? | EMB: La misión principal de HistoriaCard es **proporcionar herramientas financieras innovadoras y educativas** para empoderar a los usuarios a mejorar su historial crediticio y tomar decisiones financieras informadas. 
 | TF-IDF: Transformar la vida financiera de sus clientes y construir un camino hacia la inclusión financiera y educación en México. 



In [None]:
import pandas as pd
import time

questions_list = [
        "¿En qué año fue fundada HistoriaCard?",
        "¿Cuál es el monto mínimo y máximo de los préstamos personales de HistoriaCard?",
        "¿Qué porcentaje de interés anual ofrece la tarjeta de débito HistoriaCard sobre el saldo promedio mensual?",
        "¿Qué idiomas están disponibles en las opciones de la app HistoriaCard?",
        "¿Qué sistemas de seguridad utiliza HistoriaCard para proteger a sus usuarios?",
        "¿Cuál es la tasa de interés anual de la tarjeta de crédito HistoriaCard?",
        "¿Qué beneficios adicionales ofrece la tarjeta de crédito HistoriaCard?",
        "¿Qué tipo de soporte al cliente ofrece HistoriaCard?",
        "¿Qué tecnologías utiliza HistoriaCard para análisis de crédito personalizado?",
        "¿Cuáles son las opciones de pago de la tarjeta de crédito HistoriaCard?",
        "¿Cómo contribuye HistoriaCard a la inclusión financiera en México?",
        "¿De qué manera HistoriaCard utiliza la tecnología para mejorar la seguridad y la experiencia del usuario?",
        "Describe cómo el programa de recompensas de HistoriaCard beneficia a los usuarios.",
        "¿Qué estrategias futuras tiene HistoriaCard para expandir su base de usuarios?",
        "¿Cómo facilita HistoriaCard la gestión personalizada de finanzas para sus usuarios?",
        "Explica cómo los testimonios de clientes reflejan el impacto de HistoriaCard en la vida de sus usuarios.",
        "¿De qué manera HistoriaCard promueve la educación financiera entre sus usuarios?",
        "¿Cómo está planeando HistoriaCard integrar tecnologías futuras como DeFi en sus servicios?",
        "Describe las características y beneficios de la tarjeta de débito HistoriaCard.",
        "¿En qué consiste el compromiso de HistoriaCard con el cumplimiento normativo y la ética empresarial?",
        "¿Quién es el CEO actual de HistoriaCard?",
        "¿Cuál es el número total de empleados de HistoriaCard en 2021?",
        "¿Cuál fue el ingreso neto de HistoriaCard en el último trimestre?",
        "¿Dónde se encuentra la sede central de HistoriaCard?",
        "¿Quiénes son los inversores principales de HistoriaCard?",
        "¿Cuál es el porcentaje de mercado que posee HistoriaCard en México?",
        "¿Cuáles son los competidores directos de HistoriaCard?",
        "¿Cuál es la valoración actual de mercado de HistoriaCard?",
        "¿Cuántos usuarios activos tiene HistoriaCard actualmente?",
        "¿Qué programas de responsabilidad social corporativa tiene HistoriaCard relacionados con la salud?"
    ]

results_df = pd.DataFrame(columns=["Question", "response_embeddings", "response_tf_idf"])

for question in questions:
    embeddings_retrieve = retrieve_embeddings_documents_df(collection, question, model)
    tfidf_retrieve = retrieve_tfidf_documents_df(pdf_texts_dict, question, document_vectors, vectorizer, pipeline, top_k=3)
    
    prompt_tfidf = generate_prompt_from_df(tfidf_retrieve, question)
    prompt_emb = generate_prompt_from_df(embeddings_retrieve, question)
    
    response_tf_idf = model_geminis.generate_content(prompt_tfidf).text
    response_emb = model_geminis.generate_content(prompt_emb).text
    
    new_row = pd.DataFrame({
        "question": [question],
        "response_embeddings": [response_emb],
        "response_tf_idf": [response_tf_idf]
    })
    
    results_df = pd.concat([results_df, new_row], ignore_index=True)
    time.sleep(10)

results_df.to_csv("historiacard_responses.csv", index=False)


# Evaluation

In [121]:
data = {
    "question": questions_list,
    "expected_keywords": [
        "2018, fundada en 2018",
        "$10,000, $100,000 MXN",
        "4%, interés anual, saldo promedio",
        "español, inglés",
        "cifrado de extremo a extremo, autenticación biométrica, detección de fraudes con IA",
        "24%, 36%, tasa de interés anual",
        "programa de recompensas, seguro de protección de compras, promociones exclusivas, asistencia en viajes",
        "chat en vivo 24/7, centro de ayuda, sistema de tickets, llamadas de emergencia",
        "inteligencia artificial, IA",
        "pago mínimo, 5% del saldo, $200 MXN",
        "educación financiera, productos accesibles, programas en la comunidad, alianzas con ONGs",
        "IA, detección de fraudes, blockchain, autenticación biométrica, actualizaciones de seguridad",
        "canjeo de puntos, efectivo, descuentos, vuelos, hoteles, experiencias únicas",
        "expansión nacional e internacional, nuevos productos financieros, marketing digital, colaboraciones estratégicas",
        "interfaz intuitiva, herramientas de planificación, panel de control, personalización de notificaciones",
        "Ana Martínez, manejo responsable del crédito, Juan Carlos Hernández, reconstrucción de historial crediticio",
        "artículos, guías, calculadoras financieras, cursos en línea, asesoría personalizada",
        "investigación, integración de finanzas descentralizadas, DeFi, innovación continua",
        "emisión gratuita, sin comisiones, retiros gratuitos, transferencias SPEI, 4% de interés, alertas instantáneas",
        "regulaciones financieras, protección al consumidor, políticas AML/KYC, código de ética",
        "N/A",
        "N/A",
        "N/A",
        "N/A",
        "N/A",
        "N/A",
        "N/A",
        "N/A",
        "N/A",
        "N/A"
    ],
    "type": [
        "simple", "simple", "simple", "simple", "simple", "simple", "simple", "simple", "simple", "simple",
        "complex", "complex", "complex", "complex", "complex", "complex", "complex", "complex", "complex", "complex",
        "unanswerable", "unanswerable", "unanswerable", "unanswerable", "unanswerable", "unanswerable", "unanswerable", "unanswerable", "unanswerable", "unanswerable"
    ],
    "response_expected": [
        "HistoriaCard fue fundada en 2018.",
        "Los préstamos personales van desde $10,000 hasta $100,000 MXN.",
        "La tarjeta de débito HistoriaCard ofrece hasta un 4% de interés anual sobre el saldo promedio mensual.",
        "La app HistoriaCard está disponible en español e inglés.",
        "HistoriaCard utiliza cifrado de extremo a extremo, autenticación biométrica y sistemas de detección de fraudes con IA para proteger a sus usuarios.",
        "La tasa de interés anual de la tarjeta de crédito HistoriaCard es del 24% al 36%.",
        "La tarjeta de crédito HistoriaCard ofrece beneficios como programa de recompensas, seguro de protección de compras, promociones exclusivas y asistencia en viajes.",
        "HistoriaCard ofrece chat en vivo 24/7, centro de ayuda, sistema de tickets y llamadas de emergencia.",
        "HistoriaCard utiliza inteligencia artificial para análisis de crédito personalizado.",
        "El pago mínimo mensual de la tarjeta de crédito HistoriaCard es el 5% del saldo o $200 MXN.",
        "HistoriaCard contribuye a la inclusión financiera en México proporcionando educación financiera, ofreciendo productos accesibles y colaborando con ONGs para ayudar a comunidades vulnerables.",
        "HistoriaCard utiliza IA para detección de fraudes, explora blockchain para mayor seguridad, implementa autenticación biométrica y realiza actualizaciones constantes de seguridad para mejorar la experiencia del usuario.",
        "El programa de recompensas permite canjear puntos por efectivo, descuentos, vuelos, hoteles y experiencias únicas, beneficiando a los usuarios por el uso de la tarjeta.",
        "HistoriaCard planea expandirse nacional e internacionalmente, desarrollar nuevos productos financieros, invertir en marketing digital y establecer colaboraciones estratégicas.",
        "Ofrece una interfaz intuitiva con herramientas de planificación, un panel de control y notificaciones personalizadas para facilitar la gestión financiera.",
        "Los testimonios de Ana Martínez y Juan Carlos Hernández muestran cómo HistoriaCard ha mejorado el manejo del crédito y el historial crediticio de sus usuarios.",
        "Promueve la educación financiera mediante artículos, guías, calculadoras, cursos en línea y asesoría personalizada.",
        "Está investigando la integración de DeFi como parte de su compromiso con la innovación continua para mejorar sus servicios.",
        "La tarjeta se emite gratis, sin comisiones, ofrece retiros y transferencias SPEI gratuitas, hasta 4% de interés y alertas instantáneas.",
        "Cumple con regulaciones financieras, protege al consumidor, implementa políticas AML/KYC y sigue un código de ética empresarial.",
        "El texto no proporciona información sobre el CEO actual de HistoriaCard.",
        "No se indica el número total de empleados de HistoriaCard en 2021.",
        "No se menciona en el texto el ingreso neto de HistoriaCard en el último trimestre.",
        "El texto no especifica la ubicación de la sede central de HistoriaCard.",
        "No hay información en el texto sobre los inversores principales de HistoriaCard.",
        "El texto no proporciona datos sobre el porcentaje de mercado de HistoriaCard en México.",
        "No se mencionan los competidores directos de HistoriaCard en el texto.",
        "El texto no incluye información sobre la valoración actual de mercado de HistoriaCard.",
        "No se indica en el texto el número de usuarios activos de HistoriaCard.",
        "El texto no menciona programas de responsabilidad social corporativa de HistoriaCard relacionados con la salud."
    ]
}

df_evaluation = pd.DataFrame(data)


In [119]:

df = merged_df

metrics = ['precision_tf_idf', 'recall_tf_idf', 'cosine_sim_tf_idf', 'exact_match_tf_idf', 
           'precision_embeddings', 'recall_embeddings', 'cosine_sim_embeddings', 'exact_match_embeddings']

for metric in metrics:
    df[metric] = 0.0

for idx, row in df.iterrows():
    # Calcular Precision/Recall para TF-IDF y Embeddings
    df.at[idx, 'precision_tf_idf'], df.at[idx, 'recall_tf_idf'] = calculate_precision_recall(row['expected_keywords'], row['response_tf_idf'])
    df.at[idx, 'precision_embeddings'], df.at[idx, 'recall_embeddings'] = calculate_precision_recall(row['expected_keywords'], row['response_embeddings'])

    # Calcular Similitud Coseno para TF-IDF y Embeddings
    df.at[idx, 'cosine_sim_tf_idf'] = calculate_cosine_similarity(row['response_tf_idf'], row['response_expected'])
    df.at[idx, 'cosine_sim_embeddings'] = calculate_cosine_similarity(row['response_embeddings'], row['response_expected'])

    # Calcular Exact Match para TF-IDF y Embeddings
    df.at[idx, 'exact_match_tf_idf'] = exact_match(row['response_tf_idf'], row['response_expected'])
    df.at[idx, 'exact_match_embeddings'] = exact_match(row['response_embeddings'], row['response_expected'])

summary = {
    'Metric': ['Precision', 'Recall', 'Cosine Similarity', 'Exact Match'],
    'TF-IDF Avg': [
        df['precision_tf_idf'].mean(),
        df['recall_tf_idf'].mean(),
        df['cosine_sim_tf_idf'].mean(),
        df['exact_match_tf_idf'].mean()
    ],
    'Embeddings Avg': [
        df['precision_embeddings'].mean(),
        df['recall_embeddings'].mean(),
        df['cosine_sim_embeddings'].mean(),
        df['exact_match_embeddings'].mean()
    ]
}

summary_df = pd.DataFrame(summary)


In [120]:
summary_df

Unnamed: 0,Metric,TF-IDF Avg,Embeddings Avg
0,Precision,0.011081,0.02963
1,Recall,0.07,0.102222
2,Cosine Similarity,0.290452,0.298097
3,Exact Match,0.066667,0.066667


- **Precision**: La precisión mide la proporción de palabras clave esperadas que están presentes en la respuesta generada.
- **Recall**: El recall mide la proporción de palabras clave esperadas que fueron correctamente capturadas en la respuesta generada.
- **Cosine Similarity**: La similitud coseno mide qué tan semánticamente cercanas son las respuestas generadas respecto a la respuesta esperada.
- **Exact Match**: Verifica si la respuesta generada es exactamente igual a la respuesta esperada.
