# An√°lisis de los diferentes modelos

## 1. Importaci√≥n de librer√≠as y modulos

In [1]:
#%pip install -r requirements.txt

In [14]:
from datasets import Dataset
from ragas import evaluate
from ragas.metrics import faithfulness, answer_relevancy, context_precision, context_recall
from langchain_community.document_loaders.pdf import PyPDFDirectoryLoader
from langchain_community.llms import Ollama
from langchain_chroma import Chroma
import tqdm
from module import *

In [15]:
emb_model = "baai_small"
llm_model = "llama3"

## 2. Carga de datos 

In [16]:
documents_loader = PyPDFDirectoryLoader("./data/test3")
documents = documents_loader.load()

In [17]:
chunks = split_documents(documents)

## 3. Creaci√≥n de la base de datos vectorial

In [18]:
# Load the existing database.
db = Chroma(
    persist_directory="./database_testing",
    embedding_function=get_embedding_function(emb_model)
)

# Calculate Page IDs.
chunks_with_ids = calculate_chunk_ids(chunks)

# Add or Update the documents.
existing_items = db.get(include=[])  # IDs are always included by default
existing_ids = set(existing_items["ids"])
print(f"Number of existing documents in DB: {len(existing_ids)}")

# Only add documents that don't exist in the DB.
new_chunks = []
for chunk in chunks_with_ids:
    if chunk.metadata["id"] not in existing_ids:
        new_chunks.append(chunk)

if len(new_chunks):
    print(f"üëâ Adding new documents: {len(new_chunks)}")
    with tqdm.tqdm(total=len(new_chunks)) as pbar:
        for chunk in new_chunks:
            db.add_documents([chunk], ids=[chunk.metadata["id"]])
            pbar.update(1)
    print("Documents added correctly ‚úÖ")
else:
    print("‚úÖ No new documents to add")

Number of existing documents in DB: 87
‚úÖ No new documents to add


## 4. Preguntas de inter√©s

Formulamos las preguntas y buscamos en la base de datos los chunks que nos ofrezcan mejor contexto para responderlas.

In [19]:
questions_docs_cat = [
    "Quins s√≥n els principals medicaments que poden desencadenar o exacerbar la insufici√®ncia card√≠aca segons l'article?",
    "Quins mecanismes estan implicats en la toxicitat miocard√≠aca indu√Øda per certs f√†rmacs?",
    "Com es categoritzen els medicaments segons el risc de provocar insufici√®ncia card√≠aca en pacients amb aquesta patologia?",
    "Com actuen els inhibidors de l'enzim convertidor d'angiotensina (IECA) en el tractament de la insufici√®ncia card√≠aca?",
    "Per qu√® √©s important no interrompre el tractament farmacol√≤gic de la insufici√®ncia card√≠aca fins i tot si els s√≠mptomes milloren?",
    "Com es realitza el seguiment m√®dic d'un pacient amb insufici√®ncia card√≠aca en tractament farmacol√≤gic?"
]

questions_docs_en = [
    "What is the fundamental postulate of Einstein's theory of special relativity?",
    "Explain the mass-energy equivalence formula and its significance in special relativity.",
    "How does special relativity reconcile with the principle of the constancy of the speed of light in a vacuum?",
    "Explain the concept of the 'Imitation Game' (Turing Test) and its significance in evaluating machine intelligence.",
    "What role does the concept of discrete state machines play in Turing's argument about machine intelligence?",
    "Discuss the significance of the concept of 'universal machines' as introduced by Turing in the context of machine intelligence."
]

questions_docs_es = [
    "¬øQu√© papel juega la arquitectura von Neumann en la estructura funcional de un ordenador?",
    "Explica la funci√≥n de la Unidad de Control (UC) en un CPU y c√≥mo afecta el rendimiento del ordenador.",
    "¬øCu√°l es la f√≥rmula que define la ejecuci√≥n de un programa en un ordenador seg√∫n las instrucciones y datos de entrada?",
    "¬øQu√© es el algoritmo K-means y c√≥mo se utiliza en el contexto del an√°lisis de consumo energ√©tico?",
    "¬øC√≥mo se determina el n√∫mero √≥ptimo de cl√∫steres en un an√°lisis con K-means?",
    "¬øQu√© metodolog√≠a se utiliza para tratar los datos at√≠picos antes de aplicar el algoritmo K-means?"
]

questions = questions_docs_cat + questions_docs_en + questions_docs_es

In [20]:
contexts = []

for question in questions:
    # Get the top 5 most relevant documents
    results = db.similarity_search_with_score(question, k=5)

    # Make a list of the contexts
    question_contexts = []
    for doc, _score in results:
        question_contexts.append(doc.page_content)

    # Append the context sub-list to the list of contexts
    contexts.append(question_contexts)

print(contexts)

[['Si  se reunen los requisitos establecidos en la Ley 44/2007 de 13 de diciembre ( BOE 14 de diciembre ), la empresa se bonificar√° en la cuota\nempresarial a la Seguridad social en 850 euros/a√±o √≥ la parte proporcional si el contrato es a tiempo partcial, durante tres a√±os.\n      Si el contrato se suscribe con personas menores de 30 a√±os, la bonificaci√≥n ser√° de 1650 euros/a√±o durante tres a√±os (Ley 11/2013).CON BONIFICACI√ìN\n En lo no previsto en este   contrato, se estar√° a la legislaci√≥n vigente que resulte de aplicaci√≥n, y en particular , a lo disp uesto en el Estatuto\nde los Trabajadores, aprobado por el Real Decreto Legislativo 2/2015, de 23 de octubre (BOE. de 24 de octubre), y en la Ley 44/2007 ,  de 13 de\ndiciembre (BOE 14 de diciembre)y en lo dispuesto en la Secci√≥n I del Cap√≠tulo I de la ley 43/2006.  Asimismo le ser√° de aplicaci √≥n lo dispuesto', 'CL√ÅUSULAS ESPEC√çFICAS A TIEMPO PARCIAL CON VINCULACI√ìN FORMATIVA\nTIEMPO P ARCIALC√ìDIGO DE CONTRA TOMIN

Ahora creamos las respuestas esperadas para cada pregunta.

In [21]:
answers_cat = [
    "Els principals medicaments que poden desencadenar o exacerbar la insufici√®ncia card√≠aca inclouen antiinflamatoris no estero√Ødals (AINE), certs anest√®sics, antiarr√≠tmics, i alguns antidiab√®tics, entre d'altres, segons els mecanismes de toxicitat miocard√≠aca o disfunci√≥ card√≠aca.",
    "Els mecanismes implicats en la toxicitat miocard√≠aca inclouen l'estr√®s oxidatiu, la inhibici√≥ de prostaglandines, la retenci√≥ de sodi i aigua, i la depressi√≥ de la funci√≥ mioc√†rdica, entre d'altres. Aquests mecanismes poden variar segons el f√†rmac i la seva acci√≥ espec√≠fica sobre el cor.",
    "Els f√†rmacs associats amb la prolongaci√≥ de l'interval QT i el risc de torsades de pointes inclouen amiodarona, citalopram, escitalopram, metadona, sotalol, entre d'altres. Aquests medicaments poden provocar ar√≠tmies greus, especialment en pacients amb insufici√®ncia card√≠aca.",
    "Els inhibidors de l'enzim convertidor d'angiotensina (IECA) actuen dilatant els vasos sanguinis, cosa que facilita el bombeig de sang per part del cor i redueix la pressi√≥ arterial, ajudant a millorar els s√≠mptomes de la insufici√®ncia card√≠aca.",
    "√âs important no interrompre el tractament perqu√® els medicaments no nom√©s milloren els s√≠mptomes, sin√≥ que tamb√© prevenen l'empitjorament de la insufici√®ncia card√≠aca. Encara que el pacient es trobi b√©, ha de continuar amb el tractament prescrit.",
    "El seguiment m√®dic inclou la monitoritzaci√≥ de la pressi√≥ arterial, el ritme card√≠ac, el pes del pacient, i la realitzaci√≥ d'anal√≠tiques de sang per controlar els nivells de potassi, sodi, i la funci√≥ renal. Tamb√© es poden fer electrocardiogrames per avaluar la funci√≥ card√≠aca."
]

answers_en = [
    "The fundamental postulate of Einstein's theory of special relativity is that the laws of physics are the same in all inertial frames of reference, and that the speed of light in a vacuum is constant for all observers, regardless of the motion of the light source or the observer.",
    "The mass-energy equivalence formula is given by: E=mc^2, where E is the energy, m is the mass, and c is the speed of light. This formula signifies that mass and energy are interchangeable, and a small amount of mass can be converted into a large amount of energy.",
    "Special relativity reconciles with the principle of the constancy of the speed of light by postulating that the speed of light in a vacuum is the same for all observers, regardless of their motion relative to the light source. This leads to the need for a new understanding of space and time as being interwoven into a four-dimensional spacetime.",
    "The 'Imitation Game' involves a human interrogator communicating with both a human and a machine through written text, without knowing which is which. The interrogator's task is to determine which participant is the machine. If the machine can consistently convince the interrogator that it is human, it is considered to have passed the test, suggesting a form of intelligence.",
    "Discrete state machines are central to Turing's argument as they represent the basic structure of digital computers, which operate by transitioning between distinct states based on inputs. Turing argues that digital computers, as discrete state machines, can be programmed to simulate any other discrete state machine, including those that mimic human intelligence.",
    "The concept of 'universal machines' is significant because it implies that a single machine, with appropriate programming, can perform the tasks of any other machine. Turing suggests that this universality allows digital computers to potentially exhibit behaviors that we would classify as intelligent, supporting his thesis that machines can think."
]

answers_es = [
    "La arquitectura von Neumann es clave en la estructura funcional de un ordenador porque establece que tanto los datos como las instrucciones del programa se almacenan en la memoria principal, permitiendo que el ordenador ejecute programas de manera secuencial y eficiente.",
    "La Unidad de Control (UC) en un CPU es responsable de descodificar y ejecutar las instrucciones almacenadas en la memoria principal, enviando se√±ales de control a las dem√°s unidades del ordenador. La frecuencia del reloj de la UC, medida en MHz o GHz, determina en parte la velocidad de funcionamiento del ordenador, afectando su rendimiento.",
    "La f√≥rmula que define la ejecuci√≥n de un programa en un ordenador es: Datos de salida=f(Datos de entrada,Instrucciones), esta f√≥rmula indica que los datos de salida de un programa dependen tanto de los datos de entrada como de las instrucciones del programa almacenado en el ordenador.",
    "El algoritmo K-means es un m√©todo de agrupamiento no jer√°rquico que particiona un conjunto de datos en un n√∫mero espec√≠fico de grupos (cl√∫steres) bas√°ndose en las caracter√≠sticas compartidas. En el contexto del an√°lisis de consumo energ√©tico, K-means se utiliza para identificar patrones de consumo similares entre diferentes clientes, permitiendo una mejor gesti√≥n y optimizaci√≥n de recursos energ√©ticos.",
    "El n√∫mero √≥ptimo de cl√∫steres en un an√°lisis con K-means se determina mediante la evaluaci√≥n de la precisi√≥n y la calidad de los cl√∫steres utilizando medidas proporcionadas por la teor√≠a de los conjuntos aproximados (RST), as√≠ como mediante la ejecuci√≥n repetida del algoritmo con diferentes particiones iniciales.",
    "La metodolog√≠a utilizada para tratar los datos at√≠picos antes de aplicar el algoritmo K-means incluye la detecci√≥n de at√≠picos utilizando un rango de tres desviaciones est√°ndar y la imputaci√≥n de valores ausentes o at√≠picos mediante el valor medio del resto de las lecturas v√°lidas, asegurando que los datos sean representativos y minimizando la distorsi√≥n en los cl√∫steres resultantes."
]

answers = answers_cat + answers_en + answers_es
answers

['In the Arras Contract, the clause that specifies the conditions for the rescission of the contract is the third clause',
 'The worker will provide services as [job title], included in the professional group of [professional group], for the performance of [job functions] in accordance with the professional classification system in force in the company',
 'The buyer may terminate this contract, agreeing to forfeit the amounts paid as penalty deposits.',
 'En el Contrato de Arras, la cl√°usula que especifica las condiciones para la rescisi√≥n del contrato es la tercera cl√°usula',
 'El/la trabajador/a prestar√° sus servicios como [puesto], incluido en el grupo profesional de [grupo profesional], para la realizaci√≥n de las funciones de [funciones laborales] de acuerdo con el sistema de clasificaci√≥n profesional vigente en la empresa',
 'La parte compradora podr√° resolver el presente contrato, avini√©ndose a perder las cantidades que ha entregado como arras penitenciales.',
 "En el Con

Finalmente creamos el DataFrame para evaluar los modelos.

In [22]:
data_samples = {
    'question': questions,
    'answer': answers,
    'contexts': contexts,
    'ground_truth': answers
}

dataset = Dataset.from_dict(data_samples)

## 5. Evaluaci√≥n de los modelos

In [23]:
embeddings = get_embedding_function(emb_model)
llm = Ollama(model=llm_model)

In [24]:
import nest_asyncio
from ragas.run_config import RunConfig


nest_asyncio.apply()

try:
    score = evaluate(
        dataset,
        metrics=[faithfulness, answer_relevancy],
        llm=llm,
        embeddings=embeddings,
        raise_exceptions=False,
        run_config=RunConfig(
            max_retries=30, # Default is 10
            max_wait=180, # Default is 60
            max_workers=64 # Default is 16
        )
    )
except Exception as e:
    print(f"An error ocurred: {e}")

df_score = score.to_pandas()
print(df_score)

Evaluating:   0%|          | 0/18 [00:00<?, ?it/s]

Failed to parse output. Returning None.
Failed to parse output. Returning None.
Failed to parse output. Returning None.
Failed to parse output. Returning None.
Failed to parse output. Returning None.
Failed to parse output. Returning None.
Failed to parse output. Returning None.
Failed to parse output. Returning None.


                                            question  \
0  What is the clause that specifies the conditio...   
1  What are the job functions described in the In...   
2  What penalties are applied if the buyer does n...   
3  ¬øCu√°l es la cl√°usula que especifica las condic...   
4  ¬øCu√°les son las funciones laborales descritas ...   
5  ¬øQu√© sanciones se aplican si la parte comprado...   
6  Quina √©s la cl√†usula que especifica les condic...   
7  Quines s√≥n les funcions laborals descrites en ...   
8  Quines sancions s'apliquen si la part comprado...   

                                              answer  \
0  In the Arras Contract, the clause that specifi...   
1  The worker will provide services as [job title...   
2  The buyer may terminate this contract, agreein...   
3  En el Contrato de Arras, la cl√°usula que espec...   
4  El/la trabajador/a prestar√° sus servicios como...   
5  La parte compradora podr√° resolver el presente...   
6  En el Contracte d'Arres, la cl√

In [25]:
df_score.head(10)

Unnamed: 0,question,answer,contexts,ground_truth,faithfulness,answer_relevancy
0,What is the clause that specifies the conditio...,"In the Arras Contract, the clause that specifi...",[Si se reunen los requisitos establecidos en ...,"In the Arras Contract, the clause that specifi...",,1.0
1,What are the job functions described in the In...,The worker will provide services as [job title...,[El trabajador es perceptor de prestaciones po...,The worker will provide services as [job title...,,0.702688
2,What penalties are applied if the buyer does n...,"The buyer may terminate this contract, agreein...","[manifestaci√≥n primera y, siendo a su vez el i...","The buyer may terminate this contract, agreein...",,0.81759
3,¬øCu√°l es la cl√°usula que especifica las condic...,"En el Contrato de Arras, la cl√°usula que espec...",[CL√ÅUSULAS ESPEC√çFICAS DE UN J√ìVEN POR MICROE...,"En el Contrato de Arras, la cl√°usula que espec...",0.25,0.700195
4,¬øCu√°les son las funciones laborales descritas ...,El/la trabajador/a prestar√° sus servicios como...,[El trabajador es perceptor de prestaciones po...,El/la trabajador/a prestar√° sus servicios como...,0.0,0.605152
5,¬øQu√© sanciones se aplican si la parte comprado...,La parte compradora podr√° resolver el presente...,[Si se reunen los requisitos establecidos en ...,La parte compradora podr√° resolver el presente...,,0.0
6,Quina √©s la cl√†usula que especifica les condic...,"En el Contracte d'Arres, la cl√†usula que espec...",[CL√ÅUSULAS ESPEC√çFICAS DE UN J√ìVEN POR MICROE...,"En el Contracte d'Arres, la cl√†usula que espec...",,
7,Quines s√≥n les funcions laborals descrites en ...,El/la treballador/a prestar√† els seus serveis ...,[Se establece un per√≠odo de adaptaci√≥n al trab...,El/la treballador/a prestar√† els seus serveis ...,0.0,0.663363
8,Quines sancions s'apliquen si la part comprado...,La part compradora podr√† resoldre el present c...,"[manifestaci√≥n primera y, siendo a su vez el i...",La part compradora podr√† resoldre el present c...,0.0,0.650901
