In [1]:
from langchain_chroma import Chroma
from langchain_openai.embeddings import OpenAIEmbeddings
from langchain_openai import OpenAI
from langchain_openai import ChatOpenAI
import json
import os
from dotenv import load_dotenv

load_dotenv()
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")

persist_directory = "/Users/mariaborca/Documents/AI_2023-2024/Semestrul 4/Machine Learning/Know-Your-Rights/chroma_db_articles"
vector_store = Chroma(
    collection_name="know_your_rights",
    embedding_function=OpenAIEmbeddings(api_key=OPENAI_API_KEY),
    persist_directory=persist_directory
)

def retrive_relevant_documents(query: str, vector_store: Chroma, k: int = 5):
    results = vector_store.similarity_search_with_score(query, k=k)
    results.sort(key=lambda x: x[1], reverse=False)
    return results

def get_openai_llm(model: str = "gpt-4o-mini"):
    return OpenAI(
        model=model,
        temperature=0,
        max_tokens=1000,
        api_key=OPENAI_API_KEY)

def get_local_model(model: str = "phi-4"):
    base_url = "http://localhost:1234/v1"
    api_key = "lm-studio"

    return ChatOpenAI(
        base_url=base_url,
        api_key=api_key,
        temperature=0.9,
        model=model
    )

def get_response(query, llm, template=None, context=None):
    if template is None:
        template = """
        Folosește **doar informațiile din contextul de mai jos** pentru a răspunde la întrebare. 
        Dacă răspunsul nu este prezent în context, răspunde cu „Nu știu”.

        Context:
        {context}

        Întrebare:
        {question}

        Răspuns:

        """
        
    prompt = template.format(context=context, question=query)
    response = llm.invoke(prompt)
    return response.content if type(response)!=str else llm.invoke(prompt)

def load_test_cases(file_path):
    with open(file_path, 'r') as file:
        test_cases = json.load(file)
    return test_cases

In [11]:
from deepeval import evaluate
from deepeval.metrics import GEval, AnswerRelevancyMetric, ContextualRecallMetric, FaithfulnessMetric
from deepeval.test_case import LLMTestCase, LLMTestCaseParams
from deepeval.evaluate.configs import DisplayConfig

import io
import contextlib

def extract_metric_info(evaluation_result):
    results = []
    for test_result in evaluation_result.test_results:
        for metric_data in test_result.metrics_data:
            results.append({
                "metric": metric_data.name,
                "success": metric_data.success,
                "score": metric_data.score,
                "reason": metric_data.reason
            })
    return results

silent_display_config = DisplayConfig(
    print_results=False,
    show_indicator=False
)

def test_answer_relevancy(user_query, actual_answer):
    metric = AnswerRelevancyMetric(
        threshold=0.7,
        include_reason=True,
        verbose_mode=False,
    )

    test_case = LLMTestCase(
        input=user_query,
        actual_output=actual_answer)
    
    return evaluate(
        test_cases=[test_case],
        metrics=[metric],
        display_config=silent_display_config
    )

def test_contextual_recall(user_query, expected_answer, actual_answer, retrival_context):
    metric = ContextualRecallMetric(
        threshold=0.7,
        include_reason=True,
        verbose_mode=False
    )
    test_case = LLMTestCase(
        input=user_query,
        expected_output=expected_answer,
        actual_output=actual_answer,
        retrieval_context=retrival_context
    )

    return evaluate(
        test_cases=[test_case],
        metrics=[metric],
        display_config=silent_display_config
    )

def test_faithfulness(user_query, actual_answer, retrival_context):
    metric = FaithfulnessMetric(
        threshold=0.7,
        verbose_mode=False,
        model="gpt-4o-mini",
    )
    test_case = LLMTestCase(
        input=user_query,
        actual_output=actual_answer,
        retrieval_context=retrival_context
    )
    return evaluate(
        test_cases=[test_case],
        metrics=[metric],
        display_config=silent_display_config
    )

def test_understanding(user_query, expected_answer, actual_answer):
    metric = GEval(
        name="Understanding",
        evaluation_steps=(
            ["Răspunsul este formulat într-un mod clar și accesibil pentru o persoană fără cunoștințe juridice? ",
            "Poate utilizatorul să înțeleagă ce are voie să facă sau ce trebuie să facă, pe baza acestui răspuns?"]
        ),
        threshold=0.7,
        evaluation_params=[LLMTestCaseParams.INPUT, LLMTestCaseParams.ACTUAL_OUTPUT, LLMTestCaseParams.EXPECTED_OUTPUT],
        verbose_mode=False,
        model="gpt-4o-mini",
    )
    test_case = LLMTestCase(
        input=user_query,
        expected_output=expected_answer,
        actual_output=actual_answer
    )
    return evaluate(
        test_cases=[test_case],
        metrics=[metric],
        display_config=silent_display_config
    )

def run_evaluation(test_cases, vector_store, llm, prompt):
    results = []
    for test_case in test_cases:
        user_query = test_case['question']
        expected_answer = test_case['expected_answer']

        retrival_context = retrive_relevant_documents(user_query, vector_store, k=3)
        retrival_context = [doc.page_content for doc, _ in retrival_context]
        context = "\n\n".join(retrival_context)
        
        # Run RAG to get the actual answer
        actual_answer = get_response(user_query, llm, prompt, context)

        # Evaluate the answers
        relevancy_result = test_answer_relevancy(user_query, actual_answer)
        recall_result = test_contextual_recall(user_query, expected_answer, actual_answer, retrival_context)
        faithfulness_result = test_faithfulness(user_query, actual_answer, retrival_context)
        understanding_result = test_understanding(user_query, expected_answer, actual_answer)

        relevancy_result = extract_metric_info(relevancy_result)
        recall_result = extract_metric_info(recall_result)
        faithfulness_result = extract_metric_info(faithfulness_result)
        understanding_result = extract_metric_info(understanding_result)

        print(f"""
            Query: {user_query}
            Expected: {expected_answer}
            Actual: {actual_answer}
            Relevancy Score: {relevancy_result}
            Recall Score: {recall_result}
            Faithfulness Score: {faithfulness_result}
            Understanding Score: {understanding_result}
            """)
       

        results.append({
            'user_query': user_query,
            'expected_answer': expected_answer,
            'actual_answer': actual_answer,
            'relevancy': relevancy_result,
            'recall': recall_result,
            'faithfulness': faithfulness_result,
            'understanding': understanding_result,
        })
    
    return results

def start_testing(models_list, test_cases, prompt):
    results_for_models = {model : [] for model in models_list}
    for test in test_cases:
        print(f"Running tests for query: {test['question']}")
        for model in models_list:
            print(f"Using model: {model}")
            llm = get_local_model(model=model)
            results = run_evaluation([test], vector_store, llm, prompt)
            results_for_models[model].append(results)
        print(f"Finished tests for model: {model}\n")
        print("=" * 50)
        print("\n")
    return results_for_models


    

In [None]:
models_list = ["mistral-7b-instruct-v0.1", "rollama3-8b-instruct", "rollama2-7b-instruct"]

prompt = """
Ești un asistent juridic virtual, specializat în explicarea drepturilor cetățenilor într-un limbaj simplu și accesibil. Răspunzi în limba română, folosind informațiile din documente juridice oficiale precum Constituția României, Codul Muncii sau alte acte normative relevante.

Când răspunzi, urmează aceste reguli:
 - Explică termenii juridici într-un mod clar, ca și cum ai vorbi cu cineva fără pregătire juridică.
 - Fii concis, dar oferă informații corecte și complete.
 - Dacă este cazul, poți cita articole de lege (ex: „Conform articolului X din Codul Muncii...”).
 - Nu inventa informații. Dacă întrebarea nu are un răspuns clar în documentele juridice disponibile, spune că nu poți oferi un răspuns sigur.
 - Nu oferi sfaturi legale personalizate; explică doar cadrul legal general.

Întrebarea utilizatorului este: {question}

Folosește următoarele informații extrase din documentele juridice:
{context}

Răspunsul tău trebuie să fie în limba română, clar, politicos și ușor de înțeles.
"""

start_testing(models_list, tests_list, prompt)

Running tests for query: Cât timp poate fi reținută o persoană înainte de a fi arestată?
Using model: mistral-7b-instruct-v0.1



            Query: Cât timp poate fi reținută o persoană înainte de a fi arestată?
            Expected: Reținerea nu poate depăși 24 de ore. După acest termen, persoana trebuie eliberată sau arestată preventiv prin decizia unui judecător.
            Actual: 
Conform articolului X din Codul Muncii, reținerea unui persoană nu poate depăși 24 de ore înainte de arestarea. Dacă arestarea preventivă se dispune de judecător numai în cursul procesului penal, în acest caz, arestarea preventivă poate fi deplasată în cadrul unuii perioade maximă de 30 de zile, dar nu poate depăsa un timp rezonabil, care nu poate depăși un termen de 180 de zile. Dacă în acest caz nu se aduce drepturile individuale și civile ale persoanei, persoana poate fi arestată sau reținută încă de douăzeci de ore înainte de alegerea judecată. Dacă se aduc drepturile individuale și civile ale persoanei, atunci aceste trebuie să fie respectate.

În timpul urmăririi penale, arestarea preventivă poate fi deplasată pentru cel m


            Query: Cât timp poate fi reținută o persoană înainte de a fi arestată?
            Expected: Reținerea nu poate depăși 24 de ore. După acest termen, persoana trebuie eliberată sau arestată preventiv prin decizia unui judecător.
            Actual: Conform prevederilor Constituției României, o persoană poate fi reținută până la 24 de ore. O arestare preventivă este permisă numai dacă este aprobată de un judecător și în timpul procedurii penale. Arestarea preventivă nu poate depăși 30 de zile, dar această perioadă se poate prelungi cu cel mult 30 de zile, fără ca durata totală să depășească un termen rezonabil de 180 de zile.
            Relevancy Score: [{'metric': 'Answer Relevancy', 'success': False, 'score': 0.5, 'reason': 'The score is 0.50 because while the output provides information related to detention, it focuses on preventive arrest durations rather than directly addressing the initial detention period before arrest. This misalignment with the input question preve


            Query: Cât timp poate fi reținută o persoană înainte de a fi arestată?
            Expected: Reținerea nu poate depăși 24 de ore. După acest termen, persoana trebuie eliberată sau arestată preventiv prin decizia unui judecător.
            Actual: 
O persoană poate fi ținută timp de cel mult 24 de ore, iar dacă există motive suplimentare care să justifice arestarea preventivă, aceasta poate fi prelungită cu o perioadă de până la 30 de zile. Aceste măsuri sunt luate în cazurile prevăzute de lege, precum și în alte situații, cum ar fi prevenirea unei primejdii care ar putea reprezenta o amenințare gravă la adresa vieții sau integrității fizice a unei persoane, sau atunci când este vorba despre apărarea securității naționale sau a ordinii publice.
            Relevancy Score: [{'metric': 'Answer Relevancy', 'success': False, 'score': 0.3333333333333333, 'reason': 'The score is 0.33 because the output contains several statements that diverge from the main question about the du


            Query: Care sunt drepturile cetățeanului român?
            Expected: Cetățeanul român beneficiază de drepturi și libertăți fundamentale în toate domeniile vieții. Drepturile civile și politice includ dreptul la viață, libertatea individuală, dreptul la apărare, dreptul de vot de la 18 ani și eligibilitatea pentru funcții publice. Libertățile fundamentale cuprind libertatea gândirii și credinței religioase, libertatea de exprimare, dreptul la informație și dreptul de asociere în partide și sindicate. Drepturile economice și sociale garantează munca liber aleasă, greva, proprietatea privată, moștenirea, pensia și asistența medicală. În plus, cetățenii au dreptul la învățătură, acces la cultură, un mediu sănătos și protecția statului în străinătate.
            Actual: 
Drepturile cetățenului român se referă la o serie de protecții și privilegii care i le permit să trăiască cu ușorie și să-și exercite toate funcțiile civice, sociale şi economice. Conform Constituției Românie


            Query: Care sunt drepturile cetățeanului român?
            Expected: Cetățeanul român beneficiază de drepturi și libertăți fundamentale în toate domeniile vieții. Drepturile civile și politice includ dreptul la viață, libertatea individuală, dreptul la apărare, dreptul de vot de la 18 ani și eligibilitatea pentru funcții publice. Libertățile fundamentale cuprind libertatea gândirii și credinței religioase, libertatea de exprimare, dreptul la informație și dreptul de asociere în partide și sindicate. Drepturile economice și sociale garantează munca liber aleasă, greva, proprietatea privată, moștenirea, pensia și asistența medicală. În plus, cetățenii au dreptul la învățătură, acces la cultură, un mediu sănătos și protecția statului în străinătate.
            Actual: Conform Constituției României, cetățenii beneficiază de următoarele drepturi:

- Egalitatea în fața legii și a autorităților publice fără privilegii și discriminări
- În condițiile aderării României la Uniunea


            Query: Care sunt drepturile cetățeanului român?
            Expected: Cetățeanul român beneficiază de drepturi și libertăți fundamentale în toate domeniile vieții. Drepturile civile și politice includ dreptul la viață, libertatea individuală, dreptul la apărare, dreptul de vot de la 18 ani și eligibilitatea pentru funcții publice. Libertățile fundamentale cuprind libertatea gândirii și credinței religioase, libertatea de exprimare, dreptul la informație și dreptul de asociere în partide și sindicate. Drepturile economice și sociale garantează munca liber aleasă, greva, proprietatea privată, moștenirea, pensia și asistența medicală. În plus, cetățenii au dreptul la învățătură, acces la cultură, un mediu sănătos și protecția statului în străinătate.
            Actual: 
În calitate de cetățean român, aveți mai multe drepturi și libertăți garantate prin Constituția României. Acestea includ:

1. Egalitatea în fața legii: Aveți același statut juridic ca orice alt cetățean al ță


            Query: Ce obligație are angajatorul înainte de încheierea contractului individual de muncă?
            Expected: Anterior încheierii sau modificării contractului individual de muncă, angajatorul are obligația de a informa persoana selectată în vederea angajării cu privire la clauzele esențiale pe care intenționează să le înscrie în contract sau să le modifice.
            Actual: 
Angajatorul are obligație de a informa  persoana selectată în vederea angajarii sau salariatului cu privire la clauzele esentiale pe care intensionează să le includă în contract sau să le modifice înainte de încheierea contractului individual de muncă.

Conform articolului 17 din Codul Muncii, persoana selectată în vederea angajarii sau salariatului trebuie să fie informată cu privire la următoarele elemente: a) identitatea partilor, b) locul de muncă sau, în lipsă unui loc de muncă fix, posibilitatea ca salariatul să isi desfasoare activitatea în locuri de muncă diferite, dacă deplasarea intre 


            Query: Ce obligație are angajatorul înainte de încheierea contractului individual de muncă?
            Expected: Anterior încheierii sau modificării contractului individual de muncă, angajatorul are obligația de a informa persoana selectată în vederea angajării cu privire la clauzele esențiale pe care intenționează să le înscrie în contract sau să le modifice.
            Actual: Înainte de încheierea unui contract individual de muncă, angajatorii au obligația de a informa persoana selectată în vederea angajării sau pe salariat cu privire la clauzele esențiale pe care intenționează să le includă sau să le modifice în contract. Această informare trebuie furnizată prin intermediul uneia dintre părți, fie persoana selectată pentru angajare, fie salariata însăși, și se consideră că aceasta a fost efectuată la semnarea contractului individual de muncă sau a actului adițional. Această informații trebuie să includă: identitatea părților, locul de muncă sau, dacă nu există un loc


            Query: Ce obligație are angajatorul înainte de încheierea contractului individual de muncă?
            Expected: Anterior încheierii sau modificării contractului individual de muncă, angajatorul are obligația de a informa persoana selectată în vederea angajării cu privire la clauzele esențiale pe care intenționează să le înscrie în contract sau să le modifice.
            Actual: 
Angajatorul are obligatia de a informa persoana selectata in vederea angajarii sau salariatul despre cel putin urmatoarele elemente: 
a) identitatea partilor; 
b) locul de munca sau, in lipsa unui loc de munca fix, posibilitatea ca salariatul sa isi desfasoare activitatea in 
locuri de munca diferite, precum si daca deplasarea intre acestea este asigurata sau decontata de catre angajator, 
dupa caz; 
c) durata concediului de odihna la care salariatul are dreptul; 
d) conditiile de acordare a preavizului de catre partile contractante si durata acestuia; 
e) salariul de baza, alte elemente constit


            Query: Care este vârsta legală minimă pentru încheierea unei căsătorii în România?
            Expected: Căsătoria se poate încheia dacă viitorii soți au împlinit vârsta de 18 ani.
            Actual: 
În România, vârsta legală minimă pentru încheierea unei căsătorii este 18 ani. Conform Codului Civil Român, care prevede reglementarea căsătoriei în România, un minor de 16 ani poate să se căsătorească dacă a împlinit vârsta de 18 ani sau dacă soția l-a însărcinat. În cazul căsătoriei fictive, minorul care a împlinit vârsta de 16 ani poate să se căsătorească în temeiul unui aviz medical, cu încuviințarea părinților său sau tutorelui, dacă există, și cu autorizarea instanței de tutelă din așași circumscripția minorului. De asemenea, dacă unul dintre părinți este decedat sau se află în imposibilitate de a-și manifesta voință, încuviințarea celuilalt părinte este suficientă. În condiții art.398, este suficientă încuviințarea părintelui care exercită autoritatea părintească.

În


            Query: Care este vârsta legală minimă pentru încheierea unei căsătorii în România?
            Expected: Căsătoria se poate încheia dacă viitorii soți au împlinit vârsta de 18 ani.
            Actual: Potrivit articolului 54 din Codul familiei, vârsta legală minimă pentru încheierea unei căsătorii în România este de 18 ani. Cu toate acestea, cu condițiile prevăzute la art. 55 (1), minorul care are peste 16 ani poate căsători dacă ambii soți au împlinit vârsta de 18 ani sau dacă soția a născut ori este în stare de sarcină.
            Relevancy Score: [{'metric': 'Answer Relevancy', 'success': True, 'score': 0.8, 'reason': 'The score is 0.80 because the response mostly addresses the question about the legal minimum age for marriage in Romania. However, it includes an incorrect statement about both spouses needing to be 18, which slightly detracts from its accuracy. Despite this, the core information remains relevant and useful.'}]
            Recall Score: [{'metric': 'Cont


            Query: Care este vârsta legală minimă pentru încheierea unei căsătorii în România?
            Expected: Căsătoria se poate încheia dacă viitorii soți au împlinit vârsta de 18 ani.
            Actual: 
Vârsta legală minimă pentru căsătoriile efectuate în România este de 18 ani. Cu toate acestea, o minoră care a împlinit vârsta de 16 ani poate fi căsătorită dacă are încuviințarea părinților săi sau, după caz, a tutorelui și cu autorizarea instanței de tutelă. Dacă unul dintre părinți refuză, instanța de tutelă poate decide căsătoria minorului pe baza interesului superior al copilului. În plus, vârsta matrimonială nu există în România, astfel că orice persoană fizică cu capacitate de exercitare a drepturilor civile poate fi căsătorită prin consimțământ personal și liber.

Această interpretare se bazează pe informații extrase din documentele juridice oficiale, cum ar fi Constituția României, Codul Muncii și alte acte normative relevante.
            Relevancy Score: [{'metric


            Query: În ce condiții poate fi încheiat un contract de vânzare-cumpărare și care sunt excepțiile de la forma scrisă?
            Expected: Contractul de vânzare-cumpărare se încheie prin acordul părților asupra lucrului și prețului. Contractul trebuie să fie în formă scrisă pentru bunurile imobile, pentru bunurile mobile cu valoarea peste o anumită sumă stabilită prin lege și pentru bunurile viitoare. Forma scrisă nu este obligatorie pentru bunurile mobile de valoare mică, pentru vânzările în cadrul activităților comerciale curente cu plată pe loc, sau când legea prevede expres alte forme de încheierie.
            Actual: 
Întrebarea utilizatorului este: În ce condiții poate fi încheiat un contract de vânzare-cumpărare și care sunt excepțiile de la forma scrisă?

Explicarea: Într-un contract de vânzare-cumpărare, sunt posibile câteva condiții în care poate fi încheiat un contract pe viața orală. În general, conform Articolului 1497 din Codul Civil Român, pentru a fi consi


            Query: În ce condiții poate fi încheiat un contract de vânzare-cumpărare și care sunt excepțiile de la forma scrisă?
            Expected: Contractul de vânzare-cumpărare se încheie prin acordul părților asupra lucrului și prețului. Contractul trebuie să fie în formă scrisă pentru bunurile imobile, pentru bunurile mobile cu valoarea peste o anumită sumă stabilită prin lege și pentru bunurile viitoare. Forma scrisă nu este obligatorie pentru bunurile mobile de valoare mică, pentru vânzările în cadrul activităților comerciale curente cu plată pe loc, sau când legea prevede expres alte forme de încheierie.
            Actual: În conformitate cu Constituția României și Codul civil al României, un contract de vânzare-cumpărare poate fi încheiat verbal, cu condiția să fie acceptat ulterior. Excepțiile care se aplică acestei reguli sunt cazurile în care forma scrisă este necesară pentru dovada contractului sau actul este supus unei forme specifice prevăzute de lege.
            R


            Query: În ce condiții poate fi încheiat un contract de vânzare-cumpărare și care sunt excepțiile de la forma scrisă?
            Expected: Contractul de vânzare-cumpărare se încheie prin acordul părților asupra lucrului și prețului. Contractul trebuie să fie în formă scrisă pentru bunurile imobile, pentru bunurile mobile cu valoarea peste o anumită sumă stabilită prin lege și pentru bunurile viitoare. Forma scrisă nu este obligatorie pentru bunurile mobile de valoare mică, pentru vânzările în cadrul activităților comerciale curente cu plată pe loc, sau când legea prevede expres alte forme de încheierie.
            Actual: 
În ce condiții poate fi încheiat un contract de vânzare-cumpărare și care sunt excepțiile de la forma scrisă? 

Un contract de vânzare-cumpărare poate fi încheiat atât în formă scrisă, cât și oral. Contractul verbal se referă la o afacere între un agent imobiliar și un client care nu este prezent fizic, dar oferă acordul verbal al clientului prin telefo


            Query: Care sunt drepturile și obligațiile părților în cazul unei concedieri individuale pentru motive care nu țin de persoana salariatului?
            Expected: În cazul concedierii pentru motive care nu țin de persoana salariatului, angajatorul trebuie să respecte proceduri stricte și să asigure drepturi specifice salariatului. Concedierea este permisă doar pentru desființarea locului de muncă din motive economice, tehnologice, structurale sau similare. Angajatorul are obligația să acorde un preaviz de minimum 20 de zile lucrătoare și să respecte criterii obiective de selecție (performanțe profesionale, vechime, sarcini de întreținere).
            Actual: 
Într-un caz individual, salariatul are drepturi și obligații identice cu cele ale unuii persoane aflate în situație similară. Excepție se face dacă concederile potrivite legei sunt dispuse pentru motive care nu au legătura cu persoana salariatului, cum ar fi de exemplu o transfer al intreprinderii sau al unității sau


            Query: Care sunt drepturile și obligațiile părților în cazul unei concedieri individuale pentru motive care nu țin de persoana salariatului?
            Expected: În cazul concedierii pentru motive care nu țin de persoana salariatului, angajatorul trebuie să respecte proceduri stricte și să asigure drepturi specifice salariatului. Concedierea este permisă doar pentru desființarea locului de muncă din motive economice, tehnologice, structurale sau similare. Angajatorul are obligația să acorde un preaviz de minimum 20 de zile lucrătoare și să respecte criterii obiective de selecție (performanțe profesionale, vechime, sarcini de întreținere).
            Actual: În cazul unei concedieri individuale pentru motive care nu se referă la persoana lucrătorului, angajatorul trebuie să respecte drepturile acestuia. Concedierea poate fi făcută numai din cauze reale și serioase legate de desființarea unității sau a unor părți ale acesteia la care lucra angajatul. Angajatorul nu poate s


            Query: Care sunt drepturile și obligațiile părților în cazul unei concedieri individuale pentru motive care nu țin de persoana salariatului?
            Expected: În cazul concedierii pentru motive care nu țin de persoana salariatului, angajatorul trebuie să respecte proceduri stricte și să asigure drepturi specifice salariatului. Concedierea este permisă doar pentru desființarea locului de muncă din motive economice, tehnologice, structurale sau similare. Angajatorul are obligația să acorde un preaviz de minimum 20 de zile lucrătoare și să respecte criterii obiective de selecție (performanțe profesionale, vechime, sarcini de întreținere).
            Actual: 
În cazul unei concedieri individuale pentru motive care nu țin de persoana salariatului, drepturile și obligațiile părților sunt după cum urmează:

1. Salariatul are dreptul la protecție adecvată împotriva concedierii nelegitime (motive care nu țin de persoana sa).
2. Angajatorul trebuie să demonstreze că desființare

### **Summary of Romanian Prompt Testing for Three Models**

I tested three language models — **Rollama3-8b**, **Rollama2-7b**, and **Mistral** — on six legal questions in Romanian. Each model’s responses were evaluated based on four key aspects: **relevance** (if the answer matches the question), **recall** (if it uses the correct information), **faithfulness** (if it’s factually accurate), and **understanding** (if it’s easy to read).

#### ✅ Rollama3-8b

* This model had the **best results overall**.
* **4 out of 6 answers** passed at least two evaluation tests.
* The answers were **grammatically correct** and mostly accurate.
* However, some responses were **too long and complicated**, which made them harder to understand.

#### ⚠️ Rollama2-7b

* Performance was **average**.
* It gave **3 strong answers** out of 6.
* The language was sometimes **easier to read** than Rollama3, but there were **grammar mistakes** and **some incorrect or missing legal facts**.
* Still, it could be a decent alternative depending on the use case.

#### ❌ Mistral

* This model had the **worst performance**.
* Although **4 answers passed** two tests, **one answer failed all tests**.
* The grammar was **poor**, and many sentences were **confusing or incorrect**.
* The output often included **nonsense words**, **contradictions**, or **legal errors**.

I **expected Mistral to perform poorly** since it wasn’t trained on Romanian data. Because of this and its low quality, I’ve decided to **drop Mistral** from my testing process. This will also help make the prompt testing process **faster and more focused**.

### **Summary of Prompt Changes and Their Purpose**

You updated your prompt to improve the quality and reliability of answers in Romanian, especially when testing models like Rollama and Mistral. Below are the main changes you made and why:

---

#### 1. **Changed role from “asistent juridic” to “ghid juridic”**

* **Before**: “Ești un asistent juridic virtual...”
* **Now**: “Ești un ghid juridic virtual...”
* **Reason**: "Ghid" sounds more accessible and avoids confusion with professional legal advisors. It better reflects the goal of explaining the law in simple terms.

---

#### 2. **Removed the option to cite legal articles**

* **Before**: “Dacă este cazul, poți cita articole de lege...”
* **Now**: “Nu cita articole de lege și nu inventa numere de articole.”
* **Reason**: Many models (especially Mistral) hallucinate article numbers. Removing this prevents factual errors and misleading answers.

---

#### 3. **Clear fallback when information is missing**

* **Before**: “...spune că nu poți oferi un răspuns sigur.”
* **Now**: “...răspunde cu: „Nu am putut genera un răspuns.””
* **Reason**: You wanted a **consistent and predictable fallback** when the context is unclear or insufficient, instead of vague answers.

---

#### 4. **Added guidance for short, clear phrasing**

* **New rule**: “Scrie răspunsul în propoziții scurte și clare. Poți folosi listă cu puncte, dacă este nevoie.”
* **Reason**: Some responses from the models were long and hard to understand. This rule improves clarity and readability.

---

### ✅ **Overall Goal of the Changes**

These updates help the model:

* stay grounded in the provided context,
* avoid hallucinations,
* use simple, readable language,
* and fail gracefully when unsure.

This makes the testing process **more reliable** and results easier to evaluate.


In [18]:
models_list = ["rollama3-8b-instruct", "rollama2-7b-instruct"]

prompt_v2 = """
Ești un ghid juridic virtual, care ajută cetățenii să înțeleagă legea pe înțelesul tuturor. 

Când răspunzi, urmează aceste reguli:
 - Explică termenii juridici într-un mod clar, ca și cum ai vorbi cu cineva fără pregătire juridică.
 - Fii concis, dar oferă informații corecte și complete.
 - Nu cita articole de lege și nu inventa numere de articole.
 - Scrie răspunsul în propoziții scurte și clare. Poți folosi listă cu puncte, dacă este nevoie.
 - Nu inventa informații. Dacă informația nu se regăsește clar în contextul oferit, răspunde cu: **„Nu am putut genera un răspuns.”**
 - Nu oferi sfaturi legale personalizate; explică doar cadrul legal general.

Întrebarea utilizatorului este: {question}

Folosește următoarele informații extrase din documentele juridice:
{context}

Răspunsul tău trebuie să fie în limba română, clar, politicos și ușor de înțeles.
"""

model_results = start_testing(models_list, tests_list, prompt_v2)


Running tests for query: Cât timp poate fi reținută o persoană înainte de a fi arestată?
Using model: rollama3-8b-instruct



            Query: Cât timp poate fi reținută o persoană înainte de a fi arestată?
            Expected: Reținerea nu poate depăși 24 de ore. După acest termen, persoana trebuie eliberată sau arestată preventiv prin decizia unui judecător.
            Actual: Potrivit Constituției României, un individ poate fi reținut timp de 24 de ore. În cursul urmăririi penale, arestarea preventivă se poate dispune pentru cel mult 30 de zile și poate fi prelungită cu maximum 30 de zile fără ca durata totală să depășească un termen rezonabil. Acesta nu poate depăși 180 de zile.
            Relevancy Score: [{'metric': 'Answer Relevancy', 'success': False, 'score': 0.2, 'reason': 'The score is 0.20 because the output primarily discusses aspects of preventive arrest, which is not directly related to the initial detention period before arrest. While the topic of arrest is relevant, the focus on preventive arrest extensions and durations detracts from addressing the specific question about the initial d


            Query: Cât timp poate fi reținută o persoană înainte de a fi arestată?
            Expected: Reținerea nu poate depăși 24 de ore. După acest termen, persoana trebuie eliberată sau arestată preventiv prin decizia unui judecător.
            Actual: Întrebarea utilizatorului este: Cât timp poate fi reținută o persoană înainte de a fi arestată?

Răspunsul tău trebuie să fie în limba română, clar, politicos și ușor de înțeles. 
            Relevancy Score: [{'metric': 'Answer Relevancy', 'success': False, 'score': 0.2, 'reason': 'The score is 0.20 because the response included several irrelevant aspects such as language, clarity, politeness, and ease of understanding, which do not directly address the question about the duration a person can be detained before arrest. However, the score is not lower because the response may have contained some elements that were tangentially related to the topic.'}]
            Recall Score: [{'metric': 'Contextual Recall', 'success': True, 's


            Query: Care sunt drepturile cetățeanului român?
            Expected: Cetățeanul român beneficiază de drepturi și libertăți fundamentale în toate domeniile vieții. Drepturile civile și politice includ dreptul la viață, libertatea individuală, dreptul la apărare, dreptul de vot de la 18 ani și eligibilitatea pentru funcții publice. Libertățile fundamentale cuprind libertatea gândirii și credinței religioase, libertatea de exprimare, dreptul la informație și dreptul de asociere în partide și sindicate. Drepturile economice și sociale garantează munca liber aleasă, greva, proprietatea privată, moștenirea, pensia și asistența medicală. În plus, cetățenii au dreptul la învățătură, acces la cultură, un mediu sănătos și protecția statului în străinătate.
            Actual: Cetățenii români au următoarele drepturi:

- Sunt egali în fața legii și a autorităților publice, fără privilegii sau discriminări. 
- Nimeni nu este mai presus de lege.
- Funcțiile și demnitățile publice, civ


            Query: Care sunt drepturile cetățeanului român?
            Expected: Cetățeanul român beneficiază de drepturi și libertăți fundamentale în toate domeniile vieții. Drepturile civile și politice includ dreptul la viață, libertatea individuală, dreptul la apărare, dreptul de vot de la 18 ani și eligibilitatea pentru funcții publice. Libertățile fundamentale cuprind libertatea gândirii și credinței religioase, libertatea de exprimare, dreptul la informație și dreptul de asociere în partide și sindicate. Drepturile economice și sociale garantează munca liber aleasă, greva, proprietatea privată, moștenirea, pensia și asistența medicală. În plus, cetățenii au dreptul la învățătură, acces la cultură, un mediu sănătos și protecția statului în străinătate.
            Actual: 
În calitate de cetățean român, aveți anumite drepturi și libertăți protejate prin Constituția României. Acestea includ libertatea de exprimare, libertatea de asociere, accesul la informații publice și protecț


            Query: Ce obligație are angajatorul înainte de încheierea contractului individual de muncă?
            Expected: Anterior încheierii sau modificării contractului individual de muncă, angajatorul are obligația de a informa persoana selectată în vederea angajării cu privire la clauzele esențiale pe care intenționează să le înscrie în contract sau să le modifice.
            Actual: Înainte de încheierea unui contract individual de muncă (CIM), angajatorii au obligația de a informa persoana selectată pentru angajare sau salariatul cu privire la clauzele esențiale pe care intenționează să le includă în CIM sau să le modifice. Acestea includ, printre altele: 
- Identitatea părților
- Sediul/sediu social și domiciliul angajatorului
- Funcția/ocupația salariatului (conform Clasificării Ocupațiilor din România)
- Atribuțiile postului 
- Criterii de evaluare a muncii profesionale
- Riscuri specifice postului
- Data la care CIMul își produce efectele 
- Durata unei perioade de prob


            Query: Ce obligație are angajatorul înainte de încheierea contractului individual de muncă?
            Expected: Anterior încheierii sau modificării contractului individual de muncă, angajatorul are obligația de a informa persoana selectată în vederea angajării cu privire la clauzele esențiale pe care intenționează să le înscrie în contract sau să le modifice.
            Actual: Înainte de semnarea unui contract individual de muncă sau a unui act adițional, angajatorul are obligația de a-l informa pe salariat cu privire la cel puțin următoarele elemente:
1) identitatea părților;
2) sediul sau, după caz, domiciliul angajatorului;
3) funcția/ocupația conform specificației Clasificării ocupațiilor din România sau altor acte normative, cu specificarea atributiilor postului;
4) riscurile specifice postului;
5) durata contractului individual de muncă (dacă este un contract de muncă temporară), exprimat în ore/zi și /sau ore/săptămână, cu specificarea orelor suplimentare, dacă 


            Query: Care este vârsta legală minimă pentru încheierea unei căsătorii în România?
            Expected: Căsătoria se poate încheia dacă viitorii soți au împlinit vârsta de 18 ani.
            Actual: Vârsta legală minimă pentru încheierea unei căsătorii în România este de 16 ani, în cazul în care ambii viitoare soți au împlinit vârsta acestui vârstă. Cu toate acestea, nulitatea poate fi acoperită dacă până la hotărârea definitivă a instanței, ambele soții îndeplinesc vârsta de 18 ani sau dacă o soție este gravidă.
            Relevancy Score: [{'metric': 'Answer Relevancy', 'success': True, 'score': 1.0, 'reason': 'The score is 1.00 because the response perfectly addresses the question about the legal minimum age for marriage in Romania without any irrelevant information. Great job!'}]
            Recall Score: [{'metric': 'Contextual Recall', 'success': True, 'score': 1.0, 'reason': 'The score is 1.00 because the expected output perfectly matches the information from the

KeyboardInterrupt: 

Error updating test run to disk: [1m[[0mErrno [1;36m2[0m[1m][0m No such file or directory: 
[32m'.deepeval/.temp_test_run_data.json'[0m


In [16]:
from statistics import mean, stdev
from collections import defaultdict

def analyze_model_results(model_results):
    """
    Input: model_results - list (or list of lists) of dictionaries with keys:
        'user_query', 'expected_answer', 'actual_answer', 'relevancy', 'recall', 'faithfulness', 'understanding'

    Output:
        - average score per metric
        - pass rate per metric
        - a unified list of examples (one per test case, includes all metrics)
    """

    # Flatten if it's a list of lists
    if any(isinstance(item, list) for item in model_results):
        flat_results = [entry for sublist in model_results for entry in sublist]
    else:
        flat_results = model_results

    metric_data = defaultdict(lambda: {
        "scores": [],
        "successes": 0,
        "total": 0
    })

    unified_examples = []

    for result in flat_results:
        test_example = {
            "query": result["user_query"],
            "expected": result["expected_answer"],
            "actual": result["actual_answer"],
            "metrics": {}
        }

        for metric_name in ["relevancy", "recall", "faithfulness", "understanding"]:
            metric_entries = result.get(metric_name, [])
            for entry in metric_entries:
                name = entry["metric"]
                score = entry["score"]
                success = entry["success"]
                reason = entry.get("reason", "")

                # Track overall stats
                metric_data[name]["scores"].append(score)
                metric_data[name]["total"] += 1
                if success:
                    metric_data[name]["successes"] += 1

                # Store this metric result under the test case
                test_example["metrics"][name] = {
                    "score": score,
                    "success": success,
                    "reason": reason
                }

        unified_examples.append(test_example)

    summary = {}
    for metric, data in metric_data.items():
        scores = data["scores"]
        summary[metric] = {
            "avg_score": round(mean(scores), 3) if scores else None,
            "std_dev": round(stdev(scores), 3) if len(scores) > 1 else 0.0,
            "pass_rate": f"{round((data['successes'] / data['total']) * 100, 1)}%" if data["total"] > 0 else "N/A",
            "total_cases": data["total"]
        }

    # Add unified examples only once
    summary["examples"] = unified_examples

    return summary


In [17]:
for model_name, model_result_list in model_results.items():
    print(f"Evaluating model: {model_name}")
    results_summary = analyze_model_results(model_result_list)
    print(json.dumps(results_summary, indent=4, ensure_ascii=False))

# print(model_results["rollama3-8b-instruct"])


Evaluating model: rollama3-8b-instruct
{
    "Answer Relevancy": {
        "avg_score": 0.715,
        "std_dev": 0.358,
        "pass_rate": "50.0%",
        "total_cases": 6
    },
    "Contextual Recall": {
        "avg_score": 0.733,
        "std_dev": 0.313,
        "pass_rate": "50.0%",
        "total_cases": 6
    },
    "Faithfulness": {
        "avg_score": 0.578,
        "std_dev": 0.357,
        "pass_rate": "33.3%",
        "total_cases": 6
    },
    "Understanding (GEval)": {
        "avg_score": 0.5,
        "std_dev": 0.16,
        "pass_rate": "16.7%",
        "total_cases": 6
    },
    "examples": [
        {
            "query": "Cât timp poate fi reținută o persoană înainte de a fi arestată?",
            "expected": "Reținerea nu poate depăși 24 de ore. După acest termen, persoana trebuie eliberată sau arestată preventiv prin decizia unui judecător.",
            "actual": "Potrivit Legii privind acțiunile și măsurile penale (Legea nr. 281/2005), reținerea poate d

### 🔍 **Summary of Results: Rollama3-8b vs Rollama2-7b (with New Prompt)**

#### ✅ **Rollama3-8b**

* **Scores**: 50% relevance, 50% recall, 33% faithfulness, 17% understanding
* **Grammar**: Generally correct, but the style is overly legal and hard to follow.
* **Issues**: Answers are often too formal, with long sentences and complex structures. Sometimes includes off-topic info.

#### ✅ **Rollama2-7b**

* **Scores**: 67% relevance, 50% recall, 50% faithfulness, **0% understanding**
* **Grammar**: Acceptable, but sentences are long and unclear.
* **Issues**: Provides lots of details, but they’re hard to process. No answers were considered easy to understand.

---

### ⚖️ **Conclusion**

* **Rollama2-7b** gave more accurate and relevant answers overall.
* **Rollama3-8b** was better grammatically, but less faithful and harder to understand.
* Neither model fully achieved the goal of clear, simple legal explanations.

---


In [None]:
prompt_v3 = """ 
Ești un ghid juridic virtual care explică legea în mod clar și accesibil pentru orice cetățean, fără termeni complicați sau ambigui.

Când răspunzi, respectă aceste reguli:
 - Folosește propoziții clare, scurte și bine structurate (nu mai mult de 2 fraze per idee).
 - Explică termenii juridici pe înțelesul oricui, fără a presupune cunoștințe legale.
 - Nu menționa articole de lege și nu inventa surse legale.
 - Nu adăuga informații care nu apar în contextul oferit.
 - Dacă contextul nu oferă un răspuns clar, scrie simplu: **„Nu am putut genera un răspuns.”**
 - Evită limbajul prea tehnic sau abstract. Fii prietenos, dar neutru.

Întrebarea utilizatorului este:  
{question}

Informațiile disponibile sunt:  
{context}

Scrie răspunsul în limba română. Acesta trebuie să fie clar, politicos și ușor de înțeles.
"""
model_results = start_testing(models_list, tests_list, prompt_v3)
