## Libraries

In [1]:
import chatbot
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import json
from dotenv import load_dotenv
from openai import OpenAI
from collections import Counter
from sklearn.metrics.pairwise import cosine_similarity
import pandas as pd
import time

In [2]:
load_dotenv()
client = OpenAI()

index, metadata = chatbot.load_faiss_index(chatbot.VECTOR_DIR)
bm25=chatbot.build_bm25(metadata)
print("Index and metadata loaded.")

Index and metadata loaded.


In [3]:
with open("evaluation/evaluation_dataset_v2.json", "r", encoding="utf-8") as f:
    data = json.load(f)

In [4]:
def json_to_documents(data: dict):
    documents = []

    for source, content in data.items():
        qa_list = content.get("perguntas_respostas", [])

        for item in qa_list:
            documents.append({
                "question": item.get("pergunta", ""),
                "answer": item.get("resposta", ""),
                "source": source
            })

    return documents


In [5]:
documents = json_to_documents(data)
documents

[{'question': 'O que é o Alentejo 2030?',
  'answer': 'O Alentejo 2030 é um programa que visa transformar vidas na região do Alentejo, impulsionando a inovação, a sustentabilidade e o crescimento regional, além de facilitar o acesso aos Fundos Europeus disponíveis.',
  'source': 'alentejo2030'},
 {'question': 'Quais são alguns dos eventos programados para o Alentejo 2030?',
  'answer': "Alguns dos eventos programados incluem um workshop sobre Prospetivas e Políticas Públicas em 15 de dezembro de 2025, uma conferência e espetáculo sobre Inteligência Artificial em 27 de novembro de 2025, e um concerto intitulado 'Ecoando a voz do Alentejo' em 16 de novembro de 2025.",
  'source': 'alentejo2030'},
 {'question': 'Qual foi a decisão da Comissão Europeia em relação ao Alentejo 2030?',
  'answer': 'A Comissão Europeia aprovou, em 15 de dezembro de 2025, a reprogramação do Programa Regional do Alentejo 2030, permitindo alinhar os fundos europeus com novas prioridades estratégicas e desafios em

## RAGAS

In [6]:
# ---------------- Core Metrics ----------------
def f1_score(pred, ref):
    if not pred: return 0.0
    pred_tokens = pred.split()
    ref_tokens = ref.split()
    common = Counter(pred_tokens) & Counter(ref_tokens)
    num_same = sum(common.values())
    if num_same == 0: return 0.0
    precision = num_same / len(pred_tokens)
    recall = num_same / len(ref_tokens)
    return 2 * precision * recall / (precision + recall)

def conciseness_score(generated, reference):
    return len(reference.split()) / max(1, len(generated.split()))

def semantic_similarity_score(generated, references):
    """
    Computes max semantic similarity between generated answer and reference answers
    """
    gen_emb = chatbot.embedding(generated)
    ref_embs = np.vstack([chatbot.embedding(ref) for ref in references])
    sims = cosine_similarity(gen_emb, ref_embs)[0]
    return float(np.max(sims))


# ---------------- Embedding-based Retrieval Success ----------------
def retrieval_success_semantic(retrieved_docs, reference):
    """
    Returns the maximum semantic similarity between the reference and retrieved docs.
    If no docs are retrieved, returns 0.0.
    """
    if not retrieved_docs:
        return 0.0

    ref_emb = chatbot.embedding(reference)
    max_sim = 0.0

    for doc in retrieved_docs:
        doc_text = doc.get("content", "").strip()
        if not doc_text:
            continue
        doc_emb = chatbot.embedding(doc_text)
        sim = cosine_similarity(ref_emb, doc_emb)[0][0]
        if sim > max_sim:
            max_sim = sim

    return float(max_sim)


# ---------------- Embedding-based Grounding ----------------
def grounding_score_semantic(generated, retrieved_docs):
    """
    Fraction of generated answer semantically supported by retrieved docs
    """
    if not retrieved_docs:
        return 0.0

    gen_emb = chatbot.embedding(generated)
    doc_embs = np.vstack([chatbot.embedding(doc.get("content","")) for doc in retrieved_docs])
    sims = cosine_similarity(gen_emb, doc_embs)[0]
    return float(np.max(sims)) if len(sims) > 0 else 0.0



def claim_coverage_score(generated, reference, threshold=0.75):
    ref_sentences = [s.strip() for s in reference.split(".") if s.strip()]
    if not ref_sentences:
        return 0.0

    gen_emb = chatbot.embedding(generated)

    covered = 0
    for sent in ref_sentences:
        sent_emb = chatbot.embedding(sent)
        sim = cosine_similarity(gen_emb, sent_emb)[0][0]
        if sim >= threshold:
            covered += 1

    return covered / len(ref_sentences)


def retrieval_recall(retrieved_docs, reference, threshold=0.75):
    if not retrieved_docs:
        return 0.0

    ref_sentences = [s.strip() for s in reference.split(".") if s.strip()]
    if not ref_sentences:
        return 0.0

    doc_texts = [doc.get("content","") for doc in retrieved_docs]
    doc_embs = np.vstack([chatbot.embedding(d) for d in doc_texts])

    covered = 0

    for sent in ref_sentences:
        sent_emb = chatbot.embedding(sent)
        sims = cosine_similarity(sent_emb, doc_embs)[0]
        if np.max(sims) >= threshold:
            covered += 1

    return covered / len(ref_sentences)



**Pipeline**

In [7]:
def evaluate_rag_semantic(dataset, index, metadata, bm25, 
                            model="gpt-4o-mini",  
                            k=20,top_k=5, 
                            weight_dense=0.6, 
                            weight_sparse=0.4, 
                            rerank=False):
    results = []

    for item in dataset:
        question = item["question"]
        reference = item["answer"]
        source = item.get("source", "unknown")

        # Generate answer
        start_time = time.time()
        generated_answer, retrieved_docs = chatbot.answer(question, index, 
                                                        metadata, bm25,
                                                        model, k, top_k, 
                                                        weight_dense, 
                                                        weight_sparse, 
                                                        rerank)
        latency = time.time() - start_time

        if isinstance(generated_answer, tuple):
            generated_answer = generated_answer[0]

        # Metrics
        retrieval_success = retrieval_success_semantic(retrieved_docs, reference)
        grounding = grounding_score_semantic(generated_answer, retrieved_docs)
        f1 = f1_score(generated_answer, reference)
        conciseness = conciseness_score(generated_answer, reference)
        semantic_sim = semantic_similarity_score(generated_answer, [reference])
        retrieval_recall_val = retrieval_recall(retrieved_docs, reference)
        claim_coverage_val = claim_coverage_score(generated_answer, reference)

        results.append({
            "Question": question,
            "Reference Answer": reference,
            "Source": source,
            "Generated Answer": generated_answer,
            "Retrieval Success (semantic)": retrieval_success,
            "Grounding (semantic)": grounding,
            "F1": f1,
            "Conciseness": conciseness,
            "Semantic Similarity": semantic_sim,
            "retrieval_recall": retrieval_recall_val,
            "claim_coverage_score": claim_coverage_val,
            "Latency (s)": latency
        })

    df = pd.DataFrame(results)
    return df

**Evaluation**

In [8]:
results_1 = {}
for k in [5, 10, 15]:
    results_1[k] = evaluate_rag_semantic(documents, index, metadata, bm25, 
                                        model="gpt-4o-mini",  
                                        k=k,top_k=5, 
                                        weight_dense=0.5, 
                                        weight_sparse=0.5, 
                                        rerank=False)



Assistente: O Alentejo 2030 é um programa regional aprovado pela Comissão Europeia para o período de programação 2021-2027, que visa promover a competitividade da economia, a sustentabilidade ambiental e a valorização do território e das pessoas na região do Alentejo. Este programa tem como objetivo operacionalizar a estratégia de desenvolvimento da região e as estratégias sub-regionais das Comunidades Intermunicipais, através da disponibilização de fundos europeus. 

Fonte: alentejo.portugal2030.pt.

Assistente: Alguns dos eventos programados para o Alentejo 2030 incluem:

- Workshop – Prospetivas e Políticas Públicas (15 Dez 2025)
- Conferência e Espetáculo | “Inteligência Artificial” (27 Nov 2025)
- Concerto – “Ecoando a voz do Alentejo” (16 Nov 2025, na Vidigueira)
- Sessão de apresentação das Plataformas Regionais (12 Jun 2025)
- Como os Fundos Europeus potenciam a Inovação Social (5 Jun 2025)

Fonte: alentejo.portugal2030.pt.

Assistente: A Comissão Europeia aprovou, no dia 15 d

In [13]:
results_2 = {}
for k in [5, 10]:
    results_2[k] = evaluate_rag_semantic(documents, index, metadata, bm25, 
                                        model="gpt-4o-mini",  
                                        k=k,top_k=5, 
                                        weight_dense=0.5, 
                                        weight_sparse=0.5, 
                                        rerank=True)



Assistente: O Alentejo 2030 é um programa regional que tem como objetivo promover a competitividade da economia, a sustentabilidade ambiental e a valorização do território e das pessoas na região do Alentejo. Aprovado pela Comissão Europeia para o período de programação 2021-2027, o programa visa operacionalizar a estratégia de desenvolvimento da região e as estratégias sub-regionais das Comunidades Intermunicipais, no âmbito da Política de Coesão da União Europeia.

Se precisar de mais informações ou ajuda com outro tema, estou à disposição!

Assistente: Alguns dos eventos programados para o Alentejo 2030 incluem:

1. **Workshop – Prospetivas e Políticas Públicas** - 15 de Dezembro de 2025.
2. **Conferência e Espetáculo | “Inteligência Artificial”** - 27 de Novembro de 2025.
3. **Concerto – “Ecoando a voz do Alentejo”** - 16 de Novembro de 2025, na Vidigueira.
4. **Sessão de apresentação das Plataformas Regionais** - 12 de Junho de 2025.
5. **Como os Fundos Europeus potenciam a Inova

In [21]:
results_3 = {}
for k in [5, 10]:
    results_3[k] = evaluate_rag_semantic(documents, index, metadata, bm25, 
                                        model="gpt-4o-mini",  
                                        k=k,top_k=5, 
                                        weight_dense=0.4, 
                                        weight_sparse=0.6, 
                                        rerank=False)



Assistente: O Alentejo 2030 é um programa regional aprovado pela Comissão Europeia para o período de programação 2021-2027. O seu objetivo é promover o desenvolvimento da região do Alentejo através de investimentos em inovação, sustentabilidade e crescimento económico. O programa visa apoiar diversas áreas, contribuindo para a melhoria da qualidade de vida e a competitividade da região, através da mobilização de fundos europeus.

Se precisar de mais informações ou ajuda com outro tema, estou à disposição!

Assistente: Alguns dos eventos programados para o Alentejo 2030 incluem:

1. **Workshop – Prospetivas e Políticas Públicas** - 15 de Dezembro de 2025.
2. **Conferência e Espetáculo | “Inteligência Artificial”** - 27 de Novembro de 2025.
3. **Concerto – “Ecoando a voz do Alentejo”** - 16 de Novembro de 2025, na Vidigueira.
4. **Sessão de apresentação das Plataformas Regionais** - 12 de Junho de 2025.
5. **Como os Fundos Europeus potenciam a Inovação Social** - 5 de Junho de 2025.

Se

**Results Comparison**

In [14]:
results_1[5].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.779863,0.837757,0.491872,0.778799,0.856668,0.671429,0.880952,2.598972
std,0.094919,0.084623,0.190413,0.389276,0.107099,0.468773,0.30671,1.027622
min,0.486603,0.45383,0.059701,0.425,0.45521,0.0,0.0,1.623515
25%,0.745059,0.812163,0.361047,0.56264,0.823202,0.0,1.0,1.963115
50%,0.780513,0.852506,0.47619,0.677419,0.884364,1.0,1.0,2.248284
75%,0.845015,0.880531,0.647863,0.842105,0.916822,1.0,1.0,2.880953
max,0.907826,0.942501,0.877551,2.178571,0.959933,1.0,1.0,6.555275


In [22]:
results_3[5].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.77791,0.761203,0.422151,0.547518,0.784946,0.671429,0.7,2.385731
std,0.094534,0.072665,0.152257,0.29583,0.087397,0.468773,0.456972,0.485718
min,0.486144,0.46094,0.081301,0.265487,0.460157,0.0,0.0,1.534281
25%,0.744646,0.735717,0.322686,0.413333,0.753969,0.0,0.0,1.965801
50%,0.777766,0.776102,0.395604,0.5,0.804592,1.0,1.0,2.237435
75%,0.845094,0.795891,0.535609,0.571429,0.829653,1.0,1.0,2.71536
max,0.90816,0.905292,0.735849,2.103448,0.92052,1.0,1.0,3.334891


In [16]:
results_1[10].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.779582,0.832915,0.494076,0.806518,0.849237,0.671429,0.871429,2.360991
std,0.094285,0.087373,0.21079,0.471799,0.116716,0.468773,0.328608,1.247293
min,0.486723,0.44397,0.111111,0.425,0.433559,0.0,0.0,1.433127
25%,0.752425,0.804595,0.340718,0.586016,0.810477,0.0,1.0,1.957963
50%,0.780532,0.850129,0.467532,0.693548,0.874407,1.0,1.0,2.137947
75%,0.845071,0.882429,0.674159,0.847319,0.923311,1.0,1.0,2.35255
max,0.910047,0.942134,0.916667,3.05,0.964728,1.0,1.0,9.125016


In [20]:
results_3[10].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.781143,0.765255,0.401791,0.52858,0.78426,0.671429,0.7,2.413206
std,0.094558,0.073652,0.153566,0.317702,0.096619,0.468773,0.456972,0.57227
min,0.48621,0.460938,0.098361,0.252101,0.43549,0.0,0.0,1.438702
25%,0.751766,0.736603,0.304362,0.396896,0.751269,0.0,0.0,2.038007
50%,0.792334,0.774692,0.394161,0.452174,0.811746,1.0,1.0,2.349327
75%,0.84479,0.811717,0.510979,0.557551,0.837001,1.0,1.0,2.681686
max,0.908122,0.90532,0.735849,2.103448,0.919313,1.0,1.0,3.653453


In [11]:
results_1[15].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.775133,0.819762,0.45605,0.653927,0.831266,0.642857,0.795238,2.436645
std,0.097962,0.086241,0.171538,0.307099,0.113956,0.478531,0.39209,0.48405
min,0.486634,0.455966,0.078947,0.361702,0.466747,0.0,0.0,1.632949
25%,0.743929,0.786691,0.342216,0.507087,0.792915,0.0,1.0,2.048267
50%,0.780114,0.824143,0.424242,0.603175,0.862946,1.0,1.0,2.354473
75%,0.84553,0.87678,0.593594,0.677778,0.90807,1.0,1.0,2.711784
max,0.908114,0.94147,0.772277,2.103448,0.958973,1.0,1.0,3.49986


In [23]:
results_1[20].describe().loc["mean"]

Retrieval Success (semantic)    0.799489
Grounding (semantic)            0.819193
F1                              0.405858
Conciseness                     0.526603
Semantic Similarity             0.839202
Latency (s)                     2.204843
Name: mean, dtype: float64

In [24]:
results_2[20].describe().loc["mean"]

Retrieval Success (semantic)    0.797273
Grounding (semantic)            0.811219
F1                              0.397088
Conciseness                     0.486178
Semantic Similarity             0.819887
Latency (s)                     2.322734
Name: mean, dtype: float64

In [25]:
results_3[20].describe().loc["mean"]

Retrieval Success (semantic)    0.759946
Grounding (semantic)            0.805556
F1                              0.387738
Conciseness                     0.561103
Semantic Similarity             0.798391
Latency (s)                     2.018761
Name: mean, dtype: float64

In [26]:
results_4[20].describe().loc["mean"]

Retrieval Success (semantic)    0.759969
Grounding (semantic)            0.807498
F1                              0.381082
Conciseness                     0.550583
Semantic Similarity             0.796183
Latency (s)                     2.056838
Name: mean, dtype: float64

In [11]:
results[10][results[10]['F1'] < 0.2]

Unnamed: 0,Question,Reference Answer,Source,Generated Answer,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,Latency (s)
1,Quais são alguns dos eventos programados para ...,Alguns dos eventos programados incluem um work...,alentejo2030,Um dos eventos destacados para o Alentejo 2030...,0.616848,0.883755,0.190476,0.779661,0.599146,2.872252
27,Quais foram as atualizações principais do Avis...,As atualizações principais do Aviso MPr-2025-1...,lisboa2030,"O Aviso MPr-2025-14, que trata da Internaciona...",0.619705,0.817739,0.144144,0.881356,0.633559,1.859997
32,Quais são os principais eventos relacionados a...,Um dos principais eventos é a Mostra dos Fundo...,portugal2030,Os principais eventos relacionados ao Portugal...,0.422468,0.789208,0.15534,0.430556,0.519059,1.769419


In [9]:
results[10].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.781333,0.813265,0.384332,0.549461,0.800557,2.519529
std,0.131128,0.060378,0.153616,0.190794,0.109727,1.152649
min,0.422468,0.693576,0.144144,0.225564,0.519059,1.357077
25%,0.699726,0.775607,0.265968,0.432259,0.755421,1.958232
50%,0.795818,0.817739,0.372549,0.522388,0.825233,2.380162
75%,0.888722,0.866697,0.457329,0.697826,0.89028,2.712718
max,0.979312,0.940852,0.764045,0.93617,0.942435,8.395903


In [22]:
results[10].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.791556,0.816152,0.387394,0.503692,0.825551,2.12745
std,0.124246,0.060284,0.151614,0.191956,0.092821,0.632687
min,0.472912,0.71931,0.1,0.223022,0.59162,1.216619
25%,0.719583,0.765352,0.279165,0.376769,0.790033,1.712345
50%,0.797164,0.806561,0.369748,0.46087,0.837484,1.971969
75%,0.88847,0.867891,0.496295,0.570232,0.894935,2.372237
max,0.979312,0.95101,0.666667,1.0,0.937505,4.114343


In [13]:
small_k_10.describe().loc["mean"]

Retrieval Success (semantic)    0.733697
Grounding (semantic)            0.816320
F1                              0.474633
Conciseness                     0.861939
Semantic Similarity             0.786850
Latency (s)                     1.784377
Name: mean, dtype: float64

In [14]:
small_k_10_rerank.describe().loc["mean"]

Retrieval Success (semantic)    0.733699
Grounding (semantic)            0.813433
F1                              0.467515
Conciseness                     0.853704
Semantic Similarity             0.784782
Latency (s)                     1.548932
Name: mean, dtype: float64

In [36]:
small_k_5_rerank.describe().to_csv(f'evaluation/small_k_5_rerank.csv')

In [20]:
pd.set_option('display.max_colwidth', None)

## Bot-Based

In [54]:
def eval_chat(question, expected_answer, actual_tuple):
    """
    Returns a similarity score 0-10
    """
    actual_answer, retrieved_docs = actual_tuple

    # Embedding-based similarity with the reference
    semantic_sim = semantic_similarity_score(actual_answer, [expected_answer])

    # Scale from 0-1 → 0-10
    score = int(round(semantic_sim * 10))
    return score


In [71]:
from tqdm import tqdm
import time
import pandas as pd

def bot_evaluation(dataset, index, metadata, k=5, model="gpt-4o-mini"):
    results = []

    for idx, item in enumerate(tqdm(dataset, desc="Evaluating RAG")):
        question = item["question"]
        expected_answer = item["answer"]
        source = item.get("source", "unknown")

        # --- Generate answer ---
        start_time = time.time()
        generated_answer, retrieved_docs = chatbot.answer(
            question,
            index,
            metadata,
            k=k,
            model=model
        )
        latency = time.time() - start_time

        if isinstance(generated_answer, tuple):
            generated_answer = generated_answer[0]

        # --- Compute BPT score (0-10) ---
        # You can include grounding if you want
        semantic_sim = semantic_similarity_score(generated_answer, [expected_answer])
        grounding = grounding_score_semantic(generated_answer, retrieved_docs)
        # Weighted combination (optional)
        bpt_score = int(round(0.7 * semantic_sim * 10 + 0.3 * grounding * 10))

        results.append({
            "Question_ID": idx,
            "Source": source,
            "Question": question,
            "Expected Answer": expected_answer,
            "Generated Answer": generated_answer,
            "BPT Score": bpt_score,
            "Response Time (s)": latency
        })

    return pd.DataFrame(results)


In [72]:
results = bot_evaluation(documents, index, metadata)

Evaluating RAG:   0%|                                    | 0/30 [00:00<?, ?it/s]


Assistente: O Alentejo 2030 é um programa regional aprovado pela Comissão Europeia para o período de 2021-2027, que visa promover a inovação, a sustentabilidade e o crescimento da região do Alentejo. Através deste programa, a região dispõe de uma dotação global significativa de fundos europeus, destinados a apoiar diversas áreas e iniciativas que contribuam para o desenvolvimento regional. (Fontes: alentejo2030, portugal2030)


Evaluating RAG:   3%|▉                           | 1/30 [00:09<04:33,  9.44s/it]


Assistente: O documento não especifica eventos concretos programados para o Alentejo 2030. No entanto, menciona que haverá um evento que celebra projetos transformadores em Portugal, incluindo iniciativas do Alentejo 2030, com debates, apresentações e a cerimónia de entrega dos Prémios dos Fundos Europeus. Para informações mais detalhadas sobre eventos específicos, recomendo consultar o site oficial do Alentejo 2030. (Fontes: alentejo2030, portugal2030)


Evaluating RAG:   7%|█▊                          | 2/30 [00:15<03:33,  7.62s/it]


Assistente: A reprogramação do Alentejo 2030 foi aprovada pela Comissão Europeia no dia 15 de dezembro de 2025. (Fontes: alentejo2030, portugal2030)


Evaluating RAG:  10%|██▊                         | 3/30 [00:20<02:54,  6.48s/it]


Assistente: Algumas das novas prioridades específicas integradas no Alentejo 2030 incluem:

1. **Habitação acessível** - Promovendo a fixação populacional e a justiça social.
2. **Gestão e eficiência da água** - Reforçando a sustentabilidade e resiliência do território.

Estas prioridades visam fortalecer a resposta da região a desafios económicos, sociais, ambientais e territoriais, contribuindo para um desenvolvimento mais sustentável e inclusivo. (Fontes: alentejo2030)


Evaluating RAG:  13%|███▋                        | 4/30 [00:30<03:17,  7.61s/it]


Assistente: O objetivo da reprogramação do Alentejo 2030 é fortalecer a resposta da região a desafios económicos, sociais, ambientais e territoriais atuais e futuros, contribuindo para um desenvolvimento mais sustentável, inclusivo e resiliente. A reprogramação também visa alinhar os fundos europeus com novas prioridades estratégicas e desafios emergentes da região. (Fontes: alentejo2030, portugal2030)


Evaluating RAG:  17%|████▋                       | 5/30 [00:37<03:03,  7.35s/it]


Assistente: O objetivo principal do Programa Algarve 2030 é promover a competitividade e diversificação da economia da região, assim como a sustentabilidade ambiental, valorizando o território e as pessoas, com foco na melhoria da qualidade de vida. O programa dispõe de 780,3 milhões de euros de fundos europeus para financiar investimentos que contribuam para esses objetivos. (Fontes: algarve2030, portugal2030)


Evaluating RAG:  20%|█████▌                      | 6/30 [00:46<03:15,  8.14s/it]


Assistente: Até 28 de novembro de 2025, foram recebidas 25 candidaturas para o ciclo urbano da água, totalizando um investimento superior a 100 milhões de euros. (Fontes: portugal2030, algarve2030)


Evaluating RAG:  23%|██████▌                     | 7/30 [00:55<03:13,  8.43s/it]


Assistente: O valor total do investimento das candidaturas relacionadas ao ciclo urbano da água é superior a 100 milhões de euros. (Fontes: portugal2030, algarve2030)


Evaluating RAG:  27%|███████▍                    | 8/30 [01:01<02:48,  7.67s/it]


Assistente: Algumas das intervenções estratégicas previstas no Programa Algarve 2030 incluem:

1. **Promoção da competitividade das empresas** - Através de apoio à inovação e digitalização.
2. **Sustentabilidade ambiental** - Focando na gestão eficiente dos recursos naturais.
3. **Valorização do território** - Incentivando o desenvolvimento urbano sustentável e a reabilitação de áreas urbanas.
4. **Qualidade de vida** - Melhorando os serviços públicos e a acessibilidade.

Estas intervenções visam contribuir para um desenvolvimento equilibrado e sustentável da região do Algarve. (Fontes: algarve2030, portugal2030)


Evaluating RAG:  30%|████████▍                   | 9/30 [01:09<02:41,  7.67s/it]


Assistente: A dotação de fundos europeus para a área da água no Programa Regional Algarve 2030 é de 66 milhões de euros. (Fontes: algarve2030)


Evaluating RAG:  33%|█████████                  | 10/30 [01:18<02:40,  8.04s/it]


Assistente: O objetivo principal do Programa Centro 2030 é promover a competitividade da economia, a sustentabilidade ambiental e a valorização do território e das pessoas na região Centro de Portugal, no âmbito da Política de Coesão da União Europeia. (Fontes: centro2030)


Evaluating RAG:  37%|█████████▉                 | 11/30 [01:24<02:21,  7.46s/it]


Assistente: A Comissão Europeia aprovou a reprogramação do Programa Regional do Centro 2021-2027 (CENTRO 2030), que inclui um alargamento do financiamento para habitação social e acessível. Esta reprogramação permite também adaptar o programa às exigências da regulamentação europeia e alinhar-se com novas prioridades da UE. (Fontes: centro2030)


Evaluating RAG:  40%|██████████▊                | 12/30 [01:30<02:07,  7.10s/it]


Assistente: O valor do financiamento destinado à habitação no âmbito da reprogramação do CENTRO 2030 é de quase 200 milhões de euros. Este investimento visa ampliar o parque público de habitação, promovendo a renovação de edifícios devolutos ou vagos. (Fontes: centro2030)


Evaluating RAG:  43%|███████████▋               | 13/30 [01:36<01:51,  6.57s/it]


Assistente: O Programa Centro 2030 combate a fraude nos fundos comunitários através de várias iniciativas, incluindo:

1. **Estratégia Antifraude** - Estabelece um compromisso em prevenir, detetar, corrigir e reportar práticas fraudulentas, reforçando a integridade e transparência.
2. **Plano de Formação** - Capacita as equipas na prevenção e deteção de fraude, através de ações específicas de formação.
3. **Declaração de Política Antifraude** - Reafirma o compromisso da Autoridade de Gestão no combate à fraude, corrupção, conflito de interesses e duplo financiamento.
4. **Manual de Avaliação dos Riscos de Gestão e de Fraude** - Fortalece as capacidades de prevenção e deteção de irregularidades.

Essas medidas visam garantir a correta utilização dos fundos comunitários e a proteção contra fraudes. (Fontes: centro2030)


Evaluating RAG:  47%|████████████▌              | 14/30 [01:47<02:07,  7.95s/it]


Assistente: Algumas das áreas de intervenção do Programa Centro 2030 incluem:

1. **Competitividade da Economia** - Fomento à inovação e à digitalização das empresas.
2. **Sustentabilidade Ambiental** - Promoção de práticas sustentáveis e proteção dos recursos naturais.
3. **Valorização do Território** - Desenvolvimento de infraestruturas e serviços que melhorem a qualidade de vida das populações.
4. **Coesão Social** - Apoio a iniciativas que promovam a inclusão social e a igualdade de oportunidades.
5. **Habitação** - Investimentos em habitação social e acessível.

Essas áreas visam responder aos desafios sociais, digitais e climáticos da região. (Fontes: centro2030)


Evaluating RAG:  50%|█████████████▌             | 15/30 [01:57<02:10,  8.70s/it]


Assistente: O objetivo principal do programa COMPETE 2030 é apoiar a competitividade, sustentabilidade e resiliência das empresas portuguesas no mercado global. O programa visa impulsionar investimentos em inovação e tecnologia, promovendo a modernização das empresas e a atração de jovens e clientes através da utilização de tecnologia avançada. (Fontes: compete2030)


Evaluating RAG:  53%|██████████████▍            | 16/30 [02:04<01:52,  8.04s/it]


Assistente: Os três pilares do programa COMPETE 2030 são:

1. **Inovação** - Fomento à inovação nas empresas para aumentar a sua competitividade.
2. **Sustentabilidade** - Promoção de práticas sustentáveis que contribuam para a preservação ambiental.
3. **Digitalização** - Apoio à transformação digital das empresas, facilitando a sua adaptação às novas exigências do mercado.

Esses pilares visam fortalecer o tecido empresarial nacional e promover um desenvolvimento económico mais robusto. (Fontes: compete2030)


Evaluating RAG:  57%|███████████████▎           | 17/30 [02:14<01:53,  8.72s/it]


Assistente: O programa COMPETE 2030 pretende apoiar as PME através de várias iniciativas, incluindo:

1. **Financiamento** - Disponibilização de fundos para projetos de inovação, digitalização e sustentabilidade.
2. **Internacionalização** - Apoio à promoção da internacionalização das PME, facilitando o acesso a mercados externos.
3. **Capacitação** - Oferecimento de formação e recursos para melhorar as competências das empresas em áreas como gestão, marketing e tecnologia.
4. **Programas Específicos** - Lançamento de avisos e concursos direcionados a micro, pequenas e médias empresas, como o Aviso MPr-2024-1, que destina 2,8 milhões de euros para a propriedade intelectual e industrial.

Essas medidas visam fortalecer a competitividade e a resiliência das PME no mercado. (Fontes: compete2030)


Evaluating RAG:  60%|████████████████▏          | 18/30 [02:23<01:44,  8.75s/it]


Assistente: O canal +Transparente é um canal seguro destinado à submissão de denúncias relacionadas a irregularidades que devem ser analisadas pela organização responsável. Este canal pode ser utilizado por qualquer pessoa, mesmo que não tenha uma relação direta com a organização, para comunicar situações que considerem relevantes. (Fontes: compete2030, portugal2030)


Evaluating RAG:  63%|█████████████████          | 19/30 [02:30<01:30,  8.18s/it]


Assistente: A apresentação da Rede de Fornecedores Inovadores está agendada para o dia 29 de Abril de 2025. (Fontes: compete2030)


Evaluating RAG:  67%|██████████████████         | 20/30 [02:35<01:13,  7.36s/it]


Assistente: O StartUP Visa é um programa que visa atrair empreendedores estrangeiros para Portugal, oferecendo um visto que permite a criação e desenvolvimento de startups no país. O programa tem como objetivo fomentar a inovação e o empreendedorismo, facilitando a entrada de talentos internacionais que queiram estabelecer negócios em Portugal. Para mais informações, recomendo visitar o site oficial do programa.


Evaluating RAG:  70%|██████████████████▉        | 21/30 [02:39<00:56,  6.31s/it]


Assistente: Os tipos de certificação mencionados para PME incluem:

1. **Certificação PME** - Que comprova a dimensão da empresa como micro, pequena ou média.
2. **Certificações externas** - Como B Corp, EcoVadis e Sedex, que visam qualificar as práticas de gestão sustentável e ética das empresas.

Essas certificações ajudam as PME a melhorar a sua competitividade e a acessar novos mercados. (Fontes: iapmei)


Evaluating RAG:  73%|███████████████████▊       | 22/30 [02:48<00:56,  7.03s/it]


Assistente: Algumas das oportunidades de formação disponíveis incluem:

1. **Cursos Técnicos Superiores Profissionais (TeSP)** - Formação especializada em diversas áreas.
2. **Formações Modulares Certificadas** - Cursos que permitem a certificação em competências específicas.
3. **Formação de Profissionais do Setor da Saúde** - Programas direcionados a profissionais desta área.
4. **Cursos de Educação e Formação de Jovens (CEF)** - Destinados a jovens em processo de qualificação.
5. **Programas de Inserção Socioprofissional** - Ações que visam a integração no mercado de trabalho.

Essas formações são parte das iniciativas do PT2030 para promover a qualificação profissional e a inclusão social. (Fontes: portugal2030)


Evaluating RAG:  77%|████████████████████▋      | 23/30 [02:56<00:50,  7.29s/it]


Assistente: O objetivo do Mecanismo de Alerta Precoce (MAP) é implementar instrumentos que contribuam para a realização de processos de reestruturação empresarial mais eficazes. O MAP visa facilitar a revitalização empresarial através de alertas precoces, permitindo que as empresas identifiquem e abordem problemas financeiros antes que se tornem críticos. (Fontes: iapmei)


Evaluating RAG:  80%|█████████████████████▌     | 24/30 [03:01<00:40,  6.79s/it]


Assistente: As empresas podem se beneficiar do apoio empresarial e formação através de várias iniciativas, incluindo:

1. **Apoio ao Desenvolvimento de Produtos e Serviços** - Empresas inovadoras podem receber apoio financeiro para desenvolver novos produtos e serviços que estimulem o crescimento económico.

2. **Conteúdos Formativos** - O IAPMEI disponibiliza conteúdos formativos que ajudam as empresas a acessar programas de incentivos e a gerir as suas obrigações enquanto promotores.

3. **Consultoria e Formação** - Programas como o COMPETE 2020 oferecem ações de consultoria e formação, dotando as empresas de ferramentas para enfrentar desafios de mercado e melhorar a sua organização.

Essas iniciativas visam fortalecer a capacidade das empresas, promovendo a inovação e a competitividade. (Fontes: iapmei, compete2030)


Evaluating RAG:  83%|██████████████████████▌    | 25/30 [03:09<00:36,  7.21s/it]


Assistente: O Portugal 2030 é um plano estratégico que visa o desenvolvimento económico, social e territorial de Portugal até 2030. Aprovado pela Resolução do Conselho de Ministros n.º 98/2020, de 13 de novembro, o plano é estruturado em torno de quatro agendas temáticas centrais, que orientam as prioridades e programas para o país. O objetivo é promover um crescimento sustentável e inclusivo, articulando diferentes áreas de intervenção. (Fontes: portugal2030)


Evaluating RAG:  87%|███████████████████████▍   | 26/30 [03:18<00:30,  7.58s/it]


Assistente: Até dezembro de 2025, já foram pagos mais de 3,3 mil milhões de euros (M€) aos beneficiários do Portugal 2030, representando 30,4% do fundo aprovado. (Fontes: portugal2030)


Evaluating RAG:  90%|████████████████████████▎  | 27/30 [03:23<00:20,  6.91s/it]


Assistente: Os vencedores dos Prémios dos Fundos Europeus foram anunciados no dia 5 de dezembro de 2025, durante a 2ª edição da Mostra. (Fontes: portugal2030, centro2030)


Evaluating RAG:  93%|█████████████████████████▏ | 28/30 [03:29<00:12,  6.44s/it]


Assistente: O objetivo do projeto CustomNiTi é desenvolver placas e distratores ósseos personalizados que melhoram a eficiência e o conforto no tratamento de fraturas ósseas. Este projeto, cofinanciado pelo Programa COMPETE 2030, visa inovar o setor de dispositivos médicos, proporcionando soluções clínicas eficazes e económicas. (Fontes: portugal2030)


Evaluating RAG:  97%|██████████████████████████ | 29/30 [03:35<00:06,  6.30s/it]


Assistente: Você pode entrar em contato com a Linha dos Fundos para esclarecer dúvidas sobre o Portugal 2030 através dos seguintes meios:

- **Telefone**: (+351) 289 895 232/37 (custo gratuito para chamadas de Portugal)
- **E-mail**: linhadosfundos@linhadosfundos.pt

A Linha dos Fundos está disponível todos os dias úteis, entre as 9h e as 18h. (Fontes: portugal2030)


Evaluating RAG: 100%|███████████████████████████| 30/30 [03:41<00:00,  7.37s/it]


In [73]:
results.describe()

Unnamed: 0,Question_ID,BPT Score,Response Time (s)
count,30.0,30.0,30.0
mean,14.5,5.866667,4.013028
std,8.803408,0.899553,1.232095
min,0.0,4.0,2.09722
25%,7.25,5.25,3.123637
50%,14.5,6.0,3.726955
75%,21.75,6.0,4.770928
max,29.0,7.0,6.72383


In [75]:
results[results['BPT Score'] < 6]

Unnamed: 0,Question_ID,Source,Question,Expected Answer,Generated Answer,BPT Score,Response Time (s)
1,1,alentejo2030,Quais são alguns dos eventos programados para o Alentejo 2030?,Alguns eventos programados incluem um workshop sobre Prospetivas e Políticas Públicas em 15 de dezembro de 2025 e uma conferência sobre Inteligência Artificial em 27 de novembro de 2025.,"O documento não especifica eventos concretos programados para o Alentejo 2030. No entanto, menciona que haverá um evento que celebra projetos transformadores em Portugal, incluindo iniciativas do Alentejo 2030, com debates, apresentações e a cerimónia de entrega dos Prémios dos Fundos Europeus. Para informações mais detalhadas sobre eventos específicos, recomendo consultar o site oficial do Alentejo 2030. (Fontes: alentejo2030, portugal2030)",4,3.890048
3,3,alentejo2030,Quais são algumas das novas prioridades específicas integradas no Alentejo 2030?,"As novas prioridades incluem a Defesa, Água, Habitação a preços acessíveis e sustentável, e Competências para a descarbonização.","Algumas das novas prioridades específicas integradas no Alentejo 2030 incluem:\n\n1. **Habitação acessível** - Promovendo a fixação populacional e a justiça social.\n2. **Gestão e eficiência da água** - Reforçando a sustentabilidade e resiliência do território.\n\nEstas prioridades visam fortalecer a resposta da região a desafios económicos, sociais, ambientais e territoriais, contribuindo para um desenvolvimento mais sustentável e inclusivo. (Fontes: alentejo2030)",5,4.053267
6,6,algarve2030,Quantas candidaturas foram recebidas até 28 de novembro de 2025 para o ciclo urbano da água?,Foram recebidas 25 candidaturas de Municípios e entidades gestoras do ciclo urbano da água.,"Até 28 de novembro de 2025, foram recebidas 25 candidaturas para o ciclo urbano da água, totalizando um investimento superior a 100 milhões de euros. (Fontes: portugal2030, algarve2030)",5,3.032607
7,7,algarve2030,Qual é o valor total do investimento das candidaturas relacionadas ao ciclo urbano da água?,O investimento total das candidaturas é de mais de 100 milhões de euros.,"O valor total do investimento das candidaturas relacionadas ao ciclo urbano da água é superior a 100 milhões de euros. (Fontes: portugal2030, algarve2030)",5,2.351102
8,8,algarve2030,Quais são algumas das intervenções estratégicas previstas no Programa Algarve 2030?,"As intervenções incluem a redução de perdas nas redes urbanas de água, reabilitação de infraestruturas obsoletas, prevenção e mitigação da intrusão salina, e reutilização de águas residuais tratadas.","Algumas das intervenções estratégicas previstas no Programa Algarve 2030 incluem:\n\n1. **Promoção da competitividade das empresas** - Através de apoio à inovação e digitalização.\n2. **Sustentabilidade ambiental** - Focando na gestão eficiente dos recursos naturais.\n3. **Valorização do território** - Incentivando o desenvolvimento urbano sustentável e a reabilitação de áreas urbanas.\n4. **Qualidade de vida** - Melhorando os serviços públicos e a acessibilidade.\n\nEstas intervenções visam contribuir para um desenvolvimento equilibrado e sustentável da região do Algarve. (Fontes: algarve2030, portugal2030)",4,5.081694
12,12,centro2030,Qual é o valor do financiamento destinado à habitação no âmbito da reprogramação do CENTRO 2030?,O financiamento destinado à habitação (social e a preços acessíveis) é de quase 200 milhões de euros.,"O valor do financiamento destinado à habitação no âmbito da reprogramação do CENTRO 2030 é de quase 200 milhões de euros. Este investimento visa ampliar o parque público de habitação, promovendo a renovação de edifícios devolutos ou vagos. (Fontes: centro2030)",5,3.17532
14,14,centro2030,Quais são algumas das áreas de intervenção do Programa Centro 2030?,"As áreas de intervenção incluem habitação, tecnologias críticas, defesa e segurança, além de garantir a aplicação eficaz e transparente dos fundos europeus.","Algumas das áreas de intervenção do Programa Centro 2030 incluem:\n\n1. **Competitividade da Economia** - Fomento à inovação e à digitalização das empresas.\n2. **Sustentabilidade Ambiental** - Promoção de práticas sustentáveis e proteção dos recursos naturais.\n3. **Valorização do Território** - Desenvolvimento de infraestruturas e serviços que melhorem a qualidade de vida das populações.\n4. **Coesão Social** - Apoio a iniciativas que promovam a inclusão social e a igualdade de oportunidades.\n5. **Habitação** - Investimentos em habitação social e acessível.\n\nEssas áreas visam responder aos desafios sociais, digitais e climáticos da região. (Fontes: centro2030)",4,5.733683
22,22,iapmei,Quais são algumas das oportunidades de formação disponíveis?,"Algumas oportunidades de formação disponíveis incluem workshops sobre inovação e qualificação, recrutamento como estratégia nas PME, e webinars sobre ESG e governança.",Algumas das oportunidades de formação disponíveis incluem:\n\n1. **Cursos Técnicos Superiores Profissionais (TeSP)** - Formação especializada em diversas áreas.\n2. **Formações Modulares Certificadas** - Cursos que permitem a certificação em competências específicas.\n3. **Formação de Profissionais do Setor da Saúde** - Programas direcionados a profissionais desta área.\n4. **Cursos de Educação e Formação de Jovens (CEF)** - Destinados a jovens em processo de qualificação.\n5. **Programas de Inserção Socioprofissional** - Ações que visam a integração no mercado de trabalho.\n\nEssas formações são parte das iniciativas do PT2030 para promover a qualificação profissional e a inclusão social. (Fontes: portugal2030),5,4.77748


You can explicitly say:

Increasing k:

↑ Recall

↓ Precision

↑ Groundedness (usually)

Better chunking:

↑ Precision

↑ Groundedness

Larger chunks:

↑ Recall

↓ Precision

These trade-offs show deep understanding.