## Libraries

In [1]:
import chatbot
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import json
from dotenv import load_dotenv
from openai import OpenAI
from collections import Counter
from sklearn.metrics.pairwise import cosine_similarity
import pandas as pd
import time

load_dotenv()
client = OpenAI()

**Load index and metadata**

In [2]:
chatbot.set_vector_dir("data/05_vectorized/large/c400_40")
index, metadata = chatbot.load_faiss_index(chatbot.VECTOR_DIR)
bm25=chatbot.build_bm25(metadata)
print(f"Index and metadata loaded at {chatbot.VECTOR_DIR}")

Index and metadata loaded at data/05_vectorized/large/c400_40


**Loading Evaluation Dataset**

In [6]:
with open("evaluation/evaluation_dataset_v2.json", "r", encoding="utf-8") as f:
    data = json.load(f)

def json_to_documents(data: dict):
    documents = []

    for source, content in data.items():
        qa_list = content.get("perguntas_respostas", [])

        for item in qa_list:
            documents.append({
                "question": item.get("pergunta", ""),
                "answer": item.get("resposta", ""),
                "source": source
            })

    return documents

eval_dataset = json_to_documents(data)

**Chatbot Responses**

In [7]:
from tqdm import tqdm

def populate_eval_dataset(eval_dataset, index, metadata, bm25, 
                          model="gpt-4o-mini", k=20, top_k=5, 
                          weight_dense=0.6, weight_sparse=0.4, rerank=False):
    """
    Fill the 'answer' and 'contexts' fields in the evaluation dataset
    by calling your bot function.

    Args:
        eval_dataset (list of dicts): each dict must have 'question' and optionally 'source'
        index, metadata, bm25: your RAG components
        model, k, top_k, weight_dense, weight_sparse, rerank: bot settings

    Returns:
        list of dicts: same dataset with 'answer' and 'contexts' populated
    """
    updated_dataset = []

    for sample in tqdm(eval_dataset, desc="Generating bot answers"):
        question = sample["question"]
        # Optional: use sample['source'] if needed by retriever
        source = sample.get("source", "")

        # Call your existing bot
        generated_answer, context_chunks = chatbot.answer(
            user_query=question,
            index=index,
            metadata=metadata,
            bm25=bm25,
            model=model,
            k=k,
            top_k=top_k,
            weight_dense=weight_dense,
            weight_sparse=weight_sparse,
            rerank=rerank
        )

        # Save results back into sample
        sample["bot_answer"] = generated_answer
        sample["contexts"] = [c["content"] for c in context_chunks]

        updated_dataset.append(sample)

    return updated_dataset


In [8]:
eval_dataset_filled_c400_40 = populate_eval_dataset(
    eval_dataset, index, metadata, bm25,
    model="gpt-4o-mini",
    k=10,
    top_k=10,
    weight_dense=0.5,
    weight_sparse=0.5,
    rerank=False
)


Generating bot answers:   3%|▌                   | 1/35 [00:04<02:43,  4.82s/it]


Assistente: O Alentejo 2030 é um programa regional aprovado pela Comissão Europeia para o período de programação 2021-2027, que visa promover a competitividade da economia, a sustentabilidade ambiental e a valorização do território e das pessoas na região do Alentejo. Este programa tem como objetivo operacionalizar a estratégia de desenvolvimento da região e as estratégias sub-regionais das Comunidades Intermunicipais. O Alentejo 2030 também se propõe a transformar vidas, impulsionando a inovação e o crescimento na região, através da disponibilização de fundos europeus. 

A sua implementação resulta de um processo iniciado em 2018, que incluiu a elaboração de um Contributo Estratégico Regional e a definição de uma visão estratégica com seis objetivos para enfrentar desafios como o constrangimento demográfico. 

Fonte: alentejo.portugal2030.pt.


Generating bot answers:   6%|█▏                  | 2/35 [00:09<02:32,  4.63s/it]


Assistente: Alguns dos eventos programados para o Alentejo 2030 incluem:

1. **Workshop – Prospetivas e Políticas Públicas** - 15 de dezembro de 2025.
2. **Conferência e Espetáculo | “Inteligência Artificial”** - 27 de novembro de 2025.
3. **Concerto – “Ecoando a voz do Alentejo”** - 16 de novembro de 2025, na Vidigueira.
4. **Como os Fundos Europeus potenciam a Inovação Social** - 5 de junho de 2025.
5. **Sessão de apresentação das Plataformas Regionais** - 12 de junho de 2025, integrada na Estratégia de Desenvolvimento Regional EREI 2030.

Esses eventos visam promover a reflexão e o desenvolvimento em diversas áreas, como inovação social e políticas públicas. 

Fonte: alentejo.portugal2030.pt.


Generating bot answers:   9%|█▋                  | 3/35 [00:12<02:14,  4.20s/it]


Assistente: A Comissão Europeia aprovou, no dia 15 de dezembro de 2025, a reprogramação do Programa Regional do Alentejo 2030. Esta decisão formalizou o resultado da revisão intercalar do programa, permitindo alinhar os fundos europeus com novas prioridades estratégicas e desafios emergentes da região. A reprogramação integra novas prioridades específicas, financiadas maioritariamente pelo FEDER, FSE+ e Fundo para uma Transição Justa (FTJ), e visa reforçar a resposta da região a desafios económicos, sociais, ambientais e territoriais, promovendo um desenvolvimento mais sustentável, inclusivo e resiliente.

Além disso, as despesas que se tornaram elegíveis em resultado desta reprogramação são consideradas elegíveis a partir de 27 de outubro de 2025.

Fonte: alentejo.portugal2030.pt.


Generating bot answers:  11%|██▎                 | 4/35 [00:17<02:18,  4.48s/it]


Assistente: A reprogramação do Alentejo 2030 introduziu várias novas prioridades, incluindo:

1. **Defesa** - Reforço das capacidades industriais, com foco em tecnologias de dupla utilização.
2. **Água** - Promoção do acesso seguro à água, gestão sustentável e resiliência hídrica.
3. **Habitação Acessível** - Reforço do acesso à habitação, tanto em contextos urbanos como territoriais integrados.
4. **Competências para a Descarbonização** - Investimento em educação, formação e qualificação orientadas para a transição climática.

Além dessas, a reprogramação também permite reforçar investimentos em áreas como:

- Investigação, inovação e adoção de tecnologias avançadas.
- Digitalização de cidadãos, empresas e administração pública.
- Eficiência energética, economia circular e mobilidade urbana sustentável.
- Educação, formação ao longo da vida, saúde, inclusão social e cultura.
- Assistência técnica para melhorar a capacidade de execução do programa.

Essas alterações visam acelerar pro

Generating bot answers:  14%|██▊                 | 5/35 [00:22<02:19,  4.64s/it]


Assistente: A reprogramação do Alentejo 2030 impacta o apoio ao emprego e à formação de várias maneiras:

1. **Maior Flexibilidade** - Introduz maior flexibilidade no apoio ao emprego e à formação, permitindo uma adaptação mais eficaz às necessidades do mercado de trabalho.

2. **Financiamento de Equipamentos de Formação** - A reprogramação inclui a possibilidade de financiar equipamentos de formação, o que pode melhorar a qualidade e a eficácia das ações formativas.

3. **Nova Prioridade para Habitação Acessível** - A criação de uma nova prioridade dedicada à habitação acessível e sustentável nos territórios abrangidos pelo Fundo para uma Transição Justa (FTJ) reforça a dimensão social da transição justa, o que pode ter um impacto positivo na estabilidade e na empregabilidade das populações.

Essas medidas visam facilitar a reconversão e a reintegração profissional, respondendo às novas exigências do mercado de trabalho, especialmente no contexto da transição para uma economia mais s

Generating bot answers:  17%|███▍                | 6/35 [00:25<01:58,  4.09s/it]


Assistente: O objetivo principal do Programa Algarve 2030 é promover a competitividade e diversificação da economia da região do Algarve, assim como a sustentabilidade regional. O programa visa valorizar o território e as pessoas, incorporando conhecimento e inovação na valorização dos recursos endógenos, preservando a identidade territorial e qualificando as estruturas físicas e serviços de interesse geral. Além disso, busca capacitar os agentes de transformação do território, incluindo recursos humanos, empresas e instituições públicas e associativas, sempre centrado nas comunidades.

Fonte: algarve.portugal2030.pt.


Generating bot answers:  20%|████                | 7/35 [00:30<01:58,  4.24s/it]


Assistente: Algumas das iniciativas relacionadas ao ciclo urbano da água mencionadas no texto incluem:

1. **Redução de Perdas nas Redes Urbanas de Água** - Implementação de medidas para minimizar as perdas de água nas infraestruturas existentes.
2. **Reabilitação de Infraestruturas Obsoletas** - Atualização e modernização das infraestruturas de abastecimento e saneamento.
3. **Prevenção e Mitigação da Intrusão Salina** - Ações para evitar a contaminação das fontes de água doce por água salgada.
4. **Reutilização de Águas Residuais Tratadas** - Utilização de águas tratadas para fins não potáveis, como a rega de espaços verdes.
5. **Expansão e Modernização das Redes de Saneamento** - Melhoria das redes de saneamento para garantir um serviço mais eficiente.
6. **Monitorização Inteligente dos Recursos Hídricos** - Implementação de tecnologias para monitorar e gerir os recursos hídricos de forma mais eficaz.

Essas iniciativas visam aumentar a eficiência hídrica e promover a sustentabilid

Generating bot answers:  23%|████▌               | 8/35 [00:32<01:36,  3.57s/it]


Assistente: Os Municípios do Algarve e a empresa Águas do Algarve candidataram mais de 100 milhões de euros a fundos estruturais de coesão geridos pelo Programa Regional Algarve 2030.

Fontes: Notícias sobre o Ciclo Urbano da Água.


Generating bot answers:  26%|█████▏              | 9/35 [00:37<01:41,  3.90s/it]


Assistente: O Programa Algarve 2030 está alinhado com as diretrizes da Comissão Europeia sobre eficiência hídrica ao incorporar investimentos que visam uma redução de 10% na eficiência hídrica até 2030. Esses investimentos estão em conformidade com a estratégia europeia de resiliência hídrica e são projetados para:

1. **Promover a Gestão Sustentável da Água** - Focando na eficiência hídrica e na redução de perdas nas infraestruturas de água.
2. **Aumentar a Resiliência Climática** - Alinhando-se com os compromissos de transição ecológica e digital, ajudando a região a adaptar-se às pressões ambientais e demográficas.
3. **Atenuar os Efeitos das Alterações Climáticas** - Implementando soluções que reforçam a capacidade de adaptação da região às mudanças climáticas.

Essas ações visam garantir um uso mais eficiente e sustentável dos recursos hídricos na região do Algarve.

Fontes: Ciclo urbano da água municípios do Algarve.


Generating bot answers:  29%|█████▍             | 10/35 [00:41<01:42,  4.09s/it]


Assistente: As áreas de investimento previstas no Programa Algarve 2030 relacionadas à água incluem:

1. **Aumento da Eficiência da Rede de Abastecimento de Água e Saneamento** - Melhorar a eficácia das infraestruturas existentes.
2. **Redução de Perdas** - Implementar medidas para minimizar as perdas de água nas redes urbanas.
3. **Aproveitamento de Águas Residuais Tratadas** - Utilizar águas tratadas para usos secundários, como a rega de espaços verdes.
4. **Monitorização Inteligente dos Recursos Hídricos** - Aplicar tecnologias para uma gestão mais eficiente e sustentável dos recursos hídricos.

Essas áreas visam promover uma gestão mais eficiente e resiliente dos recursos hídricos na região do Algarve.

Fontes: Ciclo urbano da água municípios do Algarve.


Generating bot answers:  31%|█████▉             | 11/35 [00:46<01:43,  4.31s/it]


Assistente: O objetivo principal do Programa Centro 2030 é promover a competitividade da economia, a sustentabilidade ambiental e a valorização do território e das pessoas na região Centro de Portugal. O programa visa operacionalizar a estratégia de desenvolvimento da região e as estratégias sub-regionais das Comunidades Intermunicipais, através do apoio a iniciativas que promovam o desenvolvimento social, económico e ambiental integrado e inclusivo, bem como a cultura, o património natural e o turismo sustentável.

Fonte: centro2030.pt.


Generating bot answers:  34%|██████▌            | 12/35 [00:51<01:43,  4.49s/it]


Assistente: A Comissão Europeia aprovou a reprogramação do Programa Regional do Centro 2021-2027 (Centro 2030). Esta reprogramação, submetida pela Autoridade de Gestão, alarga o financiamento para várias áreas, incluindo:

1. **Habitação** - Apoio a projetos de habitação social e a preços acessíveis.
2. **Tecnologias Críticas** - Financiamento para projetos relacionados com tecnologias críticas.
3. **Defesa** - Apoio a projetos empresariais na área da defesa.

Além disso, a reprogramação foi apresentada no contexto da revisão intercalar da política de coesão europeia, permitindo alinhar o programa com novas prioridades estratégicas da União Europeia, como a competitividade, a descarbonização e a segurança hídrica.

Fonte: centro2030.pt.


Generating bot answers:  37%|███████            | 13/35 [00:54<01:27,  4.00s/it]


Assistente: A principal aposta da reprogramação do Centro 2030 é a área da **habitação**, com um financiamento de quase 200 milhões de euros. Este investimento destina-se a ampliar o parque público de habitação, promovendo a renovação de edifícios devolutos ou vagos, transformando-os em oferta pública de habitação sustentável e acessível.

Fonte: centro2030.pt.


Generating bot answers:  40%|███████▌           | 14/35 [00:58<01:27,  4.18s/it]


Assistente: O Programa Centro 2030 combate a fraude nos fundos comunitários através de várias estratégias e medidas, incluindo:

1. **Estratégia Antifraude** - Estabelece um compromisso em prevenir, detetar, corrigir e reportar práticas fraudulentas, reforçando a integridade e transparência na gestão dos fundos.

2. **Declaração de Política Antifraude** - Documento que reafirma o compromisso da Autoridade de Gestão do programa no combate à fraude, corrupção, conflitos de interesse e duplo financiamento, mantendo uma política de tolerância zero.

3. **Plano de Formação** - A Autoridade de Gestão desenvolveu um plano de formação para capacitar as equipas com conhecimentos e comportamentos de prevenção e deteção de fraude, incluindo acesso à formação da Academia dos Fundos.

4. **Plano de Gestão de Riscos de Corrupção** - Identifica e avalia riscos de fraude e corrupção, permitindo uma gestão proativa e eficaz dos riscos associados.

Essas iniciativas visam garantir uma gestão responsáve

Generating bot answers:  43%|████████▏          | 15/35 [01:04<01:32,  4.62s/it]


Assistente: Algumas das áreas de apoio incluídas na reprogramação do Centro 2030 são:

1. **Habitação** - Apoio a projetos de habitação social e a preços acessíveis.
2. **Tecnologias Críticas** - Financiamento para projetos relacionados com tecnologias críticas.
3. **Defesa** - Apoio a projetos empresariais na área da defesa.
4. **Eficiência Energética** - Iniciativas para promover a eficiência energética na administração pública regional e local.
5. **Autoconsumo e Comunidades de Energia Renovável** - Apoio a projetos que promovam a utilização de energias renováveis.
6. **Gestão de Recursos Hídricos** - Valorização da rede hidrográfica e infraestruturas de águas pluviais.
7. **Economia Circular** - Apoios a empresas que promovam a gestão de resíduos e a economia circular.
8. **Mobilidade Urbana Sustentável** - Investimentos em sistemas inteligentes de apoio à mobilidade intermunicipal e multimodal.

Essas áreas visam promover o desenvolvimento sustentável e a competitividade na regiã

Generating bot answers:  46%|████████▋          | 16/35 [01:10<01:33,  4.94s/it]


Assistente: O objetivo principal do programa COMPETE 2030 é promover a competitividade da economia nacional, através do apoio à digitalização, inovação e qualificação das empresas. O programa visa:

1. **Aumentar a Competitividade** - Apoiar o investimento em investigação e inovação, digitalização e internacionalização das empresas.
2. **Promover a Sustentabilidade** - Apoiar projetos de descarbonização e a produção de energias renováveis.
3. **Aumentar as Competências** - Facilitar a adaptação de trabalhadores e empresas às mudanças, promovendo a qualificação e formação.

O COMPETE 2030 tem uma dotação orçamental de 3,9 mil milhões de euros para o período de programação 2021-2027.

Fontes: compete2030.gov.pt.


Generating bot answers:  49%|█████████▏         | 17/35 [01:14<01:26,  4.79s/it]


Assistente: Os três pilares principais do programa COMPETE 2030 são:

1. **Competitivo** - Apoiar a digitalização, a investigação e a inovação, visando aumentar o crescimento e a competitividade das PME (Pequenas e Médias Empresas).
2. **Verde** - Apoiar as empresas em projetos de descarbonização e na produção de energias renováveis, promovendo a sustentabilidade ambiental.
3. **Social** - Apoiar a adaptação de trabalhadores e das empresas às mudanças, aumentando as suas competências e promovendo a inclusão social.

Esses pilares visam contribuir para o desenvolvimento económico e social de Portugal.

Fontes: compete2030.gov.pt.


Generating bot answers:  51%|█████████▊         | 18/35 [01:19<01:24,  4.95s/it]


Assistente: O programa COMPETE 2030 apoia as empresas através de várias iniciativas e medidas, incluindo:

1. **Financiamento de Projetos** - Oferece apoio financeiro para projetos de inovação, digitalização e internacionalização, ajudando as empresas a aumentar a sua competitividade.

2. **Apoio à Propriedade Intelectual** - Promove oportunidades de financiamento para a proteção e valorização de patentes, incentivando as empresas a transformar ideias em produtos e serviços inovadores.

3. **Descarbonização e Energias Renováveis** - Apoia projetos que visam a descarbonização e a produção de energias renováveis, ajudando as empresas a tornarem-se mais sustentáveis.

4. **Qualificação e Formação** - Facilita a formação e qualificação de trabalhadores, preparando-os para as mudanças no mercado e aumentando as competências das empresas.

5. **Concurso e Avisos de Apoio** - Mantém diversos avisos de concurso abertos, permitindo que as empresas candidatem-se a apoios específicos que respond

Generating bot answers:  54%|██████████▎        | 19/35 [01:23<01:10,  4.42s/it]


Assistente: O canal +Transparente é um canal seguro destinado à apresentação de denúncias relacionadas com eventuais infrações no âmbito do programa COMPETE 2030. Este canal permite que qualquer cidadão, incluindo beneficiários de operações e trabalhadores, submeta denúncias que devem ser analisadas pela organização, em conformidade com a legislação aplicável. O objetivo é promover a transparência e a integridade na gestão dos fundos, servindo como um mecanismo de prevenção e deteção de atos de corrupção e infrações conexas.

Fontes: compete2030.gov.pt.


Generating bot answers:  57%|██████████▊        | 20/35 [01:25<00:58,  3.92s/it]


Assistente: A apresentação da Rede de Fornecedores Inovadores ocorrerá no dia **8 de maio de 2025**, às **11:30h**, através da plataforma **Microsoft Teams**. Este evento é coorganizado pelo Ministério da Economia, o COMPETE 2030 e os Programas Regionais do Portugal 2030.

Fontes: compete2030.


Generating bot answers:  60%|███████████▍       | 21/35 [01:32<01:06,  4.77s/it]


Assistente: O StartUP Visa é um programa de acolhimento de empreendedores estrangeiros que desejam desenvolver um projeto de empreendedorismo e/ou inovação em Portugal. O programa visa facilitar a concessão de visto de residência ou autorização de residência para imigrantes empreendedores, sendo regulado pelo Despacho Normativo n.º 4/2018, de 2 de fevereiro.

O StartUP Visa decorre em duas fases:

1. **Certificação de Incubadoras** - As incubadoras são certificadas para assegurar que estão aptas a acolher cidadãos de Estados terceiros, conforme definido na legislação aplicável.
   
2. **Candidaturas de Empreendedores** - Os empreendedores devem submeter a sua candidatura através de uma plataforma online, onde são avaliados os seus projetos.

O programa é gerido pelo IAPMEI, que é responsável pela análise, seleção e certificação das candidaturas, bem como pelo acompanhamento da execução do programa.

Fontes: Startup visa pt.aspx, iapmei.


Generating bot answers:  63%|███████████▉       | 22/35 [01:38<01:05,  5.07s/it]


Assistente: Os principais serviços oferecidos pelo IAPMEI incluem:

1. **Apoio de Proximidade às Empresas** - Informação, aconselhamento e acompanhamento para PME e empreendedores, através dos Centros de Apoio Empresarial.

2. **Financiamento e Sistemas de Incentivos** - Acesso a instrumentos financeiros e incentivos para apoiar o desenvolvimento e crescimento das empresas.

3. **Autodiagnóstico e Ferramentas de Avaliação** - Ferramentas como o Autodiagnóstico Financeiro e o Innovation Scoring para ajudar as empresas a avaliar a sua situação e potencial.

4. **Formação e Capacitação** - Programas de formação e iniciativas que promovem a qualificação e o desenvolvimento de competências.

5. **Transferência de Conhecimento** - Promoção de iniciativas que facilitam a transferência de conhecimento entre empresas e centros de conhecimento.

6. **Rede de Cooperação** - Apoio à criação de redes de cooperação entre PME para fomentar a colaboração e a partilha de boas práticas.

7. **Consultor

Generating bot answers:  66%|████████████▍      | 23/35 [01:45<01:07,  5.66s/it]


Assistente: As empresas podem obter a certificação PME através do seguinte processo:

1. **Registo Eletrónico** - A certificação deve ser precedida de um registo eletrónico da empresa no serviço de Certificação PME.

2. **Preenchimento do Formulário** - As empresas devem preencher e submeter um formulário de primeira certificação, que inclui informações como:
   - Identificação da empresa (nome, sede, NIF, forma jurídica, datas de constituição e início de atividade, capital, CAE).
   - Informação sobre a atividade (efetivos, volume de negócios e balanço da empresa e das entidades parceiras).

3. **Formulários Personalizados** - Os formulários de certificação são personalizados, variando conforme as características da empresa e das entidades com que se relaciona.

4. **Submissão Online** - A certificação é realizada integralmente online, através do website do IAPMEI, na área de serviços online, sem necessidade de entrega de documentação física.

5. **Declaração de Responsabilidade** - 

Generating bot answers:  69%|█████████████      | 24/35 [01:47<00:49,  4.46s/it]


Assistente: Lamento, mas não encontrei informações específicas sobre os indicadores de atividade para 2024 nos textos que foram fornecidos. Se precisar de ajuda com outro tema ou tiver mais informações, estou à disposição para ajudar!


Generating bot answers:  71%|█████████████▌     | 25/35 [01:54<00:53,  5.33s/it]


Assistente: A Academia de PME é uma iniciativa do IAPMEI que visa promover o desenvolvimento de competências técnicas e práticas nas micro, pequenas e médias empresas (PME) em Portugal. Os principais objetivos da Academia de PME incluem:

1. **Formação e Capacitação** - Oferece uma variedade de ações formativas, informativas e de sensibilização, como webinars, workshops, conferências e programas de formação-ação, para ajudar as empresas a melhorar as suas práticas de gestão.

2. **Apoio à Gestão Empresarial** - Disponibiliza conteúdos e ferramentas que apoiam a tomada de decisões no contexto empresarial, reforçando o conhecimento na gestão.

3. **Transição Digital** - Promove iniciativas que visam capacitar as empresas para a digitalização, reconhecendo a sua importância para a economia.

4. **Empreendedorismo** - Apoia empreendedores com informações e ferramentas técnicas que visam a capacitação e o desenvolvimento de novos negócios.

5. **Recursos Informativos** - Disponibiliza víde

Generating bot answers:  74%|██████████████     | 26/35 [01:57<00:41,  4.62s/it]


Assistente: O objetivo principal do Programa Lisboa 2030 é promover a competitividade da economia, a sustentabilidade ambiental e a valorização do território e das pessoas na região de Lisboa. O programa visa responder aos desafios da região com coerência estratégica, flexibilidade e eficiência operacionais, contribuindo para a criação de uma nova dinâmica de desenvolvimento regional que restabeleça uma trajetória de convergência económica com a União Europeia.

Fontes: lisboa.portugal2030.pt.


Generating bot answers:  77%|██████████████▋    | 27/35 [02:02<00:37,  4.75s/it]


Assistente: O Espaço de Descoberta Empreendedora (EDE) é um evento que reúne atores relevantes do ecossistema regional de inovação, com o objetivo de impulsionar oportunidades e promover a colaboração entre empresas, centros de investigação e entidades públicas. 

Na sessão de 27 de novembro, realizada na sede da CCDR LVT em Lisboa, o propósito do EDE foi discutir e acelerar oportunidades no âmbito da Plataforma de Tecnologias Estratégicas para a Europa (STEP). Durante o encontro, foram abordados temas como:

- O enquadramento dos Fundos Europeus, incluindo o PT 2030 e o PRR.
- A especialização regional e os investimentos em curso.
- O calendário indicativo de avisos e oportunidades futuras.
- Networking para troca de contactos e exploração de parcerias.

A Presidente da CCDR LVT, Arquiteta Teresa Almeida, destacou a importância do EDE na reafirmação da região de Lisboa como um polo estratégico de inovação e competitividade.

Fontes: Lisboa2030, Portugal2030.


Generating bot answers:  80%|███████████████▏   | 28/35 [02:06<00:31,  4.51s/it]


Assistente: As atualizações principais do Aviso MPr-2025-14, republicado em 11 de dezembro de 2025, incluem:

1. **Prazo para Início do Investimento** - O prazo para o início do investimento foi alterado para 90 dias após a apresentação da candidatura.

2. **Esclarecimentos sobre Transferência de Incentivos** - Foram fornecidos esclarecimentos sobre a transferência do incentivo para empresas nos projetos do PT 2020, alinhando-se com as alterações do aviso dos Projetos Conjuntos de Qualificação.

3. **Especificação para Deslocações** - Foi introduzida a necessidade de comprovar quem realizou a deslocação e a data em que ocorreu.

4. **Atualização Legislativa** - Inclui uma referência ao Regulamento n.º 1007/2025, de 19 de agosto, no anexo.

Essas atualizações visam melhorar a clareza e a eficácia do processo de candidatura e execução dos projetos.

Fontes: COMPETE, Aviso MPr-2025-14.


Generating bot answers:  83%|███████████████▋   | 29/35 [02:11<00:28,  4.76s/it]


Assistente: Durante o encontro do Espaço de Descoberta Empreendedora (EDE), foram debatidos os seguintes temas:

1. **Fundos Europeus** - Enquadramento do PT 2030, PRR e perspetivas do próximo Quadro Financeiro Plurianual 2028–2034.

2. **Especialização Regional** - Discussão sobre investimentos em curso, reprogramação, prioridades estratégicas e a nova tipologia STEP.

3. **Oportunidades Futuras** - Apresentação de um calendário indicativo de avisos, integrado no plano de avisos, e matchmaking orientado para projetos estruturantes em Tecnologias Digitais.

4. **Networking** - Criação de um espaço informal para troca de contactos e exploração de parcerias.

Esses temas visam impulsionar a inovação e a competitividade na região de Lisboa.

Fontes: Lisboa2030, Portugal2030.


Generating bot answers:  86%|████████████████▎  | 30/35 [02:15<00:22,  4.44s/it]


Assistente: Durante o evento do Espaço de Descoberta Empreendedora (EDE), a Presidente da CCDR LVT, Arquiteta Teresa Almeida, destacou a relevância do encontro na reafirmação da região de Lisboa como um polo estratégico de inovação e competitividade. Ela sublinhou a importância da colaboração entre os diversos atores do ecossistema regional de inovação e a necessidade de aproveitar as oportunidades oferecidas pelos fundos europeus e pelas iniciativas de especialização regional.

Além disso, Teresa Almeida enfatizou o empenho da CCDR LVT no reposicionamento da região em termos de inovação e competitividade, alinhando-se com a progressiva subida do PIB per capita da região.

Fontes: Lisboa2030, Portugal2030.


Generating bot answers:  89%|████████████████▊  | 31/35 [02:21<00:19,  4.85s/it]


Assistente: O Portugal 2030 é um programa que materializa o Acordo de Parceria estabelecido entre Portugal e a Comissão Europeia, com o objetivo de definir as grandes diretrizes estratégicas para a aplicação de fundos europeus entre 2021 e 2027. O montante global disponível para este programa é de 23 mil milhões de euros.

O Portugal 2030 é estruturado em torno de várias agendas temáticas e programas, que incluem:

1. **Pessoas 2030** - Focado no desenvolvimento social e na inclusão.
2. **Compete 2030** - Destinado a promover a competitividade das empresas.
3. **Sustentável 2030** - Envolvendo iniciativas para a sustentabilidade ambiental.
4. **Mar 2030** - Relacionado com a economia do mar e a utilização sustentável dos recursos marinhos.
5. **Programas Regionais** - Incluindo iniciativas específicas para as regiões de Lisboa, Norte, Centro, Alentejo, Algarve, Açores e Madeira.

O programa visa promover o desenvolvimento económico, social e territorial de Portugal, alinhando-se com a

Generating bot answers:  91%|█████████████████▎ | 32/35 [02:23<00:12,  4.16s/it]


Assistente: Até ao momento, o Portugal 2030 já pagou mais de 3,3 mil milhões de euros (3,3 mil M€) aos beneficiários. Este valor representa 30,4% do fundo aprovado no âmbito do programa.

Fontes: Portugal 2030.


Generating bot answers:  94%|█████████████████▉ | 33/35 [02:33<00:11,  5.74s/it]


Assistente: Os principais eventos relacionados ao Portugal 2030 incluem:

1. **Comité de Acompanhamento** - Reuniões periódicas do Comité de Acompanhamento do Lisboa 2030, onde são discutidos os progressos e as metas do programa.

2. **Sessões de Divulgação** - Eventos como a sessão de divulgação conjunta do Centro, Alentejo e Lisboa, que abordam avisos inter-regionais e oportunidades de financiamento.

3. **Reuniões de Acompanhamento** - Encontros que visam apresentar a taxa de execução dos programas e discutir a implementação de iniciativas.

4. **Workshops e Conferências** - Ações formativas e informativas que promovem a capacitação e o conhecimento sobre os fundos e programas disponíveis.

Esses eventos são fundamentais para promover a interação entre os diversos stakeholders, facilitar o acesso à informação e fomentar a colaboração no âmbito do Portugal 2030.

Fontes: Lisboa2030, Portugal2030.


Generating bot answers:  97%|██████████████████▍| 34/35 [02:37<00:05,  5.34s/it]


Assistente: Para obter apoio técnico sobre o Balcão dos Fundos, você pode utilizar as seguintes opções:

1. **Email**: Envie um email para linhadosfundos@linhadosfundos.pt, onde poderá esclarecer as suas dúvidas.

2. **Telefone**: Ligue para o número 800 10 35 10, que é gratuito para chamadas de Portugal, ou para 00351 300 00 39 87, se estiver a ligar do estrangeiro (custo de chamada para a rede fixa de Portugal).

3. **Chat Online**: Aceda ao site da Linha dos Fundos para utilizar o chat, disponível todos os dias úteis entre as 9h e as 18h.

4. **Videochamada**: É possível agendar uma videochamada para apoio ao registo no Balcão dos Fundos.

Essas opções garantem que você tenha acesso a informações e suporte técnico sobre o Balcão dos Fundos e outras plataformas relacionadas.

Fontes: Portugal2030.


Generating bot answers: 100%|███████████████████| 35/35 [02:43<00:00,  4.68s/it]


Assistente: O projeto CustomNiTi é uma iniciativa cofinanciada pelo Programa COMPETE 2030, que visa revolucionar o setor de dispositivos médicos, especificamente na área da ortopedia. O projeto foca no desenvolvimento de placas e distratores ósseos personalizados, com o objetivo de melhorar a eficiência e o conforto no tratamento de fraturas.

As principais características e objetivos do projeto incluem:

1. **Inovação** - O CustomNiTi representa um avanço significativo na medicina moderna, criando soluções clínicas eficazes e económicas.

2. **Capacidade Industrial** - O projeto fortalece a capacidade industrial e competitiva da CPIMC (Customize Portugal), posicionando-a como uma referência nacional no fabrico de dispositivos médicos personalizados e inovadores.

3. **Impacto Clínico** - As soluções desenvolvidas têm um elevado potencial económico e um impacto positivo na saúde dos pacientes.

4. **Imagem de Inovação** - O projeto contribui para reforçar a imagem de Portugal como um 




In [9]:
with open("evaluation/eval_dataset_filled_c400_40.json", "w", encoding="utf-8") as f:
    json.dump(eval_dataset_filled_c400_40, f, ensure_ascii=False, indent=4)

In [3]:
with open("evaluation/eval_dataset_filled_c400_40.json", "r", encoding="utf-8") as f:
    eval_dataset_filled_c400_40 = json.load(f)

**Evaluation**

In [33]:
from datasets import Dataset
from ragas import evaluate
from langchain_openai import OpenAIEmbeddings
import os
from dotenv import load_dotenv

load_dotenv()  # ensure OPENAI_API_KEY is set

# Prepare your dataset
dataset = Dataset.from_list(eval_dataset_filled_c400_40)
dataset = dataset.rename_columns({
    "question": "user_input",
    "bot_answer": "response",
    "answer": "reference"
})

# Create OpenAI embeddings (CPU only)
embeddings = OpenAIEmbeddings(model="text-embedding-3-large")

# Evaluate
result = evaluate(dataset, embeddings=embeddings)
print(result)


Evaluating:   0%|          | 0/140 [00:00<?, ?it/s]

LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.
LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.

KeyboardInterrupt

LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.
LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.


In [4]:
import os
from datasets import Dataset
from openai import OpenAI
from ragas.llms import llm_factory
from langchain_openai import OpenAIEmbeddings
from ragas import evaluate
import nest_asyncio
nest_asyncio.apply()


In [5]:
# Prepare your dataset
dataset = Dataset.from_list(eval_dataset_filled_c400_40)
dataset = dataset.rename_columns({
    "question": "user_input",
    "bot_answer": "response",
    "answer": "reference"
})


In [14]:
sampled_dataset = dataset.shuffle(seed=42).select(range(10))

In [6]:
# 1️⃣ Create an OpenAI client
#client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

In [7]:
# 2️⃣ Create evaluator LLM
# "provider" should match your API type ("openai")
llm = llm_factory("gpt-3.5-turbo", provider="openai", client=client)

In [None]:
import os

os.makedirs("data/embeddings_cache", exist_ok=True)


In [31]:
# 3️⃣ Create embeddings via langchain_openai
embeddings = OpenAIEmbeddings(model="text-embedding-3-large",
                              model_kwargs={"persist": "data/embeddings_cache"})

In [32]:
from ragas.metrics import (
    AnswerRelevancy,
    Faithfulness,
    ContextPrecision,
    ContextRecall,
    AnswerSimilarity
)

# Instantiate metrics
metrics_to_compute = [
    AnswerRelevancy(),
    Faithfulness(),
    ContextPrecision(),
    ContextRecall(),
    AnswerSimilarity()
]

  from ragas.metrics import (
  from ragas.metrics import (
  from ragas.metrics import (
  from ragas.metrics import (
  from ragas.metrics import (


In [33]:
# 4️⃣ Evaluate
result = evaluate(sampled_dataset, embeddings=embeddings, 
                  llm=llm, metrics=metrics_to_compute)

Evaluating:   0%|          | 0/50 [00:00<?, ?it/s]

LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.
LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.
LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.
LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.
Exception raised in Job[0]: TypeError(Embeddings.create() got an unexpected keyword argument 'persist')
Exception raised in Job[5]: TypeError(Embeddings.create() got an unexpected keyword argument 'persist')
Exception raised in Job[10]: TypeError(Embeddings.create() got an unexpected keyword argument 'persist')
Exception raised in Job[15]: TypeError(Embeddings.create() got an unexpected keyword argument 'persist')
Exception raised in Job[4]: TypeError(AsyncEmbeddings.create() got an unexpected keyword argument 'persist')
LLM returned 1 generations instead of requested 3. Proceeding with 1 generations.
Exception raised in Job[9]: TypeError(AsyncEmbeddings.create() 

In [34]:
print(result)

{'answer_relevancy': nan, 'faithfulness': 0.8006, 'context_precision': 0.9854, 'context_recall': 1.0000, 'answer_similarity': nan}


In [29]:
print(result)

{'answer_relevancy': 0.8382, 'faithfulness': 0.8509, 'context_precision': 0.9842, 'context_recall': 1.0000, 'answer_similarity': 0.9135}


In [None]:
# Dataset
dataset = Dataset.from_list(eval_dataset_filled)
dataset = dataset.rename_columns({
    "question": "user_input",
    "bot_answer": "response",
    "answer": "reference"
})

# LLM wrapper (for evaluation metrics)
llm = LangchainLLMWrapper(ChatOpenAI(model_name="gpt-3.5-turbo"))

# OpenAI embeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")

# Evaluate with both embeddings and LLM
result = evaluate(dataset, embeddings=embeddings, llm=llm)
print(result)


In [5]:
pip install --upgrade langchain-openai openai ragas datasets python-dotenv

Collecting openai
  Obtaining dependency information for openai from https://files.pythonhosted.org/packages/cc/56/0a89092a453bb2c676d66abee44f863e742b2110d4dbb1dbcca3f7e5fc33/openai-2.21.0-py3-none-any.whl.metadata
  Downloading openai-2.21.0-py3-none-any.whl.metadata (29 kB)
Downloading openai-2.21.0-py3-none-any.whl (1.1 MB)
[2K   [38;2;114;156;31m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.1/1.1 MB[0m [31m10.0 MB/s[0m eta [36m0:00:00[0mm eta [36m0:00:01[0m0:01[0m
[?25hInstalling collected packages: openai
  Attempting uninstall: openai
    Found existing installation: openai 2.8.1
    Uninstalling openai-2.8.1:
      Successfully uninstalled openai-2.8.1
Successfully installed openai-2.21.0

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m23.2.1[0m[39;49m -> [0m[32;49m26.0.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m
Note: you may need to re

In [14]:
dataset.column_names

['user_input', 'reference', 'source', 'response', 'contexts']

In [10]:
from datasets import Dataset
from ragas import evaluate
from ragas.metrics import (
    faithfulness,
    answer_relevancy,
    context_recall,
    context_precision,
    answer_correctness
)

# Convert your list-of-dicts to a HuggingFace Dataset
dataset_for_eval = Dataset.from_list(eval_dataset_filled)

# Run RAGAS evaluation
results = evaluate(
    dataset_for_eval,
    metrics=[
        faithfulness,
        answer_relevancy,
        context_recall,
        context_precision,
        answer_correctness
    ],
    prediction_field="bot_answer",   # tell RAGAS which field contains the bot answer
    reference_field="answer",        # tell RAGAS which field is the gold/reference
    contexts_field="contexts"        # field for retrieved contexts
)

print(results)


  from ragas.metrics import (
  from ragas.metrics import (
  from ragas.metrics import (
  from ragas.metrics import (
  from ragas.metrics import (


TypeError: evaluate() got an unexpected keyword argument 'prediction_field'

**Pipeline**

In [8]:
def evaluate_rag_semantic(dataset, index, metadata, bm25, 
                            model="gpt-4o-mini",  
                            k=20,top_k=5, 
                            weight_dense=0.6, 
                            weight_sparse=0.4, 
                            rerank=False):
    results = []

    for item in dataset:
        question = item["question"]
        reference = item["answer"]
        source = item.get("source", "unknown")

        # Generate answer
        start_time = time.time()
        generated_answer, retrieved_docs = chatbot.answer(question, index, 
                                                        metadata, bm25,
                                                        model, k, top_k, 
                                                        weight_dense, 
                                                        weight_sparse, 
                                                        rerank)
        latency = time.time() - start_time

        if isinstance(generated_answer, tuple):
            generated_answer = generated_answer[0]

        # Metrics
        retrieval_success = retrieval_success_semantic(retrieved_docs, reference)
        grounding = grounding_score_semantic(generated_answer, retrieved_docs)
        f1 = f1_score(generated_answer, reference)
        conciseness = conciseness_score(generated_answer, reference)
        semantic_sim = semantic_similarity_score(generated_answer, [reference])
        retrieval_recall_val = retrieval_recall(retrieved_docs, reference)
        claim_coverage_val = claim_coverage_score(generated_answer, reference)

        results.append({
            "Question": question,
            "Reference Answer": reference,
            "Source": source,
            "Generated Answer": generated_answer,
            "Retrieval Success (semantic)": retrieval_success,
            "Grounding (semantic)": grounding,
            "F1": f1,
            "Conciseness": conciseness,
            "Semantic Similarity": semantic_sim,
            "retrieval_recall": retrieval_recall_val,
            "claim_coverage_score": claim_coverage_val,
            "Latency (s)": latency
        })

    df = pd.DataFrame(results)
    return df

**Evaluation**

In [9]:
results_1 = {}
for k in [5, 10]:
    results_1[k] = evaluate_rag_semantic(documents, index, metadata, bm25, 
                                        model="gpt-4o-mini",  
                                        k=k,top_k=5, 
                                        weight_dense=0.5, 
                                        weight_sparse=0.5, 
                                        rerank=False)



Assistente: O Alentejo 2030 é um programa que visa promover a competitividade da economia, a sustentabilidade ambiental e a valorização do território e das pessoas na região do Alentejo, no âmbito da Política de Coesão da União Europeia. O programa é constituído por cinco Objetivos Estratégicos que se articulam com as Prioridades e Objetivos Específicos, e tem como objetivo operacionalizar a estratégia de desenvolvimento da região e das suas comunidades intermunicipais. Através do Alentejo 2030, pretende-se transformar vidas, impulsionando a inovação e o crescimento da região, além de disponibilizar Fundos Europeus para apoiar esses objetivos. 

Fonte: alentejo.portugal2030.pt.

Assistente: Alguns dos eventos programados para o Alentejo 2030 incluem:

- 5 de junho de 2025: Como os Fundos Europeus potenciam a Inovação Social
- 12 de junho de 2025: Sessão de apresentação das Plataformas Regionais, integrada no contexto da Estratégia de Desenvolvimento Regional EREI 2030
- 10 de abril de

In [13]:
results_2 = {}
for k in [5, 10]:
    results_2[k] = evaluate_rag_semantic(documents, index, metadata, bm25, 
                                        model="gpt-4o-mini",  
                                        k=k,top_k=5, 
                                        weight_dense=0.5, 
                                        weight_sparse=0.5, 
                                        rerank=True)



Assistente: O Alentejo 2030 é um programa regional que tem como objetivo promover a competitividade da economia, a sustentabilidade ambiental e a valorização do território e das pessoas na região do Alentejo. Aprovado pela Comissão Europeia para o período de programação 2021-2027, o programa visa operacionalizar a estratégia de desenvolvimento da região e as estratégias sub-regionais das Comunidades Intermunicipais, no âmbito da Política de Coesão da União Europeia.

Se precisar de mais informações ou ajuda com outro tema, estou à disposição!

Assistente: Alguns dos eventos programados para o Alentejo 2030 incluem:

1. **Workshop – Prospetivas e Políticas Públicas** - 15 de Dezembro de 2025.
2. **Conferência e Espetáculo | “Inteligência Artificial”** - 27 de Novembro de 2025.
3. **Concerto – “Ecoando a voz do Alentejo”** - 16 de Novembro de 2025, na Vidigueira.
4. **Sessão de apresentação das Plataformas Regionais** - 12 de Junho de 2025.
5. **Como os Fundos Europeus potenciam a Inova

In [21]:
results_3 = {}
for k in [5, 10]:
    results_3[k] = evaluate_rag_semantic(documents, index, metadata, bm25, 
                                        model="gpt-4o-mini",  
                                        k=k,top_k=5, 
                                        weight_dense=0.4, 
                                        weight_sparse=0.6, 
                                        rerank=False)



Assistente: O Alentejo 2030 é um programa regional aprovado pela Comissão Europeia para o período de programação 2021-2027. O seu objetivo é promover o desenvolvimento da região do Alentejo através de investimentos em inovação, sustentabilidade e crescimento económico. O programa visa apoiar diversas áreas, contribuindo para a melhoria da qualidade de vida e a competitividade da região, através da mobilização de fundos europeus.

Se precisar de mais informações ou ajuda com outro tema, estou à disposição!

Assistente: Alguns dos eventos programados para o Alentejo 2030 incluem:

1. **Workshop – Prospetivas e Políticas Públicas** - 15 de Dezembro de 2025.
2. **Conferência e Espetáculo | “Inteligência Artificial”** - 27 de Novembro de 2025.
3. **Concerto – “Ecoando a voz do Alentejo”** - 16 de Novembro de 2025, na Vidigueira.
4. **Sessão de apresentação das Plataformas Regionais** - 12 de Junho de 2025.
5. **Como os Fundos Europeus potenciam a Inovação Social** - 5 de Junho de 2025.

Se

**Results Comparison**

In [14]:
# main vector db (400-80)
results_1[5].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.779863,0.837757,0.491872,0.778799,0.856668,0.671429,0.880952,2.598972
std,0.094919,0.084623,0.190413,0.389276,0.107099,0.468773,0.30671,1.027622
min,0.486603,0.45383,0.059701,0.425,0.45521,0.0,0.0,1.623515
25%,0.745059,0.812163,0.361047,0.56264,0.823202,0.0,1.0,1.963115
50%,0.780513,0.852506,0.47619,0.677419,0.884364,1.0,1.0,2.248284
75%,0.845015,0.880531,0.647863,0.842105,0.916822,1.0,1.0,2.880953
max,0.907826,0.942501,0.877551,2.178571,0.959933,1.0,1.0,6.555275


In [11]:
# main vector db (800-150)
results_1[5].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.769941,0.828711,0.405759,0.496213,0.84194,0.585714,0.795238,4.659473
std,0.094362,0.08717,0.183803,0.344021,0.11317,0.492379,0.39209,1.62296
min,0.520808,0.477615,0.102564,0.196629,0.471256,0.0,0.0,2.032452
25%,0.713674,0.78725,0.278215,0.328321,0.806371,0.0,1.0,3.385896
50%,0.782927,0.837019,0.375,0.415584,0.885896,1.0,1.0,4.783664
75%,0.832713,0.877084,0.546414,0.556901,0.917187,1.0,1.0,5.726114
max,0.906531,0.950258,0.857143,2.103448,0.954457,1.0,1.0,9.442897


In [9]:
# main vector db (500-100)
results_1[5].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.789211,0.841084,0.502815,0.749259,0.854656,0.7,0.909524,3.47052
std,0.090409,0.082945,0.207236,0.44466,0.111916,0.456972,0.266123,0.959692
min,0.492678,0.444754,0.108108,0.373626,0.433706,0.0,0.0,1.827905
25%,0.764128,0.822422,0.368119,0.515686,0.818578,0.0,1.0,2.662459
50%,0.79409,0.846303,0.472222,0.666667,0.870682,1.0,1.0,3.356894
75%,0.846317,0.885267,0.655004,0.817036,0.926184,1.0,1.0,4.022702
max,0.908167,0.942146,0.870968,3.05,0.967469,1.0,1.0,6.076466


In [10]:
# main vector db (250-50)
results_1[5].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.789211,0.841084,0.502815,0.749259,0.854656,0.7,0.909524,3.47052
std,0.090409,0.082945,0.207236,0.44466,0.111916,0.456972,0.266123,0.959692
min,0.492678,0.444754,0.108108,0.373626,0.433706,0.0,0.0,1.827905
25%,0.764128,0.822422,0.368119,0.515686,0.818578,0.0,1.0,2.662459
50%,0.79409,0.846303,0.472222,0.666667,0.870682,1.0,1.0,3.356894
75%,0.846317,0.885267,0.655004,0.817036,0.926184,1.0,1.0,4.022702
max,0.908167,0.942146,0.870968,3.05,0.967469,1.0,1.0,6.076466


In [22]:
results_3[5].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.77791,0.761203,0.422151,0.547518,0.784946,0.671429,0.7,2.385731
std,0.094534,0.072665,0.152257,0.29583,0.087397,0.468773,0.456972,0.485718
min,0.486144,0.46094,0.081301,0.265487,0.460157,0.0,0.0,1.534281
25%,0.744646,0.735717,0.322686,0.413333,0.753969,0.0,0.0,1.965801
50%,0.777766,0.776102,0.395604,0.5,0.804592,1.0,1.0,2.237435
75%,0.845094,0.795891,0.535609,0.571429,0.829653,1.0,1.0,2.71536
max,0.90816,0.905292,0.735849,2.103448,0.92052,1.0,1.0,3.334891


In [16]:
results_1[10].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.779582,0.832915,0.494076,0.806518,0.849237,0.671429,0.871429,2.360991
std,0.094285,0.087373,0.21079,0.471799,0.116716,0.468773,0.328608,1.247293
min,0.486723,0.44397,0.111111,0.425,0.433559,0.0,0.0,1.433127
25%,0.752425,0.804595,0.340718,0.586016,0.810477,0.0,1.0,1.957963
50%,0.780532,0.850129,0.467532,0.693548,0.874407,1.0,1.0,2.137947
75%,0.845071,0.882429,0.674159,0.847319,0.923311,1.0,1.0,2.35255
max,0.910047,0.942134,0.916667,3.05,0.964728,1.0,1.0,9.125016


In [20]:
results_3[10].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.781143,0.765255,0.401791,0.52858,0.78426,0.671429,0.7,2.413206
std,0.094558,0.073652,0.153566,0.317702,0.096619,0.468773,0.456972,0.57227
min,0.48621,0.460938,0.098361,0.252101,0.43549,0.0,0.0,1.438702
25%,0.751766,0.736603,0.304362,0.396896,0.751269,0.0,0.0,2.038007
50%,0.792334,0.774692,0.394161,0.452174,0.811746,1.0,1.0,2.349327
75%,0.84479,0.811717,0.510979,0.557551,0.837001,1.0,1.0,2.681686
max,0.908122,0.90532,0.735849,2.103448,0.919313,1.0,1.0,3.653453


In [11]:
results_1[15].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,retrieval_recall,claim_coverage_score,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.775133,0.819762,0.45605,0.653927,0.831266,0.642857,0.795238,2.436645
std,0.097962,0.086241,0.171538,0.307099,0.113956,0.478531,0.39209,0.48405
min,0.486634,0.455966,0.078947,0.361702,0.466747,0.0,0.0,1.632949
25%,0.743929,0.786691,0.342216,0.507087,0.792915,0.0,1.0,2.048267
50%,0.780114,0.824143,0.424242,0.603175,0.862946,1.0,1.0,2.354473
75%,0.84553,0.87678,0.593594,0.677778,0.90807,1.0,1.0,2.711784
max,0.908114,0.94147,0.772277,2.103448,0.958973,1.0,1.0,3.49986


In [23]:
results_1[20].describe().loc["mean"]

Retrieval Success (semantic)    0.799489
Grounding (semantic)            0.819193
F1                              0.405858
Conciseness                     0.526603
Semantic Similarity             0.839202
Latency (s)                     2.204843
Name: mean, dtype: float64

In [24]:
results_2[20].describe().loc["mean"]

Retrieval Success (semantic)    0.797273
Grounding (semantic)            0.811219
F1                              0.397088
Conciseness                     0.486178
Semantic Similarity             0.819887
Latency (s)                     2.322734
Name: mean, dtype: float64

In [25]:
results_3[20].describe().loc["mean"]

Retrieval Success (semantic)    0.759946
Grounding (semantic)            0.805556
F1                              0.387738
Conciseness                     0.561103
Semantic Similarity             0.798391
Latency (s)                     2.018761
Name: mean, dtype: float64

In [26]:
results_4[20].describe().loc["mean"]

Retrieval Success (semantic)    0.759969
Grounding (semantic)            0.807498
F1                              0.381082
Conciseness                     0.550583
Semantic Similarity             0.796183
Latency (s)                     2.056838
Name: mean, dtype: float64

In [11]:
results[10][results[10]['F1'] < 0.2]

Unnamed: 0,Question,Reference Answer,Source,Generated Answer,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,Latency (s)
1,Quais são alguns dos eventos programados para ...,Alguns dos eventos programados incluem um work...,alentejo2030,Um dos eventos destacados para o Alentejo 2030...,0.616848,0.883755,0.190476,0.779661,0.599146,2.872252
27,Quais foram as atualizações principais do Avis...,As atualizações principais do Aviso MPr-2025-1...,lisboa2030,"O Aviso MPr-2025-14, que trata da Internaciona...",0.619705,0.817739,0.144144,0.881356,0.633559,1.859997
32,Quais são os principais eventos relacionados a...,Um dos principais eventos é a Mostra dos Fundo...,portugal2030,Os principais eventos relacionados ao Portugal...,0.422468,0.789208,0.15534,0.430556,0.519059,1.769419


In [9]:
results[10].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.781333,0.813265,0.384332,0.549461,0.800557,2.519529
std,0.131128,0.060378,0.153616,0.190794,0.109727,1.152649
min,0.422468,0.693576,0.144144,0.225564,0.519059,1.357077
25%,0.699726,0.775607,0.265968,0.432259,0.755421,1.958232
50%,0.795818,0.817739,0.372549,0.522388,0.825233,2.380162
75%,0.888722,0.866697,0.457329,0.697826,0.89028,2.712718
max,0.979312,0.940852,0.764045,0.93617,0.942435,8.395903


In [22]:
results[10].describe()

Unnamed: 0,Retrieval Success (semantic),Grounding (semantic),F1,Conciseness,Semantic Similarity,Latency (s)
count,35.0,35.0,35.0,35.0,35.0,35.0
mean,0.791556,0.816152,0.387394,0.503692,0.825551,2.12745
std,0.124246,0.060284,0.151614,0.191956,0.092821,0.632687
min,0.472912,0.71931,0.1,0.223022,0.59162,1.216619
25%,0.719583,0.765352,0.279165,0.376769,0.790033,1.712345
50%,0.797164,0.806561,0.369748,0.46087,0.837484,1.971969
75%,0.88847,0.867891,0.496295,0.570232,0.894935,2.372237
max,0.979312,0.95101,0.666667,1.0,0.937505,4.114343


In [13]:
small_k_10.describe().loc["mean"]

Retrieval Success (semantic)    0.733697
Grounding (semantic)            0.816320
F1                              0.474633
Conciseness                     0.861939
Semantic Similarity             0.786850
Latency (s)                     1.784377
Name: mean, dtype: float64

In [14]:
small_k_10_rerank.describe().loc["mean"]

Retrieval Success (semantic)    0.733699
Grounding (semantic)            0.813433
F1                              0.467515
Conciseness                     0.853704
Semantic Similarity             0.784782
Latency (s)                     1.548932
Name: mean, dtype: float64

In [36]:
small_k_5_rerank.describe().to_csv(f'evaluation/small_k_5_rerank.csv')

In [20]:
pd.set_option('display.max_colwidth', None)

## Bot-Based

In [54]:
def eval_chat(question, expected_answer, actual_tuple):
    """
    Returns a similarity score 0-10
    """
    actual_answer, retrieved_docs = actual_tuple

    # Embedding-based similarity with the reference
    semantic_sim = semantic_similarity_score(actual_answer, [expected_answer])

    # Scale from 0-1 → 0-10
    score = int(round(semantic_sim * 10))
    return score


In [71]:
from tqdm import tqdm
import time
import pandas as pd

def bot_evaluation(dataset, index, metadata, k=5, model="gpt-4o-mini"):
    results = []

    for idx, item in enumerate(tqdm(dataset, desc="Evaluating RAG")):
        question = item["question"]
        expected_answer = item["answer"]
        source = item.get("source", "unknown")

        # --- Generate answer ---
        start_time = time.time()
        generated_answer, retrieved_docs = chatbot.answer(
            question,
            index,
            metadata,
            k=k,
            model=model
        )
        latency = time.time() - start_time

        if isinstance(generated_answer, tuple):
            generated_answer = generated_answer[0]

        # --- Compute BPT score (0-10) ---
        # You can include grounding if you want
        semantic_sim = semantic_similarity_score(generated_answer, [expected_answer])
        grounding = grounding_score_semantic(generated_answer, retrieved_docs)
        # Weighted combination (optional)
        bpt_score = int(round(0.7 * semantic_sim * 10 + 0.3 * grounding * 10))

        results.append({
            "Question_ID": idx,
            "Source": source,
            "Question": question,
            "Expected Answer": expected_answer,
            "Generated Answer": generated_answer,
            "BPT Score": bpt_score,
            "Response Time (s)": latency
        })

    return pd.DataFrame(results)


In [72]:
results = bot_evaluation(documents, index, metadata)

Evaluating RAG:   0%|                                    | 0/30 [00:00<?, ?it/s]


Assistente: O Alentejo 2030 é um programa regional aprovado pela Comissão Europeia para o período de 2021-2027, que visa promover a inovação, a sustentabilidade e o crescimento da região do Alentejo. Através deste programa, a região dispõe de uma dotação global significativa de fundos europeus, destinados a apoiar diversas áreas e iniciativas que contribuam para o desenvolvimento regional. (Fontes: alentejo2030, portugal2030)


Evaluating RAG:   3%|▉                           | 1/30 [00:09<04:33,  9.44s/it]


Assistente: O documento não especifica eventos concretos programados para o Alentejo 2030. No entanto, menciona que haverá um evento que celebra projetos transformadores em Portugal, incluindo iniciativas do Alentejo 2030, com debates, apresentações e a cerimónia de entrega dos Prémios dos Fundos Europeus. Para informações mais detalhadas sobre eventos específicos, recomendo consultar o site oficial do Alentejo 2030. (Fontes: alentejo2030, portugal2030)


Evaluating RAG:   7%|█▊                          | 2/30 [00:15<03:33,  7.62s/it]


Assistente: A reprogramação do Alentejo 2030 foi aprovada pela Comissão Europeia no dia 15 de dezembro de 2025. (Fontes: alentejo2030, portugal2030)


Evaluating RAG:  10%|██▊                         | 3/30 [00:20<02:54,  6.48s/it]


Assistente: Algumas das novas prioridades específicas integradas no Alentejo 2030 incluem:

1. **Habitação acessível** - Promovendo a fixação populacional e a justiça social.
2. **Gestão e eficiência da água** - Reforçando a sustentabilidade e resiliência do território.

Estas prioridades visam fortalecer a resposta da região a desafios económicos, sociais, ambientais e territoriais, contribuindo para um desenvolvimento mais sustentável e inclusivo. (Fontes: alentejo2030)


Evaluating RAG:  13%|███▋                        | 4/30 [00:30<03:17,  7.61s/it]


Assistente: O objetivo da reprogramação do Alentejo 2030 é fortalecer a resposta da região a desafios económicos, sociais, ambientais e territoriais atuais e futuros, contribuindo para um desenvolvimento mais sustentável, inclusivo e resiliente. A reprogramação também visa alinhar os fundos europeus com novas prioridades estratégicas e desafios emergentes da região. (Fontes: alentejo2030, portugal2030)


Evaluating RAG:  17%|████▋                       | 5/30 [00:37<03:03,  7.35s/it]


Assistente: O objetivo principal do Programa Algarve 2030 é promover a competitividade e diversificação da economia da região, assim como a sustentabilidade ambiental, valorizando o território e as pessoas, com foco na melhoria da qualidade de vida. O programa dispõe de 780,3 milhões de euros de fundos europeus para financiar investimentos que contribuam para esses objetivos. (Fontes: algarve2030, portugal2030)


Evaluating RAG:  20%|█████▌                      | 6/30 [00:46<03:15,  8.14s/it]


Assistente: Até 28 de novembro de 2025, foram recebidas 25 candidaturas para o ciclo urbano da água, totalizando um investimento superior a 100 milhões de euros. (Fontes: portugal2030, algarve2030)


Evaluating RAG:  23%|██████▌                     | 7/30 [00:55<03:13,  8.43s/it]


Assistente: O valor total do investimento das candidaturas relacionadas ao ciclo urbano da água é superior a 100 milhões de euros. (Fontes: portugal2030, algarve2030)


Evaluating RAG:  27%|███████▍                    | 8/30 [01:01<02:48,  7.67s/it]


Assistente: Algumas das intervenções estratégicas previstas no Programa Algarve 2030 incluem:

1. **Promoção da competitividade das empresas** - Através de apoio à inovação e digitalização.
2. **Sustentabilidade ambiental** - Focando na gestão eficiente dos recursos naturais.
3. **Valorização do território** - Incentivando o desenvolvimento urbano sustentável e a reabilitação de áreas urbanas.
4. **Qualidade de vida** - Melhorando os serviços públicos e a acessibilidade.

Estas intervenções visam contribuir para um desenvolvimento equilibrado e sustentável da região do Algarve. (Fontes: algarve2030, portugal2030)


Evaluating RAG:  30%|████████▍                   | 9/30 [01:09<02:41,  7.67s/it]


Assistente: A dotação de fundos europeus para a área da água no Programa Regional Algarve 2030 é de 66 milhões de euros. (Fontes: algarve2030)


Evaluating RAG:  33%|█████████                  | 10/30 [01:18<02:40,  8.04s/it]


Assistente: O objetivo principal do Programa Centro 2030 é promover a competitividade da economia, a sustentabilidade ambiental e a valorização do território e das pessoas na região Centro de Portugal, no âmbito da Política de Coesão da União Europeia. (Fontes: centro2030)


Evaluating RAG:  37%|█████████▉                 | 11/30 [01:24<02:21,  7.46s/it]


Assistente: A Comissão Europeia aprovou a reprogramação do Programa Regional do Centro 2021-2027 (CENTRO 2030), que inclui um alargamento do financiamento para habitação social e acessível. Esta reprogramação permite também adaptar o programa às exigências da regulamentação europeia e alinhar-se com novas prioridades da UE. (Fontes: centro2030)


Evaluating RAG:  40%|██████████▊                | 12/30 [01:30<02:07,  7.10s/it]


Assistente: O valor do financiamento destinado à habitação no âmbito da reprogramação do CENTRO 2030 é de quase 200 milhões de euros. Este investimento visa ampliar o parque público de habitação, promovendo a renovação de edifícios devolutos ou vagos. (Fontes: centro2030)


Evaluating RAG:  43%|███████████▋               | 13/30 [01:36<01:51,  6.57s/it]


Assistente: O Programa Centro 2030 combate a fraude nos fundos comunitários através de várias iniciativas, incluindo:

1. **Estratégia Antifraude** - Estabelece um compromisso em prevenir, detetar, corrigir e reportar práticas fraudulentas, reforçando a integridade e transparência.
2. **Plano de Formação** - Capacita as equipas na prevenção e deteção de fraude, através de ações específicas de formação.
3. **Declaração de Política Antifraude** - Reafirma o compromisso da Autoridade de Gestão no combate à fraude, corrupção, conflito de interesses e duplo financiamento.
4. **Manual de Avaliação dos Riscos de Gestão e de Fraude** - Fortalece as capacidades de prevenção e deteção de irregularidades.

Essas medidas visam garantir a correta utilização dos fundos comunitários e a proteção contra fraudes. (Fontes: centro2030)


Evaluating RAG:  47%|████████████▌              | 14/30 [01:47<02:07,  7.95s/it]


Assistente: Algumas das áreas de intervenção do Programa Centro 2030 incluem:

1. **Competitividade da Economia** - Fomento à inovação e à digitalização das empresas.
2. **Sustentabilidade Ambiental** - Promoção de práticas sustentáveis e proteção dos recursos naturais.
3. **Valorização do Território** - Desenvolvimento de infraestruturas e serviços que melhorem a qualidade de vida das populações.
4. **Coesão Social** - Apoio a iniciativas que promovam a inclusão social e a igualdade de oportunidades.
5. **Habitação** - Investimentos em habitação social e acessível.

Essas áreas visam responder aos desafios sociais, digitais e climáticos da região. (Fontes: centro2030)


Evaluating RAG:  50%|█████████████▌             | 15/30 [01:57<02:10,  8.70s/it]


Assistente: O objetivo principal do programa COMPETE 2030 é apoiar a competitividade, sustentabilidade e resiliência das empresas portuguesas no mercado global. O programa visa impulsionar investimentos em inovação e tecnologia, promovendo a modernização das empresas e a atração de jovens e clientes através da utilização de tecnologia avançada. (Fontes: compete2030)


Evaluating RAG:  53%|██████████████▍            | 16/30 [02:04<01:52,  8.04s/it]


Assistente: Os três pilares do programa COMPETE 2030 são:

1. **Inovação** - Fomento à inovação nas empresas para aumentar a sua competitividade.
2. **Sustentabilidade** - Promoção de práticas sustentáveis que contribuam para a preservação ambiental.
3. **Digitalização** - Apoio à transformação digital das empresas, facilitando a sua adaptação às novas exigências do mercado.

Esses pilares visam fortalecer o tecido empresarial nacional e promover um desenvolvimento económico mais robusto. (Fontes: compete2030)


Evaluating RAG:  57%|███████████████▎           | 17/30 [02:14<01:53,  8.72s/it]


Assistente: O programa COMPETE 2030 pretende apoiar as PME através de várias iniciativas, incluindo:

1. **Financiamento** - Disponibilização de fundos para projetos de inovação, digitalização e sustentabilidade.
2. **Internacionalização** - Apoio à promoção da internacionalização das PME, facilitando o acesso a mercados externos.
3. **Capacitação** - Oferecimento de formação e recursos para melhorar as competências das empresas em áreas como gestão, marketing e tecnologia.
4. **Programas Específicos** - Lançamento de avisos e concursos direcionados a micro, pequenas e médias empresas, como o Aviso MPr-2024-1, que destina 2,8 milhões de euros para a propriedade intelectual e industrial.

Essas medidas visam fortalecer a competitividade e a resiliência das PME no mercado. (Fontes: compete2030)


Evaluating RAG:  60%|████████████████▏          | 18/30 [02:23<01:44,  8.75s/it]


Assistente: O canal +Transparente é um canal seguro destinado à submissão de denúncias relacionadas a irregularidades que devem ser analisadas pela organização responsável. Este canal pode ser utilizado por qualquer pessoa, mesmo que não tenha uma relação direta com a organização, para comunicar situações que considerem relevantes. (Fontes: compete2030, portugal2030)


Evaluating RAG:  63%|█████████████████          | 19/30 [02:30<01:30,  8.18s/it]


Assistente: A apresentação da Rede de Fornecedores Inovadores está agendada para o dia 29 de Abril de 2025. (Fontes: compete2030)


Evaluating RAG:  67%|██████████████████         | 20/30 [02:35<01:13,  7.36s/it]


Assistente: O StartUP Visa é um programa que visa atrair empreendedores estrangeiros para Portugal, oferecendo um visto que permite a criação e desenvolvimento de startups no país. O programa tem como objetivo fomentar a inovação e o empreendedorismo, facilitando a entrada de talentos internacionais que queiram estabelecer negócios em Portugal. Para mais informações, recomendo visitar o site oficial do programa.


Evaluating RAG:  70%|██████████████████▉        | 21/30 [02:39<00:56,  6.31s/it]


Assistente: Os tipos de certificação mencionados para PME incluem:

1. **Certificação PME** - Que comprova a dimensão da empresa como micro, pequena ou média.
2. **Certificações externas** - Como B Corp, EcoVadis e Sedex, que visam qualificar as práticas de gestão sustentável e ética das empresas.

Essas certificações ajudam as PME a melhorar a sua competitividade e a acessar novos mercados. (Fontes: iapmei)


Evaluating RAG:  73%|███████████████████▊       | 22/30 [02:48<00:56,  7.03s/it]


Assistente: Algumas das oportunidades de formação disponíveis incluem:

1. **Cursos Técnicos Superiores Profissionais (TeSP)** - Formação especializada em diversas áreas.
2. **Formações Modulares Certificadas** - Cursos que permitem a certificação em competências específicas.
3. **Formação de Profissionais do Setor da Saúde** - Programas direcionados a profissionais desta área.
4. **Cursos de Educação e Formação de Jovens (CEF)** - Destinados a jovens em processo de qualificação.
5. **Programas de Inserção Socioprofissional** - Ações que visam a integração no mercado de trabalho.

Essas formações são parte das iniciativas do PT2030 para promover a qualificação profissional e a inclusão social. (Fontes: portugal2030)


Evaluating RAG:  77%|████████████████████▋      | 23/30 [02:56<00:50,  7.29s/it]


Assistente: O objetivo do Mecanismo de Alerta Precoce (MAP) é implementar instrumentos que contribuam para a realização de processos de reestruturação empresarial mais eficazes. O MAP visa facilitar a revitalização empresarial através de alertas precoces, permitindo que as empresas identifiquem e abordem problemas financeiros antes que se tornem críticos. (Fontes: iapmei)


Evaluating RAG:  80%|█████████████████████▌     | 24/30 [03:01<00:40,  6.79s/it]


Assistente: As empresas podem se beneficiar do apoio empresarial e formação através de várias iniciativas, incluindo:

1. **Apoio ao Desenvolvimento de Produtos e Serviços** - Empresas inovadoras podem receber apoio financeiro para desenvolver novos produtos e serviços que estimulem o crescimento económico.

2. **Conteúdos Formativos** - O IAPMEI disponibiliza conteúdos formativos que ajudam as empresas a acessar programas de incentivos e a gerir as suas obrigações enquanto promotores.

3. **Consultoria e Formação** - Programas como o COMPETE 2020 oferecem ações de consultoria e formação, dotando as empresas de ferramentas para enfrentar desafios de mercado e melhorar a sua organização.

Essas iniciativas visam fortalecer a capacidade das empresas, promovendo a inovação e a competitividade. (Fontes: iapmei, compete2030)


Evaluating RAG:  83%|██████████████████████▌    | 25/30 [03:09<00:36,  7.21s/it]


Assistente: O Portugal 2030 é um plano estratégico que visa o desenvolvimento económico, social e territorial de Portugal até 2030. Aprovado pela Resolução do Conselho de Ministros n.º 98/2020, de 13 de novembro, o plano é estruturado em torno de quatro agendas temáticas centrais, que orientam as prioridades e programas para o país. O objetivo é promover um crescimento sustentável e inclusivo, articulando diferentes áreas de intervenção. (Fontes: portugal2030)


Evaluating RAG:  87%|███████████████████████▍   | 26/30 [03:18<00:30,  7.58s/it]


Assistente: Até dezembro de 2025, já foram pagos mais de 3,3 mil milhões de euros (M€) aos beneficiários do Portugal 2030, representando 30,4% do fundo aprovado. (Fontes: portugal2030)


Evaluating RAG:  90%|████████████████████████▎  | 27/30 [03:23<00:20,  6.91s/it]


Assistente: Os vencedores dos Prémios dos Fundos Europeus foram anunciados no dia 5 de dezembro de 2025, durante a 2ª edição da Mostra. (Fontes: portugal2030, centro2030)


Evaluating RAG:  93%|█████████████████████████▏ | 28/30 [03:29<00:12,  6.44s/it]


Assistente: O objetivo do projeto CustomNiTi é desenvolver placas e distratores ósseos personalizados que melhoram a eficiência e o conforto no tratamento de fraturas ósseas. Este projeto, cofinanciado pelo Programa COMPETE 2030, visa inovar o setor de dispositivos médicos, proporcionando soluções clínicas eficazes e económicas. (Fontes: portugal2030)


Evaluating RAG:  97%|██████████████████████████ | 29/30 [03:35<00:06,  6.30s/it]


Assistente: Você pode entrar em contato com a Linha dos Fundos para esclarecer dúvidas sobre o Portugal 2030 através dos seguintes meios:

- **Telefone**: (+351) 289 895 232/37 (custo gratuito para chamadas de Portugal)
- **E-mail**: linhadosfundos@linhadosfundos.pt

A Linha dos Fundos está disponível todos os dias úteis, entre as 9h e as 18h. (Fontes: portugal2030)


Evaluating RAG: 100%|███████████████████████████| 30/30 [03:41<00:00,  7.37s/it]


In [73]:
results.describe()

Unnamed: 0,Question_ID,BPT Score,Response Time (s)
count,30.0,30.0,30.0
mean,14.5,5.866667,4.013028
std,8.803408,0.899553,1.232095
min,0.0,4.0,2.09722
25%,7.25,5.25,3.123637
50%,14.5,6.0,3.726955
75%,21.75,6.0,4.770928
max,29.0,7.0,6.72383


In [75]:
results[results['BPT Score'] < 6]

Unnamed: 0,Question_ID,Source,Question,Expected Answer,Generated Answer,BPT Score,Response Time (s)
1,1,alentejo2030,Quais são alguns dos eventos programados para o Alentejo 2030?,Alguns eventos programados incluem um workshop sobre Prospetivas e Políticas Públicas em 15 de dezembro de 2025 e uma conferência sobre Inteligência Artificial em 27 de novembro de 2025.,"O documento não especifica eventos concretos programados para o Alentejo 2030. No entanto, menciona que haverá um evento que celebra projetos transformadores em Portugal, incluindo iniciativas do Alentejo 2030, com debates, apresentações e a cerimónia de entrega dos Prémios dos Fundos Europeus. Para informações mais detalhadas sobre eventos específicos, recomendo consultar o site oficial do Alentejo 2030. (Fontes: alentejo2030, portugal2030)",4,3.890048
3,3,alentejo2030,Quais são algumas das novas prioridades específicas integradas no Alentejo 2030?,"As novas prioridades incluem a Defesa, Água, Habitação a preços acessíveis e sustentável, e Competências para a descarbonização.","Algumas das novas prioridades específicas integradas no Alentejo 2030 incluem:\n\n1. **Habitação acessível** - Promovendo a fixação populacional e a justiça social.\n2. **Gestão e eficiência da água** - Reforçando a sustentabilidade e resiliência do território.\n\nEstas prioridades visam fortalecer a resposta da região a desafios económicos, sociais, ambientais e territoriais, contribuindo para um desenvolvimento mais sustentável e inclusivo. (Fontes: alentejo2030)",5,4.053267
6,6,algarve2030,Quantas candidaturas foram recebidas até 28 de novembro de 2025 para o ciclo urbano da água?,Foram recebidas 25 candidaturas de Municípios e entidades gestoras do ciclo urbano da água.,"Até 28 de novembro de 2025, foram recebidas 25 candidaturas para o ciclo urbano da água, totalizando um investimento superior a 100 milhões de euros. (Fontes: portugal2030, algarve2030)",5,3.032607
7,7,algarve2030,Qual é o valor total do investimento das candidaturas relacionadas ao ciclo urbano da água?,O investimento total das candidaturas é de mais de 100 milhões de euros.,"O valor total do investimento das candidaturas relacionadas ao ciclo urbano da água é superior a 100 milhões de euros. (Fontes: portugal2030, algarve2030)",5,2.351102
8,8,algarve2030,Quais são algumas das intervenções estratégicas previstas no Programa Algarve 2030?,"As intervenções incluem a redução de perdas nas redes urbanas de água, reabilitação de infraestruturas obsoletas, prevenção e mitigação da intrusão salina, e reutilização de águas residuais tratadas.","Algumas das intervenções estratégicas previstas no Programa Algarve 2030 incluem:\n\n1. **Promoção da competitividade das empresas** - Através de apoio à inovação e digitalização.\n2. **Sustentabilidade ambiental** - Focando na gestão eficiente dos recursos naturais.\n3. **Valorização do território** - Incentivando o desenvolvimento urbano sustentável e a reabilitação de áreas urbanas.\n4. **Qualidade de vida** - Melhorando os serviços públicos e a acessibilidade.\n\nEstas intervenções visam contribuir para um desenvolvimento equilibrado e sustentável da região do Algarve. (Fontes: algarve2030, portugal2030)",4,5.081694
12,12,centro2030,Qual é o valor do financiamento destinado à habitação no âmbito da reprogramação do CENTRO 2030?,O financiamento destinado à habitação (social e a preços acessíveis) é de quase 200 milhões de euros.,"O valor do financiamento destinado à habitação no âmbito da reprogramação do CENTRO 2030 é de quase 200 milhões de euros. Este investimento visa ampliar o parque público de habitação, promovendo a renovação de edifícios devolutos ou vagos. (Fontes: centro2030)",5,3.17532
14,14,centro2030,Quais são algumas das áreas de intervenção do Programa Centro 2030?,"As áreas de intervenção incluem habitação, tecnologias críticas, defesa e segurança, além de garantir a aplicação eficaz e transparente dos fundos europeus.","Algumas das áreas de intervenção do Programa Centro 2030 incluem:\n\n1. **Competitividade da Economia** - Fomento à inovação e à digitalização das empresas.\n2. **Sustentabilidade Ambiental** - Promoção de práticas sustentáveis e proteção dos recursos naturais.\n3. **Valorização do Território** - Desenvolvimento de infraestruturas e serviços que melhorem a qualidade de vida das populações.\n4. **Coesão Social** - Apoio a iniciativas que promovam a inclusão social e a igualdade de oportunidades.\n5. **Habitação** - Investimentos em habitação social e acessível.\n\nEssas áreas visam responder aos desafios sociais, digitais e climáticos da região. (Fontes: centro2030)",4,5.733683
22,22,iapmei,Quais são algumas das oportunidades de formação disponíveis?,"Algumas oportunidades de formação disponíveis incluem workshops sobre inovação e qualificação, recrutamento como estratégia nas PME, e webinars sobre ESG e governança.",Algumas das oportunidades de formação disponíveis incluem:\n\n1. **Cursos Técnicos Superiores Profissionais (TeSP)** - Formação especializada em diversas áreas.\n2. **Formações Modulares Certificadas** - Cursos que permitem a certificação em competências específicas.\n3. **Formação de Profissionais do Setor da Saúde** - Programas direcionados a profissionais desta área.\n4. **Cursos de Educação e Formação de Jovens (CEF)** - Destinados a jovens em processo de qualificação.\n5. **Programas de Inserção Socioprofissional** - Ações que visam a integração no mercado de trabalho.\n\nEssas formações são parte das iniciativas do PT2030 para promover a qualificação profissional e a inclusão social. (Fontes: portugal2030),5,4.77748


You can explicitly say:

Increasing k:

↑ Recall

↓ Precision

↑ Groundedness (usually)

Better chunking:

↑ Precision

↑ Groundedness

Larger chunks:

↑ Recall

↓ Precision

These trade-offs show deep understanding.