In [26]:
import csv
import json
from collections import defaultdict
import pandas as pd

In [29]:
caminho_json = "results\\response.json"

resposta = defaultdict(list)

'''
    --> Pegando os dados de resposta do chatGPT
'''
with open(caminho_json, encoding='utf-8') as f:
    dados = json.load(f)

for item in dados:
    chave = (item["Projeto"], item["Sprint_ID"], item["US_ID"])
    resposta[chave].append(item)
    

In [30]:
'''
    --> Pegando os dados de resposta da base
'''
base = defaultdict(list)
caminho_csv = "Data\\dados_processados_projetos_final.csv"

with open(caminho_csv, newline='', encoding='utf-8') as csvfile:
    leitor = csv.DictReader(csvfile)
    for linha in leitor:
        chave = (linha["Projeto"], linha["Sprint_ID"], linha["US_ID"])
        base[chave].append(linha)

In [31]:
print(len(base))

246


In [32]:
cabecalhos = [
    "Project_ID", "Project_name", "Sprint_ID", "US_ID", "Tarefas_IDS",
    "LLM Model", "NFR Recommended (ground thuth)", "NFR Suggested by LLM", "NFR_agreements", "NFR_disagreements",
    "Precision", "Recall", "F-measure"
]

In [36]:
resultados_acumulados = []
quantidade_tasks = 0

for chave, tasks in base.items():
    try:
        if isinstance(chave, tuple) and len(chave) == 3:
            projeto, sprint, us = chave
            
            # Variáveis para contagem
            nfrs_base_unicos = set()  # Armazena NFRs únicos da base (para evitar repetições)
            tarefas_ids = []
            acertou = 0
            errou = 0
            sem_nfr = 0

            # Carrega os NFRs sugeridos pelo LLM (já são únicos)
            resposta_completa = resposta[(projeto, sprint, us)][0]
            lista_nfrs = json.loads(resposta_completa['Resposta'])
            nfrs_llm = {(nfr["NFR_Tipo"], nfr["NFR_Atributo"]) for nfr in lista_nfrs}  # Conjunto de NFRs do LLM

            # Processa cada tarefa da base
            for j in base[(projeto, sprint, us)]:
                quantidade_tasks += 1
                tarefas_ids.append(f"{j['Tarefa_ID']} | ")
                
                # Verifica se é um NFR válido (não é "1")
                if (j["NFR_Tipo"] != "1") and (j["NFR_Atributo"] != "1"):
                    nfr_key = (j["NFR_Tipo"], j["NFR_Atributo"])
                    
                    # Conta cada NFR da base APENAS UMA VEZ por US/Sprint
                    if nfr_key not in nfrs_base_unicos:
                        nfrs_base_unicos.add(nfr_key)
                        
                        # Verifica se o NFR está nas sugestões do LLM
                        if nfr_key in nfrs_llm:
                            acertou += 1
                else:
                    sem_nfr += 1

            # Cálculo das métricas
            total_nfr_base = len(nfrs_base_unicos)  # NFRs únicos da base
            total_nfr_llm = len(nfrs_llm)          # NFRs sugeridos pelo LLM (únicos por padrão)
            
            precision = acertou / total_nfr_llm if total_nfr_llm > 0 else 0
            recall = acertou / total_nfr_base if total_nfr_base > 0 else 0
            f_measure = (2 * precision * recall) / (precision + recall) if (precision + recall) > 0 else 0

            novo_item = {
                "Project_ID": j["Projeto_ID"],
                "Project_name": j["Projeto"],
                "Sprint_ID": j["Sprint_ID"],
                "US_ID": j["US_ID"],
                "Tarefas_IDS": "".join(tarefas_ids).strip(" | "),  # Junta IDs e remove o último separador
                "LLM Model": "gpt-4.1-mini",
                "NFR Recommended (ground thuth)": total_nfr_base,
                "NFR Suggested by LLM": total_nfr_llm,
                "NFR_agreements": acertou,
                "NFR_disagreements": total_nfr_llm - acertou,
                "Precision": round(precision, 2),
                "Recall": round(recall, 2),
                "F-measure": round(f_measure, 2)
            }
            resultados_acumulados.append(novo_item)
            
    except Exception as e:
        print(f"⚠️ Erro ao processar a chave {chave}: {e}")

print(quantidade_tasks)

1126


In [38]:
with open("results\\results_final.csv", mode="a", newline="", encoding="utf-8") as arquivo:
    writer = csv.DictWriter(arquivo, fieldnames=cabecalhos)
    
    if arquivo.tell() == 0:
        writer.writeheader()
    
    writer.writerows(resultados_acumulados) 