# 2025 DATA·AI 분석 경진대회 - 논문·데이터 추천 에이전트 평가

이 노트북은 LLM 기반 연구 데이터/논문 추천 시스템의 성능을 평가합니다.

**실행 환경**
- GPU: NVIDIA RTX 3080 이상
- CUDA: 11.8+
- Python: 3.10+

## 1. 환경 설정 및 라이브러리 임포트

In [1]:
import sys
import os
import json
import logging
from datetime import datetime
from pathlib import Path
import pandas as pd
import numpy as np
from tqdm.auto import tqdm

# 프로젝트 루트 경로
project_root = '/home/infidea/backup-data/paper-reco-agent'
sys.path.insert(0, project_root)

print(f"프로젝트 루트: {project_root}")

# 로깅 설정
os.makedirs(os.path.join(project_root, 'logs'), exist_ok=True)

logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
    handlers=[
        logging.StreamHandler(sys.stdout),
        logging.FileHandler(os.path.join(project_root, 'logs/evaluation.log'))
    ],
    force=True
)

print("✅ 로깅 설정 완료")

# 평가 모듈 임포트
from src.evaluation.metrics import (
    evaluate_recommendations,
    batch_evaluate,
    format_evaluation_report
)
from src.config.settings import settings

print("✅ 평가 모듈 임포트 완료")

프로젝트 루트: /home/infidea/backup-data/paper-reco-agent
✅ 로깅 설정 완료
✅ 평가 모듈 임포트 완료


  from .autonotebook import tqdm as notebook_tqdm


## 2. 테스트 데이터셋 로드

In [2]:
# 테스트 데이터셋 로드
testset_path = os.path.join(project_root, 'data', 'test', 'testset_filtered.json')

with open(testset_path, 'r', encoding='utf-8') as f:
    testset = json.load(f)

print(f"✅ 테스트 데이터셋 로드 완료: {testset_path}")
print(f"📊 테스트 카테고리 수: {len(testset.keys())}")

# 모든 테스트 케이스 추출
all_test_cases = []
for category, cases in testset.items():
    for case in cases:
        case['category'] = category
        all_test_cases.append(case)

print(f"📝 총 테스트 케이스: {len(all_test_cases)}개")
print(f"\n첫 번째 테스트 케이스 예시:")
print(json.dumps(all_test_cases[0], indent=2, ensure_ascii=False)[:500] + "...")

✅ 테스트 데이터셋 로드 완료: /home/infidea/backup-data/paper-reco-agent/data/test/testset_filtered.json
📊 테스트 카테고리 수: 2
📝 총 테스트 케이스: 17개

첫 번째 테스트 케이스 예시:
{
  "input_dataset": {
    "svc_id": "c1f03ab868f32371ec97a650bcdf39ac",
    "title": "한반도 기상 관측 데이터 세트",
    "description": "한반도 종관 기상 관측 세스템으로부터의 관측 데이터 세트",
    "keywords": [
      "한반도",
      "기상",
      "센서데이터"
    ]
  },
  "candidate_pool": {
    "papers": [
      {
        "id": "DIKO0014589705",
        "title": "쿠로시오 해류의 변동성과 동아시아 겨울 기후와의 상관성 연구",
        "abstract": "동아시아 겨울 기후를 대표하는 동아시아 겨울 몬순의 변동성은 외부적 다양한 인자들에 의해 영향을 받는다. 북서태평양에서 주요한 흐름인 쿠로시오 해류도 한반도와 주변 바다에 영향을 미치며 동아시아 기후에 영향을 주는...


## 3. 추천 에이전트 초기화

In [4]:
# 추천 에이전트 임포트 및 초기화
from src.agents.recommendation_agent import KoreanResearchRecommendationAgent
from src.config.settings import settings

print("모델 설정:")
print(f"  - 모델명: {settings.MODEL_NAME}")
print(f"  - 임베딩 모델: {settings.EMBEDDING_MODEL}")
print(f"  - 개발 모드: {settings.DEV_MODE}")
print("\n🚀 에이전트 초기화 중... (수 분 소요될 수 있습니다)")

agent = KoreanResearchRecommendationAgent()

print("\n✅ 에이전트 초기화 완료")
print(f"모델 정보: {json.dumps(agent.llm_model.get_model_info(), indent=2, ensure_ascii=False)}")

2025-10-15 17:11:01,869 - sentence_transformers.SentenceTransformer - INFO - Use pytorch device_name: cuda:0
2025-10-15 17:11:01,872 - sentence_transformers.SentenceTransformer - INFO - Load pretrained SentenceTransformer: intfloat/multilingual-e5-large
모델 설정:
  - 모델명: google/gemma-2-9b-it
  - 임베딩 모델: intfloat/multilingual-e5-large
  - 개발 모드: False

🚀 에이전트 초기화 중... (수 분 소요될 수 있습니다)
2025-10-15 17:11:08,763 - src.agents.recommendation_agent - INFO - 🚀 프로덕션 모드로 실행: 실제 LLM 모델 사용
2025-10-15 17:11:08,765 - src.models.llm_model - INFO - 🚀 Gemma 모델 로딩 시작: google/gemma-2-9b-it
2025-10-15 17:11:08,765 - src.models.llm_model - INFO -    - 디바이스: cuda
2025-10-15 17:11:10,231 - src.models.llm_model - INFO -    - FP16 모드


`torch_dtype` is deprecated! Use `dtype` instead!
Loading checkpoint shards: 100%|██████████| 4/4 [00:19<00:00,  4.90s/it]


2025-10-15 17:11:42,559 - src.models.llm_model - INFO - ✅ Gemma 모델 로딩 완료

✅ 에이전트 초기화 완료
모델 정보: {
  "model_name": "google/gemma-2-9b-it",
  "model_type": "Gemma",
  "device": "cuda",
  "dtype": "float16",
  "max_tokens": 512,
  "temperature": 0.1,
  "parameters": "9B",
  "context_length": "8K"
}


## 4. 평가 실행

모든 테스트 케이스에 대해 추천을 생성하고 평가합니다.

In [5]:
# TODO: 추천 개수 설정 (선택사항)
# 최대값: agent의 max_paper_candidates, max_dataset_candidates 값
num_paper_recommendations = 5
num_dataset_recommendations = 5

# agent에서 최대 후보 개수 가져오기
MAX_PAPER_CANDIDATES = agent.max_paper_candidates
MAX_DATASET_CANDIDATES = agent.max_dataset_candidates

print(f"최대 추천 가능 개수: 논문 {MAX_PAPER_CANDIDATES}개, 데이터셋 {MAX_DATASET_CANDIDATES}개")

# 추천 개수 검증
if num_paper_recommendations > MAX_PAPER_CANDIDATES:
    print(f"⚠️  경고: 논문 추천 개수({num_paper_recommendations})가 최대값({MAX_PAPER_CANDIDATES})을 초과합니다.")
    print(f"   자동으로 {MAX_PAPER_CANDIDATES}개로 조정됩니다.")
    num_paper_recommendations = MAX_PAPER_CANDIDATES

if num_dataset_recommendations > MAX_DATASET_CANDIDATES:
    print(f"⚠️  경고: 데이터셋 추천 개수({num_dataset_recommendations})가 최대값({MAX_DATASET_CANDIDATES})을 초과합니다.")
    print(f"   자동으로 {MAX_DATASET_CANDIDATES}개로 조정됩니다.")
    num_dataset_recommendations = MAX_DATASET_CANDIDATES

if num_paper_recommendations < 1:
    print(f"⚠️  경고: 논문 추천 개수는 최소 1개 이상이어야 합니다.")
    num_paper_recommendations = 1

if num_dataset_recommendations < 1:
    print(f"⚠️  경고: 데이터셋 추천 개수는 최소 1개 이상이어야 합니다.")
    num_dataset_recommendations = 1

print(f"✅ 추천 설정: 논문 {num_paper_recommendations}개, 데이터셋 {num_dataset_recommendations}개")

최대 추천 가능 개수: 논문 10개, 데이터셋 10개
✅ 추천 설정: 논문 5개, 데이터셋 5개


In [8]:
# 평가 실행
all_eval_results = []
k_values = [3, 5]

print(f"🔍 {len(all_test_cases)}개 테스트 케이스 평가 시작")
print(f"📏 평가 k 값: {k_values}")
print("=" * 80)

for idx, test_case in enumerate(tqdm(all_test_cases, desc="평가 진행")):
    try:
        dataset_id = test_case['input_dataset']['svc_id']
        category = test_case['category']

        print(f"\n[{idx+1}/{len(all_test_cases)}] {test_case['input_dataset']['title']}")
        print(f"   카테고리: {category}")

        # 추천 생성
        recommendation_result = await agent.recommend(
            dataset_id,
            num_paper_recommendations=num_paper_recommendations,
            num_dataset_recommendations=num_dataset_recommendations
        )

        if 'error' in recommendation_result:
            print(f"   ❌ 오류: {recommendation_result['error']}")
            continue

        # 평가 형식으로 변환
        predictions = []
        for paper in recommendation_result.get('paper_recommendations', []):
            predictions.append({
                'type': 'paper',
                'id': paper['id'],
                'rank': paper['rank'],
                'score': paper['score']
            })

        for dataset in recommendation_result.get('dataset_recommendations', []):
            predictions.append({
                'type': 'dataset',
                'id': dataset['id'],
                'rank': dataset['rank'],
                'score': dataset['score']
            })

        # 평가
        ground_truth = test_case['candidate_pool']
        eval_result = evaluate_recommendations(predictions, ground_truth, k_values)

        # 메타데이터 추가
        eval_result['test_case_index'] = idx
        eval_result['dataset_id'] = dataset_id
        eval_result['category'] = category
        eval_result['input_title'] = test_case['input_dataset']['title']
        eval_result['processing_time_ms'] = recommendation_result.get('processing_time_ms', 0)

        all_eval_results.append(eval_result)

        # 결과 요약 출력 (k_values 반영)
        summary_chunks = []
        for k in k_values:
            ndcg = eval_result.get(f"overall_ndcg@{k}", 0)
            mrr = eval_result.get(f"overall_mrr@{k}", 0)
            recall = eval_result.get(f"overall_recall@{k}", 0)
            summary_chunks.append(
                f"nDCG@{k}={ndcg:.4f}, MRR@{k}={mrr:.4f}, Recall@{k}={recall:.4f}"
            )
        print("   ✅ " + " | ".join(summary_chunks))

    except Exception as e:
        print(f"   ❌ 예외 발생: {e}")
        logging.error(f"테스트 케이스 {idx} 평가 실패: {e}", exc_info=True)
        continue

print("\n" + "=" * 80)
print(f"✅ 평가 완료: {len(all_eval_results)}/{len(all_test_cases)}개 케이스 성공")

🔍 17개 테스트 케이스 평가 시작
📏 평가 k 값: [3, 5]


평가 진행:   0%|          | 0/17 [00:00<?, ?it/s]


[1/17] 한반도 기상 관측 데이터 세트
   카테고리: 국내
2025-10-15 17:24:39,270 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c1f03ab868f32371ec97a650bcdf39ac
2025-10-15 17:24:39,367 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c1f03ab868f32371ec97a650bcdf39ac?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:24:39,369 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c1f03ab868f32371ec97a650bcdf39ac
2025-10-15 17:24:39,370 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "35 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c1f03ab868f32371ec97a650bcdf39ac",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "2025",
    "dataset_access_type_pc": "공개",
    "file_yn_pc": "직접다운로드",
    "dataset_cc_license


Batches: 100%|██████████| 1/1 [00:00<00:00, 113.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 67.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.10it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 48.95it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 57.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 111.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 135.62it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 129.39it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.86it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 127.53it/s]

Batches: 100%|██████████| 1/1 [00:00<

2025-10-15 17:24:41,529 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 12개 데이터셋 순위 결정 완료
2025-10-15 17:24:41,530 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 17:24:41,531 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:24:41,532 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 한반도 기상 관측 데이터 세트
Description: 한반도 종관 기상 관측 세스템으로부터의 관측 데이터 세트
Keywords: 한반도, 기상, 센서데이터

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0012379411
- Title: 기상 Index들과 한반도 강수량과의 상관관계분석
- Description: 국 문 초 록 최근 기후변화와 관련하여 전 세계적으로 강수의 빈도, 강도, 공간적 범위, 지속기간에 변화가 나타나 가뭄 등 다양한 사회경제학적 문제점이 발생하고 있다. 물과 관련된 이상기후 현상의 장기예측은 그 예측 가능성의 한계에도 불구하고 수자원의 효율적 사용과 관리, 각종 용수의 안정적 확보 등 다양한 측면에서 매우 중요하다. 본 논문에서는 우리나라 강수량과 기상 Index들과의 상관관계 분석을 통하여 우리나라의 강수량과 기후변화에 영향을 




2025-10-15 17:24:54,931 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "DIKO0012379411",
      "reason": "한반도 강수량과 기상 지수의 상관관계 분석을 다루며, 주어진 데이터셋과 매우 직접적인 관련성을 가지고 있습니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "ATN0037470932",
      "reason": "데이터센터 모니터링 시스템에서 대량 스트리밍 센서 데이터 처리를 다루며, 센서 데이터 처리와 관련된 주제와 일치합니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "DIKO0014572213",
      "reason": "시공간 센서 데이터 처리 시스템을 다루며, 센서 데이터와 관련된 주제와 일치합니다.",
      "level": "강추"
    },
    {
      "rank": 4,
      "candidate_id": "DIKO0013234394",
      "reason": "기상 정보를 활용하여 지각 변화를 연구하는 내용으로, 기상 데이터와 관련된 주제와 일치합니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "ATN0037484520",
      "reason": "다양한 현장 적용이 가능한 센서 데이터 수집 기능 개발을 다루며, 센서 데이터 수집과 관련된 주제와 일치합니다.",
      "level": "추천"
    }
  ]
}
2025-10-15 17:24:54,934 - src.agents.recommendation_agent

평가 진행:   6%|▌         | 1/17 [00:31<08:26, 31.67s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.0625 | nDCG@5=0.8772, MRR@5=1.0000, Recall@5=0.1250

[2/17] Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상을 활용한 천지호 GeoAI 데이터셋
   카테고리: 국내
2025-10-15 17:25:10,941 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 8d498db96633f07fe1d82ebe43daaf45
2025-10-15 17:25:11,038 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/8d498db96633f07fe1d82ebe43daaf45?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:25:11,040 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 8d498db96633f07fe1d82ebe43daaf45
2025-10-15 17:25:11,042 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "8d498db96633f07fe1d82ebe43daaf45",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "datase

평가 진행:  12%|█▏        | 2/17 [00:32<03:20, 13.34s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[3/17] 이동형 도시환경 센싱 데이터 셋
   카테고리: 국내
2025-10-15 17:25:11,447 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c3ad2f8c1cf9e107a3f68b6972b64ad5
2025-10-15 17:25:11,527 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c3ad2f8c1cf9e107a3f68b6972b64ad5?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:25:11,529 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c3ad2f8c1cf9e107a3f68b6972b64ad5
2025-10-15 17:25:11,530 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "21 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c3ad2f8c1cf9e107a3f68b6972b64ad5",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc


Batches: 100%|██████████| 1/1 [00:00<00:00, 106.31it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 116.87it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.39it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.02it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 117.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.43it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 67.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 76.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.90it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.69it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.19it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.35it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.35it/s]

Batches: 100%|██████████| 1/1 [00:00<00

2025-10-15 17:25:16,453 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 10개 데이터셋 순위 결정 완료
2025-10-15 17:25:16,453 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 17:25:16,454 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:25:16,455 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 이동형 도시환경 센싱 데이터 셋
Description: 자동차 탑재 센서를 활용한 전국 5대 광역시 대상 대기환경 수집 데이터. 미세먼지, 초미세먼지, 일산화탄소, 이산화질소 수치 등 각종 정보를 수집
Keywords: 사물데이터, 대기환경 센싱, 광역시, 미세먼지

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0014057037
- Title: 수도권 대기질 개선에 관한 연구 : 도로발생 PM10과 PM2.5 중심으로
- Description: 본 연구에서는 “2차 수도권 대기환경관리 기본계획”의 PM10 및 PM2.5 저감 정책을 살펴보고, 도로에서 발생하는 이들 미세먼지를 효과적으로 저감하기 위한 정책방안을 제언하였다.&#xD; 수도권 도로이동 오염원으로부터 배출되는 PM10(2012년)은 전국 미세먼지발생량의 29%(3,531.0 톤)를 차지하고 




2025-10-15 17:25:30,081 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "DIKO0013536862",
      "reason": "초미세먼지(PM2.5)의 장기적인 변화와 오염원 분석에 초점을 맞춘 연구이며, 제공된 데이터셋과 매우 유사한 주제입니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "DIKO0013873564",
      "reason": "도시 지역의 초미세먼지와 호흡기 질환, 순환기 질환의 연관성을 연구한 논문으로, 대기환경 데이터와 건강 데이터의 관계를 분석하는 데 도움이 될 것입니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "DIKO0012646651",
      "reason": "수도권 지역의 PM2.5 내 PAHs 분포 특성을 분석한 연구로, 대기오염 물질의 종류와 농도에 대한 정보를 제공합니다.",
      "level": "강추"
    },
    {
      "rank": 4,
      "candidate_id": "ART001980410",
      "reason": "서울 지역의 대기오염이 국민 건강에 미치는 영향을 분석한 연구로, 대기오염 문제의 심각성을 보여주는 자료입니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "NART78874795",
      "reason": "대기오염이 심혈관 질환에 미치는 영향을 검토한 연구로, 대기오염과 건강 문제의 연관성을 이해하는 데 도움이 될 것입니다.",
      "level": "추천"
    }
  ]
}

평가 진행:  18%|█▊        | 3/17 [01:04<05:07, 21.93s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[4/17] 이동형 도시환경 센서 및 도로영상 데이터 셋
   카테고리: 국내
2025-10-15 17:25:43,600 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 000e4340354d8219bdb3af6a7ad4800d
2025-10-15 17:25:43,696 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/000e4340354d8219bdb3af6a7ad4800d?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:25:43,698 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 000e4340354d8219bdb3af6a7ad4800d
2025-10-15 17:25:43,699 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "000e4340354d8219bdb3af6a7ad4800d",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pu


Batches: 100%|██████████| 1/1 [00:00<00:00, 107.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.47it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 116.25it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.99it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 71.23it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.47it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 98.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 117.55it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.55it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 127.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.57it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.05it/s]

Batches: 100%|██████████| 1/1 [00:0

2025-10-15 17:25:46,083 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 7개 데이터셋 순위 결정 완료
2025-10-15 17:25:46,084 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 17:25:46,085 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:25:46,085 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 이동형 도시환경 센서 및 도로영상 데이터 셋
Description: 자동차 탑재 센서 및 블랙박스를 활용한 전국 5대 광역시 대상 도로영상 수집 데이터. 미세먼지, 초미세먼지, 일산화탄소, 이산화질소 수치 등 각종 정보를 수집
Keywords: 사물데이터, 도시영상, 광역시, 미세먼지

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0014516178
- Title: 미세먼지 자료동화 및 통합예보모형 개발연구
- Description: 2002년 수도권의 대기질이 선진국에 비해 오염이 심화되며 이를 저감 하기 위해 “수도권대기환경개선을 위한 특별법”이 제정되었다. 특별법이 제정됨에 따라 미세먼지로 인한 국민 건강 피해를 줄이기 위한 사전 예방적 방법 중 하나로 미세먼지 예보제를 도입하였다. 2002년 6월부터 통계예보모델을 개발 하고, 서울을 중심으로 한 미




2025-10-15 17:26:00,549 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "DIKO0014897285",
      "reason": "미세먼지에 대한 인식과 소셜미디어 사용과의 관계를 분석하며, 미세먼지 대응 행동에 미치는 영향을 연구한 논문입니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "DIKO0013283745",
      "reason": "미세먼지 PM10 증가와 사망률의 상관관계를 체계적으로 분석하고, 그 영향을 심층적으로 조사한 연구입니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO202113939668213",
      "reason": "IoT 데이터 서비스 구축 방안을 제시하며, 특히 공공 데이터 제공에 대한 필요성을 강조하는 내용입니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "NPAP12898348",
      "reason": "사물인터넷 관련 키워드를 활용한 빅데이터 분석을 통해 대중의 인식을 파악하려는 시도를 담고 있습니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "JAKO201532742223577",
      "reason": "센서 네트워크에서 데이터 분산 기법을 제안하며, 신뢰성 향상을 위한 노력을 보여주는 연구입니다.",
      "level": "참고"
    }
  ]
}
2025-10-15 17:26:00,551 - src.agents.recommen

평가 진행:  24%|██▎       | 4/17 [01:34<05:26, 25.10s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[5/17] Dataset for Intervention strategies against COVID-19 and their estimated impact on Swedish healthcare capacity
   카테고리: 국내
2025-10-15 17:26:13,560 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 33da0205f56477ba41dec7d7db3258a6
2025-10-15 17:26:13,663 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/33da0205f56477ba41dec7d7db3258a6?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:26:13,666 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 33da0205f56477ba41dec7d7db3258a6
2025-10-15 17:26:13,667 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "36 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "33da0205f56477ba41dec7d7db3258a6",
    "ctlg_type": "02",
    "dataset_ty


Batches: 100%|██████████| 1/1 [00:00<00:00, 112.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 101.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.25it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 145.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.57it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.42it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 114.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 97.05it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.02it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.91it/s]

Batches: 100%|██████████| 1/1 [00

2025-10-15 17:26:15,703 - src.agents.recommendation_agent - INFO - 상위 12개 논문, 12개 데이터셋 순위 결정 완료
2025-10-15 17:26:15,703 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 17:26:15,705 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:26:15,705 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: Dataset for Intervention strategies against COVID-19 and their estimated impact on Swedish healthcare capacity
Description: Dataset for individual-based modeling of COVID-19 spread in Sweden.
Keywords: 코로나19, COVID-19, 코로나

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: ART002598455
- Title: 보건의료 통상과 코로나19 사태: 현황과 쟁점
- Description: The COVID-19 incident highlighted the deep interconnection between domestic healthcare systems, as well as the need for digitalization in the healthcare industry.As the world healthcare market continues to grow and development in transportation has led to repetitive occurrences of pandemics, joint respon

평가 진행:  29%|██▉       | 5/17 [02:05<05:28, 27.38s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.1667 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.1667

[6/17] 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
   카테고리: 국내
2025-10-15 17:26:44,975 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID bee3162957beecc87a91c94803d23439
2025-10-15 17:26:45,076 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/bee3162957beecc87a91c94803d23439?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:26:45,079 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset bee3162957beecc87a91c94803d23439
2025-10-15 17:26:45,079 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "bee3162957beecc87a91c94803d23439",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
   


Batches: 100%|██████████| 1/1 [00:00<00:00, 95.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 90.69it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 63.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.57it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 70.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 90.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.67it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.32it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88

2025-10-15 17:26:50,738 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 18개 데이터셋 순위 결정 완료
2025-10-15 17:26:50,739 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 17:26:50,740 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:26:50,740 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
Description: 본 데이터셋은 해양 관측을 목적으로 수집된 CCTV 화면에서 날짜와 시간을 나타내는 영역을 추출한 3362개의 이미지로 구성됨.\r\n이미지 파일명은 S-ORS_WEST_yyyy-mm-dd_hh-MM-ss 형식을 따르며, 날짜와 시간 정보를 포함함.\r\n본 데이터셋은 2023년 8월 동안 수집된 자료로, 모든 이미지 파일은 PNG 형식이며 해상도는 500x120 픽셀.
Keywords: 이미지 처리, 타임스탬프, 해양 관측, 해양 모니터링, CCTV, 날짜 및 시간 정보, 이미지 데이터셋

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO202013363977987
- Title: 한국의 연안원격탐사 활용
- Description: 최근 지구온난화로 인한 지구 규모 단

평가 진행:  35%|███▌      | 6/17 [02:40<05:29, 29.95s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[7/17] 필리핀해 해양-대기 감시부이 자료 1(2020년)
   카테고리: 국내
2025-10-15 17:27:19,934 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c592e36ae62d104b21183d9f498d918f
2025-10-15 17:27:20,039 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c592e36ae62d104b21183d9f498d918f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:27:20,042 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c592e36ae62d104b21183d9f498d918f
2025-10-15 17:27:20,043 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c592e36ae62d104b21183d9f498d918f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset


Batches: 100%|██████████| 1/1 [00:00<00:00, 80.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.08it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.79it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.43it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.97it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.45it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.90it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.96it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.86it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.

2025-10-15 17:27:25,878 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 17개 데이터셋 순위 결정 완료
2025-10-15 17:27:25,879 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 17:27:25,881 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:27:25,881 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 필리핀해 해양-대기 감시부이 자료 1(2020년)
Description: 필리핀해에 해양-대기 감시부이를 설치하여(북위 15도, 동경 134.5도) 대기변수 관측.
Keywords: 동중국해, 해류관측, 쿠로시오

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART79124255
- Title: A 150&#x2010;year variation of the Kuroshio transport inferred from coral nitrogen isotope signature
- Description: Abstract The Kuroshio Current is a major global ocean current that drives the physical ocean&#8208;atmosphere system with heat transport from tropic




2025-10-15 17:27:42,107 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "NART79124255",
      "reason": "쿠로시오 해류의 변화를 연구하는 데 중요한 정보를 제공하며, 특히 150년 동안의 데이터를 기반으로 한 연구라는 점에서 높은 가치를 지닌다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "JAKO201304854498452",
      "reason": "동해 지역의 해류와 관련된 연구이며, 특히 북한한류와 동한난류의 역할을 설명하는 내용이므로 본 주제와 관련성이 높다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO201616553237753",
      "reason": "깊은 바닷속 환경을 조사하는 연구로, 쿠로시오 해류와 관련된 생태계 이해에 도움을 줄 수 있는 정보를 제공한다.",
      "level": "강추"
    },
    {
      "rank": 4,
      "candidate_id": "JAKO200215875827292",
      "reason": "동해의 과거 해수온도 변화를 알아내는 연구로, 쿠로시오 해류의 역사적 변화와 연결될 수 있는 중요한 단서를 제공한다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "NPAP08050649",
      "reason": "동해/일본해의 열량 이동에 대한 연구로, 쿠로시오 해류의 에너지 전달 메커니즘을 이해하는데 도움을 줄 수 있다.",
      "level": "추천"
    }
  ]
}


평가 진행:  41%|████      | 7/17 [03:17<05:23, 32.32s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[8/17] 의료영상데이터
   카테고리: 국내
2025-10-15 17:27:57,123 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 17:27:57,227 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/a59a0a7d0c894a81a2936833b0790e0a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:27:57,229 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 17:27:57,230 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "33 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "a59a0a7d0c894a81a2936833b0790e0a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "2025",


Batches: 100%|██████████| 1/1 [00:00<00:00, 111.54it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 60.90it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 137.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 64.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 135.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 142.20it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 148.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 62.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 148.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.57it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 40.95it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 135.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 47.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.59it/s]

Batches: 100%|██████████| 1/1 [00:00

2025-10-15 17:27:59,337 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 12개 데이터셋 순위 결정 완료
2025-10-15 17:27:59,337 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 17:27:59,338 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:27:59,339 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 의료영상데이터
Description: 휴먼 디지털트윈을 위한 의료영상데이터
Keywords: 인체데이터, Human Digital Twin, 데이터 플랫폼

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART128751246
- Title: From Digital Human Modeling to Human Digital Twin: Framework and Perspectives in Human Factors
- Description: Abstract The human digital twin (HDT) emerges as a promising human-centric technology in Industry 5.0, but challenges remain in human modeling and simulation. Digital human modeling (DH

평가 진행:  47%|████▋     | 8/17 [03:49<04:49, 32.22s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[9/17] 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
   카테고리: 국내
2025-10-15 17:28:29,131 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID bee3162957beecc87a91c94803d23439
2025-10-15 17:28:29,228 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/bee3162957beecc87a91c94803d23439?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:28:29,232 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset bee3162957beecc87a91c94803d23439
2025-10-15 17:28:29,232 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "bee3162957beecc87a91c94803d23439",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
   


Batches: 100%|██████████| 1/1 [00:00<00:00, 93.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 101.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 67.01it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 107.89it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.55it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.87it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 108.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 95.06it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.93it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.59it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 150.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.62it/s]

Batches: 100%|██████████| 1/1 [00:0

2025-10-15 17:28:32,906 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 18개 데이터셋 순위 결정 완료
2025-10-15 17:28:32,907 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 17:28:32,908 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:28:32,908 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
Description: 본 데이터셋은 해양 관측을 목적으로 수집된 CCTV 화면에서 날짜와 시간을 나타내는 영역을 추출한 3362개의 이미지로 구성됨.\r\n이미지 파일명은 S-ORS_WEST_yyyy-mm-dd_hh-MM-ss 형식을 따르며, 날짜와 시간 정보를 포함함.\r\n본 데이터셋은 2023년 8월 동안 수집된 자료로, 모든 이미지 파일은 PNG 형식이며 해상도는 500x120 픽셀.
Keywords: 이미지 처리, 타임스탬프, 해양 관측, 해양 모니터링, CCTV, 날짜 및 시간 정보, 이미지 데이터셋

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO201927561416104
- Title: A Digital Forensic Analysis of Timestamp Change T




2025-10-15 17:28:43,860 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "NART101455497",
      "reason": "해양 환경 모니터링에 초점을 맞춘 연구이며, 이미지 처리 기술과 연관성이 높습니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "NART38031418",
      "reason": "CCTV 기반 해양 관측 시스템을 설명하며, 해당 데이터셋과 직접적인 관련성이 있습니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO201927561416104",
      "reason": "타임스탬프 변조 분석에 대한 연구로, 데이터셋의 타임스탬프 특징과 관련성이 있습니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "ART001918347",
      "reason": "카메라 기반 통신 기술과 이미지 처리를 결합하는 연구로, 데이터셋의 이미지 활용 가능성을 제시합니다.",
      "level": "참조"
    },
    {
      "rank": 5,
      "candidate_id": "ART001186224",
      "reason": "해양 색깔 모니터링에 대한 연구로, 해양 관측 분야와 관련성이 있지만, 데이터셋과 직접적인 연결성은 낮습니다.",
      "level": "참조"
    }
  ]
}
2025-10-15 17:28:43,861 - src.agents.recommendation_agent - INFO - ✅ JSON 파싱 성공
2025-1

평가 진행:  53%|█████▎    | 9/17 [04:18<04:09, 31.14s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[10/17] 필리핀해 해양-대기 감시부이 자료 1(2020년)
   카테고리: 국내
2025-10-15 17:28:57,897 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c592e36ae62d104b21183d9f498d918f
2025-10-15 17:28:57,990 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c592e36ae62d104b21183d9f498d918f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:28:57,992 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c592e36ae62d104b21183d9f498d918f
2025-10-15 17:28:57,993 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c592e36ae62d104b21183d9f498d918f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "datase


Batches: 100%|██████████| 1/1 [00:00<00:00, 112.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 117.90it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.82it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 116.87it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 93.40it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 116.93it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 116.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.96it/s]

Batches: 100%|██████████| 1/1 [00

2025-10-15 17:29:02,348 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 17개 데이터셋 순위 결정 완료
2025-10-15 17:29:02,349 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 17:29:02,351 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:29:02,352 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 필리핀해 해양-대기 감시부이 자료 1(2020년)
Description: 필리핀해에 해양-대기 감시부이를 설치하여(북위 15도, 동경 134.5도) 대기변수 관측.
Keywords: 동중국해, 해류관측, 쿠로시오

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO201403359904771
- Title: Kuroshio 해류의 흐름장에 부유하는 해양 폐기물의 변동 특성
- Description: This study is to analyze the variability of floating marine debris(FMD) on the Kuroshio Current Area(KCA). A sighting survey was conducted from July 5th to July 16th, 2013 while navigating on KCA from Keelung, Taiwan to Tokyo, Japan using T/V KAYA of Pukyong National University. The sampled zones were divided into 6 transects and observed FMD during daytime in each transect. And also spec

평가 진행:  59%|█████▉    | 10/17 [04:54<03:48, 32.65s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.3869, MRR@5=0.2000, Recall@5=0.0714

[11/17] 의료영상데이터
   카테고리: 국내
2025-10-15 17:29:33,938 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 17:29:34,036 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/a59a0a7d0c894a81a2936833b0790e0a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:29:34,038 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 17:29:34,039 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "a59a0a7d0c894a81a2936833b0790e0a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "2025"


Batches: 100%|██████████| 1/1 [00:00<00:00, 106.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 60.35it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 64.82it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 141.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.38it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 136.76it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 62.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 137.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 73.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 41.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 135.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 47.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 143.92it/s]

Batches: 100%|██████████| 1/1 [00:00

2025-10-15 17:29:36,308 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 12개 데이터셋 순위 결정 완료
2025-10-15 17:29:36,309 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 17:29:36,311 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:29:36,311 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 의료영상데이터
Description: 휴먼 디지털트윈을 위한 의료영상데이터
Keywords: 인체데이터, Human Digital Twin, 데이터 플랫폼

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART128751246
- Title: From Digital Human Modeling to Human Digital Twin: Framework and Perspectives in Human Factors
- Description: Abstract The human digital twin (HDT) emerges as a promising human-centric technology in Industry 5.0, but challenges remain in human modeling and simulation. Digital human modeling (DHM) provides solutions for modeling and simulating human physical and cognitive aspects to support ergonomic analysis. However, it has limitations in real-time data usage, personalized se

평가 진행:  65%|██████▍   | 11/17 [05:25<03:12, 32.11s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[12/17] 한국인 정상인 심전도 세부파형 
   카테고리: 국내
2025-10-15 17:30:04,806 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 4fc87916027f5568850d33ecd2f7680f
2025-10-15 17:30:04,901 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/4fc87916027f5568850d33ecd2f7680f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:30:04,904 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 4fc87916027f5568850d33ecd2f7680f
2025-10-15 17:30:04,905 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "4fc87916027f5568850d33ecd2f7680f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_p


Batches: 100%|██████████| 1/1 [00:00<00:00, 73.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.20it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.84it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.35it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.23it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.19it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.79it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.84it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.93it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 60.07it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.86it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 61.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.

2025-10-15 17:30:11,765 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 22개 데이터셋 순위 결정 완료





2025-10-15 17:30:11,766 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 17:30:11,767 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:30:11,767 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 한국인 정상인 심전도 세부파형 
Description: 참조표준 설명 : ○ P_height, Q_height, R_height, S_height, T_height, P_duration, QRS_interval, QT_interval, T_duration\n○ 60~69세 Modified lead (Mason-Likar) system에서 성인 남녀의 정상 심전도\n 참조표준 제/개정 사유 : ㅇ심장 질환 환자용 진단 기기 개발\nㅇ마취 중에 있거나 중환자실에 있는 환자의 심장질환 발병 및 경과 관찰용 기기 개발\nㅇ심전도를 이용한 심박변이도(Heart Rate Variability, HRV), 맥파전도속도(Pulse Wave Velocity) 등의 연구 및 관련 기기 개발에 도움\nㅇ 2013년에 개발한 연령대 20-50세, 2014년 2-13세, 2017년 6--60세를 추가함
Keywords: P, Electrocardiogram (ECG), Heart rate, ECG feature, QRS, Modified limb lead, Sex, T

## Top 10 paper Candidates 

평가 진행:  71%|███████   | 12/17 [05:58<02:41, 32.22s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[13/17] 돌발홍수 알람 분석
   카테고리: 국내
2025-10-15 17:30:37,290 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c05286c716d93ea28c6fd08f28b17b6a
2025-10-15 17:30:37,383 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c05286c716d93ea28c6fd08f28b17b6a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:30:37,386 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c05286c716d93ea28c6fd08f28b17b6a
2025-10-15 17:30:37,386 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c05286c716d93ea28c6fd08f28b17b6a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "20


Batches: 100%|██████████| 1/1 [00:00<00:00, 96.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 129.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 51.70it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.99it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.45it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.76it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 70.07it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.39it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.04it/s]

Batches: 100%|██████████| 1/1 [00:0

2025-10-15 17:30:38,659 - src.agents.recommendation_agent - INFO - 상위 10개 논문, 5개 데이터셋 순위 결정 완료
2025-10-15 17:30:38,660 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 17:30:38,662 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:30:38,662 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 돌발홍수 알람 분석
Description: 돌발홍수 알람 \r\n대상기간 : 2020~2022.6 중 일부\r\n단위 : 읍면동 수준\r\n알람 단계 : 3단계\r\n입력 데이터 : 격자 강우 관측(RDR_COMP_ADJ), 예측(QPF) \r\n대상 범위 : 전국(제주도 등 남부 제외)\r\nFormat : OGC KML (XML)\r\n좌표참조체계 : EPSG::4326
Keywords: 홍수, 알람

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0016784708
- Title: 알람 관리솔루션의 Nuisance 알람 제거를 통한 공정 알람부하 감소방안 연구
- Description: 본 연구는 운전자에게 불필요하거나 비정상적으로 과다하게 발생하는 공정 알람 빈도와 국제표준 ISA 18.2에서 제시하는 기준과 비교하여 차이점을 확인하고 알람 발생빈도를

평가 진행:  76%|███████▋  | 13/17 [06:25<02:03, 30.79s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[14/17] 2024 극한기후영향 보고서
   카테고리: 국내
2025-10-15 17:31:04,776 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID e876ffe4cad991d4f4930284468df093
2025-10-15 17:31:04,870 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/e876ffe4cad991d4f4930284468df093?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:31:04,873 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset e876ffe4cad991d4f4930284468df093
2025-10-15 17:31:04,874 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "e876ffe4cad991d4f4930284468df093",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc"


Batches: 100%|██████████| 1/1 [00:00<00:00, 120.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.99it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.86it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 129.97it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.52it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.52it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.25it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.38it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.03it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 135.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 51.25it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.61it/s]

Batches: 100%|██████████| 1/1 [0

2025-10-15 17:31:07,834 - src.agents.recommendation_agent - INFO - 상위 24개 논문, 13개 데이터셋 순위 결정 완료
2025-10-15 17:31:07,834 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 17:31:07,836 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:31:07,836 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 2024 극한기후영향 보고서
Description: 폭염, 한파, 폭우 및 홍수, 가뭄 등의 피해사례 및 정책
Keywords: 가뭄, 홍수, 폭우, 폭염, 한파, 극한기후

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART69884999
- Title: 폭우 소송
- Description: &amp;nbsp;&amp;nbsp;미국 대법원에 계류 중인 “폭우 소송”은 미국 환경보호청(Environmental Protection Agency)의 오랫동안 유지된 임업규칙에 도전하고 있다. 2006년, Northwest Environmental Defense Center는 Oregon 주와 목재회사 등을 상대로 연방수질법(Clean Water Act)위반을 이유로 소를 제기하였다. 제9 순회법원은 그의 판단에서, 연방수질법과 미국 환경보호청의 임업규칙에 관한 기존의 해석을 부정하는 결정을 한다. 연방수질법 그리고 환경보호청의 기존의 해석을 거부한 이러한 판단은 그러한 근거가 가히 부당하다고 볼 수만은 없겠으나, 당해 지역과 주정부 그리고 관련된 목재 산업에 상당한 부정적인 효과를 야기하게 된다. 만약 동 규칙이 현행법과 합치하지 않으며 산림도로에서 흐르는 모든 폭우의 배수로에 연방수 질법의

평가 진행:  82%|████████▏ | 14/17 [06:55<01:31, 30.51s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[15/17] 2024 극한기후영향 보고서
   카테고리: 국내
2025-10-15 17:31:34,634 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID e876ffe4cad991d4f4930284468df093
2025-10-15 17:31:34,728 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/e876ffe4cad991d4f4930284468df093?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:31:34,730 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset e876ffe4cad991d4f4930284468df093
2025-10-15 17:31:34,731 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "e876ffe4cad991d4f4930284468df093",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc"


Batches: 100%|██████████| 1/1 [00:00<00:00, 122.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 54.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.82it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 60.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 73.10it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 127.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 127.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.92it/s]

Batches: 100%|██████████| 1/1 [00:00

2025-10-15 17:31:39,816 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 20개 데이터셋 순위 결정 완료
2025-10-15 17:31:39,816 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 17:31:39,817 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:31:39,818 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 2024 극한기후영향 보고서
Description: 폭염, 한파, 폭우 및 홍수, 가뭄 등의 피해사례 및 정책
Keywords: 가뭄, 홍수, 폭우, 폭염, 한파, 극한기후

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0017175632
- Title: Hydrological variables and total water storage change in response to climate and land use change: case study of Korea
- Description: 이 연구는 두 가지 주요 구성 요소로 나뉩니다: 토양 수분 데이터 정확성을 향상시키고 기후 및 토지 이용 변화가 미래의 수문학적 변수와 총 물 저장량에 미치는 영향을 평가하는 것입니다 (SSP2-4.5 및 SSP5-8.5). 일반 회귀 신경망(GRNN) 모델을 사용하여 

평가 진행:  88%|████████▊ | 15/17 [07:39<01:09, 34.71s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[16/17] NSW COVID-19 tests by location (discontinued)
   카테고리: 해외
2025-10-15 17:32:19,076 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 03e16fe2b6d96d4961f22c244a94bb1a
2025-10-15 17:32:19,170 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/03e16fe2b6d96d4961f22c244a94bb1a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:32:19,171 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 03e16fe2b6d96d4961f22c244a94bb1a
2025-10-15 17:32:19,172 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "03e16fe2b6d96d4961f22c244a94bb1a",
    "ctlg_type": "02",
    "dataset_type": "02",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc":


Batches: 100%|██████████| 1/1 [00:00<00:00, 53.89it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.39it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 66.19it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.48it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.53it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 66.08it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 54.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 77.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 64.03it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.45it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 95.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.67it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 77.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 69.

2025-10-15 17:32:50,252 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 17개 데이터셋 순위 결정 완료
2025-10-15 17:32:50,253 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 17:32:50,255 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:32:50,255 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: NSW COVID-19 tests by location (discontinued)
Description: From 20 October 2023, COVID-19 datasets will no longer be updated. \\r\\nDetailed information is available in the fortnightly NSW Respiratory Surveillance Report: https://www.health.nsw.gov.au/Infectious/covid-19/Pages/reports.aspx. \\r\\nLatest national COVID-19 spread, vaccination and treatment metrics are available on the Australian Government Health website: https://www.health.gov.au/topics/covid-19/rep




2025-10-15 17:33:02,425 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "ART002578663",
      "reason": "코로나 바이러스 관련 질병에 대한 논문으로, 주제와 매우 유사합니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "ART001944899",
      "reason": "시민권 테스트와 사회 구성원성을 다루는 내용으로, 연구 주제와 연관성이 높습니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "NART86714278",
      "reason": "알레르기 검사와 관련된 임상 시험 결과를 분석하는 논문으로, 의료 데이터 분석과 유사한 접근 방식을 사용할 수 있습니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "NPAP12623471",
      "reason": "차량 운행 특성과 트랙 상호 작용에 대한 실험 연구로, 데이터 분석 및 모델링에 대한 이해를 높일 수 있습니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "ART001173663",
      "reason": "전쟁 이후 세대의 심리적 어려움을 다루는 소설 분석으로, 인간 행동 패턴과 사회 변화에 대한 통찰력을 제공할 수 있습니다.",
      "level": "참고"
    }
  ]
}
2025-10-15 17:33:02,427 - src.agents.recommendation_agent - INFO - ✅ JSON

평가 진행:  94%|█████████▍| 16/17 [08:54<00:46, 46.75s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[17/17] Police recorded crime trends in Victoria during the COVID-19 pandemic
   카테고리: 해외
2025-10-15 17:33:33,781 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID b89d0c5d5891c5c80cd7a565ce8a3dc6
2025-10-15 17:33:33,886 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/b89d0c5d5891c5c80cd7a565ce8a3dc6?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 17:33:33,888 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset b89d0c5d5891c5c80cd7a565ce8a3dc6
2025-10-15 17:33:33,889 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "34 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "b89d0c5d5891c5c80cd7a565ce8a3dc6",
    "ctlg_type": "02",
    "dataset_type": "02",
    "ctlg_type_pc": "dataset"


Batches: 100%|██████████| 1/1 [00:00<00:00, 62.69it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 78.45it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.45it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 78.43it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 78.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 53.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.73it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 50.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 77.62it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 67.

2025-10-15 17:33:59,687 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 16개 데이터셋 순위 결정 완료
2025-10-15 17:33:59,687 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 17:33:59,689 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 17:33:59,689 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: Police recorded crime trends in Victoria during the COVID-19 pandemic
Description: The Crime Statistics Agency (CSA) has released a research paper entitled Police-recorded crime trends in Victoria during the COVID-19 pandemic. The paper examines trends in criminal offences and family violence incidents to 30 June 2020, focusing on comparing the period from 1 April 2020 to 30 June 2020 with the same period in 2019.\\r\\nThis paper aims to examine whether and how the

평가 진행: 100%|██████████| 17/17 [09:49<00:00, 34.69s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

✅ 평가 완료: 17/17개 케이스 성공





## 5. 평가 결과 분석 및 저장

### 5.1 평가 결과 저장 디렉토리 설정

In [17]:
# 타임스탬프 기반 결과 디렉토리 생성
timestamp = datetime.now().strftime('%Y%m%d%H%M')
eval_output_dir = os.path.join(project_root, 'figures', 'evaluation_results', '202510151653')
os.makedirs(eval_output_dir, exist_ok=True)

print(f"📂 평가 결과 저장 경로: {eval_output_dir}")

# 평가 설정 저장
config_to_save = {
    'model_name': settings.MODEL_NAME,
    'embedding_model': settings.EMBEDDING_MODEL,
    'max_tokens': settings.MAX_TOKENS,
    'temperature': settings.TEMPERATURE,
    'paper_hybrid_alpha': settings.PAPER_HYBRID_ALPHA,
    'paper_hybrid_beta': settings.PAPER_HYBRID_BETA,
    'dataset_hybrid_alpha': settings.DATASET_HYBRID_ALPHA,
    'dataset_hybrid_beta': settings.DATASET_HYBRID_BETA,
    'dev_mode': settings.DEV_MODE,
    'evaluation_timestamp': timestamp,
    'testset_path': testset_path,
    'num_test_cases': len(all_test_cases)
}

config_path = os.path.join(eval_output_dir, 'config.json')
with open(config_path, 'w', encoding='utf-8') as f:
    json.dump(config_to_save, f, indent=2, ensure_ascii=False)

print(f"✅ 설정 저장 완료")
print(f"\n📋 설정 내용:")
print(json.dumps(config_to_save, indent=2, ensure_ascii=False))

📂 평가 결과 저장 경로: /home/infidea/backup-data/paper-reco-agent/figures/evaluation_results/202510151653
✅ 설정 저장 완료

📋 설정 내용:
{
  "model_name": "google/gemma-2-9b-it",
  "embedding_model": "intfloat/multilingual-e5-large",
  "max_tokens": 512,
  "temperature": 0.1,
  "paper_hybrid_alpha": 0.8,
  "paper_hybrid_beta": 0.2,
  "dataset_hybrid_alpha": 0.6,
  "dataset_hybrid_beta": 0.4,
  "dev_mode": false,
  "evaluation_timestamp": "202510151743",
  "testset_path": "/home/infidea/backup-data/paper-reco-agent/data/test/testset_filtered.json",
  "num_test_cases": 17
}


### 5.2 전체 메트릭 계산

In [18]:
if not all_eval_results:
    print("⚠️  평가 결과가 없습니다")
else:
    # DataFrame 변환
    df_results = pd.DataFrame(all_eval_results)

    print("\n" + "=" * 80)
    print("📊 평균 평가 메트릭")
    print("=" * 80)

    # 메트릭 요약 계산
    metrics_summary = {}

    for k in k_values:
        print(f"\n📏 k={k} 결과:")
        print("-" * 80)

        k_metrics = {}

        for metric_type in ['overall', 'paper', 'dataset']:
            type_label = {'overall': '전체', 'paper': '논문', 'dataset': '데이터셋'}[metric_type]
            print(f"\n  {type_label}:")

            type_metrics = {}
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@{k}'
                if col_name in df_results.columns:
                    mean_val = df_results[col_name].mean()
                    std_val = df_results[col_name].std()
                    type_metrics[metric] = {'mean': mean_val, 'std': std_val}
                    print(f"    • {metric.upper():10s}: {mean_val:.4f} ± {std_val:.4f}")

            k_metrics[metric_type] = type_metrics

        metrics_summary[f'k{k}'] = k_metrics

    # 통계
    print("\n" + "=" * 80)
    print("📈 기본 통계")
    print("=" * 80)
    print(f"  평균 추천 논문 수: {df_results['num_predicted_papers'].mean():.2f}개")
    print(f"  평균 추천 데이터셋 수: {df_results['num_predicted_datasets'].mean():.2f}개")
    print(f"  평균 관련 논문 수: {df_results['num_relevant_papers'].mean():.2f}개")
    print(f"  평균 관련 데이터셋 수: {df_results['num_relevant_datasets'].mean():.2f}개")
    print(f"  평균 처리 시간: {df_results['processing_time_ms'].mean():.0f} ms")


📊 평균 평가 메트릭

📏 k=3 결과:
--------------------------------------------------------------------------------

  전체:
    • NDCG      : 0.1176 ± 0.3321
    • MRR       : 0.1176 ± 0.3321
    • RECALL    : 0.0135 ± 0.0423
    • PRECISION : 0.0392 ± 0.1107

  논문:
    • NDCG      : 0.1176 ± 0.3321
    • MRR       : 0.1176 ± 0.3321
    • RECALL    : 0.0191 ± 0.0556
    • PRECISION : 0.0392 ± 0.1107

  데이터셋:
    • NDCG      : 0.3482 ± 0.4863
    • MRR       : 0.3529 ± 0.4926
    • RECALL    : 0.1049 ± 0.1814
    • PRECISION : 0.1373 ± 0.2061

📏 k=5 결과:
--------------------------------------------------------------------------------

  전체:
    • NDCG      : 0.1332 ± 0.3180
    • MRR       : 0.1294 ± 0.3312
    • RECALL    : 0.0214 ± 0.0505
    • PRECISION : 0.0471 ± 0.1125

  논문:
    • NDCG      : 0.1104 ± 0.3125
    • MRR       : 0.1176 ± 0.3321
    • RECALL    : 0.0265 ± 0.0752
    • PRECISION : 0.0382 ± 0.1111

  데이터셋:
    • NDCG      : 0.3393 ± 0.4741
    • MRR       : 0.3529 ± 0.4926
    • REC

### 5.3 카테고리별 분석

In [19]:
if all_eval_results:
    print("\n" + "=" * 80)
    print("📊 카테고리별 메트릭 (k=5)")
    print("=" * 80)

    category_metrics = {}

    for category in sorted(df_results['category'].unique()):
        category_data = df_results[df_results['category'] == category]

        print(f"\n📁 {category} (n={len(category_data)}):")
        print("-" * 80)

        cat_metrics = {}
        for metric_type in ['overall', 'paper', 'dataset']:
            type_label = {'overall': '전체', 'paper': '논문', 'dataset': '데이터셋'}[metric_type]
            print(f"  {type_label}:")

            type_metrics = {}
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@5'
                if col_name in category_data.columns:
                    mean_val = category_data[col_name].mean()
                    type_metrics[metric] = mean_val
                    print(f"    • {metric.upper():10s}: {mean_val:.4f}")

            cat_metrics[metric_type] = type_metrics

        category_metrics[category] = cat_metrics


📊 카테고리별 메트릭 (k=5)

📁 국내 (n=15):
--------------------------------------------------------------------------------
  전체:
    • NDCG      : 0.1509
    • MRR       : 0.1467
    • RECALL    : 0.0242
    • PRECISION : 0.0533
  논문:
    • NDCG      : 0.1251
    • MRR       : 0.1333
    • RECALL    : 0.0300
    • PRECISION : 0.0433
  데이터셋:
    • NDCG      : 0.3845
    • MRR       : 0.4000
    • RECALL    : 0.1467
    • PRECISION : 0.1200

📁 해외 (n=2):
--------------------------------------------------------------------------------
  전체:
    • NDCG      : 0.0000
    • MRR       : 0.0000
    • RECALL    : 0.0000
    • PRECISION : 0.0000
  논문:
    • NDCG      : 0.0000
    • MRR       : 0.0000
    • RECALL    : 0.0000
    • PRECISION : 0.0000
  데이터셋:
    • NDCG      : 0.0000
    • MRR       : 0.0000
    • RECALL    : 0.0000
    • PRECISION : 0.0000


### 5.4 최종 결과 저장

**📁 저장되는 파일:**
1. **`EVALUATION_SUMMARY.txt`** ⭐ - 가장 먼저 봐야 할 요약 리포트
2. **`detailed_results.csv`** - 엑셀에서 열어볼 수 있는 상세 데이터
3. **`config.json`** - 실험 재현을 위한 설정 정보
4. **`metrics.json`** - 프로그램으로 읽을 수 있는 메트릭 데이터

In [20]:
if all_eval_results:
    print("\n💾 결과 저장 중...\n")

    # 1. 요약 리포트 생성 (가장 중요!)
    report_lines = []
    report_lines.append("=" * 80)
    report_lines.append("평가 요약 리포트")
    report_lines.append("=" * 80)
    report_lines.append("")
    report_lines.append(f"📅 평가 시각: {timestamp}")
    report_lines.append(f"🤖 LLM 모델: {settings.MODEL_NAME}")
    report_lines.append(f"🔍 임베딩 모델: {settings.EMBEDDING_MODEL}")
    report_lines.append(f"📊 테스트 케이스: {len(all_eval_results)}/{len(all_test_cases)} 성공")
    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("주요 성능 지표 (k=5)")
    report_lines.append("=" * 80)
    report_lines.append("")

    # k=5 전체 메트릭
    for metric in ['ndcg', 'mrr', 'recall', 'precision']:
        col_name = f'overall_{metric}@5'
        if col_name in df_results.columns:
            mean_val = df_results[col_name].mean()
            report_lines.append(f"  {metric.upper():10s} @5: {mean_val:.4f}")

    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("타입별 성능 (k=5)")
    report_lines.append("=" * 80)

    for metric_type in ['paper', 'dataset']:
        type_label = {'paper': '논문', 'dataset': '데이터셋'}[metric_type]
        report_lines.append("")
        report_lines.append(f"[{type_label}]")
        for metric in ['ndcg', 'mrr', 'recall', 'precision']:
            col_name = f'{metric_type}_{metric}@5'
            if col_name in df_results.columns:
                mean_val = df_results[col_name].mean()
                report_lines.append(f"  {metric.upper():10s}: {mean_val:.4f}")

    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("카테고리별 nDCG@5")
    report_lines.append("=" * 80)
    report_lines.append("")

    for category in sorted(df_results['category'].unique()):
        category_data = df_results[df_results['category'] == category]
        mean_val = category_data['overall_ndcg@5'].mean()
        report_lines.append(f"  {category:30s}: {mean_val:.4f} (n={len(category_data)})")

    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("전체 메트릭 (모든 k 값)")
    report_lines.append("=" * 80)

    for k in k_values:
        report_lines.append("")
        report_lines.append(f"k={k}:")
        report_lines.append("-" * 40)
        for metric_type in ['overall', 'paper', 'dataset']:
            type_label = {'overall': '전체', 'paper': '논문', 'dataset': '데이터셋'}[metric_type]
            report_lines.append(f"  [{type_label}]")
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@{k}'
                if col_name in df_results.columns:
                    mean_val = df_results[col_name].mean()
                    std_val = df_results[col_name].std()
                    report_lines.append(f"    {metric.upper():10s}: {mean_val:.4f} ± {std_val:.4f}")

    report_lines.append("")
    report_lines.append("=" * 80)

    # 요약 리포트 저장
    summary_path = os.path.join(eval_output_dir, 'EVALUATION_SUMMARY.txt')
    with open(summary_path, 'w', encoding='utf-8') as f:
        f.write('\n'.join(report_lines))
    print(f"✅ 1. 요약 리포트 저장: EVALUATION_SUMMARY.txt")

    # 2. 상세 CSV 저장
    csv_path = os.path.join(eval_output_dir, 'detailed_results.csv')
    df_results.to_csv(csv_path, index=False, encoding='utf-8-sig')
    print(f"✅ 2. 상세 결과 CSV 저장: detailed_results.csv")

    # 3. 메트릭 JSON 저장
    all_metrics = {
        'summary': metrics_summary,
        'by_category': category_metrics,
        'individual_results': all_eval_results
    }

    metrics_path = os.path.join(eval_output_dir, 'metrics.json')
    with open(metrics_path, 'w', encoding='utf-8') as f:
        json.dump(all_metrics, f, indent=2, ensure_ascii=False)
    print(f"✅ 3. 메트릭 JSON 저장: metrics.json")

    print(f"\n" + "=" * 80)
    print(f"📂 모든 결과가 저장되었습니다:")
    print(f"   {eval_output_dir}")
    print(f"" + "=" * 80)
    print(f"\n⭐ 결과 확인: EVALUATION_SUMMARY.txt 파일을 먼저 읽어보세요!")

    # 요약 리포트 미리보기
    print(f"\n" + "=" * 80)
    print("📄 요약 리포트 미리보기:")
    print("=" * 80)
    print('\n'.join(report_lines[:50]))  # 처음 50줄만 표시
    if len(report_lines) > 50:
        print("\n... (전체 내용은 EVALUATION_SUMMARY.txt 참고) ...")
else:
    print("⚠️  저장할 결과가 없습니다")


💾 결과 저장 중...

✅ 1. 요약 리포트 저장: EVALUATION_SUMMARY.txt
✅ 2. 상세 결과 CSV 저장: detailed_results.csv
✅ 3. 메트릭 JSON 저장: metrics.json

📂 모든 결과가 저장되었습니다:
   /home/infidea/backup-data/paper-reco-agent/figures/evaluation_results/202510151653

⭐ 결과 확인: EVALUATION_SUMMARY.txt 파일을 먼저 읽어보세요!

📄 요약 리포트 미리보기:
평가 요약 리포트

📅 평가 시각: 202510151743
🤖 LLM 모델: google/gemma-2-9b-it
🔍 임베딩 모델: intfloat/multilingual-e5-large
📊 테스트 케이스: 17/17 성공

주요 성능 지표 (k=5)

  NDCG       @5: 0.1332
  MRR        @5: 0.1294
  RECALL     @5: 0.0214
  PRECISION  @5: 0.0471

타입별 성능 (k=5)

[논문]
  NDCG      : 0.1104
  MRR       : 0.1176
  RECALL    : 0.0265
  PRECISION : 0.0382

[데이터셋]
  NDCG      : 0.3393
  MRR       : 0.3529
  RECALL    : 0.1294
  PRECISION : 0.1059

카테고리별 nDCG@5

  국내                            : 0.1509 (n=15)
  해외                            : 0.0000 (n=2)

전체 메트릭 (모든 k 값)

k=3:
----------------------------------------
  [전체]
    NDCG      : 0.1176 ± 0.3321
    MRR       : 0.1176 ± 0.3321

... (전체 내용은 EVALUATION_SUMM

## 7. 평가 완료

**결과 파일 안내**
- 평가 결과는 `figures/evaluation_results/{timestamp}/` 디렉토리에 저장됩니다.

**파일 읽는 순서:**
1. `EVALUATION_SUMMARY.txt` ⭐⭐⭐
   - 가장 먼저 읽어야 할 파일
   - 주요 성능 지표와 카테고리별 결과 요약
   - 텍스트 에디터로 바로 열어볼 수 있음

2. `detailed_results.csv`
   - 엑셀이나 스프레드시트로 열어서 상세 분석
   - 각 테스트 케이스별 메트릭 포함
   - 필터링, 정렬, 차트 생성 가능

3. `config.json`
   - 실험 재현을 위한 모든 설정 정보
   - 모델 설정, 하이브리드 가중치 등

4. `metrics.json`
   - 프로그램으로 읽을 수 있는 메트릭 데이터
   - 자동화된 분석이나 비교에 사용

**주요 메트릭 설명**
- nDCG@k: 순위를 고려한 추천 품질 (0~1, 높을수록 좋음)
- MRR@k: 첫 번째 관련 항목의 순위 (0~1, 높을수록 좋음)
- Recall@k: 관련 항목 중 추천된 비율 (0~1, 높을수록 좋음)
- Precision@k: 추천 항목 중 관련된 비율 (0~1, 높을수록 좋음)