# 2025 DATA·AI 분석 경진대회 - 논문·데이터 추천 에이전트 평가

이 노트북은 LLM 기반 연구 데이터/논문 추천 시스템의 성능을 평가합니다.

**실행 환경**
- GPU: NVIDIA RTX 3080 이상
- CUDA: 11.8+
- Python: 3.10+

## 1. 환경 설정 및 라이브러리 임포트

In [1]:
import sys
import os
import json
import logging
from datetime import datetime
from pathlib import Path
import pandas as pd
import numpy as np
from tqdm.auto import tqdm

# 프로젝트 루트 경로
project_root = '/home/infidea/backup-data/paper-reco-agent'
sys.path.insert(0, project_root)

print(f"프로젝트 루트: {project_root}")

# 로깅 설정
os.makedirs(os.path.join(project_root, 'logs'), exist_ok=True)

logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
    handlers=[
        logging.StreamHandler(sys.stdout),
        logging.FileHandler(os.path.join(project_root, 'logs/evaluation.log'))
    ],
    force=True
)

print("✅ 로깅 설정 완료")

# 평가 모듈 임포트
from src.evaluation.metrics import (
    evaluate_recommendations,
    batch_evaluate,
    format_evaluation_report
)
from src.config.settings import settings

print("✅ 평가 모듈 임포트 완료")

프로젝트 루트: /home/infidea/backup-data/paper-reco-agent
✅ 로깅 설정 완료
✅ 평가 모듈 임포트 완료


  from .autonotebook import tqdm as notebook_tqdm


## 2. 테스트 데이터셋 로드

In [2]:
# 테스트 데이터셋 로드
testset_path = os.path.join(project_root, 'data', 'test', 'testset_aug.json')

with open(testset_path, 'r', encoding='utf-8') as f:
    testset = json.load(f)

print(f"✅ 테스트 데이터셋 로드 완료: {testset_path}")
print(f"📊 테스트 카테고리 수: {len(testset.keys())}")

# 모든 테스트 케이스 추출
all_test_cases = []
for category, cases in testset.items():
    for case in cases:
        case['category'] = category
        all_test_cases.append(case)

print(f"📝 총 테스트 케이스: {len(all_test_cases)}개")
print(f"\n첫 번째 테스트 케이스 예시:")
print(json.dumps(all_test_cases[0], indent=2, ensure_ascii=False)[:500] + "...")

✅ 테스트 데이터셋 로드 완료: /home/infidea/backup-data/paper-reco-agent/data/test/testset_aug.json
📊 테스트 카테고리 수: 2
📝 총 테스트 케이스: 13개

첫 번째 테스트 케이스 예시:
{
  "input_dataset": {
    "svc_id": "c1f03ab868f32371ec97a650bcdf39ac",
    "title": "한반도 기상 관측 데이터 세트",
    "description": "한반도 종관 기상 관측 세스템으로부터의 관측 데이터 세트",
    "keywords": [
      "한반도",
      "기상",
      "센서데이터"
    ]
  },
  "candidate_pool": {
    "papers": [
      {
        "id": "JAKO202029757857862",
        "title": "시군구별 대기오염 및 기상 데이터",
        "abstract": "대기오염의 사회경제적 효과에 대한 연구에는 측정된 대기오염 물질, 기상 자료, 그리고 사회경제적 데이터의 병합이 필요하다. 이들 자료들의 시간적&#x00B7;공간적 범위와 단위가 상이하기 때문에 분석에 필요한 데이터 가공에 많은 시...


### 2.1 테스트셋 데이터 분포 분석

In [3]:
# svd_id(=svc_id/id)별 candidate_pool 분석 (type 컬럼 기반 2행 구조)
import pandas as pd
from pathlib import Path
from IPython.display import display

# ---- Helper ----
LEVEL_TO_REL = {"강추": 2, "추천": 1, "참고": 0}

def get_svd_id(d):
    return d.get("svd_id") or d.get("svc_id") or d.get("id") or d.get("dataset_id")

def ensure_relevance_score(items):
    items = items or []
    out = []
    for it in items:
        it = dict(it)
        if "relevance_score" not in it:
            it["relevance_score"] = LEVEL_TO_REL.get(it.get("level"), 0)
        out.append(it)
    return out

def count_scores(items):
    total = len(items)
    s2 = sum(1 for x in items if x.get("relevance_score", 0) == 2)
    s1 = sum(1 for x in items if x.get("relevance_score", 0) == 1)
    s0 = sum(1 for x in items if x.get("relevance_score", 0) == 0)
    def ratio(x): 
        return (x / total * 100.0) if total else 0.0
    return {
        "total": total,
        "score2_cnt": s2, "score1_cnt": s1, "score0_cnt": s0,
        "score2_ratio(%)": round(ratio(s2), 1),
        "score1_ratio(%)": round(ratio(s1), 1),
        "score0_ratio(%)": round(ratio(s0), 1),
    }

# ---- Build rows (paper / dataset 각각 한 행씩) ----
rows = []
for case in all_test_cases:
    category = case.get("category")
    ds = case.get("input_dataset", {})
    svd_id = get_svd_id(ds)
    title = ds.get("title", "")
    pool = case.get("candidate_pool", {}) or {}

    for tname, items in {"paper": pool.get("papers", []), "dataset": pool.get("datasets", [])}.items():
        items = ensure_relevance_score(items or [])
        stats = count_scores(items)
        rows.append({
            "category": category,
            "svd_id": svd_id,
            "title": title,
            "type": tname,
            **stats
        })

# ---- DataFrame ----
df_svd_type = pd.DataFrame(rows).sort_values(["category", "svd_id", "type"]).reset_index(drop=True)

print("✅ svd_id 단위 분석 테이블 (type 컬럼 기반):")
display(df_svd_type)

✅ svd_id 단위 분석 테이블 (type 컬럼 기반):


Unnamed: 0,category,svd_id,title,type,total,score2_cnt,score1_cnt,score0_cnt,score2_ratio(%),score1_ratio(%),score0_ratio(%)
0,국내,000e4340354d8219bdb3af6a7ad4800d,이동형 도시환경 센서 및 도로영상 데이터 셋,dataset,5,2,3,0,40.0,60.0,0.0
1,국내,000e4340354d8219bdb3af6a7ad4800d,이동형 도시환경 센서 및 도로영상 데이터 셋,paper,5,2,2,1,40.0,40.0,20.0
2,국내,33da0205f56477ba41dec7d7db3258a6,Dataset for Intervention strategies against CO...,dataset,5,1,2,2,20.0,40.0,40.0
3,국내,33da0205f56477ba41dec7d7db3258a6,Dataset for Intervention strategies against CO...,paper,5,1,2,2,20.0,40.0,40.0
4,국내,4fc87916027f5568850d33ecd2f7680f,한국인 정상인 심전도 세부파형,dataset,5,4,1,0,80.0,20.0,0.0
5,국내,4fc87916027f5568850d33ecd2f7680f,한국인 정상인 심전도 세부파형,paper,5,2,2,1,40.0,40.0,20.0
6,국내,8d498db96633f07fe1d82ebe43daaf45,Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상을 활용한 천지호...,dataset,5,1,2,2,20.0,40.0,40.0
7,국내,8d498db96633f07fe1d82ebe43daaf45,Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상을 활용한 천지호...,paper,5,2,2,1,40.0,40.0,20.0
8,국내,a59a0a7d0c894a81a2936833b0790e0a,의료영상데이터,dataset,5,3,2,0,60.0,40.0,0.0
9,국내,a59a0a7d0c894a81a2936833b0790e0a,의료영상데이터,paper,5,2,2,1,40.0,40.0,20.0


## 3. 추천 에이전트 초기화

In [4]:
# 추천 에이전트 임포트 및 초기화
from src.agents.recommendation_agent import KoreanResearchRecommendationAgent
from src.config.settings import settings

print("모델 설정:")
print(f"  - 모델명: {settings.MODEL_NAME}")
print(f"  - 임베딩 모델: {settings.EMBEDDING_MODEL}")
print(f"  - 개발 모드: {settings.DEV_MODE}")
print("\n🚀 에이전트 초기화 중... (수 분 소요될 수 있습니다)")

agent = KoreanResearchRecommendationAgent()

print("\n✅ 에이전트 초기화 완료")
print(f"모델 정보: {json.dumps(agent.llm_model.get_model_info(), indent=2, ensure_ascii=False)}")

2025-10-16 07:22:19,543 - sentence_transformers.SentenceTransformer - INFO - Use pytorch device_name: cuda:0
2025-10-16 07:22:19,545 - sentence_transformers.SentenceTransformer - INFO - Load pretrained SentenceTransformer: intfloat/multilingual-e5-large
모델 설정:
  - 모델명: google/gemma-2-9b-it
  - 임베딩 모델: intfloat/multilingual-e5-large
  - 개발 모드: False

🚀 에이전트 초기화 중... (수 분 소요될 수 있습니다)
2025-10-16 07:22:26,622 - src.agents.recommendation_agent - INFO - 🚀 프로덕션 모드로 실행: 실제 LLM 모델 사용
2025-10-16 07:22:26,624 - src.models.llm_model - INFO - 🚀 Gemma 모델 로딩 시작: google/gemma-2-9b-it
2025-10-16 07:22:26,625 - src.models.llm_model - INFO -    - 디바이스: cuda
2025-10-16 07:22:27,868 - src.models.llm_model - INFO -    - FP16 모드


`torch_dtype` is deprecated! Use `dtype` instead!
Loading checkpoint shards: 100%|██████████| 4/4 [00:18<00:00,  4.50s/it]


2025-10-16 07:23:00,260 - src.models.llm_model - INFO - ✅ Gemma 모델 로딩 완료

✅ 에이전트 초기화 완료
모델 정보: {
  "model_name": "google/gemma-2-9b-it",
  "model_type": "Gemma",
  "device": "cuda",
  "dtype": "float16",
  "max_tokens_reranking": 1024,
  "max_tokens_keyword": 300,
  "max_tokens": 1024,
  "temperature": 0.0,
  "parameters": "9B",
  "context_length": "8K"
}


## 4. 평가 실행

모든 테스트 케이스에 대해 추천을 생성하고 평가합니다.

In [5]:
# TODO: 추천 개수 설정 (선택사항)
# 최대값: agent의 max_paper_candidates, max_dataset_candidates 값
num_paper_recommendations = 5
num_dataset_recommendations = 5

# agent에서 최대 후보 개수 가져오기
MAX_PAPER_CANDIDATES = agent.max_paper_candidates
MAX_DATASET_CANDIDATES = agent.max_dataset_candidates

print(f"최대 추천 가능 개수: 논문 {MAX_PAPER_CANDIDATES}개, 데이터셋 {MAX_DATASET_CANDIDATES}개")

# 추천 개수 검증
if num_paper_recommendations > MAX_PAPER_CANDIDATES:
    print(f"⚠️  경고: 논문 추천 개수({num_paper_recommendations})가 최대값({MAX_PAPER_CANDIDATES})을 초과합니다.")
    print(f"   자동으로 {MAX_PAPER_CANDIDATES}개로 조정됩니다.")
    num_paper_recommendations = MAX_PAPER_CANDIDATES

if num_dataset_recommendations > MAX_DATASET_CANDIDATES:
    print(f"⚠️  경고: 데이터셋 추천 개수({num_dataset_recommendations})가 최대값({MAX_DATASET_CANDIDATES})을 초과합니다.")
    print(f"   자동으로 {MAX_DATASET_CANDIDATES}개로 조정됩니다.")
    num_dataset_recommendations = MAX_DATASET_CANDIDATES

if num_paper_recommendations < 1:
    print(f"⚠️  경고: 논문 추천 개수는 최소 1개 이상이어야 합니다.")
    num_paper_recommendations = 1

if num_dataset_recommendations < 1:
    print(f"⚠️  경고: 데이터셋 추천 개수는 최소 1개 이상이어야 합니다.")
    num_dataset_recommendations = 1

print(f"✅ 추천 설정: 논문 {num_paper_recommendations}개, 데이터셋 {num_dataset_recommendations}개")

최대 추천 가능 개수: 논문 10개, 데이터셋 10개
✅ 추천 설정: 논문 5개, 데이터셋 5개


In [6]:
# 평가 실행
all_eval_results = []
k_values = [3, 5]

# 추천 원본 결과(recommend_result.json 저장용)
all_recommendations = []

print(f"🔍 {len(all_test_cases)}개 테스트 케이스 평가 시작")
print(f"📏 평가 k 값: {k_values}")
print("=" * 80)

# 모델/임베딩 정보
try:
    _model_info = agent.llm_model.get_model_info()
except Exception:
    _model_info = {}
_model_info_safe = {
    "model_name": _model_info.get("model_name"),
    "model_type": _model_info.get("model_type"),
    "device": _model_info.get("device"),
    "dtype": _model_info.get("dtype"),
    "max_tokens": _model_info.get("max_tokens"),
    "temperature": _model_info.get("temperature"),
    "parameters": _model_info.get("parameters"),
    "context_length": _model_info.get("context_length"),
}

_embedding_info_safe = {
    "embedding_model": getattr(settings, "EMBEDDING_MODEL", None),
    "paper_hybrid_weights": {
        "alpha": getattr(settings, "PAPER_HYBRID_ALPHA", None),
        "beta": getattr(settings, "PAPER_HYBRID_BETA", None),
    },
    "dataset_hybrid_weights": {
        "alpha": getattr(settings, "DATASET_HYBRID_ALPHA", None),
        "beta": getattr(settings, "DATASET_HYBRID_BETA", None),
    },
}

for idx, test_case in enumerate(tqdm(all_test_cases, desc="평가 진행")):
    try:
        dataset_id = test_case['input_dataset']['svc_id']
        category = test_case['category']

        print(f"\n[{idx+1}/{len(all_test_cases)}] {test_case['input_dataset']['title']}")
        print(f"   카테고리: {category}")

        # 추천 생성
        recommendation_result = await agent.recommend(
            dataset_id,
            num_paper_recommendations=num_paper_recommendations,
            num_dataset_recommendations=num_dataset_recommendations
        )

        if 'error' in recommendation_result:
            print(f"   ❌ 오류: {recommendation_result['error']}")
            continue

        # ===== 추천 원본 결과 수집 =====
        # source_dataset
        src_ds = test_case.get("input_dataset", {})
        source_dataset_block = {
            "id": src_ds.get("svc_id"),
            "title": src_ds.get("title"),
            "description": src_ds.get("description"),
            "keywords": src_ds.get("keywords", []),
        }

        # search_result
        search_result = recommendation_result.get("search_result", {})
        search_result_block = {
            "paper_keywords": search_result.get("paper_keywords", []),
            "dataset_keywords": search_result.get("dataset_keywords", []),
            "paper_search_details": search_result.get("paper_search_details", []),
            "dataset_search_details": search_result.get("dataset_search_details", []),
        }

        # paper/dataset recommendations
        paper_reco = recommendation_result.get("paper_recommendations", [])
        dataset_reco = recommendation_result.get("dataset_recommendations", [])

        # candidates_analyzed
        candidates_analyzed = recommendation_result.get(
            "candidates_analyzed",
            (len(recommendation_result.get("paper_candidates", [])) +
             len(recommendation_result.get("dataset_candidates", []))
             if ("paper_candidates" in recommendation_result or "dataset_candidates" in recommendation_result)
             else (len(paper_reco) + len(dataset_reco)))
        )

        # 처리 시간
        processing_time_ms = recommendation_result.get("processing_time_ms", None)

        # 하나의 케이스 레코드 구성
        reco_record = {
            "source_dataset": source_dataset_block,
            "search_result": search_result_block,
            "paper_recommendations": paper_reco,
            "dataset_recommendations": dataset_reco,
            "processing_time_ms": processing_time_ms,
            "candidates_analyzed": candidates_analyzed,
            "model_info": _model_info_safe,
            "embedding_model_info": _embedding_info_safe,
        }
        all_recommendations.append(reco_record)
        # ==============================================

        # 평가 형식으로 변환
        predictions = []
        for paper in recommendation_result.get('paper_recommendations', []):
            predictions.append({
                'type': 'paper',
                'id': paper['id'],
                'rank': paper.get('rank'),
                'score': paper.get('score')
            })

        for dataset in recommendation_result.get('dataset_recommendations', []):
            predictions.append({
                'type': 'dataset',
                'id': dataset['id'],
                'rank': dataset.get('rank'),
                'score': dataset.get('score')
            })

        # 평가
        ground_truth = test_case['candidate_pool']
        eval_result = evaluate_recommendations(predictions, ground_truth, k_values)

        # 메타데이터 추가
        eval_result['test_case_index'] = idx
        eval_result['dataset_id'] = dataset_id
        eval_result['category'] = category
        eval_result['input_title'] = test_case['input_dataset']['title']
        eval_result['processing_time_ms'] = processing_time_ms if processing_time_ms is not None else recommendation_result.get('processing_time_ms', 0)
        # 선택: 추천 개수 기록(분석 편의)
        eval_result['num_predicted_papers'] = len([p for p in predictions if p['type'] == 'paper'])
        eval_result['num_predicted_datasets'] = len([p for p in predictions if p['type'] == 'dataset'])
        all_eval_results.append(eval_result)

        # 결과 요약 출력 (k_values 반영)
        summary_chunks = []
        for k in k_values:
            ndcg = eval_result.get(f"overall_ndcg@{k}", 0)
            mrr = eval_result.get(f"overall_mrr@{k}", 0)
            recall = eval_result.get(f"overall_recall@{k}", 0)
            summary_chunks.append(
                f"nDCG@{k}={ndcg:.4f}, MRR@{k}={mrr:.4f}, Recall@{k}={recall:.4f}"
            )
        print("   ✅ " + " | ".join(summary_chunks))

    except Exception as e:
        print(f"   ❌ 예외 발생: {e}")
        logging.error(f"테스트 케이스 {idx} 평가 실패: {e}", exc_info=True)
        continue

print("\n" + "=" * 80)
print(f"✅ 평가 완료: {len(all_eval_results)}/{len(all_test_cases)}개 케이스 성공")

🔍 13개 테스트 케이스 평가 시작
📏 평가 k 값: [3, 5]


평가 진행:   0%|          | 0/13 [00:00<?, ?it/s]


[1/13] 한반도 기상 관측 데이터 세트
   카테고리: 국내
2025-10-16 07:23:00,285 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c1f03ab868f32371ec97a650bcdf39ac
2025-10-16 07:23:00,393 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c1f03ab868f32371ec97a650bcdf39ac?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:23:00,395 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c1f03ab868f32371ec97a650bcdf39ac
2025-10-16 07:23:00,396 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c1f03ab868f32371ec97a650bcdf39ac",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "2025",
    "dataset_access_type_pc": "공개",
    "file_yn_pc": "직접다운로드",
    "dataset_cc_license

The following generation flags are not valid and may be ignored: ['temperature', 'top_p']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


2025-10-16 07:23:02,175 - src.agents.recommendation_agent - INFO - ✅ LLM 키워드 생성 완료
2025-10-16 07:23:02,177 - src.agents.recommendation_agent - INFO -    원본 키워드 (3개): ['센서데이터', '한반도', '기상']
2025-10-16 07:23:02,177 - src.agents.recommendation_agent - INFO -    → 데이터셋 검색 (3개): ['한반도', '기상', '관측']
2025-10-16 07:23:02,178 - src.agents.recommendation_agent - INFO -    → 논문 검색 (4개): ['Korea Weather', 'climate observation', 'meteorology', 'South Korea']
2025-10-16 07:23:02,178 - src.agents.recommendation_agent - INFO - 검색 쿼리 생성 완료: 데이터셋(3개), 논문(4개)
2025-10-16 07:23:02,335 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/?key=370D3EC3BBD8E5DCCC40807922CCEC12&query=%ED%95%9C%EB%B0%98%EB%8F%84&page=1&size=5 "HTTP/1.1 200 200"
2025-10-16 07:23:02,340 - src.clients.dataon_client - INFO - Search completed: 5 datasets for '한반도'
2025-10-16 07:23:02,474 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/?key=370D3EC3BBD8E5DCCC40807


Batches: 100%|██████████| 1/1 [00:00<00:00, 14.87it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 59.95it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 116.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.82it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.57it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 50.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 60.31it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 115.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 113.43it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 62.93it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 117.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.66it/s]

Batches: 100%|██████████| 1/1 [00:00<

2025-10-16 07:23:04,986 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 12개 데이터셋 순위 결정 완료
2025-10-16 07:23:04,987 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-16 07:23:04,988 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:23:04,989 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 한반도 기상 관측 데이터 세트
Description: 한반도 종관 기상 관측 세스템으로부터의 관측 데이터 세트
Keywords: 센서데이터, 한반도, 기상

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO202029757857862
- Title: 시군구별 대기오염 및 기상 데이터
- Description: 대기오염의 사회경제적 효과에 대한 연구에는 측정된 대기오염 물질, 기상 자료, 그리고 사회경제적 데이터의 병합이 필요하다. 이들 자료들의 시간적&#x00B7;공간적 범위와 단위가 상이하기 때문에 분석에 필요한 데이터 가공에 많은 시간과 노력이 요구된다. 본 데이터의 구축은 사회과학 분야에서 널리 사용되는 대표적인 대기오염 및 기상 변수를 시군구 단위로 제공하는 것을 목표로 한다. 2020년 8월 기준 배포 버전 데이터의 시간적 범위는 2001년부터 2018년이며, 공간적 범위는 250개 시군구로서 패널 형태의 자료를 제공한다. 본 데이터의 기상 변수들은 대기오염 관련 분석뿐만 아니라 다양한 사회과학의 연구에서 사용할 수 있는 주요 변수들을 포함하고 있다.
- Keywords: Air, pollution, Weather, Si-Gun-Gu, Korea
- Semantic Score

평가 진행:   8%|▊         | 1/13 [00:34<06:56, 34.70s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.3333 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.3333

[2/13] Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상을 활용한 천지호 GeoAI 데이터셋
   카테고리: 국내
2025-10-16 07:23:34,985 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 8d498db96633f07fe1d82ebe43daaf45
2025-10-16 07:23:35,087 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/8d498db96633f07fe1d82ebe43daaf45?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:23:35,089 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 8d498db96633f07fe1d82ebe43daaf45
2025-10-16 07:23:35,091 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "36 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "8d498db96633f07fe1d82ebe43daaf45",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "datase


Batches: 100%|██████████| 1/1 [00:00<00:00, 103.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.66it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.66it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.32it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 49.89it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 77.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 49.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.73it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 55.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 57.07it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.66it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 71.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.40it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.97it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.95it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00,

2025-10-16 07:23:39,482 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 15개 데이터셋 순위 결정 완료
2025-10-16 07:23:39,483 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-16 07:23:39,485 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:23:39,485 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상을 활용한 천지호 GeoAI 데이터셋
Description: Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상으로부터 구축된 백두산 천지호 GeoAI 데이터셋
Keywords: #백두산 #화산활동 #천지 #수체 #광학위성 #인공지능 데이터셋

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: ART003063868
- Title: Landsat-5/-7/-8 및 Sentinel-2 광학 위성영상을 활용한 천지호GeoAI 데이터셋
- Description: The variations in the water area and water level of Cheonji, the caldera lake ofBaekdu Mountain, serve as reliable indicators of v




2025-10-16 07:23:57,253 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "ART003063868",
      "reason": "본 논문은 백두산 천지호의 GeoAI 데이터셋을 Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상을 활용하여 생성했으며, 연구 목적과 키워드가 가장 직접적으로 일치합니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "JAKO202201253176356",
      "reason": "백두산 천지호의 얼음 변화를 Landsat 위성 영상을 활용하여 관측하는 내용으로, 연구 주제와 관련성이 높습니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO202331749707386",
      "reason": "Sentinel-1과 Sentinel-2 위성 영상을 활용하여 토양수분도를 제작하는 연구이며, 본 연구와 유사한 위성 영상 활용 방식을 제시합니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "DIKO0016545091",
      "reason": "Sentinel-1과 Sentinel-2 위성 영상을 활용하여 농지와 초지의 토양수분을 추정하는 연구로, 위성 영상 활용 기술과 관련성이 있습니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "JAKO201607564006785",
      "reason": "Landsat 8 위성 영상을 활용하여 고해상도 지표면 광

평가 진행:  15%|█▌        | 2/13 [01:14<06:57, 37.91s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.4286 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.5714

[3/13] 이동형 도시환경 센싱 데이터 셋
   카테고리: 국내
2025-10-16 07:24:15,146 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c3ad2f8c1cf9e107a3f68b6972b64ad5
2025-10-16 07:24:15,240 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c3ad2f8c1cf9e107a3f68b6972b64ad5?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:24:15,243 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c3ad2f8c1cf9e107a3f68b6972b64ad5
2025-10-16 07:24:15,244 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c3ad2f8c1cf9e107a3f68b6972b64ad5",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc


Batches: 100%|██████████| 1/1 [00:00<00:00, 101.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.53it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.02it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.79it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 126.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.35it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.59it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 67.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.43it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.71it/s]

Batches: 100%|██████████| 1/1 [00:00

2025-10-16 07:24:19,553 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 11개 데이터셋 순위 결정 완료
2025-10-16 07:24:19,553 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-16 07:24:19,554 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:24:19,555 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 이동형 도시환경 센싱 데이터 셋
Description: 자동차 탑재 센서를 활용한 전국 5대 광역시 대상 대기환경 수집 데이터. 미세먼지, 초미세먼지, 일산화탄소, 이산화질소 수치 등 각종 정보를 수집
Keywords: 대기환경 센싱, 광역시, 사물데이터, 미세먼지

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0012517403
- Title: ALGIERS AIR QUALITY
- Description: 특정 장소에 대한 제한들이 우리에게 그것을 더 잘 이해할 수 있는 열쇠들을 준다고 해도, 현실의 비전을 가지고, 다음에는 필요하다면 같은 현실에 개입하기 시작하라. 본 논문에서는 알제리의 대기 관측을 담당하는 기관(SAMASAFIA)에서 발표한 알제시의 2002년 ~ 2009년 사이 대기 관련 자료의 유용한 활용을 위해 분석작업과 조사를 하였다. 첫 




2025-10-16 07:24:33,836 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "DIKO0012517403",
      "reason": "알제리의 대기 환경을 분석하고 오염원을 파악하는 데 초점을 맞춘 논문으로, 제공된 데이터셋과의 연관성이 높습니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "NART57411633",
      "reason": "실험을 통해 공기 순환이 인식되는 공기 질에 미치는 영향을 연구하며, 데이터셋과 관련된 주요 요소들을 다룹니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "ART002115575",
      "reason": "지하철 개통이 대기 질에 미치는 영향을 분석하는 연구로, 도시 환경과 대기오염 문제에 대한 통찰력을 제공합니다.",
      "level": "강추"
    },
    {
      "rank": 4,
      "candidate_id": "COVID-19 lockdown improves air quality in Morocco",
      "reason": "코로나19 잠재적 영향을 분석하면서 대기 질 개선을 보여주는 사례 연구이며, 도시 환경과 대기 오염의 관계를 보여줍니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "JAKO202016047215049",
      "reason": "근대 사회의 도시 오염 문제를 다루며, 특히 상하이를 중심으로 환경 문제와 사회적 영향을 분석합니다.",
      "level": "추천"
    }
  ]

평가 진행:  23%|██▎       | 3/13 [01:49<06:02, 36.29s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.1429 | nDCG@5=0.8503, MRR@5=1.0000, Recall@5=0.2857

[4/13] 이동형 도시환경 센서 및 도로영상 데이터 셋
   카테고리: 국내
2025-10-16 07:24:49,504 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 000e4340354d8219bdb3af6a7ad4800d
2025-10-16 07:24:49,603 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/000e4340354d8219bdb3af6a7ad4800d?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:24:49,605 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 000e4340354d8219bdb3af6a7ad4800d
2025-10-16 07:24:49,606 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "34 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "000e4340354d8219bdb3af6a7ad4800d",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pu


Batches: 100%|██████████| 1/1 [00:00<00:00, 106.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 116.95it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 64.96it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.97it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.57it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 97.12it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.90it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 129.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.52it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 115.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.17it/s]

Batches: 100%|██████████| 1/1 [00:00

2025-10-16 07:24:53,455 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 10개 데이터셋 순위 결정 완료
2025-10-16 07:24:53,456 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-16 07:24:53,457 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:24:53,457 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 이동형 도시환경 센서 및 도로영상 데이터 셋
Description: 자동차 탑재 센서 및 블랙박스를 활용한 전국 5대 광역시 대상 도로영상 수집 데이터. 미세먼지, 초미세먼지, 일산화탄소, 이산화질소 수치 등 각종 정보를 수집
Keywords: 도시영상, 광역시, 사물데이터, 미세먼지

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0014573814
- Title: CCTV 영상 기반의 주행 차량 인식에 관한 연구
- Description: 본 연구는 원거리, 광범위한 감시 영역에 대하여 효과적으로 기능할 수 있는 주행 차량 인식 시스템의 개발을 목적으로 한다. 기존의 차량 인식 시스템이 가지는 차량 진입 경로의 고정, 센서 등의 추가 장비 설치 등의 정규화가 되지 않은 환경에서 별도의 대규모 공간이나 비용이 들지 않는 방법을 제안하였다. 제안하는 시스템




2025-10-16 07:25:08,135 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "DIKO0014573814",
      "reason": "CCTV 영상을 활용한 차량 인식에 대한 연구로, 도시영상, 사물데이터, 미세먼지와 같은 키워드가 포함되어 관련성이 높습니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "DIKO0014041906",
      "reason": "CCTV 환경에서 얼굴 인식의 성능 분석을 다루며, 도시영상, CCTV, 얼굴 인식과 같은 키워드가 일치합니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "DIKO0013665661",
      "reason": "CCTV 카메라의 촬영 가능 범위 및 최적 위치 산출 알고리즘 연구로, 도시영상, CCTV, 광역시와 같은 키워드가 관련성을 보입니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "NART78874795",
      "reason": "공기오염이 심혈관 질환에 미치는 영향을 다루며, 도시환경과 건강과 관련된 주제로, 미세먼지와 같은 키워드가 연결됩니다.",
      "level": "참고"
    },
    {
      "rank": 5,
      "candidate_id": "ART002256341",
      "reason": "센서 네트워크에서 스카이라인 쿼리 처리 알고리즘을 제안하는 연구로, 데이터 분석, 도시환경 모니터링과 관련된 주제입니다.",
      "level": "참고"
    }
  ]
}
2025-10

평가 진행:  31%|███       | 4/13 [02:23<05:21, 35.67s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[5/13] Dataset for Intervention strategies against COVID-19 and their estimated impact on Swedish healthcare capacity
   카테고리: 국내
2025-10-16 07:25:24,221 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 33da0205f56477ba41dec7d7db3258a6
2025-10-16 07:25:24,319 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/33da0205f56477ba41dec7d7db3258a6?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:25:24,321 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 33da0205f56477ba41dec7d7db3258a6
2025-10-16 07:25:24,322 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "33da0205f56477ba41dec7d7db3258a6",
    "ctlg_type": "02",
    "dataset_ty


Batches: 100%|██████████| 1/1 [00:00<00:00, 99.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.68it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.68it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 127.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 127.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.44it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 114.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.08it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.01it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 129.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.96it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.27it/s]

Batches: 100%|██████████| 1/1 [00

2025-10-16 07:25:28,478 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 15개 데이터셋 순위 결정 완료
2025-10-16 07:25:28,479 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-16 07:25:28,480 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:25:28,480 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: Dataset for Intervention strategies against COVID-19 and their estimated impact on Swedish healthcare capacity
Description: Dataset for individual-based modeling of COVID-19 spread in Sweden.
Keywords: 코로나19, COVID-19, 코로나

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: ART002578663
- Title: 신종 코로나바이러스 감염증(COVID-19) 유행의 대응과 치료
- Description: Infectious diseases caused by the novel coronavirus (severe acute respiratory syndrome coronavirus 2, SARS-Co




2025-10-16 07:25:43,429 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "ART002578663",
      "reason": "코로나19에 대한 정보 제공 및 치료 방안 모색을 다루고 있어, 요청 데이터셋과 매우 연관성이 높습니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "NART98954272",
      "reason": "훈련 프로그램이 개입으로서의 의미를 가지고 있으며, 코로나19와 같은 상황에서의 적용 가능성을 논의하는 내용이 포함되어 있습니다.",
      "level": "추천"
    },
    {
      "rank": 3,
      "candidate_id": "NPAP00196273",
      "reason": "스웨덴에서의 원격 병리학 적용 사례를 다루고 있어, 해당 국가의 의료 시스템과 관련된 정보를 제공합니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "NART22057700",
      "reason": "스웨덴에서의 외래 수술 현황을 분석하고 있는데, 의료 서비스 제공 방식과 관련된 정보를 얻을 수 있습니다.",
      "level": "참고"
    },
    {
      "rank": 5,
      "candidate_id": "DIKO0016377333",
      "reason": "팬데믹 상황에서 여행 의도에 영향을 미치는 요인들을 분석하고 있으며, 코로나19와 관련된 사회적 영향을 살펴봅니다.",
      "level": "참고"
    }
  ]
}
2025-10-16 07:25:43,430 - src.agents.rec

평가 진행:  38%|███▊      | 5/13 [02:58<04:41, 35.18s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.5000 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.5000

[6/13] 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
   카테고리: 국내
2025-10-16 07:25:58,525 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID bee3162957beecc87a91c94803d23439
2025-10-16 07:25:58,611 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/bee3162957beecc87a91c94803d23439?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:25:58,613 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset bee3162957beecc87a91c94803d23439
2025-10-16 07:25:58,614 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "23 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "bee3162957beecc87a91c94803d23439",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
   


Batches: 100%|██████████| 1/1 [00:00<00:00, 90.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 69.89it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 107.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 101.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 126.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.68it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 107.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 98.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.76it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.52it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 107.09it/s]

Batches: 100%|██████████| 1/1 [00:00<

2025-10-16 07:26:02,178 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 3개 데이터셋 순위 결정 완료
2025-10-16 07:26:02,179 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-16 07:26:02,180 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:26:02,181 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
Description: 본 데이터셋은 해양 관측을 목적으로 수집된 CCTV 화면에서 날짜와 시간을 나타내는 영역을 추출한 3362개의 이미지로 구성됨.\r\n이미지 파일명은 S-ORS_WEST_yyyy-mm-dd_hh-MM-ss 형식을 따르며, 날짜와 시간 정보를 포함함.\r\n본 데이터셋은 2023년 8월 동안 수집된 자료로, 모든 이미지 파일은 PNG 형식이며 해상도는 500x120 픽셀.
Keywords: 해양 모니터링, 날짜 및 시간 정보, 이미지 데이터셋, 해양 관측, 타임스탬프, 이미지 처리, CCTV

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO202009165808359
- Title: CCTV영상 내 교통량 분석을 위한 적응적 계수선 검출 방법
- Description: 최




2025-10-16 07:26:16,221 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "JAKO202305249645588",
      "reason": "CCTV 설치의 효과와 관련된 연구로, 범죄 예방 효과에 대한 분석 내용이 포함되어 있습니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "JAKO202009165808359",
      "reason": "교통 CCTV 영상에서 차량을 검출하고 계수선을 검출하는 방법에 대한 연구로, 해당 데이터셋과 관련된 이미지 처리 기술을 설명합니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "NART81416482",
      "reason": "CCTV 영상에서 발생하는 왜곡이나 오류를 분석하는 연구로, 이미지 처리 및 분석 기술과 관련성이 높습니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "NART109650001",
      "reason": "필름에서 스캔된 이미지에서 시간 정보를 추출하는 연구로, 해당 데이터셋과 유사한 이미지 처리 작업을 수행합니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "JAKO201712256377755",
      "reason": "CCTV 설치의 비용과 효과를 분석하는 연구로, 해당 데이터셋의 활용에 대한 정책적 근거를 제공할 수 있습니다.",
      "level": "참고"
    }
  ]
}
2025-10-16 07:26:16,2

평가 진행:  46%|████▌     | 6/13 [03:25<03:46, 32.41s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[7/13] 필리핀해 해양-대기 감시부이 자료 1(2020년)
   카테고리: 국내
2025-10-16 07:26:25,554 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c592e36ae62d104b21183d9f498d918f
2025-10-16 07:26:25,645 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c592e36ae62d104b21183d9f498d918f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:26:25,647 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c592e36ae62d104b21183d9f498d918f
2025-10-16 07:26:25,649 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c592e36ae62d104b21183d9f498d918f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset


Batches: 100%|██████████| 1/1 [00:00<00:00, 109.52it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.62it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.38it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.52it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.53it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.95it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 112.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 93.45it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 97.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.06it/s]

Batches: 100%|██████████| 1/1 [00:

2025-10-16 07:26:29,618 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 13개 데이터셋 순위 결정 완료
2025-10-16 07:26:29,619 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-16 07:26:29,619 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:26:29,620 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 필리핀해 해양-대기 감시부이 자료 1(2020년)
Description: 필리핀해에 해양-대기 감시부이를 설치하여(북위 15도, 동경 134.5도) 대기변수 관측.
Keywords: 쿠로시오, 동중국해, 해류관측

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART78021822
- Title: Eddy properties in the Subtropical Countercurrent, Western Philippine Sea
- Description: Abstract An array of six oceanographic moorings with acoustic and environmental sensors was deployed in the central Philippine Sea from April 2010 to April 2011. The location 




2025-10-16 07:26:40,528 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "NART78021822",
      "reason": "필리핀해에서 발생하는 에디 현상에 대한 연구이며, 해류 관측과 관련된 주요 키워드가 포함되어 있습니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "NART77424969",
      "reason": "필리핀해와 동중국해에서 메탄 가스 분포 및 배출량에 대한 연구로, 해양 화학적 특징과 연관성이 높습니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO201121538715176",
      "reason": "무선 부표 시스템에 대한 연구로, 해양 관측 데이터 수집과 관련된 기술적인 내용을 담고 있습니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "NPAP12202042",
      "reason": "오션 관측 데이터 오류 검출 방법에 대한 연구로, 해양 데이터 분석 및 신뢰성 확보와 관련된 중요한 주제입니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "JAKO201608259727031",
      "reason": "gillnet 어구 부이의 깃대가 부이 줄 장력에 미치는 영향에 대한 연구로, 해양 어업과 관련된 실험적 접근 방식을 보여줍니다.",
      "level": "참고"
    }
  ]
}
2025-10-16 07:26:40,531 - src.agents

평가 진행:  54%|█████▍    | 7/13 [03:53<03:07, 31.17s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.3750 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.5000

[8/13] 의료영상데이터
   카테고리: 국내
2025-10-16 07:26:54,186 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID a59a0a7d0c894a81a2936833b0790e0a
2025-10-16 07:26:54,286 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/a59a0a7d0c894a81a2936833b0790e0a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:26:54,288 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset a59a0a7d0c894a81a2936833b0790e0a
2025-10-16 07:26:54,288 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "34 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "a59a0a7d0c894a81a2936833b0790e0a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "2025",


Batches: 100%|██████████| 1/1 [00:00<00:00, 111.40it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.48it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.99it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 137.70it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 142.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 62.93it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 66.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 137.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 66.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.96it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.59it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 135.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 64.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.41it/s]

Batches: 100%|██████████| 1/1 [00:00

2025-10-16 07:26:58,135 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 5개 데이터셋 순위 결정 완료
2025-10-16 07:26:58,136 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-16 07:26:58,137 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:26:58,137 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 의료영상데이터
Description: 휴먼 디지털트윈을 위한 의료영상데이터
Keywords: 인체데이터, Human Digital Twin, 데이터 플랫폼

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO202020264317117
- Title: Digital Twin 개념을 적용한 제조환경 시뮬레이션 모형 설계
- Description: 제조환경이 더욱 복잡해짐에 따라 전통적인 시뮬레이션만으로는 실시간 현장 결과를 평가하는 데 많은 어려움을 겪고 있다. 이를 극복하기 위한 대안으로 Digital Twin개념이 활발히 논의되고 있지만, 제품설계 단계에 국한되어 연구가 진행되고 있는 실정이다. 본 연구는 Digital Twin개념이 생산 공정 프로세스에 적용되기 위한 Digital Twin 기반 제조환경 프레임워크를 제시하였다. 구성요소는 실제 생산환경인 물

평가 진행:  62%|██████▏   | 8/13 [04:28<02:41, 32.25s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.3333 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.4444

[9/13] 한국인 정상인 심전도 세부파형 
   카테고리: 국내
2025-10-16 07:27:28,747 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 4fc87916027f5568850d33ecd2f7680f
2025-10-16 07:27:28,856 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/4fc87916027f5568850d33ecd2f7680f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:27:28,860 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 4fc87916027f5568850d33ecd2f7680f
2025-10-16 07:27:28,861 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "46 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "4fc87916027f5568850d33ecd2f7680f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc


Batches: 100%|██████████| 1/1 [00:00<00:00, 65.52it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 53.38it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 61.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 78.84it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 76.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.57it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.79it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.45it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.82it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 52.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 53.02it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 57.

2025-10-16 07:27:33,215 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 11개 데이터셋 순위 결정 완료





2025-10-16 07:27:33,216 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-16 07:27:33,217 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:27:33,218 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 한국인 정상인 심전도 세부파형 
Description: 참조표준 설명 : ○ P_height, Q_height, R_height, S_height, T_height, P_duration, QRS_interval, QT_interval, T_duration\n○ 60~69세 Modified lead (Mason-Likar) system에서 성인 남녀의 정상 심전도\n 참조표준 제/개정 사유 : ㅇ심장 질환 환자용 진단 기기 개발\nㅇ마취 중에 있거나 중환자실에 있는 환자의 심장질환 발병 및 경과 관찰용 기기 개발\nㅇ심전도를 이용한 심박변이도(Heart Rate Variability, HRV), 맥파전도속도(Pulse Wave Velocity) 등의 연구 및 관련 기기 개발에 도움\nㅇ 2013년에 개발한 연령대 20-50세, 2014년 2-13세, 2017년 6--60세를 추가함
Keywords: Electrocardiogram (ECG), P, ECG feature, QRS, T, Sex, Modified limb lead, Heart rate

## Top 10 paper Candidates 

평가 진행:  69%|██████▉   | 9/13 [05:02<02:11, 32.96s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.3333 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.4444

[10/13] 돌발홍수 알람 분석
   카테고리: 국내
2025-10-16 07:28:03,265 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c05286c716d93ea28c6fd08f28b17b6a
2025-10-16 07:28:03,368 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c05286c716d93ea28c6fd08f28b17b6a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:28:03,370 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c05286c716d93ea28c6fd08f28b17b6a
2025-10-16 07:28:03,371 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c05286c716d93ea28c6fd08f28b17b6a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "20


Batches: 100%|██████████| 1/1 [00:00<00:00, 71.84it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 77.55it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.23it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 54.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.87it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.82it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.35it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.32it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.03it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 62.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 53.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 67.70it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 47.

2025-10-16 07:28:07,774 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 4개 데이터셋 순위 결정 완료
2025-10-16 07:28:07,775 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-16 07:28:07,776 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:28:07,777 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 돌발홍수 알람 분석
Description: 돌발홍수 알람 \r\n대상기간 : 2020~2022.6 중 일부\r\n단위 : 읍면동 수준\r\n알람 단계 : 3단계\r\n입력 데이터 : 격자 강우 관측(RDR_COMP_ADJ), 예측(QPF) \r\n대상 범위 : 전국(제주도 등 남부 제외)\r\nFormat : OGC KML (XML)\r\n좌표참조체계 : EPSG::4326
Keywords: 알람, 홍수

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0016824477
- Title: 돌발홍수 및 강우 예보기반의 머신러닝을 활용한 돌발홍수 예보 및 평가
- Description: Flash floods are natural disasters with highly significant risks to life, infrastructure, and the en

평가 진행:  77%|███████▋  | 10/13 [05:33<01:36, 32.15s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.4286 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.5714

[11/13] 2024 극한기후영향 보고서
   카테고리: 국내
2025-10-16 07:28:33,611 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID e876ffe4cad991d4f4930284468df093
2025-10-16 07:28:33,704 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/e876ffe4cad991d4f4930284468df093?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:28:33,706 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset e876ffe4cad991d4f4930284468df093
2025-10-16 07:28:33,707 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "e876ffe4cad991d4f4930284468df093",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc"


Batches: 100%|██████████| 1/1 [00:00<00:00, 101.55it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 95.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.35it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 93.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.84it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.38it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.10it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.83it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 68.53it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.87it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.20it/s]

Batches: 100%|██████████| 1/1 [00:00<

2025-10-16 07:28:36,939 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 12개 데이터셋 순위 결정 완료
2025-10-16 07:28:36,940 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-16 07:28:36,941 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:28:36,941 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 2024 극한기후영향 보고서
Description: 폭염, 한파, 폭우 및 홍수, 가뭄 등의 피해사례 및 정책
Keywords: 폭우, 폭염, 한파, 홍수, 극한기후, 가뭄

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO201105462035709
- Title: Analysis of Changes in Extreme Weather Events Using Extreme Indices
- Description: The climate of the $21^{st}$ century is likely to be significantly different from that of the 20th century because of human-induced climate change. An extreme weather event is defined as a climate




2025-10-16 07:28:47,624 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "JAKO201105462035709",
      "reason": "극한 기후 현상에 대한 분석과 변화 추세를 파악하는 데 중점을 두고 있어 주제와 매우 부합합니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "NART76126089",
      "reason": "주제와 관련된 핵심 키워드인 'extreme weather'를 명확하게 포함하고 있습니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "NART110594260",
      "reason": "다른 후보들과 마찬가지로 'extreme weather'라는 핵심 키워드를 사용하여 주제와 직접적인 연관성을 보입니다.",
      "level": "강추"
    },
    {
      "rank": 4,
      "candidate_id": "NART100333301",
      "reason": "'extreme weather'라는 키워드를 통해 주제와 관련성이 있음을 나타냅니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "NART103788737",
      "reason": "'extreme weather'라는 키워드를 사용하여 주제와 관련성을 드러냅니다.",
      "level": "추천"
    }
  ]
}
2025-10-16 07:28:47,625 - src.agents.recommendation_agent - INFO - ✅ JSON 파싱 성공
2

평가 진행:  85%|████████▍ | 11/13 [06:04<01:03, 31.92s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.2222 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.2222

[12/13] NSW COVID-19 tests by location (discontinued)
   카테고리: 해외
2025-10-16 07:29:05,006 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 03e16fe2b6d96d4961f22c244a94bb1a
2025-10-16 07:29:05,100 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/03e16fe2b6d96d4961f22c244a94bb1a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:29:05,102 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 03e16fe2b6d96d4961f22c244a94bb1a
2025-10-16 07:29:05,103 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "03e16fe2b6d96d4961f22c244a94bb1a",
    "ctlg_type": "02",
    "dataset_type": "02",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc":


Batches: 100%|██████████| 1/1 [00:00<00:00, 65.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 66.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 73.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 63.18it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.02it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 62.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 73.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 62.18it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 73.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 69.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 61.03it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 78.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 73.83it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 70.01it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 73.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 73.

2025-10-16 07:29:09,045 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 10개 데이터셋 순위 결정 완료
2025-10-16 07:29:09,046 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-16 07:29:09,047 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:29:09,047 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: NSW COVID-19 tests by location (discontinued)
Description: From 20 October 2023, COVID-19 datasets will no longer be updated. \\r\\nDetailed information is available in the fortnightly NSW Respiratory Surveillance Report: https://www.health.nsw.gov.au/Infectious/covid-19/Pages/reports.aspx. \\r\\nLatest national COVID-19 spread, vaccination and treatment metrics are available on the Australian Government Health website: https://www.health.gov.au/topics/covid-19/rep

평가 진행:  92%|█████████▏| 12/13 [06:37<00:32, 32.30s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.3333 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.4444

[13/13] Police recorded crime trends in Victoria during the COVID-19 pandemic
   카테고리: 해외
2025-10-16 07:29:38,185 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID b89d0c5d5891c5c80cd7a565ce8a3dc6
2025-10-16 07:29:38,280 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/b89d0c5d5891c5c80cd7a565ce8a3dc6?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-16 07:29:38,283 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset b89d0c5d5891c5c80cd7a565ce8a3dc6
2025-10-16 07:29:38,284 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "b89d0c5d5891c5c80cd7a565ce8a3dc6",
    "ctlg_type": "02",
    "dataset_type": "02",
    "ctlg_type_pc": "dataset"


Batches: 100%|██████████| 1/1 [00:00<00:00, 80.57it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 93.99it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.73it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.06it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.42it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 151.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.23it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.25it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 117.95it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 57.70it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.01it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 63.02it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.67it/s]

Batches: 100%|██████████| 1/1 [00:00<00:0

2025-10-16 07:29:42,184 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 11개 데이터셋 순위 결정 완료
2025-10-16 07:29:42,185 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-16 07:29:42,186 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-16 07:29:42,187 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: Police recorded crime trends in Victoria during the COVID-19 pandemic
Description: The Crime Statistics Agency (CSA) has released a research paper entitled Police-recorded crime trends in Victoria during the COVID-19 pandemic. The paper examines trends in criminal offences and family violence incidents to 30 June 2020, focusing on comparing the period from 1 April 2020 to 30 June 2020 with the same period in 2019.\\r\\nThis paper aims to examine whether and how the COVID-19 pandemic, associated behaviour changes and implemented restrictions impacted on crime in Victoria. It examines whether there were changes in the volume, nature or location of o

평가 진행: 100%|██████████| 13/13 [07:10<00:00, 33.13s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.3333 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.5556

✅ 평가 완료: 13/13개 케이스 성공





## 5. 평가 결과 분석 및 저장

### 5.1 평가 결과 저장 디렉토리 설정

In [7]:
# 타임스탬프 기반 결과 디렉토리 생성
timestamp = datetime.now().strftime('%Y%m%d%H%M')
eval_output_dir = os.path.join(project_root, 'figures', 'evaluation_results', timestamp)
os.makedirs(eval_output_dir, exist_ok=True)

print(f"📂 평가 결과 저장 경로: {eval_output_dir}")

# 추천 원본 결과 저장 
try:
    recommend_path = os.path.join(eval_output_dir, 'recommend_result.json')
    with open(recommend_path, 'w', encoding='utf-8') as f:
        json.dump(all_recommendations, f, indent=2, ensure_ascii=False)
    print(f"💾 recommend_result.json 저장 완료 → {recommend_path}")
except Exception as e:
    print(f"⚠️ recommend_result.json 저장 실패: {e}")

📂 평가 결과 저장 경로: /home/infidea/backup-data/paper-reco-agent/figures/evaluation_results/202510160730
💾 recommend_result.json 저장 완료 → /home/infidea/backup-data/paper-reco-agent/figures/evaluation_results/202510160730/recommend_result.json


### 5.2 전체 메트릭 계산

In [8]:
if not all_eval_results:
    print("⚠️  평가 결과가 없습니다")
else:
    # DataFrame 변환
    df_results = pd.DataFrame(all_eval_results)

    print("\n" + "=" * 80)
    print("📊 평균 평가 메트릭")
    print("=" * 80)

    # 메트릭 요약 계산
    metrics_summary = {}

    for k in k_values:
        print(f"\n📏 k={k} 결과:")
        print("-" * 80)

        k_metrics = {}

        for metric_type in ['overall', 'paper', 'dataset']:
            type_label = {'overall': '전체', 'paper': '논문', 'dataset': '데이터셋'}[metric_type]
            print(f"\n  {type_label}:")

            type_metrics = {}
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@{k}'
                if col_name in df_results.columns:
                    mean_val = df_results[col_name].mean()
                    std_val = df_results[col_name].std()
                    type_metrics[metric] = {'mean': mean_val, 'std': std_val}
                    print(f"    • {metric.upper():10s}: {mean_val:.4f} ± {std_val:.4f}")

            k_metrics[metric_type] = type_metrics

        metrics_summary[f'k{k}'] = k_metrics

    # 통계
    print("\n" + "=" * 80)
    print("📈 기본 통계")
    print("=" * 80)
    print(f"  평균 추천 논문 수: {df_results['num_predicted_papers'].mean():.2f}개")
    print(f"  평균 추천 데이터셋 수: {df_results['num_predicted_datasets'].mean():.2f}개")
    print(f"  평균 관련 논문 수: {df_results['num_relevant_papers'].mean():.2f}개")
    print(f"  평균 관련 데이터셋 수: {df_results['num_relevant_datasets'].mean():.2f}개")
    print(f"  평균 처리 시간: {df_results['processing_time_ms'].mean():.0f} ms")


📊 평균 평가 메트릭

📏 k=3 결과:
--------------------------------------------------------------------------------

  전체:
    • NDCG      : 0.8462 ± 0.3755
    • MRR       : 0.8462 ± 0.3755
    • RECALL    : 0.2895 ± 0.1564
    • PRECISION : 0.7436 ± 0.3886

  논문:
    • NDCG      : 0.8462 ± 0.3755
    • MRR       : 0.8462 ± 0.3755
    • RECALL    : 0.5744 ± 0.3137
    • PRECISION : 0.7436 ± 0.3886

  데이터셋:
    • NDCG      : 0.9192 ± 0.2765
    • MRR       : 0.9231 ± 0.2774
    • RECALL    : 0.7167 ± 0.2915
    • PRECISION : 0.8462 ± 0.2924

📏 k=5 결과:
--------------------------------------------------------------------------------

  전체:
    • NDCG      : 0.8346 ± 0.3727
    • MRR       : 0.8462 ± 0.3755
    • RECALL    : 0.3748 ± 0.1979
    • PRECISION : 0.5846 ± 0.3211

  논문:
    • NDCG      : 0.8462 ± 0.3755
    • MRR       : 0.8462 ± 0.3755
    • RECALL    : 0.7205 ± 0.4068
    • PRECISION : 0.5731 ± 0.3308

  데이터셋:
    • NDCG      : 0.9161 ± 0.2757
    • MRR       : 0.9231 ± 0.2774
    • REC

### 5.3 카테고리별 분석

In [9]:
if all_eval_results:
    print("\n" + "=" * 80)
    print("📊 카테고리별 메트릭 (k=5)")
    print("=" * 80)

    category_metrics = {}

    for category in sorted(df_results['category'].unique()):
        category_data = df_results[df_results['category'] == category]

        print(f"\n📁 {category} (n={len(category_data)}):")
        print("-" * 80)

        cat_metrics = {}
        for metric_type in ['overall', 'paper', 'dataset']:
            type_label = {'overall': '전체', 'paper': '논문', 'dataset': '데이터셋'}[metric_type]
            print(f"  {type_label}:")

            type_metrics = {}
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@5'
                if col_name in category_data.columns:
                    mean_val = category_data[col_name].mean()
                    type_metrics[metric] = mean_val
                    print(f"    • {metric.upper():10s}: {mean_val:.4f}")

            cat_metrics[metric_type] = type_metrics

        category_metrics[category] = cat_metrics


📊 카테고리별 메트릭 (k=5)

📁 국내 (n=11):
--------------------------------------------------------------------------------
  전체:
    • NDCG      : 0.8046
    • MRR       : 0.8182
    • RECALL    : 0.3521
    • PRECISION : 0.5273
  논문:
    • NDCG      : 0.8182
    • MRR       : 0.8182
    • RECALL    : 0.6697
    • PRECISION : 0.5136
  데이터셋:
    • NDCG      : 0.9025
    • MRR       : 0.9091
    • RECALL    : 0.8788
    • PRECISION : 0.6818

📁 해외 (n=2):
--------------------------------------------------------------------------------
  전체:
    • NDCG      : 1.0000
    • MRR       : 1.0000
    • RECALL    : 0.5000
    • PRECISION : 0.9000
  논문:
    • NDCG      : 1.0000
    • MRR       : 1.0000
    • RECALL    : 1.0000
    • PRECISION : 0.9000
  데이터셋:
    • NDCG      : 0.9908
    • MRR       : 1.0000
    • RECALL    : 0.7750
    • PRECISION : 0.8000


### 5.4 최종 결과 저장

**📁 저장되는 파일:**
1. **`EVALUATION_SUMMARY.txt`** ⭐ - 가장 먼저 봐야 할 요약 리포트
2. **`detailed_results.csv`** - 엑셀에서 열어볼 수 있는 상세 데이터
3. **`config.json`** - 실험 재현을 위한 설정 정보
4. **`metrics.json`** - 프로그램으로 읽을 수 있는 메트릭 데이터

In [10]:
if all_eval_results:
    print("\n💾 결과 저장 중...\n")

    # 1. 요약 리포트 생성 (가장 중요!)
    report_lines = []
    report_lines.append("=" * 80)
    report_lines.append("평가 요약 리포트")
    report_lines.append("=" * 80)
    report_lines.append("")
    report_lines.append(f"📅 평가 시각: {timestamp}")
    report_lines.append(f"🤖 LLM 모델: {settings.MODEL_NAME}")
    report_lines.append(f"🔍 임베딩 모델: {settings.EMBEDDING_MODEL}")
    report_lines.append(f"📊 테스트 케이스: {len(all_eval_results)}/{len(all_test_cases)} 성공")
    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("주요 성능 지표 (k=5)")
    report_lines.append("=" * 80)
    report_lines.append("")

    # k=5 전체 메트릭
    for metric in ['ndcg', 'mrr', 'recall', 'precision']:
        col_name = f'overall_{metric}@5'
        if col_name in df_results.columns:
            mean_val = df_results[col_name].mean()
            report_lines.append(f"  {metric.upper():10s} @5: {mean_val:.4f}")

    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("타입별 성능 (k=5)")
    report_lines.append("=" * 80)

    for metric_type in ['paper', 'dataset']:
        type_label = {'paper': '논문', 'dataset': '데이터셋'}[metric_type]
        report_lines.append("")
        report_lines.append(f"[{type_label}]")
        for metric in ['ndcg', 'mrr', 'recall', 'precision']:
            col_name = f'{metric_type}_{metric}@5'
            if col_name in df_results.columns:
                mean_val = df_results[col_name].mean()
                report_lines.append(f"  {metric.upper():10s}: {mean_val:.4f}")

    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("카테고리별 nDCG@5")
    report_lines.append("=" * 80)
    report_lines.append("")

    for category in sorted(df_results['category'].unique()):
        category_data = df_results[df_results['category'] == category]
        mean_val = category_data['overall_ndcg@5'].mean()
        report_lines.append(f"  {category:30s}: {mean_val:.4f} (n={len(category_data)})")

    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("전체 메트릭 (모든 k 값)")
    report_lines.append("=" * 80)

    for k in k_values:
        report_lines.append("")
        report_lines.append(f"k={k}:")
        report_lines.append("-" * 40)
        for metric_type in ['overall', 'paper', 'dataset']:
            type_label = {'overall': '전체', 'paper': '논문', 'dataset': '데이터셋'}[metric_type]
            report_lines.append(f"  [{type_label}]")
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@{k}'
                if col_name in df_results.columns:
                    mean_val = df_results[col_name].mean()
                    std_val = df_results[col_name].std()
                    report_lines.append(f"    {metric.upper():10s}: {mean_val:.4f} ± {std_val:.4f}")

    report_lines.append("")
    report_lines.append("=" * 80)

    # 요약 리포트 저장
    summary_path = os.path.join(eval_output_dir, 'EVALUATION_SUMMARY.txt')
    with open(summary_path, 'w', encoding='utf-8') as f:
        f.write('\n'.join(report_lines))
    print(f"✅ 1. 요약 리포트 저장: EVALUATION_SUMMARY.txt")

    # 2. 상세 CSV 저장
    csv_path = os.path.join(eval_output_dir, 'detailed_results.csv')
    df_results.to_csv(csv_path, index=False, encoding='utf-8-sig')
    print(f"✅ 2. 상세 결과 CSV 저장: detailed_results.csv")

    # 3. 메트릭 JSON 저장
    all_metrics = {
        'summary': metrics_summary,
        'by_category': category_metrics,
        'individual_results': all_eval_results
    }

    metrics_path = os.path.join(eval_output_dir, 'metrics.json')
    with open(metrics_path, 'w', encoding='utf-8') as f:
        json.dump(all_metrics, f, indent=2, ensure_ascii=False)
    print(f"✅ 3. 메트릭 JSON 저장: metrics.json")

    print(f"\n" + "=" * 80)
    print(f"📂 모든 결과가 저장되었습니다:")
    print(f"   {eval_output_dir}")
    print(f"" + "=" * 80)
    print(f"\n⭐ 결과 확인: EVALUATION_SUMMARY.txt 파일을 먼저 읽어보세요!")

    # 요약 리포트 미리보기
    print(f"\n" + "=" * 80)
    print("📄 요약 리포트 미리보기:")
    print("=" * 80)
    print('\n'.join(report_lines[:50]))  # 처음 50줄만 표시
    if len(report_lines) > 50:
        print("\n... (전체 내용은 EVALUATION_SUMMARY.txt 참고) ...")
else:
    print("⚠️  저장할 결과가 없습니다")


💾 결과 저장 중...

✅ 1. 요약 리포트 저장: EVALUATION_SUMMARY.txt
✅ 2. 상세 결과 CSV 저장: detailed_results.csv
✅ 3. 메트릭 JSON 저장: metrics.json

📂 모든 결과가 저장되었습니다:
   /home/infidea/backup-data/paper-reco-agent/figures/evaluation_results/202510160730

⭐ 결과 확인: EVALUATION_SUMMARY.txt 파일을 먼저 읽어보세요!

📄 요약 리포트 미리보기:
평가 요약 리포트

📅 평가 시각: 202510160730
🤖 LLM 모델: google/gemma-2-9b-it
🔍 임베딩 모델: intfloat/multilingual-e5-large
📊 테스트 케이스: 13/13 성공

주요 성능 지표 (k=5)

  NDCG       @5: 0.8346
  MRR        @5: 0.8462
  RECALL     @5: 0.3748
  PRECISION  @5: 0.5846

타입별 성능 (k=5)

[논문]
  NDCG      : 0.8462
  MRR       : 0.8462
  RECALL    : 0.7205
  PRECISION : 0.5731

[데이터셋]
  NDCG      : 0.9161
  MRR       : 0.9231
  RECALL    : 0.8628
  PRECISION : 0.7000

카테고리별 nDCG@5

  국내                            : 0.8046 (n=11)
  해외                            : 1.0000 (n=2)

전체 메트릭 (모든 k 값)

k=3:
----------------------------------------
  [전체]
    NDCG      : 0.8462 ± 0.3755
    MRR       : 0.8462 ± 0.3755

... (전체 내용은 EVALUATION_SUMM

## 6. 평가 완료

**결과 파일 안내**
- 평가 결과는 `figures/evaluation_results/{timestamp}/` 디렉토리에 저장됩니다.

**파일 읽는 순서:**
1. `EVALUATION_SUMMARY.txt` ⭐⭐⭐
   - 가장 먼저 읽어야 할 파일
   - 주요 성능 지표와 카테고리별 결과 요약
   - 텍스트 에디터로 바로 열어볼 수 있음

2. `detailed_results.csv`
   - 엑셀이나 스프레드시트로 열어서 상세 분석
   - 각 테스트 케이스별 메트릭 포함
   - 필터링, 정렬, 차트 생성 가능

3. `recommend_result.json`
   - 평가 데이터 추천 결과

4. `metrics.json`
   - 프로그램으로 읽을 수 있는 메트릭 데이터
   - 자동화된 분석이나 비교에 사용

**주요 메트릭 설명**
- nDCG@k: 순위를 고려한 추천 품질 (0~1, 높을수록 좋음)
- MRR@k: 첫 번째 관련 항목의 순위 (0~1, 높을수록 좋음)
- Recall@k: 관련 항목 중 추천된 비율 (0~1, 높을수록 좋음)
- Precision@k: 추천 항목 중 관련된 비율 (0~1, 높을수록 좋음)