# 2025 DATA·AI 분석 경진대회 - 논문·데이터 추천 에이전트 평가

이 노트북은 LLM 기반 연구 데이터/논문 추천 시스템의 성능을 평가합니다.

**실행 환경**
- GPU: NVIDIA RTX 3080 이상
- CUDA: 11.8+
- Python: 3.10+

## 1. 환경 설정 및 라이브러리 임포트

In [2]:
import sys
import os
import json
import logging
from datetime import datetime
from pathlib import Path
import pandas as pd
import numpy as np
from tqdm.auto import tqdm

# 프로젝트 루트 경로
project_root = '/home/infidea/backup-data/paper-reco-agent'
sys.path.insert(0, project_root)

print(f"프로젝트 루트: {project_root}")

# 로깅 설정
os.makedirs(os.path.join(project_root, 'logs'), exist_ok=True)

logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
    handlers=[
        logging.StreamHandler(sys.stdout),
        logging.FileHandler(os.path.join(project_root, 'logs/evaluation.log'))
    ],
    force=True
)

print("✅ 로깅 설정 완료")

# 평가 모듈 임포트
from src.evaluation.metrics import (
    evaluate_recommendations,
    batch_evaluate,
    format_evaluation_report
)
from src.config.settings import settings

print("✅ 평가 모듈 임포트 완료")

프로젝트 루트: /home/infidea/backup-data/paper-reco-agent
✅ 로깅 설정 완료
✅ 평가 모듈 임포트 완료


## 2. 테스트 데이터셋 로드

In [3]:
# 테스트 데이터셋 로드
testset_path = os.path.join(project_root, 'data', 'test', 'testset_filtered.json')

with open(testset_path, 'r', encoding='utf-8') as f:
    testset = json.load(f)

print(f"✅ 테스트 데이터셋 로드 완료: {testset_path}")
print(f"📊 테스트 카테고리 수: {len(testset.keys())}")

# 모든 테스트 케이스 추출
all_test_cases = []
for category, cases in testset.items():
    for case in cases:
        case['category'] = category
        all_test_cases.append(case)

print(f"📝 총 테스트 케이스: {len(all_test_cases)}개")
print(f"\n첫 번째 테스트 케이스 예시:")
print(json.dumps(all_test_cases[0], indent=2, ensure_ascii=False)[:500] + "...")

✅ 테스트 데이터셋 로드 완료: /home/infidea/backup-data/paper-reco-agent/data/test/testset_filtered.json
📊 테스트 카테고리 수: 2
📝 총 테스트 케이스: 17개

첫 번째 테스트 케이스 예시:
{
  "input_dataset": {
    "svc_id": "c1f03ab868f32371ec97a650bcdf39ac",
    "title": "한반도 기상 관측 데이터 세트",
    "description": "한반도 종관 기상 관측 세스템으로부터의 관측 데이터 세트",
    "keywords": [
      "한반도",
      "기상",
      "센서데이터"
    ]
  },
  "candidate_pool": {
    "papers": [
      {
        "id": "DIKO0014589705",
        "title": "쿠로시오 해류의 변동성과 동아시아 겨울 기후와의 상관성 연구",
        "abstract": "동아시아 겨울 기후를 대표하는 동아시아 겨울 몬순의 변동성은 외부적 다양한 인자들에 의해 영향을 받는다. 북서태평양에서 주요한 흐름인 쿠로시오 해류도 한반도와 주변 바다에 영향을 미치며 동아시아 기후에 영향을 주는...


## 3. 추천 에이전트 초기화

In [4]:
# 추천 에이전트 임포트 및 초기화
from src.agents.recommendation_agent import KoreanResearchRecommendationAgent
from src.config.settings import settings

print("모델 설정:")
print(f"  - 모델명: {settings.MODEL_NAME}")
print(f"  - 임베딩 모델: {settings.EMBEDDING_MODEL}")
print(f"  - 개발 모드: {settings.DEV_MODE}")
print("\n🚀 에이전트 초기화 중... (수 분 소요될 수 있습니다)")

agent = KoreanResearchRecommendationAgent()

print("\n✅ 에이전트 초기화 완료")
print(f"모델 정보: {json.dumps(agent.llm_model.get_model_info(), indent=2, ensure_ascii=False)}")

2025-10-15 19:18:56,972 - sentence_transformers.SentenceTransformer - INFO - Use pytorch device_name: cuda:0
2025-10-15 19:18:56,975 - sentence_transformers.SentenceTransformer - INFO - Load pretrained SentenceTransformer: intfloat/multilingual-e5-large
모델 설정:
  - 모델명: google/gemma-2-9b-it
  - 임베딩 모델: intfloat/multilingual-e5-large
  - 개발 모드: False

🚀 에이전트 초기화 중... (수 분 소요될 수 있습니다)
2025-10-15 19:19:02,788 - src.agents.recommendation_agent - INFO - 🚀 프로덕션 모드로 실행: 실제 LLM 모델 사용
2025-10-15 19:19:02,790 - src.models.llm_model - INFO - 🚀 Gemma 모델 로딩 시작: google/gemma-2-9b-it
2025-10-15 19:19:02,791 - src.models.llm_model - INFO -    - 디바이스: cuda
2025-10-15 19:19:03,961 - src.models.llm_model - INFO -    - FP16 모드


`torch_dtype` is deprecated! Use `dtype` instead!
Loading checkpoint shards: 100%|██████████| 4/4 [00:19<00:00,  4.87s/it]


2025-10-15 19:19:36,578 - src.models.llm_model - INFO - ✅ Gemma 모델 로딩 완료

✅ 에이전트 초기화 완료
모델 정보: {
  "model_name": "google/gemma-2-9b-it",
  "model_type": "Gemma",
  "device": "cuda",
  "dtype": "float16",
  "max_tokens": 512,
  "temperature": 0.0,
  "parameters": "9B",
  "context_length": "8K"
}


## 4. 평가 실행

모든 테스트 케이스에 대해 추천을 생성하고 평가합니다.

In [5]:
# TODO: 추천 개수 설정 (선택사항)
# 최대값: agent의 max_paper_candidates, max_dataset_candidates 값
num_paper_recommendations = 5
num_dataset_recommendations = 5

# agent에서 최대 후보 개수 가져오기
MAX_PAPER_CANDIDATES = agent.max_paper_candidates
MAX_DATASET_CANDIDATES = agent.max_dataset_candidates

print(f"최대 추천 가능 개수: 논문 {MAX_PAPER_CANDIDATES}개, 데이터셋 {MAX_DATASET_CANDIDATES}개")

# 추천 개수 검증
if num_paper_recommendations > MAX_PAPER_CANDIDATES:
    print(f"⚠️  경고: 논문 추천 개수({num_paper_recommendations})가 최대값({MAX_PAPER_CANDIDATES})을 초과합니다.")
    print(f"   자동으로 {MAX_PAPER_CANDIDATES}개로 조정됩니다.")
    num_paper_recommendations = MAX_PAPER_CANDIDATES

if num_dataset_recommendations > MAX_DATASET_CANDIDATES:
    print(f"⚠️  경고: 데이터셋 추천 개수({num_dataset_recommendations})가 최대값({MAX_DATASET_CANDIDATES})을 초과합니다.")
    print(f"   자동으로 {MAX_DATASET_CANDIDATES}개로 조정됩니다.")
    num_dataset_recommendations = MAX_DATASET_CANDIDATES

if num_paper_recommendations < 1:
    print(f"⚠️  경고: 논문 추천 개수는 최소 1개 이상이어야 합니다.")
    num_paper_recommendations = 1

if num_dataset_recommendations < 1:
    print(f"⚠️  경고: 데이터셋 추천 개수는 최소 1개 이상이어야 합니다.")
    num_dataset_recommendations = 1

print(f"✅ 추천 설정: 논문 {num_paper_recommendations}개, 데이터셋 {num_dataset_recommendations}개")

최대 추천 가능 개수: 논문 10개, 데이터셋 10개
✅ 추천 설정: 논문 5개, 데이터셋 5개


In [None]:
# 평가 실행
all_eval_results = []
k_values = [3, 5]

# 추천 원본 결과(recommend_result.json 저장용)
all_recommendations = []

print(f"🔍 {len(all_test_cases)}개 테스트 케이스 평가 시작")
print(f"📏 평가 k 값: {k_values}")
print("=" * 80)

# 모델/임베딩 정보
try:
    _model_info = agent.llm_model.get_model_info()
except Exception:
    _model_info = {}
_model_info_safe = {
    "model_name": _model_info.get("model_name"),
    "model_type": _model_info.get("model_type"),
    "device": _model_info.get("device"),
    "dtype": _model_info.get("dtype"),
    "max_tokens": _model_info.get("max_tokens"),
    "temperature": _model_info.get("temperature"),
    "parameters": _model_info.get("parameters"),
    "context_length": _model_info.get("context_length"),
}

_embedding_info_safe = {
    "embedding_model": getattr(settings, "EMBEDDING_MODEL", None),
    "paper_hybrid_weights": {
        "alpha": getattr(settings, "PAPER_HYBRID_ALPHA", None),
        "beta": getattr(settings, "PAPER_HYBRID_BETA", None),
    },
    "dataset_hybrid_weights": {
        "alpha": getattr(settings, "DATASET_HYBRID_ALPHA", None),
        "beta": getattr(settings, "DATASET_HYBRID_BETA", None),
    },
}

for idx, test_case in enumerate(tqdm(all_test_cases, desc="평가 진행")):
    try:
        dataset_id = test_case['input_dataset']['svc_id']
        category = test_case['category']

        print(f"\n[{idx+1}/{len(all_test_cases)}] {test_case['input_dataset']['title']}")
        print(f"   카테고리: {category}")

        # 추천 생성
        recommendation_result = await agent.recommend(
            dataset_id,
            num_paper_recommendations=num_paper_recommendations,
            num_dataset_recommendations=num_dataset_recommendations
        )

        if 'error' in recommendation_result:
            print(f"   ❌ 오류: {recommendation_result['error']}")
            continue

        # ===== 추천 원본 결과 수집 =====
        # source_dataset
        src_ds = test_case.get("input_dataset", {})
        source_dataset_block = {
            "id": src_ds.get("svc_id"),
            "title": src_ds.get("title"),
            "description": src_ds.get("description"),
            "keywords": src_ds.get("keywords", []),
        }

        # search_result
        search_result = recommendation_result.get("search_result", {})
        search_result_block = {
            "paper_keywords": search_result.get("paper_keywords", []),
            "dataset_keywords": search_result.get("dataset_keywords", []),
            "paper_search_details": search_result.get("paper_search_details", []),
            "dataset_search_details": search_result.get("dataset_search_details", []),
        }

        # paper/dataset recommendations
        paper_reco = recommendation_result.get("paper_recommendations", [])
        dataset_reco = recommendation_result.get("dataset_recommendations", [])

        # candidates_analyzed
        candidates_analyzed = recommendation_result.get(
            "candidates_analyzed",
            (len(recommendation_result.get("paper_candidates", [])) +
             len(recommendation_result.get("dataset_candidates", []))
             if ("paper_candidates" in recommendation_result or "dataset_candidates" in recommendation_result)
             else (len(paper_reco) + len(dataset_reco)))
        )

        # 처리 시간
        processing_time_ms = recommendation_result.get("processing_time_ms", None)

        # 하나의 케이스 레코드 구성
        reco_record = {
            "source_dataset": source_dataset_block,
            "search_result": search_result_block,
            "paper_recommendations": paper_reco,
            "dataset_recommendations": dataset_reco,
            "processing_time_ms": processing_time_ms,
            "candidates_analyzed": candidates_analyzed,
            "model_info": _model_info_safe,
            "embedding_model_info": _embedding_info_safe,
        }
        all_recommendations.append(reco_record)
        # ==============================================

        # 평가 형식으로 변환
        predictions = []
        for paper in recommendation_result.get('paper_recommendations', []):
            predictions.append({
                'type': 'paper',
                'id': paper['id'],
                'rank': paper.get('rank'),
                'score': paper.get('score')
            })

        for dataset in recommendation_result.get('dataset_recommendations', []):
            predictions.append({
                'type': 'dataset',
                'id': dataset['id'],
                'rank': dataset.get('rank'),
                'score': dataset.get('score')
            })

        # 평가
        ground_truth = test_case['candidate_pool']
        eval_result = evaluate_recommendations(predictions, ground_truth, k_values)

        # 메타데이터 추가
        eval_result['test_case_index'] = idx
        eval_result['dataset_id'] = dataset_id
        eval_result['category'] = category
        eval_result['input_title'] = test_case['input_dataset']['title']
        eval_result['processing_time_ms'] = processing_time_ms if processing_time_ms is not None else recommendation_result.get('processing_time_ms', 0)
        # 선택: 추천 개수 기록(분석 편의)
        eval_result['num_predicted_papers'] = len([p for p in predictions if p['type'] == 'paper'])
        eval_result['num_predicted_datasets'] = len([p for p in predictions if p['type'] == 'dataset'])
        all_eval_results.append(eval_result)

        # 결과 요약 출력 (k_values 반영)
        summary_chunks = []
        for k in k_values:
            ndcg = eval_result.get(f"overall_ndcg@{k}", 0)
            mrr = eval_result.get(f"overall_mrr@{k}", 0)
            recall = eval_result.get(f"overall_recall@{k}", 0)
            summary_chunks.append(
                f"nDCG@{k}={ndcg:.4f}, MRR@{k}={mrr:.4f}, Recall@{k}={recall:.4f}"
            )
        print("   ✅ " + " | ".join(summary_chunks))

    except Exception as e:
        print(f"   ❌ 예외 발생: {e}")
        logging.error(f"테스트 케이스 {idx} 평가 실패: {e}", exc_info=True)
        continue

print("\n" + "=" * 80)
print(f"✅ 평가 완료: {len(all_eval_results)}/{len(all_test_cases)}개 케이스 성공")

🔍 17개 테스트 케이스 평가 시작
📏 평가 k 값: [3, 5]


평가 진행:   0%|          | 0/17 [00:00<?, ?it/s]


[1/17] 한반도 기상 관측 데이터 세트
   카테고리: 국내
2025-10-15 19:19:36,604 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c1f03ab868f32371ec97a650bcdf39ac
2025-10-15 19:19:36,706 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c1f03ab868f32371ec97a650bcdf39ac?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:19:36,709 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c1f03ab868f32371ec97a650bcdf39ac
2025-10-15 19:19:36,710 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c1f03ab868f32371ec97a650bcdf39ac",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "2025",
    "dataset_access_type_pc": "공개",
    "file_yn_pc": "직접다운로드",
    "dataset_cc_license


Batches: 100%|██████████| 1/1 [00:00<00:00, 10.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.25it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.86it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.70it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.07it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.01it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 55.06it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.70it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 77.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.32it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.42it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.

2025-10-15 19:19:42,220 - src.agents.recommendation_agent - INFO - 상위 16개 논문, 10개 데이터셋 순위 결정 완료
2025-10-15 19:19:42,221 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:19:42,222 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:19:42,223 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 한반도 기상 관측 데이터 세트
Description: 한반도 종관 기상 관측 세스템으로부터의 관측 데이터 세트
Keywords: 센서데이터, 한반도, 기상

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0017175632
- Title: Hydrological variables and total water storage change in response to climate and land use change: case study of Korea
- Description: 이 연구는 두 가지 주요 구성 요소로 나뉩니다: 토양 수분 데이터 정확성을 향상시키고 기후 및 토지 이용 변화가 미래의 수문학적 변수와 총 물 저장량에 미치는 영향을 평가하는 것입니다 (SSP2-4.5 및 SSP5-8.5). 일반 회귀 신경망(GRNN) 모델을 사용하여 위성에서 추출한 G


The following generation flags are not valid and may be ignored: ['temperature', 'top_p']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


2025-10-15 19:19:54,329 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "DIKO0017175632",
      "reason": "기후변화와 토지 이용 변화가 한국의 수문학적 변수에 미치는 영향을 분석하는 연구이며, 제공된 데이터셋과 직접적인 관련성이 있습니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "JAKO202101134664018",
      "reason": "한국 반도의 대기 중 지연을 계산하고 분석하는 연구로, 기상 관측 데이터와 관련된 내용입니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "NART83091926",
      "reason": "한국 기후에 대한 전반적인 정보를 제공하는 책이나 논문일 가능성이 높아, 기본적인 이해를 위한 자료로 적합합니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "ART001990639",
      "reason": "한국에서 기후변화 대응 방안을 모색하는 노력을 설명하는 글로, 기후변화와 관련된 연구와 연관성이 있을 수 있습니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "ART001513959",
      "reason": "기상 관측 데이터를 수집하고 처리하는 장비 개발에 대한 연구로, 데이터셋 활용과 관련된 기술적 배경을 이해하는 데 도움이 될 수 있습니다.",
      "level": "참고"
    }
  ]
}
2025-10-15 19:1

평가 진행:   6%|▌         | 1/17 [00:44<11:53, 44.60s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[2/17] Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상을 활용한 천지호 GeoAI 데이터셋
   카테고리: 국내
2025-10-15 19:20:21,207 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 8d498db96633f07fe1d82ebe43daaf45
2025-10-15 19:20:21,302 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/8d498db96633f07fe1d82ebe43daaf45?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:20:21,304 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 8d498db96633f07fe1d82ebe43daaf45
2025-10-15 19:20:21,305 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "24 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "8d498db96633f07fe1d82ebe43daaf45",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "datase


Batches: 100%|██████████| 1/1 [00:00<00:00, 101.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 116.48it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.40it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.70it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 57.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 66.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.40it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 62.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 110.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 61.54it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 78.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.59it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.62it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.93it/s]

Batches: 100%|██████████| 1/1 [00:00<

2025-10-15 19:20:26,385 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 19개 데이터셋 순위 결정 완료
2025-10-15 19:20:26,386 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 19:20:26,387 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:20:26,388 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상을 활용한 천지호 GeoAI 데이터셋
Description: Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상으로부터 구축된 백두산 천지호 GeoAI 데이터셋
Keywords: #백두산 #화산활동 #천지 #수체 #광학위성 #인공지능 데이터셋

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO202013363977987
- Title: 한국의 연안원격탐사 활용
- Description: 최근 지구온난화로 인한 지구 규모 단위의 기후변화로 인한 연안의 환경변화에 대한 관심이 매우 높다. 또한 인간의 도시 개발로 인해 중요한 자연 및 사회적으로 유용한 연안지역 환경이 많이 훼손되고 있다. 이를 보호하기 위한 다양한 플랫폼과 탑재체를 이용한 현장 조사 및 원격탐사 연구가 연안 및 근해 지역에서 수행되고 있다. 본 특별호는 한국해양과학기술원 해양위성센터와 그 외 여러 대학에서 진행되고 있는 다양한 주제의 흥미로운 연안원격탐사 연구 결과를 소개한다. 본 특별호를 통해 한국해양과학기술원 해양위성센터에서 수행되고 있는 다양한 국내 연안원격탐사의 역할과 가치를 공유하고 연안 환경을 보호하기 위한 연안원격탐사 과제 발굴

평가 진행:  12%|█▏        | 2/17 [01:14<09:00, 36.05s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.3869, MRR@5=0.2000, Recall@5=0.0714

[3/17] 이동형 도시환경 센싱 데이터 셋
   카테고리: 국내
2025-10-15 19:20:51,274 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c3ad2f8c1cf9e107a3f68b6972b64ad5
2025-10-15 19:20:51,364 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c3ad2f8c1cf9e107a3f68b6972b64ad5?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:20:51,366 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c3ad2f8c1cf9e107a3f68b6972b64ad5
2025-10-15 19:20:51,367 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c3ad2f8c1cf9e107a3f68b6972b64ad5",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc


Batches: 100%|██████████| 1/1 [00:00<00:00, 105.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.89it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 66.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 136.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 57.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.68it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 135.96it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 135.99it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.25it/s]

Batches: 100%|██████████| 1/1 [0

2025-10-15 19:20:56,767 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 10개 데이터셋 순위 결정 완료
2025-10-15 19:20:56,768 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 19:20:56,769 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:20:56,769 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 이동형 도시환경 센싱 데이터 셋
Description: 자동차 탑재 센서를 활용한 전국 5대 광역시 대상 대기환경 수집 데이터. 미세먼지, 초미세먼지, 일산화탄소, 이산화질소 수치 등 각종 정보를 수집
Keywords: 미세먼지, 대기환경 센싱, 광역시, 사물데이터

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO201900937409543
- Title: IoT 기반 대기 오염 관련 스마트 생활 정보 서비스 구현
- Description: 사물인터넷(Internet of Things:IoT)은 각종 사물에 센서와 통신 기능을 내장하여 인터넷에 연결하는 기술로 스마트 홈, 스마트 공장 등 다양한 분야에서 활용되고 있다. 최근 미세먼지 등 대기 오염 정보에 대한 관심이 높아짐에 따라 IoT 기술을 기반으로 날씨 정보, 대기 오염 정보를 제공하는 앱이 개발되고 있다. 본 연구에서는 IoT 기술을 활용하여 시각적인 대기 오염 및 날씨 정보를 제공하고 이를 활용하여 가전 자동화 등의 유용한 서비스를 개발함을 목표로 한다. 이를 위해 본 연구에서는 IoT 기술을 기반으로 하여 대기 오염 정보를 이용한 가전 자동화, 메시지 및 알람, 시각적인 대기 오염 정보 및 날씨 정보를 제공하는 스마트 서

평가 진행:  18%|█▊        | 3/17 [02:03<09:45, 41.79s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[4/17] 이동형 도시환경 센서 및 도로영상 데이터 셋
   카테고리: 국내
2025-10-15 19:21:39,884 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 000e4340354d8219bdb3af6a7ad4800d
2025-10-15 19:21:40,014 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/000e4340354d8219bdb3af6a7ad4800d?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:21:40,016 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 000e4340354d8219bdb3af6a7ad4800d
2025-10-15 19:21:40,016 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "33 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "000e4340354d8219bdb3af6a7ad4800d",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pu


Batches: 100%|██████████| 1/1 [00:00<00:00, 104.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.05it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.19it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.44it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.25it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.03it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 59.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.68it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.93it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.67it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.27it/s]

Batches: 100%|██████████| 1/1 [00:0

2025-10-15 19:21:45,032 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 13개 데이터셋 순위 결정 완료
2025-10-15 19:21:45,032 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:21:45,033 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:21:45,034 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 이동형 도시환경 센서 및 도로영상 데이터 셋
Description: 자동차 탑재 센서 및 블랙박스를 활용한 전국 5대 광역시 대상 도로영상 수집 데이터. 미세먼지, 초미세먼지, 일산화탄소, 이산화질소 수치 등 각종 정보를 수집
Keywords: 미세먼지, 도시영상, 사물데이터, 광역시

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART69863817
- Title: 자동차 IT융합을 위한 다중 센서 데이터 변환기술
- Description: &amp;nbsp;&amp;nbsp;최근 자동차산업과 IT산업의 융합화가 사회적 이슈로 부각되고 있다. 자동차분야는 지능형자동차, 전기자동차, 하이브리드 자동차 개발 시 자동차에 차량 제어네트워크, 인프라 연계 등 IT기술을 접목하는 형태의 연구가 활발히 진행되고 있고, IT분야에서는 차량과 인프라, 차량과 차량, 차량과




2025-10-15 19:21:59,601 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "JAKO201224963707613",
      "reason": "자동차 센서와 통신 기술을 활용한 위치 추정 알고리즘에 대한 내용으로, 데이터 수집 및 분석에 대한 정보가 포함되어 있습니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "NART69863817",
      "reason": "자동차 IT융합 기술, 특히 다중 센서 데이터 변환 및 처리 기술에 대한 연구 내용으로, 데이터 관련성이 높습니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO201400841250230",
      "reason": "스마트 센서와 지능형 자동차 연구 동향을 다루며, 센서 기술과 자동차 분야의 연관성을 설명합니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "JAKO200500842580862",
      "reason": "자동차 센서 모니터링 시스템 개발에 대한 연구로, 센서 데이터를 활용한 시스템 구축에 대한 정보를 제공합니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "JAKO201033538931936",
      "reason": "GIS 기반 실시간 용수 모니터링 시스템 연구로, 센서 데이터를 활용한 모니터링 시스템에 대한 이해를 높입니다.",
      "level": "참고"
    }
  ]
}
2025-10-15 19:

평가 진행:  24%|██▎       | 4/17 [02:54<09:49, 45.32s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[5/17] Dataset for Intervention strategies against COVID-19 and their estimated impact on Swedish healthcare capacity
   카테고리: 국내
2025-10-15 19:22:30,623 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 33da0205f56477ba41dec7d7db3258a6
2025-10-15 19:22:30,728 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/33da0205f56477ba41dec7d7db3258a6?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:22:30,730 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 33da0205f56477ba41dec7d7db3258a6
2025-10-15 19:22:30,731 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "33 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "33da0205f56477ba41dec7d7db3258a6",
    "ctlg_type": "02",
    "dataset_ty


Batches: 100%|██████████| 1/1 [00:00<00:00, 69.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.82it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.62it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.10it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.07it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.97it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 90.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 76.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 76.73it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 63.90it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.

2025-10-15 19:22:36,938 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 15개 데이터셋 순위 결정 완료
2025-10-15 19:22:36,938 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:22:36,939 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:22:36,940 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: Dataset for Intervention strategies against COVID-19 and their estimated impact on Swedish healthcare capacity
Description: Dataset for individual-based modeling of COVID-19 spread in Sweden.
Keywords: 코로나19, 코로나, COVID-19

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: ART002578663
- Title: 신종 코로나바이러스 감염증(COVID-19) 유행의 대응과 치료
- Description: Infectious diseases caused by the novel coronavirus (severe acute respiratory syndrome coronavirus 2, SARS-Co




2025-10-15 19:22:48,259 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "ART002578663",
      "reason": "코로나19 관련 질환 및 치료에 대한 논문으로, 주제와 매우 유사합니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "NART128644656",
      "reason": "흡입 약물에 대한 모델링 연구로, 코로나19 예방 및 치료와 관련된 연구와 연관성이 높습니다.",
      "level": "추천"
    },
    {
      "rank": 3,
      "candidate_id": "NART98954272",
      "reason": "훈련 프로그램이 개입으로서의 역할을 설명하는 내용으로, 코로나19 팬데믹 시대의 사회적 문제 해결 방안과 연결될 수 있습니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "NPAP00156273",
      "reason": "코로나19가 스포츠 활동에 미치는 영향을 연구하는 논문으로, 코로나19와 관련된 사회적 영향을 분석하는 데 도움이 될 수 있습니다.",
      "level": "참고"
    },
    {
      "rank": 5,
      "candidate_id": "NART22057700",
      "reason": "스웨덴에서의 외과 수술에 대한 연구로, 의료 서비스 제공 방식과 관련된 정보를 제공합니다.",
      "level": "참고"
    }
  ]
}
2025-10-15 19:22:48,260 - src.agents.recommendation_agent - INFO - 

평가 진행:  29%|██▉       | 5/17 [03:37<08:56, 44.70s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.1667 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.1667

[6/17] 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
   카테고리: 국내
2025-10-15 19:23:14,224 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID bee3162957beecc87a91c94803d23439
2025-10-15 19:23:14,332 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/bee3162957beecc87a91c94803d23439?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:23:14,335 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset bee3162957beecc87a91c94803d23439
2025-10-15 19:23:14,336 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "bee3162957beecc87a91c94803d23439",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
   


Batches: 100%|██████████| 1/1 [00:00<00:00, 91.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 145.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 95.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.55it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 98.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.32it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.08it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.19it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.19it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 115.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.69it/s]

Batches: 100%|██████████| 1/1 [00:00

2025-10-15 19:23:18,703 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 11개 데이터셋 순위 결정 완료
2025-10-15 19:23:18,704 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:23:18,706 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:23:18,706 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
Description: 본 데이터셋은 해양 관측을 목적으로 수집된 CCTV 화면에서 날짜와 시간을 나타내는 영역을 추출한 3362개의 이미지로 구성됨.\r\n이미지 파일명은 S-ORS_WEST_yyyy-mm-dd_hh-MM-ss 형식을 따르며, 날짜와 시간 정보를 포함함.\r\n본 데이터셋은 2023년 8월 동안 수집된 자료로, 모든 이미지 파일은 PNG 형식이며 해상도는 500x120 픽셀.
Keywords: 해양 관측, CCTV, 이미지 데이터셋, 타임스탬프, 날짜 및 시간 정보, 해양 모니터링, 이미지 처리

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART69976214
- Title: 해양 모니터링 설비의 기술 성숙도 평가방법 탐구
- Description: 현대 해양 모니터링 설비(

평가 진행:  35%|███▌      | 6/17 [04:22<08:11, 44.71s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[7/17] 필리핀해 해양-대기 감시부이 자료 1(2020년)
   카테고리: 국내
2025-10-15 19:23:58,943 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c592e36ae62d104b21183d9f498d918f
2025-10-15 19:23:59,039 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c592e36ae62d104b21183d9f498d918f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:23:59,042 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c592e36ae62d104b21183d9f498d918f
2025-10-15 19:23:59,043 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c592e36ae62d104b21183d9f498d918f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset


Batches: 100%|██████████| 1/1 [00:00<00:00, 74.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.23it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.66it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 77.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.89it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 63.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 76.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.69it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.03it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 73.89it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 56.

2025-10-15 19:24:04,344 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 14개 데이터셋 순위 결정 완료
2025-10-15 19:24:04,345 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:24:04,346 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:24:04,347 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 필리핀해 해양-대기 감시부이 자료 1(2020년)
Description: 필리핀해에 해양-대기 감시부이를 설치하여(북위 15도, 동경 134.5도) 대기변수 관측.
Keywords: 해류관측, 동중국해, 쿠로시오

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART78021822
- Title: Eddy properties in the Subtropical Countercurrent, Western Philippine Sea
- Description: Abstract An array of six oceanographic moorings with acoustic and environmental sensors was deployed in the central Philippine Sea from April 2010 to April 2011. The location 




2025-10-15 19:24:15,785 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "NART78021822",
      "reason": "필리핀해에서 발생하는 에디 현상과 관련된 연구이며, 특히 서부 필리핀해와 쿠로시오 해류에 대한 정보를 제공합니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "NART77424969",
      "reason": "서부 필리핀해의 메탄 가스 분포와 배출량을 분석한 연구로, 해양 화학적 특성과 연관성을 파악할 수 있습니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "NART12944019",
      "reason": "해양 관측 및 국제 협력의 중요성을 강조하며, 필리핀해 지역의 해양 환경 연구에 대한 배경 지식을 제공합니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "NART82971256",
      "reason": "필리핀해 해저 구조를 조사하고 해양 지형에 대한 이해를 높이는 데 도움이 될 수 있습니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "NART17391920",
      "reason": "필리핀해의 열류 분포를 분석하여 해양 기후 변화와 관련된 정보를 얻을 수 있습니다.",
      "level": "추천"
    }
  ]
}
2025-10-15 19:24:15,787 - src.agents.recommendation_agent - INFO - ✅ JSON

평가 진행:  41%|████      | 7/17 [05:06<07:26, 44.66s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[8/17] 의료영상데이터
   카테고리: 국내
2025-10-15 19:24:43,521 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 19:24:43,619 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/a59a0a7d0c894a81a2936833b0790e0a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:24:43,622 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 19:24:43,623 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "a59a0a7d0c894a81a2936833b0790e0a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "2025",


Batches: 100%|██████████| 1/1 [00:00<00:00, 119.70it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.70it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 136.76it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 145.79it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 140.67it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 52.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.95it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 139.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 136.93it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.90it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.83it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 147.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 101.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.91it/s]

Batches: 100%|██████████| 1/1 [0

2025-10-15 19:24:48,559 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 14개 데이터셋 순위 결정 완료





2025-10-15 19:24:48,560 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:24:48,561 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:24:48,561 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 의료영상데이터
Description: 휴먼 디지털트윈을 위한 의료영상데이터
Keywords: 데이터 플랫폼, Human Digital Twin, 인체데이터

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO202020264317117
- Title: Digital Twin 개념을 적용한 제조환경 시뮬레이션 모형 설계
- Description: 제조환경이 더욱 복잡해짐에 따라 전통적인 시뮬레이션만으로는 실시간 현장 결과를 평가하는 데 많은 어려움을 겪고 있다. 이를 극복하기 위한 대안으로 Digital Twin개념이 활발히 논의되고 있지만, 제품설계 단계에 국한되어 연구가 진행되고 있는 실정이다. 본 연구는 Digital Twin개념이 생산 공정 프로세스에 적용되기 위한 Digital Twin 기반 제조환경 프레임워크를 제시하였다. 구성요소는 실제 생산환경인 물리적 시스템과 데이터베이스, 그리고 가상 시스템인 트윈 모델을 제안하였다. 본 연구에서는 Arena 소프트웨어와 엑셀 VBA를 활용하여 컨베이어 시스템을 대상으로 간단한 

평가 진행:  47%|████▋     | 8/17 [05:37<06:01, 40.15s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[9/17] 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
   카테고리: 국내
2025-10-15 19:25:14,016 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID bee3162957beecc87a91c94803d23439
2025-10-15 19:25:14,109 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/bee3162957beecc87a91c94803d23439?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:25:14,111 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset bee3162957beecc87a91c94803d23439
2025-10-15 19:25:14,112 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "bee3162957beecc87a91c94803d23439",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
   


Batches: 100%|██████████| 1/1 [00:00<00:00, 97.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 142.23it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.42it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 67.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.38it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 61.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.68it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 64.54it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.38it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 70.38it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.96it/s]

Batches: 100%|██████████| 1/1 [00:00

2025-10-15 19:25:19,281 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 12개 데이터셋 순위 결정 완료
2025-10-15 19:25:19,282 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:25:19,283 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:25:19,283 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
Description: 본 데이터셋은 해양 관측을 목적으로 수집된 CCTV 화면에서 날짜와 시간을 나타내는 영역을 추출한 3362개의 이미지로 구성됨.\r\n이미지 파일명은 S-ORS_WEST_yyyy-mm-dd_hh-MM-ss 형식을 따르며, 날짜와 시간 정보를 포함함.\r\n본 데이터셋은 2023년 8월 동안 수집된 자료로, 모든 이미지 파일은 PNG 형식이며 해상도는 500x120 픽셀.
Keywords: 해양 관측, CCTV, 이미지 데이터셋, 타임스탬프, 날짜 및 시간 정보, 해양 모니터링, 이미지 처리

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART69976214
- Title: 해양 모니터링 설비의 기술 성숙도 평가방법 탐구
- Description: 현대 해양 모니터링 설비(




2025-10-15 19:25:31,533 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "NART69976214",
      "reason": "해양 모니터링 설비에 대한 기술 성숙도 평가 방법을 연구하는 내용이므로, 해양 관측 관련 데이터셋과 직접적인 연관성이 있습니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "JAKO201236135723615",
      "reason": "시간 정보와 리트윗 분석을 통해 핵심 사건을 추출하는 방법을 제시하며, 해당 데이터셋에서 시간 정보 추출과 관련된 가능성을 열어줍니다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO201022442401436",
      "reason": "해양 환경 모니터링 시스템 구축에 대한 연구로, 해양 관측과 관련된 데이터셋의 활용 가능성을 시사합니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "DIKO0009171486",
      "reason": "사건 탐지에 필요한 시간 정보 추출 방법을 다루고 있으며, 해당 데이터셋에서 시간 정보를 활용한 분석 가능성을 제시합니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "JAKO201731063141341",
      "reason": "오픈소스 기반 해양환경 모니터링 시스템을 제안하며, 해양 관측 데이터를 활용한 시스템 구축에 대한 아이디어를 제공합니다.",
      "level": "참고"
   

평가 진행:  53%|█████▎    | 9/17 [06:10<05:03, 37.93s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[10/17] 필리핀해 해양-대기 감시부이 자료 1(2020년)
   카테고리: 국내
2025-10-15 19:25:47,060 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c592e36ae62d104b21183d9f498d918f
2025-10-15 19:25:47,166 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c592e36ae62d104b21183d9f498d918f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:25:47,168 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c592e36ae62d104b21183d9f498d918f
2025-10-15 19:25:47,169 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c592e36ae62d104b21183d9f498d918f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "datase


Batches: 100%|██████████| 1/1 [00:00<00:00, 67.54it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.18it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.01it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.25it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 108.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 112.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.68it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 101.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.99it/s]

Batches: 100%|██████████| 1/1 [0

2025-10-15 19:25:52,124 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 14개 데이터셋 순위 결정 완료
2025-10-15 19:25:52,125 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 19:25:52,126 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:25:52,127 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 필리핀해 해양-대기 감시부이 자료 1(2020년)
Description: 필리핀해에 해양-대기 감시부이를 설치하여(북위 15도, 동경 134.5도) 대기변수 관측.
Keywords: 해류관측, 동중국해, 쿠로시오

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART78021822
- Title: Eddy properties in the Subtropical Countercurrent, Western Philippine Sea
- Description: Abstract An array of six oceanographic moorings with acoustic and environmental sensors was deployed in the central Philippine Sea from April 2010 to April 2011. The location spanned 18&minus;23&deg;N, 124 &ndash; 130&deg;E in the Subtropical Countercurrent (STCC). The most prominent feature of the data set was a densely-packed eddy field with about equal num

## 5. 평가 결과 분석 및 저장

### 5.1 평가 결과 저장 디렉토리 설정

In [None]:
# 타임스탬프 기반 결과 디렉토리 생성
timestamp = datetime.now().strftime('%Y%m%d%H%M')
eval_output_dir = os.path.join(project_root, 'figures', 'evaluation_results', '202510151653')
os.makedirs(eval_output_dir, exist_ok=True)

print(f"📂 평가 결과 저장 경로: {eval_output_dir}")

# 추천 원본 결과 저장 
try:
    recommend_path = os.path.join(eval_output_dir, 'recommend_result.json')
    with open(recommend_path, 'w', encoding='utf-8') as f:
        json.dump(all_recommendations, f, indent=2, ensure_ascii=False)
    print(f"💾 recommend_result.json 저장 완료 → {recommend_path}")
except Exception as e:
    print(f"⚠️ recommend_result.json 저장 실패: {e}")

### 5.2 전체 메트릭 계산

In [None]:
if not all_eval_results:
    print("⚠️  평가 결과가 없습니다")
else:
    # DataFrame 변환
    df_results = pd.DataFrame(all_eval_results)

    print("\n" + "=" * 80)
    print("📊 평균 평가 메트릭")
    print("=" * 80)

    # 메트릭 요약 계산
    metrics_summary = {}

    for k in k_values:
        print(f"\n📏 k={k} 결과:")
        print("-" * 80)

        k_metrics = {}

        for metric_type in ['overall', 'paper', 'dataset']:
            type_label = {'overall': '전체', 'paper': '논문', 'dataset': '데이터셋'}[metric_type]
            print(f"\n  {type_label}:")

            type_metrics = {}
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@{k}'
                if col_name in df_results.columns:
                    mean_val = df_results[col_name].mean()
                    std_val = df_results[col_name].std()
                    type_metrics[metric] = {'mean': mean_val, 'std': std_val}
                    print(f"    • {metric.upper():10s}: {mean_val:.4f} ± {std_val:.4f}")

            k_metrics[metric_type] = type_metrics

        metrics_summary[f'k{k}'] = k_metrics

    # 통계
    print("\n" + "=" * 80)
    print("📈 기본 통계")
    print("=" * 80)
    print(f"  평균 추천 논문 수: {df_results['num_predicted_papers'].mean():.2f}개")
    print(f"  평균 추천 데이터셋 수: {df_results['num_predicted_datasets'].mean():.2f}개")
    print(f"  평균 관련 논문 수: {df_results['num_relevant_papers'].mean():.2f}개")
    print(f"  평균 관련 데이터셋 수: {df_results['num_relevant_datasets'].mean():.2f}개")
    print(f"  평균 처리 시간: {df_results['processing_time_ms'].mean():.0f} ms")

### 5.3 카테고리별 분석

In [None]:
if all_eval_results:
    print("\n" + "=" * 80)
    print("📊 카테고리별 메트릭 (k=5)")
    print("=" * 80)

    category_metrics = {}

    for category in sorted(df_results['category'].unique()):
        category_data = df_results[df_results['category'] == category]

        print(f"\n📁 {category} (n={len(category_data)}):")
        print("-" * 80)

        cat_metrics = {}
        for metric_type in ['overall', 'paper', 'dataset']:
            type_label = {'overall': '전체', 'paper': '논문', 'dataset': '데이터셋'}[metric_type]
            print(f"  {type_label}:")

            type_metrics = {}
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@5'
                if col_name in category_data.columns:
                    mean_val = category_data[col_name].mean()
                    type_metrics[metric] = mean_val
                    print(f"    • {metric.upper():10s}: {mean_val:.4f}")

            cat_metrics[metric_type] = type_metrics

        category_metrics[category] = cat_metrics

### 5.4 최종 결과 저장

**📁 저장되는 파일:**
1. **`EVALUATION_SUMMARY.txt`** ⭐ - 가장 먼저 봐야 할 요약 리포트
2. **`detailed_results.csv`** - 엑셀에서 열어볼 수 있는 상세 데이터
3. **`config.json`** - 실험 재현을 위한 설정 정보
4. **`metrics.json`** - 프로그램으로 읽을 수 있는 메트릭 데이터

In [None]:
if all_eval_results:
    print("\n💾 결과 저장 중...\n")

    # 1. 요약 리포트 생성 (가장 중요!)
    report_lines = []
    report_lines.append("=" * 80)
    report_lines.append("평가 요약 리포트")
    report_lines.append("=" * 80)
    report_lines.append("")
    report_lines.append(f"📅 평가 시각: {timestamp}")
    report_lines.append(f"🤖 LLM 모델: {settings.MODEL_NAME}")
    report_lines.append(f"🔍 임베딩 모델: {settings.EMBEDDING_MODEL}")
    report_lines.append(f"📊 테스트 케이스: {len(all_eval_results)}/{len(all_test_cases)} 성공")
    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("주요 성능 지표 (k=5)")
    report_lines.append("=" * 80)
    report_lines.append("")

    # k=5 전체 메트릭
    for metric in ['ndcg', 'mrr', 'recall', 'precision']:
        col_name = f'overall_{metric}@5'
        if col_name in df_results.columns:
            mean_val = df_results[col_name].mean()
            report_lines.append(f"  {metric.upper():10s} @5: {mean_val:.4f}")

    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("타입별 성능 (k=5)")
    report_lines.append("=" * 80)

    for metric_type in ['paper', 'dataset']:
        type_label = {'paper': '논문', 'dataset': '데이터셋'}[metric_type]
        report_lines.append("")
        report_lines.append(f"[{type_label}]")
        for metric in ['ndcg', 'mrr', 'recall', 'precision']:
            col_name = f'{metric_type}_{metric}@5'
            if col_name in df_results.columns:
                mean_val = df_results[col_name].mean()
                report_lines.append(f"  {metric.upper():10s}: {mean_val:.4f}")

    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("카테고리별 nDCG@5")
    report_lines.append("=" * 80)
    report_lines.append("")

    for category in sorted(df_results['category'].unique()):
        category_data = df_results[df_results['category'] == category]
        mean_val = category_data['overall_ndcg@5'].mean()
        report_lines.append(f"  {category:30s}: {mean_val:.4f} (n={len(category_data)})")

    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("전체 메트릭 (모든 k 값)")
    report_lines.append("=" * 80)

    for k in k_values:
        report_lines.append("")
        report_lines.append(f"k={k}:")
        report_lines.append("-" * 40)
        for metric_type in ['overall', 'paper', 'dataset']:
            type_label = {'overall': '전체', 'paper': '논문', 'dataset': '데이터셋'}[metric_type]
            report_lines.append(f"  [{type_label}]")
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@{k}'
                if col_name in df_results.columns:
                    mean_val = df_results[col_name].mean()
                    std_val = df_results[col_name].std()
                    report_lines.append(f"    {metric.upper():10s}: {mean_val:.4f} ± {std_val:.4f}")

    report_lines.append("")
    report_lines.append("=" * 80)

    # 요약 리포트 저장
    summary_path = os.path.join(eval_output_dir, 'EVALUATION_SUMMARY.txt')
    with open(summary_path, 'w', encoding='utf-8') as f:
        f.write('\n'.join(report_lines))
    print(f"✅ 1. 요약 리포트 저장: EVALUATION_SUMMARY.txt")

    # 2. 상세 CSV 저장
    csv_path = os.path.join(eval_output_dir, 'detailed_results.csv')
    df_results.to_csv(csv_path, index=False, encoding='utf-8-sig')
    print(f"✅ 2. 상세 결과 CSV 저장: detailed_results.csv")

    # 3. 메트릭 JSON 저장
    all_metrics = {
        'summary': metrics_summary,
        'by_category': category_metrics,
        'individual_results': all_eval_results
    }

    metrics_path = os.path.join(eval_output_dir, 'metrics.json')
    with open(metrics_path, 'w', encoding='utf-8') as f:
        json.dump(all_metrics, f, indent=2, ensure_ascii=False)
    print(f"✅ 3. 메트릭 JSON 저장: metrics.json")

    print(f"\n" + "=" * 80)
    print(f"📂 모든 결과가 저장되었습니다:")
    print(f"   {eval_output_dir}")
    print(f"" + "=" * 80)
    print(f"\n⭐ 결과 확인: EVALUATION_SUMMARY.txt 파일을 먼저 읽어보세요!")

    # 요약 리포트 미리보기
    print(f"\n" + "=" * 80)
    print("📄 요약 리포트 미리보기:")
    print("=" * 80)
    print('\n'.join(report_lines[:50]))  # 처음 50줄만 표시
    if len(report_lines) > 50:
        print("\n... (전체 내용은 EVALUATION_SUMMARY.txt 참고) ...")
else:
    print("⚠️  저장할 결과가 없습니다")

## 7. 평가 완료

**결과 파일 안내**
- 평가 결과는 `figures/evaluation_results/{timestamp}/` 디렉토리에 저장됩니다.

**파일 읽는 순서:**
1. `EVALUATION_SUMMARY.txt` ⭐⭐⭐
   - 가장 먼저 읽어야 할 파일
   - 주요 성능 지표와 카테고리별 결과 요약
   - 텍스트 에디터로 바로 열어볼 수 있음

2. `detailed_results.csv`
   - 엑셀이나 스프레드시트로 열어서 상세 분석
   - 각 테스트 케이스별 메트릭 포함
   - 필터링, 정렬, 차트 생성 가능

3. `recommend_result.json`
   - 평가 데이터 추천 결과

4. `metrics.json`
   - 프로그램으로 읽을 수 있는 메트릭 데이터
   - 자동화된 분석이나 비교에 사용

**주요 메트릭 설명**
- nDCG@k: 순위를 고려한 추천 품질 (0~1, 높을수록 좋음)
- MRR@k: 첫 번째 관련 항목의 순위 (0~1, 높을수록 좋음)
- Recall@k: 관련 항목 중 추천된 비율 (0~1, 높을수록 좋음)
- Precision@k: 추천 항목 중 관련된 비율 (0~1, 높을수록 좋음)