# 2025 DATA·AI 분석 경진대회 - 논문·데이터 추천 에이전트

이 노트북은 LLM 기반 연구 데이터/논문 추천 시스템의 평가를 수행합니다.

**실행 환경**
- GPU: NVIDIA RTX 3080 이상
- CUDA: 11.8+
- Python: 3.10+

## 평가 (Evaluation)

In [1]:
import sys
import os
import json
import logging
from datetime import datetime
from pathlib import Path
import pandas as pd
import numpy as np
from tqdm.auto import tqdm

# Project root path
project_root = '/home/infidea/backup-data/paper-reco-agent'
sys.path.insert(0, project_root)

print(f"프로젝트 루트: {project_root}")

# Logging setup
os.makedirs(os.path.join(project_root, 'logs'), exist_ok=True)

logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
    handlers=[
        logging.StreamHandler(sys.stdout),
        logging.FileHandler(os.path.join(project_root, 'logs/evaluation.log'))
    ],
    force=True
)

print("✅ 로깅 설정 완료")

# Import evaluation modules
from src.evaluation.metrics import (
    evaluate_recommendations,
    batch_evaluate,
    format_evaluation_report
)
from src.config.settings import settings

print("✅ 평가 모듈 임포트 완료")

Project root: /home/infidea/backup-data/paper-reco-agent
Logging setup complete
Evaluation modules imported successfully


  from .autonotebook import tqdm as notebook_tqdm


### 1. 환경 설정 및 평가 모듈 임포트

In [2]:
# Load test dataset
testset_path = os.path.join(project_root, 'data', 'test', 'testset.json')

with open(testset_path, 'r', encoding='utf-8') as f:
    testset = json.load(f)

print(f"테스트 데이터셋 로드 완료: {testset_path}")
print(f"테스트 카테고리 수: {len(testset.keys())}")

# Extract all test cases
all_test_cases = []
for category, cases in testset.items():
    for case in cases:
        case['category'] = category
        all_test_cases.append(case)

print(f"총 테스트 케이스: {len(all_test_cases)}개")
print(f"\n첫 번째 테스트 케이스 구조:")
print(json.dumps(all_test_cases[0], indent=2, ensure_ascii=False)[:500])

Test dataset loaded from: /home/infidea/backup-data/paper-reco-agent/data/test/testset_gemini_ver1.json
Number of test categories: 2
Total test cases: 19

First test case structure:
{
  "input_dataset": {
    "svc_id": "c1f03ab868f32371ec97a650bcdf39ac",
    "title": "한반도 기상 관측 데이터 세트",
    "description": "한반도 종관 기상 관측 세스템으로부터의 관측 데이터 세트",
    "keywords": [
      "한반도",
      "기상",
      "센서데이터"
    ]
  },
  "candidate_pool": {
    "papers": [
      {
        "id": "DIKO0014589705",
        "title": "쿠로시오 해류의 변동성과 동아시아 겨울 기후와의 상관성 연구",
        "abstract": "동아시아 겨울 기후를 대표하는 동아시아 겨울 몬순의 변동성은 외부적 다양한 인자들에 의해 영향을 받는다. 북서태평양에서 주요한 흐름인 쿠로시오 해류도 한반도와 주변 바다에 영향을 미치며 동아시아 기후에 영향을 주는


### 2. 테스트 데이터셋 로드

In [3]:
# Create timestamped output directory
timestamp = datetime.now().strftime('%Y%m%d%H%M%S')
eval_output_dir = os.path.join(project_root, 'figures', 'evaluation_results', timestamp)
os.makedirs(eval_output_dir, exist_ok=True)

print(f"📊 평가 결과 저장 경로: {eval_output_dir}")

# Save evaluation configuration
config_to_save = {
    'model_name': settings.MODEL_NAME,
    'embedding_model': settings.EMBEDDING_MODEL,
    'max_tokens': settings.MAX_TOKENS,
    'temperature': settings.TEMPERATURE,
    'paper_hybrid_alpha': settings.PAPER_HYBRID_ALPHA,
    'paper_hybrid_beta': settings.PAPER_HYBRID_BETA,
    'dataset_hybrid_alpha': settings.DATASET_HYBRID_ALPHA,
    'dataset_hybrid_beta': settings.DATASET_HYBRID_BETA,
    'dev_mode': settings.DEV_MODE,
    'evaluation_timestamp': timestamp,
    'testset_path': testset_path,
    'num_test_cases': len(all_test_cases)
}

config_path = os.path.join(eval_output_dir, 'config.json')
with open(config_path, 'w', encoding='utf-8') as f:
    json.dump(config_to_save, f, indent=2, ensure_ascii=False)

print(f"✅ 설정 저장 완료: {config_path}")
print(f"\n설정 내용:")
print(json.dumps(config_to_save, indent=2, ensure_ascii=False))

Evaluation results will be saved to: /home/infidea/backup-data/paper-reco-agent/data/evaluation_results/20251015103509
Configuration saved to: /home/infidea/backup-data/paper-reco-agent/data/evaluation_results/20251015103509/config.json

Configuration:
{
  "model_name": "Qwen/Qwen3-14B",
  "embedding_model": "intfloat/multilingual-e5-large",
  "max_tokens": 512,
  "temperature": 0.1,
  "paper_hybrid_alpha": 0.8,
  "paper_hybrid_beta": 0.2,
  "dataset_hybrid_alpha": 0.6,
  "dataset_hybrid_beta": 0.4,
  "dev_mode": false,
  "evaluation_timestamp": "20251015103509",
  "testset_path": "/home/infidea/backup-data/paper-reco-agent/data/test/testset_gemini_ver1.json",
  "num_test_cases": 19
}


### 3. 평가 결과 저장 디렉토리 설정

In [4]:
from src.agents.recommendation_agent import KoreanResearchRecommendationAgent
import asyncio

# Initialize agent
agent = KoreanResearchRecommendationAgent()

print(f"✅ 에이전트 초기화 완료")
print(f"개발 모드: {agent.dev_mode}")
print(f"모델 정보: {agent.llm_model.get_model_info()}")

2025-10-15 10:35:21,399 - sentence_transformers.SentenceTransformer - INFO - Use pytorch device_name: cuda:0
2025-10-15 10:35:21,402 - sentence_transformers.SentenceTransformer - INFO - Load pretrained SentenceTransformer: intfloat/multilingual-e5-large
2025-10-15 10:35:27,438 - src.agents.recommendation_agent - INFO - 🚀 프로덕션 모드로 실행: 실제 Qwen 모델 사용
2025-10-15 10:35:27,441 - src.models.qwen_model - INFO - 🚀 Qwen 모델 로딩 시작: Qwen/Qwen3-14B
2025-10-15 10:35:27,442 - src.models.qwen_model - INFO -    - 디바이스: cuda
2025-10-15 10:35:28,324 - src.models.qwen_model - INFO -    - FP16 모드 (~28GB VRAM)


`torch_dtype` is deprecated! Use `dtype` instead!
Loading checkpoint shards: 100%|██████████| 8/8 [00:24<00:00,  3.01s/it]


2025-10-15 10:36:09,312 - src.models.qwen_model - INFO - ✅ Qwen 모델 로딩 완료
Agent initialized
Development mode: False
Model info: {'model_name': 'Qwen/Qwen3-14B', 'device': 'cuda', 'dtype': 'float16', 'max_tokens': 512, 'temperature': 0.1, 'parameters': '14.8B', 'context_length': '32K (extendable to 128K)'}


### 4. 추천 에이전트 초기화

In [5]:
# Run evaluation on all test cases
all_eval_results = []
k_values = [3, 5, 10]

print(f"🔍 {len(all_test_cases)}개 테스트 케이스 평가 시작...")
print(f"평가 k 값: {k_values}")
print("=" * 80)

for idx, test_case in enumerate(tqdm(all_test_cases, desc="Evaluating")):
    try:
        # Extract test case info
        dataset_id = test_case['input_dataset']['svc_id']
        category = test_case['category']
        
        print(f"\n[{idx+1}/{len(all_test_cases)}] 평가 중: {test_case['input_dataset']['title']}")
        print(f"  데이터셋 ID: {dataset_id}")
        print(f"  카테고리: {category}")
        
        # Get recommendations from agent
        recommendation_result = await agent.recommend(dataset_id)
        
        if 'error' in recommendation_result:
            print(f"  ❌ 오류: {recommendation_result['error']}")
            continue
        
        # Convert agent output to evaluation format
        paper_recommendations = recommendation_result.get('paper_recommendations', [])
        dataset_recommendations = recommendation_result.get('dataset_recommendations', [])
        
        # Combine predictions
        predictions = []
        for paper in paper_recommendations:
            predictions.append({
                'type': 'paper',
                'id': paper['id'],
                'rank': paper['rank'],
                'score': paper['score']
            })
        
        for dataset in dataset_recommendations:
            predictions.append({
                'type': 'dataset',
                'id': dataset['id'],
                'rank': dataset['rank'],
                'score': dataset['score']
            })
        
        # Ground truth from test case
        ground_truth = test_case['candidate_pool']
        
        # Evaluate
        eval_result = evaluate_recommendations(predictions, ground_truth, k_values)
        
        # Add metadata
        eval_result['test_case_index'] = idx
        eval_result['dataset_id'] = dataset_id
        eval_result['category'] = category
        eval_result['input_title'] = test_case['input_dataset']['title']
        eval_result['processing_time_ms'] = recommendation_result.get('processing_time_ms', 0)
        
        all_eval_results.append(eval_result)
        
        # Print summary
        print(f"  결과: nDCG@5={eval_result.get('overall_ndcg@5', 0):.4f}, "
              f"MRR@5={eval_result.get('overall_mrr@5', 0):.4f}, "
              f"Recall@5={eval_result.get('overall_recall@5', 0):.4f}")
        
    except Exception as e:
        print(f"  ❌ 평가 중 예외 발생: {e}")
        logging.error(f"테스트 케이스 {idx} 평가 실패: {e}", exc_info=True)
        continue

print("\n" + "=" * 80)
print(f"✅ 평가 완료: {len(all_eval_results)}/{len(all_test_cases)}개 케이스 성공")

Starting evaluation on 19 test cases...
Evaluating with k values: [3, 5, 10]


Evaluating:   0%|          | 0/19 [00:00<?, ?it/s]


[1/19] Evaluating: 한반도 기상 관측 데이터 세트
  Dataset ID: c1f03ab868f32371ec97a650bcdf39ac
  Category: 국내
2025-10-15 10:36:48,544 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c1f03ab868f32371ec97a650bcdf39ac
2025-10-15 10:36:48,662 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c1f03ab868f32371ec97a650bcdf39ac?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:36:48,664 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c1f03ab868f32371ec97a650bcdf39ac
2025-10-15 10:36:48,666 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c1f03ab868f32371ec97a650bcdf39ac",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "2025",
    "dataset_access_type_


Batches:   0%|          | 0/1 [00:00<?, ?it/s][A
Batches: 100%|██████████| 1/1 [00:00<00:00,  9.57it/s][A

Batches: 100%|██████████| 1/1 [00:00<00:00, 52.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 42.03it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 53.47it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 55.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.52it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.07it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 56.44it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.69it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.18i

2025-10-15 10:36:54,191 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 14개 데이터셋 순위 결정 완료





2025-10-15 10:36:54,205 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:36:54,207 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:36:54,208 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 한반도 기상 관측 데이터 세트
Description: 한반도 종관 기상 관측 세스템으로부터의 관측 데이터 세트
Keywords: 한반도, 기상, 센서데이터

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO201008939909795
- Title: 2차원 기상 위성 영상의 구름 모델링 기법을 이용한 3차원 구름 애니메이션
- Description: 본 논문에서는 기상 위성으로부터 수신된 2차원 영상들을 구름 모델링 기법을 이용하여 3차원 입체 영상으로 재구성하는 구름 애니메이션 방법을 제안한다. 먼저 위성 영상들에 다수의 제어점을 분포시킨 후, 박판 스플라인 워핑 해석을 통하여 구름의 움직임을 모델링한다. 이에 더하여 가시채널과 적외채널 영상으로부터 구름의 양과 높낮이 정보를 추출하여 입체감을 가진 3차원 구름을 모델링한다. 구름 가시화를 위하여 적은 수의 볼륨데이터 슬라이스로도 우수한 품질의 영상을 빠르게 얻을 수 있는 선적분 볼륨 렌더링 방식을 사용한다. 제안 기법으로 2차원 위성 영상으로부터 적절한 속도와 화질을 갖는 3

Evaluating:   5%|▌         | 1/19 [00:19<05:56, 19.81s/it]

  Results: nDCG@5=0.4307, MRR@5=0.2500, Recall@5=0.0625

[2/19] Evaluating: Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상을 활용한 천지호 GeoAI 데이터셋
  Dataset ID: 8d498db96633f07fe1d82ebe43daaf45
  Category: 국내
2025-10-15 10:37:08,358 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 8d498db96633f07fe1d82ebe43daaf45
2025-10-15 10:37:08,453 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/8d498db96633f07fe1d82ebe43daaf45?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:37:08,455 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 8d498db96633f07fe1d82ebe43daaf45
2025-10-15 10:37:08,457 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "29 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "8d498db96633f07fe1d82ebe43daaf45",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "


Batches: 100%|██████████| 1/1 [00:00<00:00, 104.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.44it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 127.47it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.90it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.06it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.40it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 158.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 68.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.04it/s]

Batches: 100%|██████████| 1/1 [0

2025-10-15 10:37:11,776 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 13개 데이터셋 순위 결정 완료
2025-10-15 10:37:11,777 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:37:11,778 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:37:11,778 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상을 활용한 천지호 GeoAI 데이터셋
Description: Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상으로부터 구축된 백두산 천지호 GeoAI 데이터셋
Keywords: #백두산 #화산활동 #천지 #수체 #광학위성 #인공지능 데이터셋

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: ART003247968
- Title: 자바섬 주요 화산분화 탐지를 위한 위성기반 분석 및 활용 방안
- Description: 강한 폭발 활동이 있는 활화산 지역은 종종 화재와 같은 이차적인 위험 현상에 영향을 준다. 본 연구는 위성영상을 활용하여 인도네시아 자바섬의 주요 화산 분화 지역인 메르라피, 브로모, 시나붕 화산의 분화가 식생에 미친 영향을 분석합니다. 이를 위해 피해 평가 체계 구축을 

Evaluating:  11%|█         | 2/19 [00:36<05:09, 18.21s/it]

  Results: nDCG@5=0.4744, MRR@5=0.2500, Recall@5=0.1429

[3/19] Evaluating: 이동형 도시환경 센싱 데이터 셋
  Dataset ID: c3ad2f8c1cf9e107a3f68b6972b64ad5
  Category: 국내
2025-10-15 10:37:25,443 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c3ad2f8c1cf9e107a3f68b6972b64ad5
2025-10-15 10:37:25,541 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c3ad2f8c1cf9e107a3f68b6972b64ad5?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:37:25,544 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c3ad2f8c1cf9e107a3f68b6972b64ad5
2025-10-15 10:37:25,545 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c3ad2f8c1cf9e107a3f68b6972b64ad5",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
 


Batches: 100%|██████████| 1/1 [00:00<00:00, 106.32it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 98.43it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.62it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.55it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.10it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.54it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.86it/s]

Batches: 100%|██████████| 1/1 [00

2025-10-15 10:37:28,764 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 12개 데이터셋 순위 결정 완료





2025-10-15 10:37:28,765 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:37:28,766 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:37:28,767 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 이동형 도시환경 센싱 데이터 셋
Description: 자동차 탑재 센서를 활용한 전국 5대 광역시 대상 대기환경 수집 데이터. 미세먼지, 초미세먼지, 일산화탄소, 이산화질소 수치 등 각종 정보를 수집
Keywords: 사물데이터, 대기환경 센싱, 미세먼지, 광역시

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0015089605
- Title: 가정용 미세먼지 측정기 개발을 위한 연구
- Description: 미세먼지는 재난수준으로 증가하고 있다. 미세먼지로 인한 피해는 매년 증가하고 있고 사회적 비용도 증가하고 있다. 하지만 미세먼지의 예보에만 의존하기엔 한계가 있다. 측정소는 제한적으로 설치 되어있고 심지어 넓은 지역임에도 불구하고 7개의 미세먼지 측정소만 설치되어 운영되는 지역도 있다. 미세먼지와 초미세먼지는 각각 호흡기와 심혈관계에 큰 문제를 일으킨다. 본 논문은 미세먼지를 측정하는 방법과 현재 시장에서 판매되는 미세먼지 측정기기의 한계점을 파악하고 측정기 개발을 통해 시장의 발전 가능성에 대해서 논한다. 실외 측

Evaluating:  16%|█▌        | 3/19 [00:56<05:03, 18.95s/it]

  Results: nDCG@5=0.4307, MRR@5=0.2500, Recall@5=0.0909

[4/19] Evaluating: 이동형 도시환경 센서 및 도로영상 데이터 셋
  Dataset ID: 000e4340354d8219bdb3af6a7ad4800d
  Category: 국내
2025-10-15 10:37:45,265 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 000e4340354d8219bdb3af6a7ad4800d
2025-10-15 10:37:45,356 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/000e4340354d8219bdb3af6a7ad4800d?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:37:45,358 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 000e4340354d8219bdb3af6a7ad4800d
2025-10-15 10:37:45,360 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "23 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "000e4340354d8219bdb3af6a7ad4800d",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": 


Batches: 100%|██████████| 1/1 [00:00<00:00, 107.53it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.35it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.89it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.82it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 101.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 138.76it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.90it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 136.87it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.10it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.12it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 101.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 61.59it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.52it/s]

Batches: 100%|██████████| 1/1 [0

2025-10-15 10:37:48,425 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 7개 데이터셋 순위 결정 완료
2025-10-15 10:37:48,426 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 10:37:48,427 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:37:48,427 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 이동형 도시환경 센서 및 도로영상 데이터 셋
Description: 자동차 탑재 센서 및 블랙박스를 활용한 전국 5대 광역시 대상 도로영상 수집 데이터. 미세먼지, 초미세먼지, 일산화탄소, 이산화질소 수치 등 각종 정보를 수집
Keywords: 사물데이터, 도시영상, 미세먼지, 광역시

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0015089605
- Title: 가정용 미세먼지 측정기 개발을 위한 연구
- Description: 미세먼지는 재난수준으로 증가하고 있다. 미세먼지로 인한 피해는 매년 증가하고 있고 사회적 비용도 증가하고 있다. 하지만 미세먼지의 예보에만 의존하기엔 한계가 있다. 측정소는 제한적으로 설치 되어있고 심지어 넓은 지역임에도 불구하고 7개의 미세먼지 측정소만 설치되어 운영되는 지역도 있다. 미세먼지와 초미세먼지는 각각 호흡기와 심혈관계에 큰 문제를 일으킨다. 본 논문은 미세먼지를 측정하는 방법과 현재 시장에서 판매되는 미세먼지 측정기기의 한계점을 파악하고 측정기 개발을 통해 시장의 발전 가능성에 대해서 논한다. 실외 측정기의 경우 태양광 기판을 이용해 자가발전을 이용해 측정이 가능하도록 설계하였다. 디자인은 공기의 순환에 가장 큰 중점을 두었고, 실제 공기 

Evaluating:  21%|██        | 4/19 [01:15<04:43, 18.91s/it]

  Results: nDCG@5=0.4307, MRR@5=0.2500, Recall@5=0.0714

[5/19] Evaluating: Dataset for Intervention strategies against COVID-19 and their estimated impact on Swedish healthcare capacity
  Dataset ID: 33da0205f56477ba41dec7d7db3258a6
  Category: 국내
2025-10-15 10:38:04,115 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 33da0205f56477ba41dec7d7db3258a6
2025-10-15 10:38:04,211 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/33da0205f56477ba41dec7d7db3258a6?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:38:04,214 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 33da0205f56477ba41dec7d7db3258a6
2025-10-15 10:38:04,215 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "33da0205f56477ba41dec7d7db3258a6",
    "ctlg_type": 


Batches: 100%|██████████| 1/1 [00:00<00:00, 107.32it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 97.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.73it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.70it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 112.31it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.54it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.62it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 135.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 127.40it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.83it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.07it/s]

Batches: 100%|██████████| 1/1 [00:0

2025-10-15 10:38:07,689 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 15개 데이터셋 순위 결정 완료
2025-10-15 10:38:07,690 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 10:38:07,692 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:38:07,693 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: Dataset for Intervention strategies against COVID-19 and their estimated impact on Swedish healthcare capacity
Description: Dataset for individual-based modeling of COVID-19 spread in Sweden.
Keywords: 코로나19, 코로나, COVID-19

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: ATN0041256627
- Title: 코로나 바이러스 전파와 손해배상책임
- Description: The Infectious Disease Prevention Act stipulates that the State may claim compensation for damages against a person who spreads the infection or increases the risk of infection in violation of the Infectious Disease Prevention Act. This article relates to compensation for damages, not the burden of administrat

Evaluating:  26%|██▋       | 5/19 [01:35<04:30, 19.31s/it]

  Results: nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[6/19] Evaluating: 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
  Dataset ID: bee3162957beecc87a91c94803d23439
  Category: 국내
2025-10-15 10:38:24,139 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID bee3162957beecc87a91c94803d23439
2025-10-15 10:38:24,267 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/bee3162957beecc87a91c94803d23439?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:38:24,268 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset bee3162957beecc87a91c94803d23439
2025-10-15 10:38:24,269 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "bee3162957beecc87a91c94803d23439",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "datase


Batches: 100%|██████████| 1/1 [00:00<00:00, 89.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 107.73it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 169.43it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 108.19it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.62it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 108.93it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.18it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 109.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.96it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 77.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.10it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 108.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 107.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.72it/s]

Batches: 100%|██████████| 1/1 [00:00<

2025-10-15 10:38:27,873 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 14개 데이터셋 순위 결정 완료
2025-10-15 10:38:27,874 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:38:27,875 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:38:27,875 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
Description: 본 데이터셋은 해양 관측을 목적으로 수집된 CCTV 화면에서 날짜와 시간을 나타내는 영역을 추출한 3362개의 이미지로 구성됨.\r\n이미지 파일명은 S-ORS_WEST_yyyy-mm-dd_hh-MM-ss 형식을 따르며, 날짜와 시간 정보를 포함함.\r\n본 데이터셋은 2023년 8월 동안 수집된 자료로, 모든 이미지 파일은 PNG 형식이며 해상도는 500x120 픽셀.
Keywords: CCTV, 날짜 및 시간 정보, 이미지 처리, 이미지 데이터셋, 타임스탬프, 해양 관측, 해양 모니터링

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART69976214
- Title: 해양 모니터링 설비의 기술 성숙도 평가방법 탐구
- Description: 현대 해양 모니터링 설비(o

Evaluating:  32%|███▏      | 6/19 [01:55<04:12, 19.43s/it]

  Results: nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[7/19] Evaluating: 필리핀해 해양-대기 감시부이 자료 1(2020년)
  Dataset ID: c592e36ae62d104b21183d9f498d918f
  Category: 국내
2025-10-15 10:38:43,805 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c592e36ae62d104b21183d9f498d918f
2025-10-15 10:38:43,899 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c592e36ae62d104b21183d9f498d918f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:38:43,902 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c592e36ae62d104b21183d9f498d918f
2025-10-15 10:38:43,903 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "28 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c592e36ae62d104b21183d9f498d918f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc


Batches: 100%|██████████| 1/1 [00:00<00:00, 104.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.06it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.87it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 135.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.73it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.35it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.99it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.20it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.18it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.05it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.12it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 70.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.44it/s]

Batches: 100%|██████████| 1/1 [

2025-10-15 10:38:47,520 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 10개 데이터셋 순위 결정 완료





2025-10-15 10:38:47,521 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:38:47,522 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:38:47,522 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 필리핀해 해양-대기 감시부이 자료 1(2020년)
Description: 필리핀해에 해양-대기 감시부이를 설치하여(북위 15도, 동경 134.5도) 대기변수 관측.
Keywords: 해류관측, 동중국해, 쿠로시오

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO201707153702664
- Title: 관측 기반 과학적 지식에 근거한 과학교과서 황해 및 동중국해 해류모식도
- Description: 현행 중등학교 과학 및 지구과학 교과서에 제시되어 있는 대부분의 해류도는 1930년대 일본 과학자에 의한 대규모 해양 관측을 기반으로 제작된 것이다. 현재 해양학자들의 과학적인 관점으로 보았을 때 이 해류도들은 상당한 오류를 가지고 있고 학생들에게 오개념을 유발할 가능성이 높아 새로운 해류도 제작이 필요하였다. 그러나 황해와 동중국해의 해류는 상대적으로 얕은 수심과 복잡한 지형, 바람, 조류의 영향으로 계절적으로 복잡한 양상을 나타내기 때문에 하나의 해류도로 표현하는 것은 간단하지 않다. 이 문제를 해결하기 위하여 황해 및 동중국

Evaluating:  37%|███▋      | 7/19 [02:13<03:49, 19.14s/it]

  Results: nDCG@5=0.4307, MRR@5=0.2500, Recall@5=0.2500

[8/19] Evaluating: 의료영상데이터
  Dataset ID: a59a0a7d0c894a81a2936833b0790e0a
  Category: 국내
2025-10-15 10:39:02,337 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 10:39:02,431 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/a59a0a7d0c894a81a2936833b0790e0a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:39:02,433 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 10:39:02,434 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "33 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "a59a0a7d0c894a81a2936833b0790e0a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "datase


Batches: 100%|██████████| 1/1 [00:00<00:00, 117.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 62.79it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 152.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 67.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 152.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.45it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 152.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 108.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 163.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 166.20it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 163.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 64.99it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 159.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 73.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 163.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.06it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 156.59it/s]

Batches: 100%|██████████| 1/1 [00:

2025-10-15 10:39:06,329 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 13개 데이터셋 순위 결정 완료
2025-10-15 10:39:06,331 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:39:06,332 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:39:06,333 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 의료영상데이터
Description: 휴먼 디지털트윈을 위한 의료영상데이터
Keywords: Human Digital Twin, 인체데이터, 데이터 플랫폼

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO202020264317117
- Title: Digital Twin 개념을 적용한 제조환경 시뮬레이션 모형 설계
- Description: 제조환경이 더욱 복잡해짐에 따라 전통적인 시뮬레이션만으로는 실시간 현장 결과를 평가하는 데 많은 어려움을 겪고 있다. 이를 극복하기 위한 대안으로 Digital Twin개념이 활발히 논의되고 있지만, 제품설계 단계에 국한되어 연구가 진행되고 있는 실정이다. 본 연구는 Digital Twin개념이 생산 공정 프로세스에 적용되기 위한 Digital Twin 기반 제조환경 프레임워크를 제시하였다. 구성요소는 실제 생산환경인 물




2025-10-15 10:39:13,268 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "JAKO202020264317117",
      "reason": "본 논문은 디지털 트윈 기반 제조환경 프레임워크를 제시하며, 실제 생산환경과 가상 시스템 간의 데이터 연동 및 시뮬레이션을 다루고 있어 주제와 의미적으로 매우 유사하다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "JAKO202228660783851",
      "reason": "디지털 트윈의 상호운용성에 대한 체계적인 분석을 제공하며, 다양한 분야에서의 적용 가능성과 국제 표준 마련의 필요성을 언급하고 있어 관련성이 높다.",
      "level": "추천"
    },
    {
      "rank": 3,
      "candidate_id": "DIKO0015025571",
      "reason": "스마트팩토리 환경에서 디지털 트윈을 설계하는 방법을 제시하며, 실제 공장 데이터와 가상 모델 간의 연동을 중심으로 설명하고 있어 주제와 밀접하다.",
      "level": "추천"
    }
  ]
}
2025-10-15 10:39:13,271 - src.agents.recommendation_agent - INFO - ✅ JSON 파싱 성공
2025-10-15 10:39:13,271 - src.agents.recommendation_agent - INFO - 파싱된 타입: <class 'dict'>, 키: dict_keys(['recommendations'])
2025-10-15 10:39:13,272 - src.agents.recommendation_agent - INFO - recommendations 키 발견, 3개

Evaluating:  42%|████▏     | 8/19 [02:33<03:31, 19.19s/it]

  Results: nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[9/19] Evaluating: 한국인 정상인 심전도 세부파형 
  Dataset ID: 4fc87916027f5568850d33ecd2f7680f
  Category: 국내
2025-10-15 10:39:21,640 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 4fc87916027f5568850d33ecd2f7680f
2025-10-15 10:39:21,730 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/4fc87916027f5568850d33ecd2f7680f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:39:21,733 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 4fc87916027f5568850d33ecd2f7680f
2025-10-15 10:39:21,734 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "22 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "4fc87916027f5568850d33ecd2f7680f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
 


Batches: 100%|██████████| 1/1 [00:00<00:00, 81.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 98.53it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 70.87it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.32it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 70.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.45it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 126.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.69it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 71.39it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 98.59it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00

2025-10-15 10:39:24,922 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 1개 데이터셋 순위 결정 완료
2025-10-15 10:39:24,923 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:39:24,924 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:39:24,924 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 한국인 정상인 심전도 세부파형 
Description: 참조표준 설명 : ○ P_height, Q_height, R_height, S_height, T_height, P_duration, QRS_interval, QT_interval, T_duration\n○ 60~69세 Modified lead (Mason-Likar) system에서 성인 남녀의 정상 심전도\n  참조표준 제/개정 사유 : ㅇ심장 질환 환자용 진단 기기 개발\nㅇ마취 중에 있거나 중환자실에 있는 환자의 심장질환 발병 및 경과 관찰용 기기 개발\nㅇ심전도를 이용한 심박변이도(Heart Rate Variability, HRV), 맥파전도속도(Pulse Wave Velocity) 등의 연구 및 관련 기기 개발에 도움\nㅇ 2013년에 개발한 연령대 20-50세, 2014년 2-13세, 2017년 6--60세를 추가함
Keywords: T, Modified limb 




2025-10-15 10:39:31,995 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "JAKO201506565684286",
      "reason": "제목과 설명에서 Q, R, S 피크 변화에 대한 분석을 중심으로 ECG 신호의 패턴을 다루고 있어 소스 문서의 QRS_interval, P_height 등과 같은 핵심 키워드와 밀접하게 연결된다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "DIKO0016810526",
      "reason": "심전도 데이터 증강 기법에 대한 연구로, ECG의 파형 분석과 딥러닝 모델 성능 향상에 초점을 두고 있어 소스 문서의 심전도 파형 관련 내용과 의미적으로 유사하다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "NPAP08302711",
      "reason": "ECG 압축 방법들에 대한 코딩 성능 비교 분석을 다루며, ECG 신호의 특성과 관련된 다양한 알고리즘을 포함하고 있어 소스 문서의 심전도 관련 연구 목적과 어느 정도 연관성이 있다.",
      "level": "추천"
    }
  ]
}
2025-10-15 10:39:31,996 - src.agents.recommendation_agent - INFO - ✅ JSON 파싱 성공
2025-10-15 10:39:31,997 - src.agents.recommendation_agent - INFO - 파싱된 타입: <class 'dict'>, 키: dict_keys(['recommendations'])
2025-10-15 10:39:31,997 - src.agents.recommendation_a

Evaluating:  47%|████▋     | 9/19 [02:46<02:53, 17.33s/it]

  Results: nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[10/19] Evaluating: 돌발홍수 알람 분석
  Dataset ID: c05286c716d93ea28c6fd08f28b17b6a
  Category: 국내
2025-10-15 10:39:34,887 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c05286c716d93ea28c6fd08f28b17b6a
2025-10-15 10:39:34,978 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c05286c716d93ea28c6fd08f28b17b6a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:39:34,981 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c05286c716d93ea28c6fd08f28b17b6a
2025-10-15 10:39:34,982 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "29 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c05286c716d93ea28c6fd08f28b17b6a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "da


Batches: 100%|██████████| 1/1 [00:00<00:00, 94.45it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.00it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 107.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.12it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 52.42it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.66it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 107.25it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.10it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 108.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 107.62it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.44it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.19it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 108.12it/s]

Batches: 100%|██████████| 1/1 [00

2025-10-15 10:39:37,602 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 7개 데이터셋 순위 결정 완료
2025-10-15 10:39:37,603 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:39:37,604 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:39:37,605 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 돌발홍수 알람 분석
Description: 돌발홍수 알람 \r\n대상기간 : 2020~2022.6 중 일부\r\n단위 : 읍면동 수준\r\n알람 단계 : 3단계\r\n입력 데이터 : 격자 강우 관측(RDR_COMP_ADJ), 예측(QPF) \r\n대상 범위 : 전국(제주도 등 남부 제외)\r\nFormat : OGC KML (XML)\r\n좌표참조체계 : EPSG::4326
Keywords: 홍수, 알람

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO201614139533246
- Title: LDAPS 예측 강우를 활용한 한탄강홍수조절댐 홍수 유입량 예측
- Description: 최근 우리나라는 지구 온난화에 의한 기후 변화로 지역별 기후 변동뿐만 아니라 극한 기상 발생의 규모와 빈도가 커지고 있다. 2013년 장마 전선이 주로 중부지방에 위치하여 중부지




2025-10-15 10:39:45,332 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "JAKO201614139533246",
      "reason": "논문 제목과 설명에서 홍수 예측과 관련된 핵심 요소인 '예측 강우', '유입량' 등의 내용이 다수 포함되어 있어 의미적으로 매우 유사하며, 홍수 조절과 관련된 실제 사례를 바탕으로 한 연구로 실용성과 관련성이 높음.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "JAKO202519957603638",
      "reason": "머신러닝 기반의 하천 수위 예측 모델에 대한 연구로, 홍수 예방이라는 목적과 직접적으로 연결되며, 다양한 모델과 방법론을 비교하여 고찰한 점에서 깊이 있는 분석이 이루어졌음.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO202102661325099",
      "reason": "CNN 기반의 수위 예측 모델을 제안하며, 홍수 예측에 필요한 시계열 데이터를 활용한 연구로, 기존의 LSTM, GRU 모델과 비교하여 성능을 검증한 점에서 실용적 가치가 있음.",
      "level": "추천"
    }
  ]
}
2025-10-15 10:39:45,333 - src.agents.recommendation_agent - INFO - ✅ JSON 파싱 성공
2025-10-15 10:39:45,334 - src.agents.recommendation_agent - INFO - 파싱된 타입: <class 'dict'>, 키: dict_keys(['recommendations'])
2025-10-15 10:39:45,335 - s

Evaluating:  53%|█████▎    | 10/19 [03:03<02:36, 17.35s/it]

  Results: nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[11/19] Evaluating: 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
  Dataset ID: bee3162957beecc87a91c94803d23439
  Category: 국내
2025-10-15 10:39:52,285 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID bee3162957beecc87a91c94803d23439
2025-10-15 10:39:52,370 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/bee3162957beecc87a91c94803d23439?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:39:52,373 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset bee3162957beecc87a91c94803d23439
2025-10-15 10:39:52,374 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "24 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "bee3162957beecc87a91c94803d23439",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "datas


Batches: 100%|██████████| 1/1 [00:00<00:00, 98.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 108.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 174.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 107.76it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 109.05it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 109.07it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.01it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 108.32it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 109.45it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 108.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 109.41it/s]

Batches: 100%|██████████| 1/1 [0

2025-10-15 10:39:55,815 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 14개 데이터셋 순위 결정 완료
2025-10-15 10:39:55,816 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:39:55,817 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:39:55,817 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
Description: 본 데이터셋은 해양 관측을 목적으로 수집된 CCTV 화면에서 날짜와 시간을 나타내는 영역을 추출한 3362개의 이미지로 구성됨.\r\n이미지 파일명은 S-ORS_WEST_yyyy-mm-dd_hh-MM-ss 형식을 따르며, 날짜와 시간 정보를 포함함.\r\n본 데이터셋은 2023년 8월 동안 수집된 자료로, 모든 이미지 파일은 PNG 형식이며 해상도는 500x120 픽셀.
Keywords: CCTV, 날짜 및 시간 정보, 이미지 처리, 이미지 데이터셋, 타임스탬프, 해양 관측, 해양 모니터링

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0012549031
- Title: 영상처리 알고리즘을 이용한 전선추적 시스템
- Description: 최근 지중화 사업으로 전선(전




2025-10-15 10:40:02,568 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "JAKO201813164517795",
      "reason": "해양 감시 시스템에 대한 직접적인 언급이 있으며, 다중 플랫폼을 활용한 광역 통합 감시 시스템 구축에 대한 내용이 있어 주제와 밀접하게 연결된다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "DIKO0012549031",
      "reason": "영상처리 알고리즘을 중심으로 한 시스템 설계와 관련된 내용으로, 해양 관측 CCTV 이미지 처리와 연관성이 크며, 실시간 처리 기술에 대한 설명이 포함되어 있다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "DIKO0014542289",
      "reason": "초고해상도 영상 변환과 에지 기반의 보간 방법에 대한 연구로, 해양 관측 CCTV 이미지의 품질 향상과 관련된 기술적 접근을 제시하고 있어 일정한 관련성이 있다.",
      "level": "추천"
    }
  ]
}
2025-10-15 10:40:02,570 - src.agents.recommendation_agent - INFO - ✅ JSON 파싱 성공
2025-10-15 10:40:02,571 - src.agents.recommendation_agent - INFO - 파싱된 타입: <class 'dict'>, 키: dict_keys(['recommendations'])
2025-10-15 10:40:02,572 - src.agents.recommendation_agent - INFO - recommendations 키 발견, 3개 

Evaluating:  58%|█████▊    | 11/19 [03:21<02:20, 17.62s/it]

  Results: nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[12/19] Evaluating: 필리핀해 해양-대기 감시부이 자료 1(2020년)
  Dataset ID: c592e36ae62d104b21183d9f498d918f
  Category: 국내
2025-10-15 10:40:10,506 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c592e36ae62d104b21183d9f498d918f
2025-10-15 10:40:10,598 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c592e36ae62d104b21183d9f498d918f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:40:10,600 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c592e36ae62d104b21183d9f498d918f
2025-10-15 10:40:10,602 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c592e36ae62d104b21183d9f498d918f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_p


Batches: 100%|██████████| 1/1 [00:00<00:00, 111.06it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.10it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.03it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.39it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.44it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.79it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.66it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 63.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.14it/s]

Batches: 100%|██████████| 1/1 [00

2025-10-15 10:40:14,119 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 10개 데이터셋 순위 결정 완료
2025-10-15 10:40:14,120 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:40:14,121 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:40:14,122 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 필리핀해 해양-대기 감시부이 자료 1(2020년)
Description: 필리핀해에 해양-대기 감시부이를 설치하여(북위 15도, 동경 134.5도) 대기변수 관측.
Keywords: 해류관측, 동중국해, 쿠로시오

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0016627629
- Title: 북서태평양 해양순환 지역모델 구축 및 동해 잔차 역전 순환 분석
- Description: 동해는 대한민국과 일본, 러시아와 접하고 있는 주변해이다. 대부분의 태평양 해양이 잘 환기되어 있지 않은 반면, 동해는 깊은 곳까지 환기되어 있다. 이는 역전 순환류가 존재함을 의미한다. 열, 염분, 담수 그리고 영양염류는 바람에 의해 발생하는 순환(Eulerian circulation)과 난류에 의해 유도되는 순환의 합인 잔차 순환(Residual circulation)을 따




2025-10-15 10:40:21,207 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "JAKO201434438338680",
      "reason": "제목과 설명에서 황해 및 동중국해 해류도에 대한 분석 내용이 포함되어 있으며, 주요 키워드인 '쿠로시오'와 관련된 해류 정보를 다루고 있어 직접적인 관련성이 크다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "DIKO0016627629",
      "reason": "동해와 북서태평양 해양 순환에 대한 심층적인 분석을 진행했으며, 난류와 역전 순환에 대한 설명이 포함되어 있어 해양 순환과 관련된 주제와 밀접하다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO202020264317395",
      "reason": "중등학교 교과서에 포함된 해류도에 대한 분석을 수행했으며, 해류도의 표준화와 관련된 내용이 포함되어 있어 해류에 대한 교육적 접근과 관련성이 있다.",
      "level": "추천"
    }
  ]
}
2025-10-15 10:40:21,208 - src.agents.recommendation_agent - INFO - ✅ JSON 파싱 성공
2025-10-15 10:40:21,209 - src.agents.recommendation_agent - INFO - 파싱된 타입: <class 'dict'>, 키: dict_keys(['recommendations'])
2025-10-15 10:40:21,209 - src.agents.recommendation_agent - INFO - recommendations 키 발견, 3개 항

Evaluating:  63%|██████▎   | 12/19 [03:39<02:03, 17.68s/it]

  Results: nDCG@5=0.4307, MRR@5=0.2500, Recall@5=0.0714

[13/19] Evaluating: 의료영상데이터
  Dataset ID: a59a0a7d0c894a81a2936833b0790e0a
  Category: 국내
2025-10-15 10:40:28,331 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 10:40:28,424 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/a59a0a7d0c894a81a2936833b0790e0a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:40:28,426 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 10:40:28,427 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "29 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "a59a0a7d0c894a81a2936833b0790e0a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "datas


Batches: 100%|██████████| 1/1 [00:00<00:00, 131.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 66.47it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 145.95it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 67.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.39it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 135.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 145.47it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 147.82it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 150.48it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 142.00it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 71.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 139.08it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.90it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 155.68it/s]

Batches: 100%|██████████| 1/1 [00:

2025-10-15 10:40:32,218 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 13개 데이터셋 순위 결정 완료
2025-10-15 10:40:32,219 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 10:40:32,221 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:40:32,221 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 의료영상데이터
Description: 휴먼 디지털트윈을 위한 의료영상데이터
Keywords: Human Digital Twin, 인체데이터, 데이터 플랫폼

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO202020264317117
- Title: Digital Twin 개념을 적용한 제조환경 시뮬레이션 모형 설계
- Description: 제조환경이 더욱 복잡해짐에 따라 전통적인 시뮬레이션만으로는 실시간 현장 결과를 평가하는 데 많은 어려움을 겪고 있다. 이를 극복하기 위한 대안으로 Digital Twin개념이 활발히 논의되고 있지만, 제품설계 단계에 국한되어 연구가 진행되고 있는 실정이다. 본 연구는 Digital Twin개념이 생산 공정 프로세스에 적용되기 위한 Digital Twin 기반 제조환경 프레임워크를 제시하였다. 구성요소는 실제 생산환경인 물리적 시스템과 데이터베이스, 그리고 가상 시스템인 트윈 모델을 제안하였다. 본 연구에서는 Arena 소프트웨어와 엑셀 VBA를 활용하여 컨베이어 시스템을 대상으로 간단한 Digital Twin 기반 제조시스템을 모의실험하였다. 실험결과 트윈 모델이 실제 물리적 시스템의 실시간 데이터를 전송받아 동일한 시간단위로 작동됨을 확인하였고,

Evaluating:  68%|██████▊   | 13/19 [03:59<01:49, 18.18s/it]

  Results: nDCG@5=0.5013, MRR@5=0.2500, Recall@5=0.1818

[14/19] Evaluating: 한국인 정상인 심전도 세부파형 
  Dataset ID: 4fc87916027f5568850d33ecd2f7680f
  Category: 국내
2025-10-15 10:40:47,645 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 4fc87916027f5568850d33ecd2f7680f
2025-10-15 10:40:47,744 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/4fc87916027f5568850d33ecd2f7680f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:40:47,746 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 4fc87916027f5568850d33ecd2f7680f
2025-10-15 10:40:47,747 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "37 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "4fc87916027f5568850d33ecd2f7680f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",



Batches: 100%|██████████| 1/1 [00:00<00:00, 85.44it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 77.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 97.83it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 97.57it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 97.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 69.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.96it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.47it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 9

2025-10-15 10:40:51,189 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 6개 데이터셋 순위 결정 완료
2025-10-15 10:40:51,190 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:40:51,191 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:40:51,191 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 한국인 정상인 심전도 세부파형 
Description: 참조표준 설명 : ○ P_height, Q_height, R_height, S_height, T_height, P_duration, QRS_interval, QT_interval, T_duration\n○ 60~69세 Modified lead (Mason-Likar) system에서 성인 남녀의 정상 심전도\n  참조표준 제/개정 사유 : ㅇ심장 질환 환자용 진단 기기 개발\nㅇ마취 중에 있거나 중환자실에 있는 환자의 심장질환 발병 및 경과 관찰용 기기 개발\nㅇ심전도를 이용한 심박변이도(Heart Rate Variability, HRV), 맥파전도속도(Pulse Wave Velocity) 등의 연구 및 관련 기기 개발에 도움\nㅇ 2013년에 개발한 연령대 20-50세, 2014년 2-13세, 2017년 6--60세를 추가함
Keywords: T, Modified limb 

Evaluating:  74%|███████▎  | 14/19 [04:20<01:35, 19.00s/it]

  Results: nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[15/19] Evaluating: 돌발홍수 알람 분석
  Dataset ID: c05286c716d93ea28c6fd08f28b17b6a
  Category: 국내
2025-10-15 10:41:08,557 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c05286c716d93ea28c6fd08f28b17b6a
2025-10-15 10:41:08,651 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c05286c716d93ea28c6fd08f28b17b6a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:41:08,653 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c05286c716d93ea28c6fd08f28b17b6a
2025-10-15 10:41:08,654 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c05286c716d93ea28c6fd08f28b17b6a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "da


Batches: 100%|██████████| 1/1 [00:00<00:00, 79.67it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 77.54it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.18it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 93.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 43.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 56.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.54it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.43it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 93.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 78.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 107.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 97.82it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 47.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89

2025-10-15 10:41:11,542 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 5개 데이터셋 순위 결정 완료
2025-10-15 10:41:11,543 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 10:41:11,544 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:41:11,545 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 돌발홍수 알람 분석
Description: 돌발홍수 알람 \r\n대상기간 : 2020~2022.6 중 일부\r\n단위 : 읍면동 수준\r\n알람 단계 : 3단계\r\n입력 데이터 : 격자 강우 관측(RDR_COMP_ADJ), 예측(QPF) \r\n대상 범위 : 전국(제주도 등 남부 제외)\r\nFormat : OGC KML (XML)\r\n좌표참조체계 : EPSG::4326
Keywords: 홍수, 알람

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO201614139533246
- Title: LDAPS 예측 강우를 활용한 한탄강홍수조절댐 홍수 유입량 예측
- Description: 최근 우리나라는 지구 온난화에 의한 기후 변화로 지역별 기후 변동뿐만 아니라 극한 기상 발생의 규모와 빈도가 커지고 있다. 2013년 장마 전선이 주로 중부지방에 위치하여 중부지방에서 강수일수 최고값을 기록하였으며, 남부지방은 강수일수 최저값을 기록하였다. 이러한 강우의 공간적, 시간적 집중 현상으로 호우 피해가 발생하여 치수의 중요성이 부각되고 있다. 본 연구에서는 홍수기 신속한 홍수 방재를 위하여 예측 강우 자료를 활용하고자 한다. 이를 위해 수치 예보 자료의 적용 가능성을 지상 관측 강우 및 유입량

Evaluating:  79%|███████▉  | 15/19 [04:38<01:15, 18.77s/it]

  Results: nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[16/19] Evaluating: 2024 극한기후영향 보고서
  Dataset ID: e876ffe4cad991d4f4930284468df093
  Category: 국내
2025-10-15 10:41:26,804 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID e876ffe4cad991d4f4930284468df093
2025-10-15 10:41:26,896 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/e876ffe4cad991d4f4930284468df093?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:41:26,898 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset e876ffe4cad991d4f4930284468df093
2025-10-15 10:41:26,900 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "e876ffe4cad991d4f4930284468df093",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
  


Batches: 100%|██████████| 1/1 [00:00<00:00, 80.99it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.20it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.02it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.82it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 90.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 50.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.32it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.83it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.01it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.

2025-10-15 10:41:31,426 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 13개 데이터셋 순위 결정 완료
2025-10-15 10:41:31,426 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:41:31,427 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:41:31,428 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 2024 극한기후영향 보고서
Description: 폭염, 한파, 폭우 및 홍수, 가뭄 등의 피해사례 및 정책
Keywords: 극한기후, 홍수, 폭염, 가뭄, 한파, 폭우

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0012940049
- Title: 기후변화 대응 상습침수지구 개선방안 연구
- Description: 최근 기후변화의 영향으로 해수면 상승, 폭우 등의 기상이변들이 극명하게 드러나고 있다. 통계에 따르면 1975년에서 2005년 사이 약 30년 동안 전 세계적으로 2,317,395명이 자연재해로 인해 사망하였고, 이 중 82%는 대규모 재해 (10,000명 이상의 사망자 발생)에 의해 희생되었으며 재해발생에 있어 기후 관련 재해발생건수가 지질학적 재해발생건수 보다 훨씬 더 빨리 증가하고 있는 것으로 나타났다. 이러한 경향은 1970년대 후




2025-10-15 10:41:39,239 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "DIKO0012940049",
      "reason": "논문 제목과 설명에서 극한기후와 관련된 홍수, 폭우, 기후변화 등의 주제가 직접적으로 언급되어 있으며, 극한기후의 영향과 대응 방안에 대한 구체적인 분석이 이루어져 있어 매우 관련성이 높다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "ART001471268",
      "reason": "지구온난화로 인한 자연재해 발생 전망이라는 주제가 극한기후와 관련된 홍수, 가뭄, 기후변화 등의 영향을 다루고 있어 핵심 키워드와 주제가 잘 일치한다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "DIKO0013598882",
      "reason": "자연재해에 대한 방재정보 관리 체계에 대한 연구로, 재해 예방 및 복구와 관련된 내용이 포함되어 있어 극한기후 영향 보고서와 연결될 수 있는 부분이 존재한다.",
      "level": "추천"
    }
  ]
}
2025-10-15 10:41:39,241 - src.agents.recommendation_agent - INFO - ✅ JSON 파싱 성공
2025-10-15 10:41:39,242 - src.agents.recommendation_agent - INFO - 파싱된 타입: <class 'dict'>, 키: dict_keys(['recommendations'])
2025-10-15 10:41:39,242 - src.agents.recommendation_agent - INFO - recommendations

Evaluating:  84%|████████▍ | 16/19 [04:57<00:56, 18.99s/it]

  Results: nDCG@5=0.4307, MRR@5=0.2500, Recall@5=0.0769

[17/19] Evaluating: 2024 극한기후영향 보고서
  Dataset ID: e876ffe4cad991d4f4930284468df093
  Category: 국내
2025-10-15 10:41:46,297 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID e876ffe4cad991d4f4930284468df093
2025-10-15 10:41:46,391 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/e876ffe4cad991d4f4930284468df093?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:41:46,393 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset e876ffe4cad991d4f4930284468df093
2025-10-15 10:41:46,394 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "e876ffe4cad991d4f4930284468df093",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
  


Batches: 100%|██████████| 1/1 [00:00<00:00, 120.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 98.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.38it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.68it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.39it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 71.02it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 51.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.08it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.55it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.57it/s]

Batches: 100%|██████████| 1/1 [00:

2025-10-15 10:41:49,457 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 13개 데이터셋 순위 결정 완료





2025-10-15 10:41:49,458 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:41:49,459 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:41:49,459 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: 2024 극한기후영향 보고서
Description: 폭염, 한파, 폭우 및 홍수, 가뭄 등의 피해사례 및 정책
Keywords: 극한기후, 홍수, 폭염, 가뭄, 한파, 폭우

## Top 5 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0012940049
- Title: 기후변화 대응 상습침수지구 개선방안 연구
- Description: 최근 기후변화의 영향으로 해수면 상승, 폭우 등의 기상이변들이 극명하게 드러나고 있다. 통계에 따르면 1975년에서 2005년 사이 약 30년 동안 전 세계적으로 2,317,395명이 자연재해로 인해 사망하였고, 이 중 82%는 대규모 재해 (10,000명 이상의 사망자 발생)에 의해 희생되었으며 재해발생에 있어 기후 관련 재해발생건수가 지질학적 재해발생건수 보다 훨씬 더 빨리 증가하고 있는 것으로 나타났다. 이러한 경향은 1970년대 후반부터 나타나고 있는데, 이는 기후변화에 따른 돌발홍수, 국지성 집중호우, 산사태, 연안지역의 침수피해 등의 증가에 기인하는 것으로 추정할 수 있다.
- Keywords: 

Evaluating:  89%|████████▉ | 17/19 [05:15<00:37, 18.75s/it]

  Results: nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[18/19] Evaluating: NSW COVID-19 tests by location (discontinued)
  Dataset ID: 03e16fe2b6d96d4961f22c244a94bb1a
  Category: 해외
2025-10-15 10:42:04,480 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 03e16fe2b6d96d4961f22c244a94bb1a
2025-10-15 10:42:04,581 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/03e16fe2b6d96d4961f22c244a94bb1a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:42:04,584 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 03e16fe2b6d96d4961f22c244a94bb1a
2025-10-15 10:42:04,584 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "03e16fe2b6d96d4961f22c244a94bb1a",
    "ctlg_type": "02",
    "dataset_type": "02",
    "ctlg_type_pc": "dataset",
 


Batches: 100%|██████████| 1/1 [00:00<00:00, 58.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 90.23it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 67.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 62.01it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 68.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 60.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 68.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.67it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 68.84it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 68.95it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.06it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 69.42it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 69.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 69.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 90.

2025-10-15 10:42:08,468 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 14개 데이터셋 순위 결정 완료
2025-10-15 10:42:08,469 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 10:42:08,470 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:42:08,470 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: NSW COVID-19 tests by location (discontinued)
Description: From 20 October 2023, COVID-19 datasets will no longer be updated. \\r\\nDetailed information is available in the fortnightly NSW Respiratory Surveillance Report: https://www.health.nsw.gov.au/Infectious/covid-19/Pages/reports.aspx. \\r\\nLatest national COVID-19 spread, vaccination and treatment metrics are available on the Australian Government Health website: https://www.health.gov.au/topics/covid-19/rep




2025-10-15 10:42:17,109 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "DIKO0017074599",
      "reason": "본 논문은 분자 진단 기술의 민감도와 정확도 향상을 위한 나노-하이브리드 멤브레인 기반의 전처리 기법을 다루고 있으며, 이는 데이터 수집 및 분석과 관련된 핵심 요소로, 주어진 데이터셋의 목적과 직접적으로 연관된다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "NPAP07933354",
      "reason": "논문은 생체 내 이물질 대사 및 해독 작용에 대한 메커니즘을 설명하며, 이는 특정 화학 물질의 영향을 이해하는 데 도움을 주며, 데이터셋에서 언급된 감염병과 관련된 생물학적 분석에 간접적으로 연결될 수 있다.",
      "level": "추천"
    },
    {
      "rank": 3,
      "candidate_id": "ATN0018595406",
      "reason": "항생제와 관련된 귀독성에 대한 내용을 다루고 있으나, 주어진 데이터셋과 직접적인 연관성이 낮음에도 불구하고, 감염병과 관련된 의학적 맥락에서 간접적으로 참고 가치가 있을 수 있다.",
      "level": "참고"
    }
  ]
}
2025-10-15 10:42:17,110 - src.agents.recommendation_agent - INFO - ✅ JSON 파싱 성공
2025-10-15 10:42:17,111 - src.agents.recommendation_agent - INFO - 파싱된 타입: <class 'dict'>, 키: dict_keys(['recommendations'])
2025-10-15 10:42:17,112 -

Evaluating:  95%|█████████▍| 18/19 [05:35<00:19, 19.14s/it]

  Results: nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[19/19] Evaluating: Police recorded crime trends in Victoria during the COVID-19 pandemic
  Dataset ID: b89d0c5d5891c5c80cd7a565ce8a3dc6
  Category: 해외
2025-10-15 10:42:24,527 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID b89d0c5d5891c5c80cd7a565ce8a3dc6
2025-10-15 10:42:24,617 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/b89d0c5d5891c5c80cd7a565ce8a3dc6?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 10:42:24,619 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset b89d0c5d5891c5c80cd7a565ce8a3dc6
2025-10-15 10:42:24,620 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "b89d0c5d5891c5c80cd7a565ce8a3dc6",
    "ctlg_type": "02",
    "dataset_type": "02",
    "ctl


Batches: 100%|██████████| 1/1 [00:00<00:00, 70.79it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 88.43it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 61.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 60.96it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.68it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.59it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.79it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.06it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.10it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.73it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.23it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.59it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 67.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.

2025-10-15 10:42:28,560 - src.agents.recommendation_agent - INFO - 상위 15개 논문, 14개 데이터셋 순위 결정 완료
2025-10-15 10:42:28,561 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 10:42:28,563 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 10:42:28,563 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 3 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 3 most relevant items.
## Source Dataset:
Title: Police recorded crime trends in Victoria during the COVID-19 pandemic
Description: The Crime Statistics Agency (CSA) has released a research paper entitled Police-recorded crime trends in Victoria during the COVID-19 pandemic. The paper examines trends in criminal offences and family violence incidents to 30 June 2020, focusing on comparing the period from 1 April 2020 to 30 June 2020 with the same period in 2019.\\r\\nThis paper aims to examine whether and how the COVID-19 pandemic, associated behaviour changes and implemented restrictions impacted on crime in Victoria. It examines whether there were changes in the volume, nature or location of o

Evaluating: 100%|██████████| 19/19 [05:57<00:00, 18.82s/it]

  Results: nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

Evaluation completed: 19/19 cases evaluated successfully





### 5. 테스트 케이스 평가 실행

In [6]:
# Save detailed individual results
individual_results_path = os.path.join(eval_output_dir, 'individual_results.json')
with open(individual_results_path, 'w', encoding='utf-8') as f:
    json.dump(all_eval_results, f, indent=2, ensure_ascii=False)

print(f"✅ 개별 결과 저장 완료: {individual_results_path}")
print(f"총 결과: {len(all_eval_results)}개")

Individual results saved to: /home/infidea/backup-data/paper-reco-agent/data/evaluation_results/20251015103509/individual_results.json
Total results: 19


### 6. 개별 결과 저장

In [7]:
if all_eval_results:
    # Convert to DataFrame for easier analysis
    df_results = pd.DataFrame(all_eval_results)
    
    print("\n" + "=" * 80)
    print("📊 평균 평가 메트릭")
    print("=" * 80)
    
    # Calculate metrics for each k
    metrics_summary = {}
    
    for k in k_values:
        print(f"\nk={k} 결과")
        print("-" * 80)
        
        # Overall metrics
        print(f"  전체 (Overall):")
        overall_metrics = {}
        for metric in ['ndcg', 'mrr', 'recall', 'precision']:
            col_name = f'overall_{metric}@{k}'
            if col_name in df_results.columns:
                mean_val = df_results[col_name].mean()
                std_val = df_results[col_name].std()
                overall_metrics[metric] = {'mean': mean_val, 'std': std_val}
                print(f"    - {metric.upper()}@{k}: {mean_val:.4f} ± {std_val:.4f}")
        
        # Paper metrics
        print(f"\n  논문 (Papers):")
        paper_metrics = {}
        for metric in ['ndcg', 'mrr', 'recall', 'precision']:
            col_name = f'paper_{metric}@{k}'
            if col_name in df_results.columns:
                mean_val = df_results[col_name].mean()
                std_val = df_results[col_name].std()
                paper_metrics[metric] = {'mean': mean_val, 'std': std_val}
                print(f"    - {metric.upper()}@{k}: {mean_val:.4f} ± {std_val:.4f}")
        
        # Dataset metrics
        print(f"\n  데이터셋 (Datasets):")
        dataset_metrics = {}
        for metric in ['ndcg', 'mrr', 'recall', 'precision']:
            col_name = f'dataset_{metric}@{k}'
            if col_name in df_results.columns:
                mean_val = df_results[col_name].mean()
                std_val = df_results[col_name].std()
                dataset_metrics[metric] = {'mean': mean_val, 'std': std_val}
                print(f"    - {metric.upper()}@{k}: {mean_val:.4f} ± {std_val:.4f}")
        
        metrics_summary[f'k{k}'] = {
            'overall': overall_metrics,
            'papers': paper_metrics,
            'datasets': dataset_metrics
        }
    
    # Save metrics summary
    metrics_summary_path = os.path.join(eval_output_dir, 'metrics_summary.json')
    with open(metrics_summary_path, 'w', encoding='utf-8') as f:
        json.dump(metrics_summary, f, indent=2, ensure_ascii=False)
    
    print(f"\n\n✅ 메트릭 요약 저장 완료: {metrics_summary_path}")
    
    # Statistics
    print("\n" + "=" * 80)
    print("📈 통계")
    print("=" * 80)
    print(f"  평균 추천 논문 수: {df_results['num_predicted_papers'].mean():.2f}개")
    print(f"  평균 추천 데이터셋 수: {df_results['num_predicted_datasets'].mean():.2f}개")
    print(f"  평균 관련 논문 수: {df_results['num_relevant_papers'].mean():.2f}개")
    print(f"  평균 관련 데이터셋 수: {df_results['num_relevant_datasets'].mean():.2f}개")
    print(f"  평균 처리 시간: {df_results['processing_time_ms'].mean():.0f} ms")
    
else:
    print("⚠️  분석할 평가 결과가 없습니다")


Average Evaluation Metrics

k=3 Results
--------------------------------------------------------------------------------
  Overall:
    - NDCG@3: 0.0000 ± 0.0000
    - MRR@3: 0.0000 ± 0.0000
    - RECALL@3: 0.0000 ± 0.0000
    - PRECISION@3: 0.0000 ± 0.0000

  Papers:
    - NDCG@3: 0.0000 ± 0.0000
    - MRR@3: 0.0000 ± 0.0000
    - RECALL@3: 0.0000 ± 0.0000
    - PRECISION@3: 0.0000 ± 0.0000

  Datasets:
    - NDCG@3: 0.4211 ± 0.5073
    - MRR@3: 0.4211 ± 0.5073
    - RECALL@3: 0.1155 ± 0.1760
    - PRECISION@3: 0.1754 ± 0.2322

k=5 Results
--------------------------------------------------------------------------------
  Overall:
    - NDCG@5: 0.1874 ± 0.2264
    - MRR@5: 0.1053 ± 0.1268
    - RECALL@5: 0.0499 ± 0.0734
    - PRECISION@5: 0.1053 ± 0.1393

  Papers:
    - NDCG@5: 0.0000 ± 0.0000
    - MRR@5: 0.0000 ± 0.0000
    - RECALL@5: 0.0000 ± 0.0000
    - PRECISION@5: 0.0000 ± 0.0000

  Datasets:
    - NDCG@5: 0.4211 ± 0.5073
    - MRR@5: 0.4211 ± 0.5073
    - RECALL@5: 0.1155 ± 

### 7. 타입별 메트릭 계산 및 저장

In [None]:
if all_eval_results:
    print("\n" + "=" * 80)
    print("📊 카테고리별 메트릭 (k=5)")
    print("=" * 80)
    
    category_metrics = {}
    
    for category in df_results['category'].unique():
        category_data = df_results[df_results['category'] == category]
        
        print(f"\n{category} (n={len(category_data)}):")
        print("-" * 80)
        
        cat_metrics = {}
        for metric_type in ['overall', 'paper', 'dataset']:
            print(f"  {metric_type.capitalize()}:")
            type_metrics = {}
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@5'
                if col_name in category_data.columns:
                    mean_val = category_data[col_name].mean()
                    type_metrics[metric] = mean_val
                    print(f"    - {metric.upper()}@5: {mean_val:.4f}")
            cat_metrics[metric_type] = type_metrics
        
        category_metrics[category] = cat_metrics
    
    # Save category metrics
    category_metrics_path = os.path.join(eval_output_dir, 'category_metrics.json')
    with open(category_metrics_path, 'w', encoding='utf-8') as f:
        json.dump(category_metrics, f, indent=2, ensure_ascii=False)
    
    print(f"\n\n✅ 카테고리 메트릭 저장 완료: {category_metrics_path}")
else:
    print("⚠️  분석할 평가 결과가 없습니다")

### 8. 카테고리별 분석

In [None]:
if all_eval_results:
    # Export to CSV for easier analysis in spreadsheet tools
    csv_path = os.path.join(eval_output_dir, 'results.csv')
    df_results.to_csv(csv_path, index=False, encoding='utf-8-sig')
    
    print(f"✅ CSV 내보내기 완료: {csv_path}")
    print(f"컬럼: {list(df_results.columns)}")
    print(f"\nDataFrame 크기: {df_results.shape}")
    print(f"\n첫 몇 행:")
    print(df_results.head())
else:
    print("⚠️  내보낼 결과가 없습니다")

### 9. CSV로 결과 내보내기

In [None]:
if all_eval_results:
    # Generate text summary report
    report_lines = []
    report_lines.append("=" * 80)
    report_lines.append("평가 요약 리포트")
    report_lines.append("=" * 80)
    report_lines.append(f"")
    report_lines.append(f"타임스탬프: {timestamp}")
    report_lines.append(f"모델: {settings.MODEL_NAME}")
    report_lines.append(f"임베딩 모델: {settings.EMBEDDING_MODEL}")
    report_lines.append(f"테스트 케이스: {len(all_eval_results)}/{len(all_test_cases)}")
    report_lines.append(f"")
    report_lines.append(f"모델 설정:")
    report_lines.append(f"  - Temperature: {settings.TEMPERATURE}")
    report_lines.append(f"  - Max Tokens: {settings.MAX_TOKENS}")
    report_lines.append(f"  - Paper Hybrid (alpha/beta): {settings.PAPER_HYBRID_ALPHA}/{settings.PAPER_HYBRID_BETA}")
    report_lines.append(f"  - Dataset Hybrid (alpha/beta): {settings.DATASET_HYBRID_ALPHA}/{settings.DATASET_HYBRID_BETA}")
    report_lines.append(f"")
    report_lines.append("=" * 80)
    report_lines.append("전체 메트릭")
    report_lines.append("=" * 80)
    
    for k in k_values:
        report_lines.append(f"")
        report_lines.append(f"k={k}:")
        report_lines.append("-" * 40)
        for metric_type in ['overall', 'paper', 'dataset']:
            report_lines.append(f"  {metric_type.capitalize()}:")
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@{k}'
                if col_name in df_results.columns:
                    mean_val = df_results[col_name].mean()
                    std_val = df_results[col_name].std()
                    report_lines.append(f"    {metric.upper():10s}: {mean_val:.4f} ± {std_val:.4f}")
    
    report_lines.append(f"")
    report_lines.append("=" * 80)
    report_lines.append("카테고리별 분석 (k=5)")
    report_lines.append("=" * 80)
    
    for category in sorted(df_results['category'].unique()):
        category_data = df_results[df_results['category'] == category]
        report_lines.append(f"")
        report_lines.append(f"{category} (n={len(category_data)}):")
        report_lines.append("-" * 40)
        
        for metric_type in ['overall', 'paper', 'dataset']:
            col_name = f'{metric_type}_ndcg@5'
            if col_name in category_data.columns:
                mean_val = category_data[col_name].mean()
                report_lines.append(f"  {metric_type.capitalize()} nDCG@5: {mean_val:.4f}")
    
    report_lines.append(f"")
    report_lines.append("=" * 80)
    report_lines.append("리포트 끝")
    report_lines.append("=" * 80)
    
    # Save report
    report_path = os.path.join(eval_output_dir, 'summary_report.txt')
    with open(report_path, 'w', encoding='utf-8') as f:
        f.write('\n'.join(report_lines))
    
    print('\n'.join(report_lines))
    print(f"\n\n✅ 요약 리포트 저장 완료: {report_path}")
else:
    print("⚠️  리포트를 생성할 결과가 없습니다")

## 평가 완료

모든 결과가 타임스탬프 디렉토리에 저장되었습니다:
- `config.json`: 평가 설정 및 모델 옵션
- `individual_results.json`: 각 테스트 케이스의 상세 결과
- `metrics_summary.json`: k별 평균 메트릭
- `category_metrics.json`: 카테고리별 메트릭 분석
- `results.csv`: 스프레드시트 분석용 테이블 데이터
- `summary_report.txt`: 사람이 읽기 쉬운 요약 리포트