# 2025 DATA·AI 분석 경진대회 - 논문·데이터 추천 에이전트 평가

이 노트북은 LLM 기반 연구 데이터/논문 추천 시스템의 성능을 평가합니다.

**실행 환경**
- GPU: NVIDIA RTX 3080 이상
- CUDA: 11.8+
- Python: 3.10+

## 1. 환경 설정 및 라이브러리 임포트

In [1]:
import sys
import os
import json
import logging
from datetime import datetime
from pathlib import Path
import pandas as pd
import numpy as np
from tqdm.auto import tqdm

# 프로젝트 루트 경로
project_root = '/home/infidea/backup-data/paper-reco-agent'
sys.path.insert(0, project_root)

print(f"프로젝트 루트: {project_root}")

# 로깅 설정
os.makedirs(os.path.join(project_root, 'logs'), exist_ok=True)

logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
    handlers=[
        logging.StreamHandler(sys.stdout),
        logging.FileHandler(os.path.join(project_root, 'logs/evaluation.log'))
    ],
    force=True
)

print("✅ 로깅 설정 완료")

# 평가 모듈 임포트
from src.evaluation.metrics import (
    evaluate_recommendations,
    batch_evaluate,
    format_evaluation_report
)
from src.config.settings import settings

print("✅ 평가 모듈 임포트 완료")

프로젝트 루트: /home/infidea/backup-data/paper-reco-agent
✅ 로깅 설정 완료
✅ 평가 모듈 임포트 완료


  from .autonotebook import tqdm as notebook_tqdm


## 2. 테스트 데이터셋 로드

In [2]:
# 테스트 데이터셋 로드
testset_path = os.path.join(project_root, 'data', 'test', 'testset_filtered.json')

with open(testset_path, 'r', encoding='utf-8') as f:
    testset = json.load(f)

print(f"✅ 테스트 데이터셋 로드 완료: {testset_path}")
print(f"📊 테스트 카테고리 수: {len(testset.keys())}")

# 모든 테스트 케이스 추출
all_test_cases = []
for category, cases in testset.items():
    for case in cases:
        case['category'] = category
        all_test_cases.append(case)

print(f"📝 총 테스트 케이스: {len(all_test_cases)}개")
print(f"\n첫 번째 테스트 케이스 예시:")
print(json.dumps(all_test_cases[0], indent=2, ensure_ascii=False)[:500] + "...")

✅ 테스트 데이터셋 로드 완료: /home/infidea/backup-data/paper-reco-agent/data/test/testset_filtered.json
📊 테스트 카테고리 수: 2
📝 총 테스트 케이스: 17개

첫 번째 테스트 케이스 예시:
{
  "input_dataset": {
    "svc_id": "c1f03ab868f32371ec97a650bcdf39ac",
    "title": "한반도 기상 관측 데이터 세트",
    "description": "한반도 종관 기상 관측 세스템으로부터의 관측 데이터 세트",
    "keywords": [
      "한반도",
      "기상",
      "센서데이터"
    ]
  },
  "candidate_pool": {
    "papers": [
      {
        "id": "DIKO0014589705",
        "title": "쿠로시오 해류의 변동성과 동아시아 겨울 기후와의 상관성 연구",
        "abstract": "동아시아 겨울 기후를 대표하는 동아시아 겨울 몬순의 변동성은 외부적 다양한 인자들에 의해 영향을 받는다. 북서태평양에서 주요한 흐름인 쿠로시오 해류도 한반도와 주변 바다에 영향을 미치며 동아시아 기후에 영향을 주는...


## 3. 추천 에이전트 초기화

In [3]:
# 추천 에이전트 임포트 및 초기화
from src.agents.recommendation_agent import KoreanResearchRecommendationAgent
from src.config.settings import settings

print("모델 설정:")
print(f"  - 모델명: {settings.MODEL_NAME}")
print(f"  - 임베딩 모델: {settings.EMBEDDING_MODEL}")
print(f"  - 개발 모드: {settings.DEV_MODE}")
print("\n🚀 에이전트 초기화 중... (수 분 소요될 수 있습니다)")

agent = KoreanResearchRecommendationAgent()

print("\n✅ 에이전트 초기화 완료")
print(f"모델 정보: {json.dumps(agent.llm_model.get_model_info(), indent=2, ensure_ascii=False)}")

2025-10-15 19:34:28,517 - sentence_transformers.SentenceTransformer - INFO - Use pytorch device_name: cuda:0
2025-10-15 19:34:28,520 - sentence_transformers.SentenceTransformer - INFO - Load pretrained SentenceTransformer: intfloat/multilingual-e5-large
모델 설정:
  - 모델명: Qwen/Qwen3-14B
  - 임베딩 모델: intfloat/multilingual-e5-large
  - 개발 모드: False

🚀 에이전트 초기화 중... (수 분 소요될 수 있습니다)
2025-10-15 19:34:35,150 - src.agents.recommendation_agent - INFO - 🚀 프로덕션 모드로 실행: 실제 LLM 모델 사용
2025-10-15 19:34:35,153 - src.models.llm_model - INFO - 🚀 Qwen 모델 로딩 시작: Qwen/Qwen3-14B
2025-10-15 19:34:35,154 - src.models.llm_model - INFO -    - 디바이스: cuda
2025-10-15 19:34:36,255 - src.models.llm_model - INFO -    - FP16 모드


`torch_dtype` is deprecated! Use `dtype` instead!
Loading checkpoint shards: 100%|██████████| 8/8 [01:36<00:00, 12.04s/it]


2025-10-15 19:36:34,117 - src.models.llm_model - INFO - ✅ Qwen 모델 로딩 완료

✅ 에이전트 초기화 완료
모델 정보: {
  "model_name": "Qwen/Qwen3-14B",
  "model_type": "Qwen",
  "device": "cuda",
  "dtype": "float16",
  "max_tokens": 512,
  "temperature": 0.0,
  "parameters": "14.8B",
  "context_length": "32K"
}


## 4. 평가 실행

모든 테스트 케이스에 대해 추천을 생성하고 평가합니다.

In [4]:
# TODO: 추천 개수 설정 (선택사항)
# 최대값: agent의 max_paper_candidates, max_dataset_candidates 값
num_paper_recommendations = 5
num_dataset_recommendations = 5

# agent에서 최대 후보 개수 가져오기
MAX_PAPER_CANDIDATES = agent.max_paper_candidates
MAX_DATASET_CANDIDATES = agent.max_dataset_candidates

print(f"최대 추천 가능 개수: 논문 {MAX_PAPER_CANDIDATES}개, 데이터셋 {MAX_DATASET_CANDIDATES}개")

# 추천 개수 검증
if num_paper_recommendations > MAX_PAPER_CANDIDATES:
    print(f"⚠️  경고: 논문 추천 개수({num_paper_recommendations})가 최대값({MAX_PAPER_CANDIDATES})을 초과합니다.")
    print(f"   자동으로 {MAX_PAPER_CANDIDATES}개로 조정됩니다.")
    num_paper_recommendations = MAX_PAPER_CANDIDATES

if num_dataset_recommendations > MAX_DATASET_CANDIDATES:
    print(f"⚠️  경고: 데이터셋 추천 개수({num_dataset_recommendations})가 최대값({MAX_DATASET_CANDIDATES})을 초과합니다.")
    print(f"   자동으로 {MAX_DATASET_CANDIDATES}개로 조정됩니다.")
    num_dataset_recommendations = MAX_DATASET_CANDIDATES

if num_paper_recommendations < 1:
    print(f"⚠️  경고: 논문 추천 개수는 최소 1개 이상이어야 합니다.")
    num_paper_recommendations = 1

if num_dataset_recommendations < 1:
    print(f"⚠️  경고: 데이터셋 추천 개수는 최소 1개 이상이어야 합니다.")
    num_dataset_recommendations = 1

print(f"✅ 추천 설정: 논문 {num_paper_recommendations}개, 데이터셋 {num_dataset_recommendations}개")

최대 추천 가능 개수: 논문 10개, 데이터셋 10개
✅ 추천 설정: 논문 5개, 데이터셋 5개


In [5]:
# 평가 실행
all_eval_results = []
k_values = [3, 5]

# 추천 원본 결과(recommend_result.json 저장용)
all_recommendations = []

print(f"🔍 {len(all_test_cases)}개 테스트 케이스 평가 시작")
print(f"📏 평가 k 값: {k_values}")
print("=" * 80)

# 모델/임베딩 정보
try:
    _model_info = agent.llm_model.get_model_info()
except Exception:
    _model_info = {}
_model_info_safe = {
    "model_name": _model_info.get("model_name"),
    "model_type": _model_info.get("model_type"),
    "device": _model_info.get("device"),
    "dtype": _model_info.get("dtype"),
    "max_tokens": _model_info.get("max_tokens"),
    "temperature": _model_info.get("temperature"),
    "parameters": _model_info.get("parameters"),
    "context_length": _model_info.get("context_length"),
}

_embedding_info_safe = {
    "embedding_model": getattr(settings, "EMBEDDING_MODEL", None),
    "paper_hybrid_weights": {
        "alpha": getattr(settings, "PAPER_HYBRID_ALPHA", None),
        "beta": getattr(settings, "PAPER_HYBRID_BETA", None),
    },
    "dataset_hybrid_weights": {
        "alpha": getattr(settings, "DATASET_HYBRID_ALPHA", None),
        "beta": getattr(settings, "DATASET_HYBRID_BETA", None),
    },
}

for idx, test_case in enumerate(tqdm(all_test_cases, desc="평가 진행")):
    try:
        dataset_id = test_case['input_dataset']['svc_id']
        category = test_case['category']

        print(f"\n[{idx+1}/{len(all_test_cases)}] {test_case['input_dataset']['title']}")
        print(f"   카테고리: {category}")

        # 추천 생성
        recommendation_result = await agent.recommend(
            dataset_id,
            num_paper_recommendations=num_paper_recommendations,
            num_dataset_recommendations=num_dataset_recommendations
        )

        if 'error' in recommendation_result:
            print(f"   ❌ 오류: {recommendation_result['error']}")
            continue

        # ===== 추천 원본 결과 수집 =====
        # source_dataset
        src_ds = test_case.get("input_dataset", {})
        source_dataset_block = {
            "id": src_ds.get("svc_id"),
            "title": src_ds.get("title"),
            "description": src_ds.get("description"),
            "keywords": src_ds.get("keywords", []),
        }

        # search_result
        search_result = recommendation_result.get("search_result", {})
        search_result_block = {
            "paper_keywords": search_result.get("paper_keywords", []),
            "dataset_keywords": search_result.get("dataset_keywords", []),
            "paper_search_details": search_result.get("paper_search_details", []),
            "dataset_search_details": search_result.get("dataset_search_details", []),
        }

        # paper/dataset recommendations
        paper_reco = recommendation_result.get("paper_recommendations", [])
        dataset_reco = recommendation_result.get("dataset_recommendations", [])

        # candidates_analyzed
        candidates_analyzed = recommendation_result.get(
            "candidates_analyzed",
            (len(recommendation_result.get("paper_candidates", [])) +
             len(recommendation_result.get("dataset_candidates", []))
             if ("paper_candidates" in recommendation_result or "dataset_candidates" in recommendation_result)
             else (len(paper_reco) + len(dataset_reco)))
        )

        # 처리 시간
        processing_time_ms = recommendation_result.get("processing_time_ms", None)

        # 하나의 케이스 레코드 구성
        reco_record = {
            "source_dataset": source_dataset_block,
            "search_result": search_result_block,
            "paper_recommendations": paper_reco,
            "dataset_recommendations": dataset_reco,
            "processing_time_ms": processing_time_ms,
            "candidates_analyzed": candidates_analyzed,
            "model_info": _model_info_safe,
            "embedding_model_info": _embedding_info_safe,
        }
        all_recommendations.append(reco_record)
        # ==============================================

        # 평가 형식으로 변환
        predictions = []
        for paper in recommendation_result.get('paper_recommendations', []):
            predictions.append({
                'type': 'paper',
                'id': paper['id'],
                'rank': paper.get('rank'),
                'score': paper.get('score')
            })

        for dataset in recommendation_result.get('dataset_recommendations', []):
            predictions.append({
                'type': 'dataset',
                'id': dataset['id'],
                'rank': dataset.get('rank'),
                'score': dataset.get('score')
            })

        # 평가
        ground_truth = test_case['candidate_pool']
        eval_result = evaluate_recommendations(predictions, ground_truth, k_values)

        # 메타데이터 추가
        eval_result['test_case_index'] = idx
        eval_result['dataset_id'] = dataset_id
        eval_result['category'] = category
        eval_result['input_title'] = test_case['input_dataset']['title']
        eval_result['processing_time_ms'] = processing_time_ms if processing_time_ms is not None else recommendation_result.get('processing_time_ms', 0)
        # 선택: 추천 개수 기록(분석 편의)
        eval_result['num_predicted_papers'] = len([p for p in predictions if p['type'] == 'paper'])
        eval_result['num_predicted_datasets'] = len([p for p in predictions if p['type'] == 'dataset'])
        all_eval_results.append(eval_result)

        # 결과 요약 출력 (k_values 반영)
        summary_chunks = []
        for k in k_values:
            ndcg = eval_result.get(f"overall_ndcg@{k}", 0)
            mrr = eval_result.get(f"overall_mrr@{k}", 0)
            recall = eval_result.get(f"overall_recall@{k}", 0)
            summary_chunks.append(
                f"nDCG@{k}={ndcg:.4f}, MRR@{k}={mrr:.4f}, Recall@{k}={recall:.4f}"
            )
        print("   ✅ " + " | ".join(summary_chunks))

    except Exception as e:
        print(f"   ❌ 예외 발생: {e}")
        logging.error(f"테스트 케이스 {idx} 평가 실패: {e}", exc_info=True)
        continue

print("\n" + "=" * 80)
print(f"✅ 평가 완료: {len(all_eval_results)}/{len(all_test_cases)}개 케이스 성공")

🔍 17개 테스트 케이스 평가 시작
📏 평가 k 값: [3, 5]


평가 진행:   0%|          | 0/17 [00:00<?, ?it/s]


[1/17] 한반도 기상 관측 데이터 세트
   카테고리: 국내
2025-10-15 19:36:34,142 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c1f03ab868f32371ec97a650bcdf39ac
2025-10-15 19:36:34,257 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c1f03ab868f32371ec97a650bcdf39ac?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:36:34,260 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c1f03ab868f32371ec97a650bcdf39ac
2025-10-15 19:36:34,261 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "35 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c1f03ab868f32371ec97a650bcdf39ac",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "2025",
    "dataset_access_type_pc": "공개",
    "file_yn_pc": "직접다운로드",
    "dataset_cc_license


Batches: 100%|██████████| 1/1 [00:00<00:00, 14.61it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.76it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 68.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.35it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 136.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 90.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 137.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.31it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 64.01it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.23it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.59it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 111.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 134.42it/s]

Batches: 100%|██████████| 1/1 [00:00<

2025-10-15 19:36:39,940 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 18개 데이터셋 순위 결정 완료





2025-10-15 19:36:39,941 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:36:39,942 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:36:39,942 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 한반도 기상 관측 데이터 세트
Description: 한반도 종관 기상 관측 세스템으로부터의 관측 데이터 세트
Keywords: 기상, 센서데이터, 한반도

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO202009651118985
- Title: 기상드론을 이용한 보성 지역 기상 인자의 연직 측정 및 분석
- Description: 기상현상관측은 기상청에서 다양한 방법(지상, 고층, 해양, 항공, 등)으로 관측되고 있다. 하지만, 인간생활에 많은 영향을 미치는 대기경계층 관측에는 한계가 있다. 특히, 존데 또는 항공기를 이용한 기상관측은 경제적인 측면에서 상당한 비용이 필요하다. 따라서 본 연구의 목적은 기상드론을 이용하여 국지기상현상 중 해륙풍 연직분포에 대한 기상 인자들을 측정하고 분석하는 것이다. 해륙풍의 공간적 분포를 연구하기 위해 보성지역 표준기상관측소의 보성종합기상탑을 포함한 다른 세 지점(해안가, 산기슭, 산중턱)에 동일한 통합기상센서를 각 드론에 탑재하였다. 2018년 8월 4일 1100 LST부터 1800 

The following generation flags are not valid and may be ignored: ['temperature', 'top_p', 'top_k']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


2025-10-15 19:36:51,672 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "JAKO202009651118985",
      "reason": "제목과 설명에서 '기상', '센서', '관측'이라는 핵심 키워드가 다수 포함되어 있으며, 기상드론을 활용한 실제 기상 인자 측정 사례를 다루고 있어 주제와 매우 밀접하다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "ATN0037470932",
      "reason": "센서 데이터 처리에 대한 내용이 포함되어 있으며, 실시간 스트리밍 처리 모델에 대한 연구로 데이터 센서와 관련된 주제와 연관성이 크다.",
      "level": "추천"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO202131559466401",
      "reason": "'기상', '레이다', '탐지'라는 키워드가 다수 포함되어 있으며, 국지적 기상 변화를 탐지하는 방법을 제안하고 있어 기상 관측과 관련된 주제와 밀접하다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "JAKO201630762630902",
      "reason": "기상 레이다에서의 클러터 영향 분석을 다루며, 기상 신호와 관련된 기술적 내용이 포함되어 있어 기상 관측과 관련성이 있다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "JAKO200340961071385",
      "reason": "기상 영상기의 기술적 특성 분석을 다루고 있으며, 정지궤도 위성

평가 진행:   6%|▌         | 1/17 [00:41<11:04, 41.52s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[2/17] Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상을 활용한 천지호 GeoAI 데이터셋
   카테고리: 국내
2025-10-15 19:37:15,663 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 8d498db96633f07fe1d82ebe43daaf45
2025-10-15 19:37:15,762 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/8d498db96633f07fe1d82ebe43daaf45?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:37:15,764 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 8d498db96633f07fe1d82ebe43daaf45
2025-10-15 19:37:15,764 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "8d498db96633f07fe1d82ebe43daaf45",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "datase


Batches: 100%|██████████| 1/1 [00:00<00:00, 106.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 109.57it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 116.79it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.12it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 109.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.44it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 51.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 117.90it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 101.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 117.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.96it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 117.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 56.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 117.42it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 64.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.38it/s]

Batches: 100%|██████████| 1/1 [00:0

2025-10-15 19:37:20,685 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 18개 데이터셋 순위 결정 완료
2025-10-15 19:37:20,686 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:37:20,688 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:37:20,688 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상을 활용한 천지호 GeoAI 데이터셋
Description: Landsat-5/-7/-8 및 Sentinel-2 광학 위성 영상으로부터 구축된 백두산 천지호 GeoAI 데이터셋
Keywords: #백두산 #화산활동 #천지 #수체 #광학위성 #인공지능 데이터셋

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO202210559551497
- Title: 위성영상 이미지를 활용한 연구 동향 및 데이터셋 리뷰
- Description: 기존 컴퓨터 비전의 연구 동향과 마찬가지로, 위성영상을 이용한 연구도 GPU 기반의 컴퓨터 연산능력과 이미지 처리와 관련된 딥러닝 방법론의 발전으로 많이 이루어지고 있다. 그로 인해 다양한 분야에 위성영상이 활용되고 있고, 위성 영상을 활용에 관한 연구도 증가하고 있




2025-10-15 19:37:32,412 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "ART003035577",
      "reason": "논문 제목과 설명에서 광학 위성영상과 GeoAI 데이터셋을 직접적으로 언급하며, 딥러닝 기반의 이미지 정합 모델 학습에 초점을 맞춘 내용으로 소스 데이터셋과 주제가 매우 유사함.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "JAKO202210559551497",
      "reason": "위성영상과 관련된 연구 동향 및 데이터셋을 다루었으며, 다양한 분야에서의 활용 사례와 데이터셋 정보를 상세히 설명하고 있어 소스 데이터셋과 관련성이 높음.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "DIKO0016950738",
      "reason": "UAV 영상과 GeoAI 기술을 결합하여 환경 공간정보를 구축하는 방법을 다루며, GeoAI의 실제 적용 사례를 제시하고 있어 관련성이 있음.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "ART003244580",
      "reason": "GeoAI 기술의 발전 전략과 정책 방향을 다루며, 데이터 통합 및 학습 데이터 마련 등 GeoAI와 관련된 핵심 이슈를 다루고 있어 맥락상 관련성이 있음.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "NPAP08018991",
      "reason": "위성 이미지를 활용한 특정 분야(가뭄 민감도 분석)

평가 진행:  12%|█▏        | 2/17 [01:22<10:15, 41.03s/it]

   ✅ nDCG@3=1.0000, MRR@3=1.0000, Recall@3=0.0714 | nDCG@5=1.0000, MRR@5=1.0000, Recall@5=0.0714

[3/17] 이동형 도시환경 센싱 데이터 셋
   카테고리: 국내
2025-10-15 19:37:56,347 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c3ad2f8c1cf9e107a3f68b6972b64ad5
2025-10-15 19:37:56,523 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c3ad2f8c1cf9e107a3f68b6972b64ad5?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:37:56,526 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c3ad2f8c1cf9e107a3f68b6972b64ad5
2025-10-15 19:37:56,527 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "108 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c3ad2f8c1cf9e107a3f68b6972b64ad5",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_p


Batches: 100%|██████████| 1/1 [00:00<00:00, 105.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.07it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.73it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 96.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 97.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.52it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.54it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 89.69it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 115.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.96it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 135.86it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.45it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.20it/s]

Batches: 100%|██████████| 1/1 [00:0

2025-10-15 19:38:01,422 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 7개 데이터셋 순위 결정 완료
2025-10-15 19:38:01,424 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:38:01,425 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:38:01,425 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 이동형 도시환경 센싱 데이터 셋
Description: 자동차 탑재 센서를 활용한 전국 5대 광역시 대상 대기환경 수집 데이터. 미세먼지, 초미세먼지, 일산화탄소, 이산화질소 수치 등 각종 정보를 수집
Keywords: 대기환경 센싱, 광역시, 사물데이터, 미세먼지

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO201914260902411
- Title: 실시간 데이터 수집/분석/처리를 위한 지능형 IoT
- Description: 본 연구는 데이터의 실시간 수집/분석/처리를 위한 빅데이터 기반, 데이터 자산의 창의적 분석과 유통단계를 실시간으로 측정할 수 있는 IoT 기반 지능형 처리시스템을 개발한다. 모바일 단말은 제공된 디바이스의 SDK를 이용하여 특정지역 해산물 생산유통소비에 대한 데이터 정보를 측정한다. 측정된 정보를 oneM2M 프로토콜을 이용하




2025-10-15 19:38:13,676 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "rank": 1,
  "candidate_id": "NPAP12898529",
  "reason": "논문의 주제가 대기 오염 모니터링 시스템 설계에 집중되어 있으며, 실제 센서를 활용한 데이터 수집과 공공데이터와의 연동이라는 점에서 주어진 데이터셋과 직접적인 관련성이 있다.",
  "level": "강추"
}
2025-10-15 19:38:13,679 - src.agents.recommendation_agent - INFO - ✅ JSON 파싱 성공
2025-10-15 19:38:13,681 - src.agents.recommendation_agent - INFO - 파싱된 타입: <class 'dict'>, 키: dict_keys(['rank', 'candidate_id', 'reason', 'level'])
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "NPAP12898529",
      "reason": "논문의 주제가 대기 오염 모니터링 시스템 설계에 집중되어 있으며, 실제 센서를 활용한 데이터 수집과 공공데이터와의 연동이라는 점에서 주어진 데이터셋과 직접적인 관련성이 있다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "NPAP12898528",
      "reason": "대기 오염 모니터링을 위한 모바일 앱 설계라는 주제로, 미세먼지 데이터 수집 및 시각화에 대한 내용이 포함되어 있어 주어진 데이터셋과 밀접한 관련성을 가진다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO201914260902411",
      ...
2025-10-15

평가 진행:  18%|█▊        | 3/17 [02:16<10:56, 46.92s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[4/17] 이동형 도시환경 센서 및 도로영상 데이터 셋
   카테고리: 국내
2025-10-15 19:38:50,280 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 000e4340354d8219bdb3af6a7ad4800d
2025-10-15 19:38:50,387 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/000e4340354d8219bdb3af6a7ad4800d?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:38:50,390 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 000e4340354d8219bdb3af6a7ad4800d
2025-10-15 19:38:50,390 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "44 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "000e4340354d8219bdb3af6a7ad4800d",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pu


Batches: 100%|██████████| 1/1 [00:00<00:00, 100.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.03it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 98.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 113.07it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 98.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.16it/s]

Batches: 100%|██████████| 1/1 [00:0

2025-10-15 19:38:55,154 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 10개 데이터셋 순위 결정 완료





2025-10-15 19:38:55,154 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:38:55,155 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:38:55,156 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 이동형 도시환경 센서 및 도로영상 데이터 셋
Description: 자동차 탑재 센서 및 블랙박스를 활용한 전국 5대 광역시 대상 도로영상 수집 데이터. 미세먼지, 초미세먼지, 일산화탄소, 이산화질소 수치 등 각종 정보를 수집
Keywords: 광역시, 사물데이터, 도시영상, 미세먼지

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0014861001
- Title: 딥 뉴럴 네트워크 기반 교통 CCTV 데이터 분석
- Description: 기술의 발전과 도시로의 인구 밀집 현상에 의하여 교통정보의 활용과 중요성은 점차 높아지고 있다. 이에 따라 교통 정보의 수집 지역이 늘어나고 있지만, 현재 교통 정보 수집 방법은 설치나 유지 보수에 많은 시간과 비용이 들기 때문에 효율이 떨어지는 단점이 있다.&amp;#xD; 따라서 본 논문에서는 별도의 추가 설비 없이 기존 설치된 CCTV를 이용해 딥러닝(Deep learning) 기반의 SSD(Single Shot Multibox Detector)[1]와, Deep SORT(Simp

평가 진행:  24%|██▎       | 4/17 [02:44<08:36, 39.70s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[5/17] Dataset for Intervention strategies against COVID-19 and their estimated impact on Swedish healthcare capacity
   카테고리: 국내
2025-10-15 19:39:18,921 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 33da0205f56477ba41dec7d7db3258a6
2025-10-15 19:39:19,013 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/33da0205f56477ba41dec7d7db3258a6?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:39:19,015 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 33da0205f56477ba41dec7d7db3258a6
2025-10-15 19:39:19,016 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "33da0205f56477ba41dec7d7db3258a6",
    "ctlg_type": "02",
    "dataset_ty


Batches: 100%|██████████| 1/1 [00:00<00:00, 94.39it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 93.72it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 127.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 144.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 126.32it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.87it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.23it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 111.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.92it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.20it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 129.69it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.89it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.32it/s]

Batches: 100%|██████████| 1/1 [0

2025-10-15 19:39:23,637 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 10개 데이터셋 순위 결정 완료
2025-10-15 19:39:23,637 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:39:23,638 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:39:23,639 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: Dataset for Intervention strategies against COVID-19 and their estimated impact on Swedish healthcare capacity
Description: Dataset for individual-based modeling of COVID-19 spread in Sweden.
Keywords: COVID-19, 코로나, 코로나19

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: ART002891904
- Title: 상사무례 및 부하무례가 의료종사자의 조직몰입과 고객지향성에 미치는 영향
- Description: This study aimed at the administration and medical workers who are at the customer contact point providin




2025-10-15 19:39:34,059 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "JAKO201528638841075",
      "reason": "제목과 내용이 병원 내 감염 방지 및 감염 제어와 관련되어 있으며, 연구 주제와 직접적인 연관성이 있음.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "NPAP08511814",
      "reason": "심장 운동 부하와 의료 장비 개발에 대한 연구로, 의료 분야의 기술적 발전과 관련성이 큼.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "DIKO0017293803",
      "reason": "의료 종사자의 허리 부상 방지를 위한 생체 역학적 모델과 센서 기반 기술을 다루며, 의료 현장의 안전 문제와 관련됨.",
      "level": "강추"
    },
    {
      "rank": 4,
      "candidate_id": "ART002891904",
      "reason": "의료 종사자의 조직몰입과 고객지향성에 대한 연구로, 의료 인력 관리와 관련된 주제로 연결될 수 있음.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "ATN0027097727",
      "reason": "개인 신용 평가 방법론에 대한 연구로, 금융 분야의 모델링 기법을 이해하는 데 도움이 됨.",
      "level": "추천"
    }
  ]
}
2025-10-15 19:39:34,061 - src.agents.recommendation_agent - INFO

평가 진행:  29%|██▉       | 5/17 [03:24<07:57, 39.78s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[6/17] 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
   카테고리: 국내
2025-10-15 19:39:58,841 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID bee3162957beecc87a91c94803d23439
2025-10-15 19:39:58,936 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/bee3162957beecc87a91c94803d23439?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:39:58,939 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset bee3162957beecc87a91c94803d23439
2025-10-15 19:39:58,940 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "bee3162957beecc87a91c94803d23439",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
   


Batches: 100%|██████████| 1/1 [00:00<00:00, 93.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 50.96it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 59.05it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.86it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 69.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 71.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.49it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.20it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.92it/s]

Batches: 100%|██████████| 1/1 [00:00

2025-10-15 19:40:04,189 - src.agents.recommendation_agent - INFO - 상위 21개 논문, 8개 데이터셋 순위 결정 완료
2025-10-15 19:40:04,190 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:40:04,191 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:40:04,192 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
Description: 본 데이터셋은 해양 관측을 목적으로 수집된 CCTV 화면에서 날짜와 시간을 나타내는 영역을 추출한 3362개의 이미지로 구성됨.\r\n이미지 파일명은 S-ORS_WEST_yyyy-mm-dd_hh-MM-ss 형식을 따르며, 날짜와 시간 정보를 포함함.\r\n본 데이터셋은 2023년 8월 동안 수집된 자료로, 모든 이미지 파일은 PNG 형식이며 해상도는 500x120 픽셀.
Keywords: 이미지 데이터셋, 이미지 처리, CCTV, 날짜 및 시간 정보, 해양 관측, 해양 모니터링, 타임스탬프

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART69976214
- Title: 해양 모니터링 설비의 기술 성숙도 평가방법 탐구
- Description: 현대 해양 모니터링 설비(o




2025-10-15 19:40:15,726 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "NART69976214",
      "reason": "해양 관측과 관련된 기술 성숙도 평가 방법을 다루고 있어 주제와 직접적으로 연결되며, 해양 모니터링 설비에 대한 내용이 포함되어 있어 의미적으로 매우 유사함.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "JAKO202228049104234",
      "reason": "이미지 처리 기법에 대한 심층적인 연구가 진행되었으며, 안면 교체와 관련된 기술이 포함되어 있어 해양 관측 CCTV 이미지 처리와 관련성이 있음.",
      "level": "추천"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO200932056740511",
      "reason": "디지털 이미지 처리 기법을 활용한 입자 형상 분석이 이루어졌으며, 이는 해양 관측 CCTV 이미지의 처리와 유사한 기술적 접근을 포함하고 있음.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "JAKO201118559655094",
      "reason": "디지털 이미지 처리 기법을 이용한 입도분포곡선 작성에 관한 연구로, 해양 관측 CCTV 이미지의 처리와 관련된 기술적 내용이 포함되어 있음.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "JAKO199811920099693",
      "reason": "실시간 해양 모니터링 시스템에 대한 고찰을 다루고 있어 주제

평가 진행:  35%|███▌      | 6/17 [04:06<07:23, 40.31s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[7/17] 필리핀해 해양-대기 감시부이 자료 1(2020년)
   카테고리: 국내
2025-10-15 19:40:40,163 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c592e36ae62d104b21183d9f498d918f
2025-10-15 19:40:40,256 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c592e36ae62d104b21183d9f498d918f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:40:40,258 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c592e36ae62d104b21183d9f498d918f
2025-10-15 19:40:40,259 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "29 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c592e36ae62d104b21183d9f498d918f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset


Batches: 100%|██████████| 1/1 [00:00<00:00, 106.02it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 97.59it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 116.05it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.89it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 115.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 119.82it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 118.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 93.39it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 101.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 117.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 120.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 93.40it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 121.12it/s]

Batches: 100%|██████████| 1/1 [00

2025-10-15 19:40:45,689 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 17개 데이터셋 순위 결정 완료





2025-10-15 19:40:45,690 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:40:45,691 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:40:45,691 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 필리핀해 해양-대기 감시부이 자료 1(2020년)
Description: 필리핀해에 해양-대기 감시부이를 설치하여(북위 15도, 동경 134.5도) 대기변수 관측.
Keywords: 해류관측, 쿠로시오, 동중국해

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0015098806
- Title: 장기 해양관측시스템을 활용한 해양관측과 이를 기반으로 한 해양환경특성 분석
- Description: 해양재난재해에 의한 피해를 줄이고, 미래 해양의 변동을 예측하기 위해서는 장기간의 고품질 해양관측자료가 필수적이다. 황해와 동중국해(이하 황동중국해)는 한반도의 주요 기상현상이 최종적으로 결정되는 해역으로서 장기 해양정보 획득을 위해 주요 거점 해역에 2003년 이어도 해양과학기지를 시작으로 현재는 가거초 및 소청초 기지, 그리고 황해중부부이가 설치되어 운용 중에 있다. 황동중국해 최초의 장기 해양관측시스템으로서 지난 10년 이상의 관측자료 및 운영 성과를 분석함으로써 해양과학기지의 해양과학적 가치를 재평가하고자 하였다. &amp;#

평가 진행:  41%|████      | 7/17 [04:47<06:46, 40.60s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[8/17] 의료영상데이터
   카테고리: 국내
2025-10-15 19:41:21,375 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 19:41:21,474 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/a59a0a7d0c894a81a2936833b0790e0a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:41:21,477 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 19:41:21,478 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "34 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "a59a0a7d0c894a81a2936833b0790e0a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "2025",


Batches: 100%|██████████| 1/1 [00:00<00:00, 76.95it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.20it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.05it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.32it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 87.22it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.54it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.70it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 78.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.84it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 86.19it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 59.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 61.

2025-10-15 19:41:27,440 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 14개 데이터셋 순위 결정 완료
2025-10-15 19:41:27,440 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:41:27,441 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:41:27,442 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 의료영상데이터
Description: 휴먼 디지털트윈을 위한 의료영상데이터
Keywords: 인체데이터, Human Digital Twin, 데이터 플랫폼

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO202020264317117
- Title: Digital Twin 개념을 적용한 제조환경 시뮬레이션 모형 설계
- Description: 제조환경이 더욱 복잡해짐에 따라 전통적인 시뮬레이션만으로는 실시간 현장 결과를 평가하는 데 많은 어려움을 겪고 있다. 이를 극복하기 위한 대안으로 Digital Twin개념이 활발히 논의되고 있지만, 제품설계 단계에 국한되어 연구가 진행되고 있는 실정이다. 본 연구는 Digital Twin개념이 생산 공정 프로세스에 적용되기 위한 Digital Twin 기반 제조환경 프레임워크를 제시하였다. 구성요소는 실제 생산환경인 




2025-10-15 19:41:40,112 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "JAKO202020264317117",
      "reason": "제목과 설명에서 디지털 트윈과 관련된 제조환경 시뮬레이션을 다루고 있으며, 실제 시스템과 가상 모델 간의 상호연동을 언급하여 주제와 밀접하게 연결된다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "JAKO202228660783851",
      "reason": "디지털 트윈의 상호운용성에 초점을 맞춘 연구로, 다양한 분야에서의 적용 가능성과 표준화 필요성을 강조하며 주제와 관련성이 크다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "DIKO0015025571",
      "reason": "스마트팩토리 환경에서 디지털 트윈을 설계하는 방법을 제시하며, 실제 공장과 가상 모델 간의 연동을 통해 이상 상태를 감지하고 대처하는 과정을 설명한다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "JAKO201810038012250",
      "reason": "생체정보 컴퓨팅과 빅데이터 플랫폼에 대한 연구로, 복합적인 데이터 형식을 다루며 디지털 기술과 관련된 내용을 포함하고 있어 주제와 어느 정도 연관된다.",
      "level": "참고"
    },
    {
      "rank": 5,
      "candidate_id": "NART136355857",
      "reason": "디지털 트윈 기술과 관련된 첫 번째 오픈 연구 출판 플랫폼에 대해 소개하며

평가 진행:  47%|████▋     | 8/17 [05:31<06:14, 41.62s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[9/17] 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
   카테고리: 국내
2025-10-15 19:42:05,173 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID bee3162957beecc87a91c94803d23439
2025-10-15 19:42:05,280 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/bee3162957beecc87a91c94803d23439?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:42:05,283 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset bee3162957beecc87a91c94803d23439
2025-10-15 19:42:05,284 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "34 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "bee3162957beecc87a91c94803d23439",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
   


Batches: 100%|██████████| 1/1 [00:00<00:00, 71.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 71.91it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.39it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 55.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 51.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.59it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 60.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 33.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 77.75it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.43it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 85.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 57.

2025-10-15 19:42:10,839 - src.agents.recommendation_agent - INFO - 상위 21개 논문, 8개 데이터셋 순위 결정 완료
2025-10-15 19:42:10,840 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:42:10,841 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:42:10,842 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 해양 관측 CCTV 타임스탬프 이미지 데이터셋 (2023년 8월)
Description: 본 데이터셋은 해양 관측을 목적으로 수집된 CCTV 화면에서 날짜와 시간을 나타내는 영역을 추출한 3362개의 이미지로 구성됨.\r\n이미지 파일명은 S-ORS_WEST_yyyy-mm-dd_hh-MM-ss 형식을 따르며, 날짜와 시간 정보를 포함함.\r\n본 데이터셋은 2023년 8월 동안 수집된 자료로, 모든 이미지 파일은 PNG 형식이며 해상도는 500x120 픽셀.
Keywords: 이미지 데이터셋, 이미지 처리, CCTV, 날짜 및 시간 정보, 해양 관측, 해양 모니터링, 타임스탬프

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NART69976214
- Title: 해양 모니터링 설비의 기술 성숙도 평가방법 탐구
- Description: 현대 해양 모니터링 설비(o




2025-10-15 19:42:23,862 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "NART69976214",
      "reason": "해양 관측과 관련된 기술 성숙도 평가 방법을 다루고 있어 주제와 직접적으로 연결되며, 해양 모니터링 설비에 대한 내용이 포함되어 있어 의미적으로 매우 유사함.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "JAKO202228049104234",
      "reason": "이미지 처리 기법에 대한 연구로, 제안된 기법이 안면 교체와 관련된 이미지 품질 향상에 초점을 맞추고 있어 해양 관측 CCTV 이미지 처리와 관련성이 있음.",
      "level": "추천"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO200932056740511",
      "reason": "디지털 이미지 처리 기법을 활용한 입자 형상 분석을 다루고 있어, 해양 관측 CCTV 이미지의 형태 분석이나 처리와 관련된 기술적 접근을 공유함.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "JAKO200629734288734",
      "reason": "시간정보 추출 기법을 다루고 있어, 해양 관측 CCTV 이미지에 포함된 타임스탬프 정보의 처리와 관련성이 있음.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "JAKO199811920099693",
      "reason": "실시간 해양 모니터링 시스템에 대한 고찰을 다루고 있어, 해양 관측 CCTV

평가 진행:  53%|█████▎    | 9/17 [06:15<05:40, 42.55s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[10/17] 필리핀해 해양-대기 감시부이 자료 1(2020년)
   카테고리: 국내
2025-10-15 19:42:49,759 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c592e36ae62d104b21183d9f498d918f
2025-10-15 19:42:49,856 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c592e36ae62d104b21183d9f498d918f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:42:49,859 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c592e36ae62d104b21183d9f498d918f
2025-10-15 19:42:49,860 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c592e36ae62d104b21183d9f498d918f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "datase


Batches: 100%|██████████| 1/1 [00:00<00:00, 110.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.96it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.04it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.80it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.42it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.47it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.98it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.05it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 101.17it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 122.47it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.23it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.34it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 106.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 98.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.84it/s]

Batches: 100%|██████████| 1/1 [0

2025-10-15 19:42:55,287 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 13개 데이터셋 순위 결정 완료
2025-10-15 19:42:55,288 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:42:55,289 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:42:55,290 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 필리핀해 해양-대기 감시부이 자료 1(2020년)
Description: 필리핀해에 해양-대기 감시부이를 설치하여(북위 15도, 동경 134.5도) 대기변수 관측.
Keywords: 해류관측, 쿠로시오, 동중국해

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0015098806
- Title: 장기 해양관측시스템을 활용한 해양관측과 이를 기반으로 한 해양환경특성 분석
- Description: 해양재난재해에 의한 피해를 줄이고, 미래 해양의 변동을 예측하기 위해서는 장기간의 고품질 해양관측자료가 필수적이다. 황해와 동중국해(이하 황동중국해)는 한반도의 주요 기상현상이 최종적으로 결정되는 해역으로서 장기 해양정보 획득을 위해 주요 거점 해역에 2003년 이어도 해양과학기지를 시작으로 현재는 가거초 및 소청초 기지, 그리고 황해중부부이가 설치되어 운용 중에 




2025-10-15 19:43:07,677 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "DIKO0015098806",
      "reason": "제목과 설명에서 장기 해양관측 및 해양환경 특성 분석에 대한 내용이 직접적으로 언급되어 있어 의미적으로 매우 유사하며, 해양관측이라는 핵심 키워드도 일치합니다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "JAKO202125761281604",
      "reason": "대기 환경 데이터와 기상 데이터를 활용한 분석이라는 점에서 일부 관련성이 있으며, 대기 변수에 대한 관심이 공유됩니다.",
      "level": "추천"
    },
    {
      "rank": 3,
      "candidate_id": "JAKO202208360603657",
      "reason": "항공기의 대기 속도 추정을 위한 기상 및 지형 데이터 통합 방법에 대해 다루고 있어 대기 변수와 관련된 연구로서 일정 부분 연관성이 있습니다.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "JAKO202433472038794",
      "reason": "대기 환경 데이터의 이상치 탐지에 대한 연구로, 대기 변수에 대한 분석 접근법이 공유되며, 관련성이 어느 정도 있습니다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "JAKO200828073326403",
      "reason": "기후변화 모니터링을 위한 USN 활용이라는 주제로, 기후와 환경 데이터 수집에 대한 관심이 공유되며, 

평가 진행:  59%|█████▉    | 10/17 [06:57<04:56, 42.37s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[11/17] 의료영상데이터
   카테고리: 국내
2025-10-15 19:43:31,740 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 19:43:31,832 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/a59a0a7d0c894a81a2936833b0790e0a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:43:31,835 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset a59a0a7d0c894a81a2936833b0790e0a
2025-10-15 19:43:31,836 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "a59a0a7d0c894a81a2936833b0790e0a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "2025"


Batches: 100%|██████████| 1/1 [00:00<00:00, 126.74it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.73it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.15it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.76it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 142.02it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 141.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.12it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 146.11it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 139.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 152.73it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 147.69it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 148.26it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 65.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 144.28it/s]

Batches: 100%|██████████| 1/1 [00:

2025-10-15 19:43:37,173 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 14개 데이터셋 순위 결정 완료
2025-10-15 19:43:37,174 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:43:37,175 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:43:37,176 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 의료영상데이터
Description: 휴먼 디지털트윈을 위한 의료영상데이터
Keywords: 인체데이터, Human Digital Twin, 데이터 플랫폼

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: JAKO202020264317117
- Title: Digital Twin 개념을 적용한 제조환경 시뮬레이션 모형 설계
- Description: 제조환경이 더욱 복잡해짐에 따라 전통적인 시뮬레이션만으로는 실시간 현장 결과를 평가하는 데 많은 어려움을 겪고 있다. 이를 극복하기 위한 대안으로 Digital Twin개념이 활발히 논의되고 있지만, 제품설계 단계에 국한되어 연구가 진행되고 있는 실정이다. 본 연구는 Digital Twin개념이 생산 공정 프로세스에 적용되기 위한 Digital Twin 기반 제조환경 프레임워크를 제시하였다. 구성요소는 실제 생산환경인 

평가 진행:  65%|██████▍   | 11/17 [07:40<04:14, 42.40s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[12/17] 한국인 정상인 심전도 세부파형 
   카테고리: 국내
2025-10-15 19:44:14,200 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 4fc87916027f5568850d33ecd2f7680f
2025-10-15 19:44:14,300 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/4fc87916027f5568850d33ecd2f7680f?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:44:14,302 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 4fc87916027f5568850d33ecd2f7680f
2025-10-15 19:44:14,303 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "4fc87916027f5568850d33ecd2f7680f",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_p


Batches: 100%|██████████| 1/1 [00:00<00:00, 66.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 57.84it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.08it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 61.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.53it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 63.89it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 82.48it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 78.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.25it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.27it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.23it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 83.86it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.52it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 40.43it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.50it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.

2025-10-15 19:44:19,071 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 14개 데이터셋 순위 결정 완료
2025-10-15 19:44:19,072 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2





2025-10-15 19:44:19,073 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:44:19,074 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 한국인 정상인 심전도 세부파형 
Description: 참조표준 설명 : ○ P_height, Q_height, R_height, S_height, T_height, P_duration, QRS_interval, QT_interval, T_duration\n○ 60~69세 Modified lead (Mason-Likar) system에서 성인 남녀의 정상 심전도\n 참조표준 제/개정 사유 : ㅇ심장 질환 환자용 진단 기기 개발\nㅇ마취 중에 있거나 중환자실에 있는 환자의 심장질환 발병 및 경과 관찰용 기기 개발\nㅇ심전도를 이용한 심박변이도(Heart Rate Variability, HRV), 맥파전도속도(Pulse Wave Velocity) 등의 연구 및 관련 기기 개발에 도움\nㅇ 2013년에 개발한 연령대 20-50세, 2014년 2-13세, 2017년 6--60세를 추가함
Keywords: Sex, QRS, ECG feature, T, P, Electrocardiogram (ECG), Heart rate, Modified limb lead

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0011402885
- Title: 신체 활동량을 기반으로 한 심전도 분석
- Descri

평가 진행:  71%|███████   | 12/17 [08:22<03:31, 42.35s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[13/17] 돌발홍수 알람 분석
   카테고리: 국내
2025-10-15 19:44:56,440 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID c05286c716d93ea28c6fd08f28b17b6a
2025-10-15 19:44:56,534 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/c05286c716d93ea28c6fd08f28b17b6a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:44:56,537 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset c05286c716d93ea28c6fd08f28b17b6a
2025-10-15 19:44:56,538 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "31 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "c05286c716d93ea28c6fd08f28b17b6a",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc": "20


Batches: 100%|██████████| 1/1 [00:00<00:00, 94.39it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.13it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.00it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 124.18it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.78it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 84.19it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.21it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.83it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.89it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.12it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.10it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 66.08it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 101.83it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 63.66it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.11it/s]

Batches: 100%|██████████| 1/1 [00:0

2025-10-15 19:45:01,021 - src.agents.recommendation_agent - INFO - 상위 20개 논문, 8개 데이터셋 순위 결정 완료
2025-10-15 19:45:01,022 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:45:01,024 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:45:01,024 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 돌발홍수 알람 분석
Description: 돌발홍수 알람 \r\n대상기간 : 2020~2022.6 중 일부\r\n단위 : 읍면동 수준\r\n알람 단계 : 3단계\r\n입력 데이터 : 격자 강우 관측(RDR_COMP_ADJ), 예측(QPF) \r\n대상 범위 : 전국(제주도 등 남부 제외)\r\nFormat : OGC KML (XML)\r\n좌표참조체계 : EPSG::4326
Keywords: 홍수, 알람

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: NPAP13594929
- Title: 호우 영향예보를 위한 머신러닝 기반의 수문학적 정량강우예측(HQPF) 연구
- Description: 기상 예보자료는 발생 가능한 재난의 예방 및 대비 차원에서 매우 중요한 자료로 활용되고 있다. 우리나라 기상청에서는 동네예보를 통해 5km 공간해상도의 1시간 간격 초단기예보와,




2025-10-15 19:45:12,205 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "NPAP13594929",
      "reason": "제목과 설명에서 정량적 강우예측(HQPF)과 관련된 기술적 내용이 다수 언급되며, 연구 목적과 방법이 돌발홍수 예측과 밀접하게 연결되어 있음.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "DIKO0012543631",
      "reason": "홍수경보와 관련된 모바일 기반 시스템 개발에 대한 연구로, 실제 홍수 예측 및 경보 시스템 구축에 필요한 요소들이 잘 반영되어 있음.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "NPAP13248379",
      "reason": "레이더 자료를 활용한 초단기 강우 예측 기법에 대한 연구로, 돌발홍수 예측에 필요한 실시간 강우 예측 기술과 관련성이 큼.",
      "level": "추천"
    },
    {
      "rank": 4,
      "candidate_id": "NPAP14024814",
      "reason": "LSTM 기반의 침수 예측 모델에 대한 연구로, 집중호우로 인한 홍수 예측과 관련된 기계학습 기법을 다루고 있음.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "NPAP13594557",
      "reason": "고해상도 격자 강수자료를 활용한 QPF 모델 개발에 대한 연구로, 돌발홍수 예측에 필요한 정확한 강수 예측 기술과 관련성이 있음.",
      "level": "추천"
    }
 

평가 진행:  76%|███████▋  | 13/17 [09:01<02:46, 41.50s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[14/17] 2024 극한기후영향 보고서
   카테고리: 국내
2025-10-15 19:45:35,987 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID e876ffe4cad991d4f4930284468df093
2025-10-15 19:45:36,091 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/e876ffe4cad991d4f4930284468df093?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:45:36,094 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset e876ffe4cad991d4f4930284468df093
2025-10-15 19:45:36,095 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "e876ffe4cad991d4f4930284468df093",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc"


Batches: 100%|██████████| 1/1 [00:00<00:00, 117.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.83it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.33it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 102.76it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.63it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 93.51it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 132.86it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.46it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 129.25it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.08it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 131.83it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 100.66it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.28it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 123.29it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 125.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 44.41it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 78.28it/s]

Batches: 100%|██████████| 1/1 [00:0

2025-10-15 19:45:41,144 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 13개 데이터셋 순위 결정 완료





2025-10-15 19:45:41,145 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:45:41,146 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:45:41,147 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 2024 극한기후영향 보고서
Description: 폭염, 한파, 폭우 및 홍수, 가뭄 등의 피해사례 및 정책
Keywords: 홍수, 한파, 폭염, 극한기후, 가뭄, 폭우

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0016913178
- Title: 토픽 모델링을 활용한 기후위기 적응에 대한 언론보도 연구
- Description: 기후위기 적응처럼 중앙 및 지방정부, 기관 및 기업, 개인 등 관련된 주체 의 참여와 수용성 확보가 필요한 정책의 경우 언론의 역할이 매우 중요하다. 언론은 일반인들에게 익숙하지 않은 과학적 사실을 정확하게 전달해 여론을 형성하고 정책 수립의 목표 달성에 영향력을 발휘할 수 있기 때문이다. 본 연구에서는 국내 기후위기 적응에 대한 언론의 이슈 변화를 살펴보고, 주 요 보도내용을 주제별로 분석했다. 이를 위해 ‘국가 기후위기 적응대책’이 처 음으로 수립된 2011년부터 ‘제3차 국가 기후위기 적응강화대책’이 발표된 2023년 6월까지 국내 54개 언론사에서 보도한 기후위기 적응 관련 기사를 

평가 진행:  82%|████████▏ | 14/17 [09:41<02:03, 41.08s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[15/17] 2024 극한기후영향 보고서
   카테고리: 국내
2025-10-15 19:46:16,093 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID e876ffe4cad991d4f4930284468df093
2025-10-15 19:46:16,188 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/e876ffe4cad991d4f4930284468df093?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:46:16,190 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset e876ffe4cad991d4f4930284468df093
2025-10-15 19:46:16,192 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "e876ffe4cad991d4f4930284468df093",
    "ctlg_type": "02",
    "dataset_type": "01",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc": "국내",
    "dataset_pub_dt_pc"


Batches: 100%|██████████| 1/1 [00:00<00:00, 113.66it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 99.84it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.14it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.99it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.97it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.07it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 105.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 133.10it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.37it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 129.85it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 130.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 104.31it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 128.08it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 97.94it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 129.39it/s]

Batches: 100%|██████████| 1/1 [00

2025-10-15 19:46:20,938 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 10개 데이터셋 순위 결정 완료
2025-10-15 19:46:20,939 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:46:20,940 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:





2025-10-15 19:46:20,941 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: 2024 극한기후영향 보고서
Description: 폭염, 한파, 폭우 및 홍수, 가뭄 등의 피해사례 및 정책
Keywords: 홍수, 한파, 폭염, 극한기후, 가뭄, 폭우

## Top 10 paper Candidates (by E5+BM25 hybrid score):

[1] ID: DIKO0016806046
- Title: 기후위기와 복지 관련 언론기사 빅데이터 분석
- Description: 기후위기가 심화되면서 기후재난, 기후고통 등의 단어까지 등장했다. 앞으로 기후재난이 더욱 빈번하게 일어날 것으로 예측되는 가운데, 기후위기로 인한 피해는 모든 계층이나 지역에 동일하게 발생되지 않기 때문에 기후위기로 인한 불평등 또한 더 심해질 것으로 예측되고 있다. 해마다 기후위기와 사회복지 실천, 대응에 관한 사회적 관심도가 높아지고 있으며, 문제 해결을 위해 대안적인 복지국가 모델과 사회복지 실천이 요구되고 있다. &amp;#xD; 2000년대부터 환경문제와 사회복지의 결합적 의미를 담고 있는 연구들은 진행되어 왔으나 핵심 용어도 명확히 정의되지 않은 상태이다. 그 결과 사회복지 정책 및 현장에서 실제적이고 직접적인 지원이 이루어지지 못하고 있으며, 구체적인 로드맵과 정책 대상이 부재한 상태에서 지자체별로 사회복지 실천을 수행하고 있는 것으로 나타났다. &amp;#xD; 따라서 본 연구는 기후위기와 사회복지 관련 키워드가 언론에서 어떤 키워드와 이슈(군집)로 나타났는지 비교 분석하여 그 의미를 탐색적으로 살펴보고

평가 진행:  88%|████████▊ | 15/17 [10:22<01:21, 40.78s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[16/17] NSW COVID-19 tests by location (discontinued)
   카테고리: 해외
2025-10-15 19:46:56,191 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID 03e16fe2b6d96d4961f22c244a94bb1a
2025-10-15 19:46:56,287 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/03e16fe2b6d96d4961f22c244a94bb1a?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:46:56,290 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset 03e16fe2b6d96d4961f22c244a94bb1a
2025-10-15 19:46:56,291 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "32 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "03e16fe2b6d96d4961f22c244a94bb1a",
    "ctlg_type": "02",
    "dataset_type": "02",
    "ctlg_type_pc": "dataset",
    "dataset_type_pc":


Batches: 100%|██████████| 1/1 [00:00<00:00, 63.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 103.83it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 95.65it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.95it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 154.20it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.31it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 155.36it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 75.08it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 142.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.88it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 66.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.60it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.53it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.56it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 72.16it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 73.24it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00,

2025-10-15 19:47:02,127 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 1개 데이터셋 순위 결정 완료
2025-10-15 19:47:02,128 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:47:02,129 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:47:02,130 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: NSW COVID-19 tests by location (discontinued)
Description: From 20 October 2023, COVID-19 datasets will no longer be updated. \\r\\nDetailed information is available in the fortnightly NSW Respiratory Surveillance Report: https://www.health.nsw.gov.au/Infectious/covid-19/Pages/reports.aspx. \\r\\nLatest national COVID-19 spread, vaccination and treatment metrics are available on the Australian Government Health website: https://www.health.gov.au/topics/covid-19/repo




2025-10-15 19:47:13,348 - src.agents.recommendation_agent - INFO - 추출된 JSON:
{
  "recommendations": [
    {
      "rank": 1,
      "candidate_id": "ATN0044151145",
      "reason": "코로나19와 관련된 의료관광에 대한 인식 변화를 분석한 연구로, 빅데이터 분석 방법과 의미 연결망 분석을 사용해 코로나19 전후의 트렌드를 비교했다.",
      "level": "강추"
    },
    {
      "rank": 2,
      "candidate_id": "ATN0037310409",
      "reason": "와인 소비자 인식 변화를 코로나19 전후로 비교한 연구로, 빅데이터와 텍스트 마이닝을 활용해 소비자 행동의 변화를 분석했다.",
      "level": "강추"
    },
    {
      "rank": 3,
      "candidate_id": "ATN0035592080",
      "reason": "대구 지역의 코로나19 유행에 대한 뉴스 데이터를 바탕으로 키워드 변화를 분석했으며, 사회적 반응과 감정 변화를 파악했다.",
      "level": "강추"
    },
    {
      "rank": 4,
      "candidate_id": "NART125448485",
      "reason": "WBE와 지리정보시스템을 활용한 감염병 확산 모니터링에 관한 연구로, 감염병 감시 체계에 대한 중요한 통찰을 제공한다.",
      "level": "추천"
    },
    {
      "rank": 5,
      "candidate_id": "JAKO200820258461929",
      "reason": "이소시안화물에 대한 보호장갑의 성능을 평가한 연구로, 화학 물질 노출에 대한 안전성을 분석하고 개인 보호 장비 선택에 도움을 준다.",
      "level": 

평가 진행:  94%|█████████▍| 16/17 [10:42<00:34, 34.53s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

[17/17] Police recorded crime trends in Victoria during the COVID-19 pandemic
   카테고리: 해외
2025-10-15 19:47:16,198 - src.agents.recommendation_agent - INFO - 추천 프로세스 시작: 데이터셋 ID b89d0c5d5891c5c80cd7a565ce8a3dc6
2025-10-15 19:47:16,301 - httpx - INFO - HTTP Request: GET https://dataon.kisti.re.kr/rest/api/search/dataset/b89d0c5d5891c5c80cd7a565ce8a3dc6?key=4936BC43D48603524DEDA2E2D56D6B46 "HTTP/1.1 200 200"
2025-10-15 19:47:16,304 - src.clients.dataon_client - INFO - Successfully retrieved metadata for dataset b89d0c5d5891c5c80cd7a565ce8a3dc6
2025-10-15 19:47:16,305 - src.clients.dataon_client - INFO - API Response:
{
  "response": {
    "elapsed time": "30 ms",
    "status": "200",
    "message": "OK",
    "total count": "1",
    "type": "json"
  },
  "records": {
    "svc_id": "b89d0c5d5891c5c80cd7a565ce8a3dc6",
    "ctlg_type": "02",
    "dataset_type": "02",
    "ctlg_type_pc": "dataset"


Batches: 100%|██████████| 1/1 [00:00<00:00, 83.42it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 61.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 93.87it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 79.30it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.07it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 81.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.87it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.93it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 93.64it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 61.35it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 94.35it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 80.09it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 92.00it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 74.81it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 91.71it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 161.77it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 95.58it/s]

Batches: 100%|██████████| 1/1 [00:00<00:00, 63

2025-10-15 19:47:20,899 - src.agents.recommendation_agent - INFO - 상위 25개 논문, 5개 데이터셋 순위 결정 완료
2025-10-15 19:47:20,900 - src.agents.recommendation_agent - INFO - LLM paper 추천 생성 시도 1/2
2025-10-15 19:47:20,901 - src.agents.recommendation_agent - INFO - LLM에게 전송하는 paper 프롬프트:
2025-10-15 19:47:20,902 - src.agents.recommendation_agent - INFO - # Task: Re-rank and Select Top 5 paper Recommendations
You are a research recommendation expert. Re-rank the candidates and select the top 5 most relevant items.
## Source Dataset:
Title: Police recorded crime trends in Victoria during the COVID-19 pandemic
Description: The Crime Statistics Agency (CSA) has released a research paper entitled Police-recorded crime trends in Victoria during the COVID-19 pandemic. The paper examines trends in criminal offences and family violence incidents to 30 June 2020, focusing on comparing the period from 1 April 2020 to 30 June 2020 with the same period in 2019.\\r\\nThis paper aims to examine whether and how the 

평가 진행: 100%|██████████| 17/17 [11:23<00:00, 40.20s/it]

   ✅ nDCG@3=0.0000, MRR@3=0.0000, Recall@3=0.0000 | nDCG@5=0.0000, MRR@5=0.0000, Recall@5=0.0000

✅ 평가 완료: 17/17개 케이스 성공





## 5. 평가 결과 분석 및 저장

### 5.1 평가 결과 저장 디렉토리 설정

In [10]:
# 타임스탬프 기반 결과 디렉토리 생성
timestamp = datetime.now().strftime('%Y%m%d%H%M')
eval_output_dir = os.path.join(project_root, 'figures', 'evaluation_results', timestamp)
os.makedirs(eval_output_dir, exist_ok=True)

print(f"📂 평가 결과 저장 경로: {eval_output_dir}")

# 추천 원본 결과 저장 
try:
    recommend_path = os.path.join(eval_output_dir, 'recommend_result.json')
    with open(recommend_path, 'w', encoding='utf-8') as f:
        json.dump(all_recommendations, f, indent=2, ensure_ascii=False)
    print(f"💾 recommend_result.json 저장 완료 → {recommend_path}")
except Exception as e:
    print(f"⚠️ recommend_result.json 저장 실패: {e}")

📂 평가 결과 저장 경로: /home/infidea/backup-data/paper-reco-agent/figures/evaluation_results/202510151948
💾 recommend_result.json 저장 완료 → /home/infidea/backup-data/paper-reco-agent/figures/evaluation_results/202510151948/recommend_result.json


### 5.2 전체 메트릭 계산

In [11]:
if not all_eval_results:
    print("⚠️  평가 결과가 없습니다")
else:
    # DataFrame 변환
    df_results = pd.DataFrame(all_eval_results)

    print("\n" + "=" * 80)
    print("📊 평균 평가 메트릭")
    print("=" * 80)

    # 메트릭 요약 계산
    metrics_summary = {}

    for k in k_values:
        print(f"\n📏 k={k} 결과:")
        print("-" * 80)

        k_metrics = {}

        for metric_type in ['overall', 'paper', 'dataset']:
            type_label = {'overall': '전체', 'paper': '논문', 'dataset': '데이터셋'}[metric_type]
            print(f"\n  {type_label}:")

            type_metrics = {}
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@{k}'
                if col_name in df_results.columns:
                    mean_val = df_results[col_name].mean()
                    std_val = df_results[col_name].std()
                    type_metrics[metric] = {'mean': mean_val, 'std': std_val}
                    print(f"    • {metric.upper():10s}: {mean_val:.4f} ± {std_val:.4f}")

            k_metrics[metric_type] = type_metrics

        metrics_summary[f'k{k}'] = k_metrics

    # 통계
    print("\n" + "=" * 80)
    print("📈 기본 통계")
    print("=" * 80)
    print(f"  평균 추천 논문 수: {df_results['num_predicted_papers'].mean():.2f}개")
    print(f"  평균 추천 데이터셋 수: {df_results['num_predicted_datasets'].mean():.2f}개")
    print(f"  평균 관련 논문 수: {df_results['num_relevant_papers'].mean():.2f}개")
    print(f"  평균 관련 데이터셋 수: {df_results['num_relevant_datasets'].mean():.2f}개")
    print(f"  평균 처리 시간: {df_results['processing_time_ms'].mean():.0f} ms")


📊 평균 평가 메트릭

📏 k=3 결과:
--------------------------------------------------------------------------------

  전체:
    • NDCG      : 0.0588 ± 0.2425
    • MRR       : 0.0588 ± 0.2425
    • RECALL    : 0.0042 ± 0.0173
    • PRECISION : 0.0196 ± 0.0808

  논문:
    • NDCG      : 0.0588 ± 0.2425
    • MRR       : 0.0588 ± 0.2425
    • RECALL    : 0.0084 ± 0.0346
    • PRECISION : 0.0196 ± 0.0808

  데이터셋:
    • NDCG      : 0.3283 ± 0.4656
    • MRR       : 0.3235 ± 0.4657
    • RECALL    : 0.1375 ± 0.2294
    • PRECISION : 0.2647 ± 0.4042

📏 k=5 결과:
--------------------------------------------------------------------------------

  전체:
    • NDCG      : 0.0588 ± 0.2425
    • MRR       : 0.0588 ± 0.2425
    • RECALL    : 0.0042 ± 0.0173
    • PRECISION : 0.0118 ± 0.0485

  논문:
    • NDCG      : 0.0588 ± 0.2425
    • MRR       : 0.0588 ± 0.2425
    • RECALL    : 0.0084 ± 0.0346
    • PRECISION : 0.0118 ± 0.0485

  데이터셋:
    • NDCG      : 0.3252 ± 0.4610
    • MRR       : 0.3235 ± 0.4657
    • REC

### 5.3 카테고리별 분석

In [12]:
if all_eval_results:
    print("\n" + "=" * 80)
    print("📊 카테고리별 메트릭 (k=5)")
    print("=" * 80)

    category_metrics = {}

    for category in sorted(df_results['category'].unique()):
        category_data = df_results[df_results['category'] == category]

        print(f"\n📁 {category} (n={len(category_data)}):")
        print("-" * 80)

        cat_metrics = {}
        for metric_type in ['overall', 'paper', 'dataset']:
            type_label = {'overall': '전체', 'paper': '논문', 'dataset': '데이터셋'}[metric_type]
            print(f"  {type_label}:")

            type_metrics = {}
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@5'
                if col_name in category_data.columns:
                    mean_val = category_data[col_name].mean()
                    type_metrics[metric] = mean_val
                    print(f"    • {metric.upper():10s}: {mean_val:.4f}")

            cat_metrics[metric_type] = type_metrics

        category_metrics[category] = cat_metrics


📊 카테고리별 메트릭 (k=5)

📁 국내 (n=15):
--------------------------------------------------------------------------------
  전체:
    • NDCG      : 0.0667
    • MRR       : 0.0667
    • RECALL    : 0.0048
    • PRECISION : 0.0133
  논문:
    • NDCG      : 0.0667
    • MRR       : 0.0667
    • RECALL    : 0.0095
    • PRECISION : 0.0133
  데이터셋:
    • NDCG      : 0.3685
    • MRR       : 0.3667
    • RECALL    : 0.1780
    • PRECISION : 0.2267

📁 해외 (n=2):
--------------------------------------------------------------------------------
  전체:
    • NDCG      : 0.0000
    • MRR       : 0.0000
    • RECALL    : 0.0000
    • PRECISION : 0.0000
  논문:
    • NDCG      : 0.0000
    • MRR       : 0.0000
    • RECALL    : 0.0000
    • PRECISION : 0.0000
  데이터셋:
    • NDCG      : 0.0000
    • MRR       : 0.0000
    • RECALL    : 0.0000
    • PRECISION : 0.0000


### 5.4 최종 결과 저장

**📁 저장되는 파일:**
1. **`EVALUATION_SUMMARY.txt`** ⭐ - 가장 먼저 봐야 할 요약 리포트
2. **`detailed_results.csv`** - 엑셀에서 열어볼 수 있는 상세 데이터
3. **`config.json`** - 실험 재현을 위한 설정 정보
4. **`metrics.json`** - 프로그램으로 읽을 수 있는 메트릭 데이터

In [13]:
if all_eval_results:
    print("\n💾 결과 저장 중...\n")

    # 1. 요약 리포트 생성 (가장 중요!)
    report_lines = []
    report_lines.append("=" * 80)
    report_lines.append("평가 요약 리포트")
    report_lines.append("=" * 80)
    report_lines.append("")
    report_lines.append(f"📅 평가 시각: {timestamp}")
    report_lines.append(f"🤖 LLM 모델: {settings.MODEL_NAME}")
    report_lines.append(f"🔍 임베딩 모델: {settings.EMBEDDING_MODEL}")
    report_lines.append(f"📊 테스트 케이스: {len(all_eval_results)}/{len(all_test_cases)} 성공")
    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("주요 성능 지표 (k=5)")
    report_lines.append("=" * 80)
    report_lines.append("")

    # k=5 전체 메트릭
    for metric in ['ndcg', 'mrr', 'recall', 'precision']:
        col_name = f'overall_{metric}@5'
        if col_name in df_results.columns:
            mean_val = df_results[col_name].mean()
            report_lines.append(f"  {metric.upper():10s} @5: {mean_val:.4f}")

    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("타입별 성능 (k=5)")
    report_lines.append("=" * 80)

    for metric_type in ['paper', 'dataset']:
        type_label = {'paper': '논문', 'dataset': '데이터셋'}[metric_type]
        report_lines.append("")
        report_lines.append(f"[{type_label}]")
        for metric in ['ndcg', 'mrr', 'recall', 'precision']:
            col_name = f'{metric_type}_{metric}@5'
            if col_name in df_results.columns:
                mean_val = df_results[col_name].mean()
                report_lines.append(f"  {metric.upper():10s}: {mean_val:.4f}")

    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("카테고리별 nDCG@5")
    report_lines.append("=" * 80)
    report_lines.append("")

    for category in sorted(df_results['category'].unique()):
        category_data = df_results[df_results['category'] == category]
        mean_val = category_data['overall_ndcg@5'].mean()
        report_lines.append(f"  {category:30s}: {mean_val:.4f} (n={len(category_data)})")

    report_lines.append("")
    report_lines.append("=" * 80)
    report_lines.append("전체 메트릭 (모든 k 값)")
    report_lines.append("=" * 80)

    for k in k_values:
        report_lines.append("")
        report_lines.append(f"k={k}:")
        report_lines.append("-" * 40)
        for metric_type in ['overall', 'paper', 'dataset']:
            type_label = {'overall': '전체', 'paper': '논문', 'dataset': '데이터셋'}[metric_type]
            report_lines.append(f"  [{type_label}]")
            for metric in ['ndcg', 'mrr', 'recall', 'precision']:
                col_name = f'{metric_type}_{metric}@{k}'
                if col_name in df_results.columns:
                    mean_val = df_results[col_name].mean()
                    std_val = df_results[col_name].std()
                    report_lines.append(f"    {metric.upper():10s}: {mean_val:.4f} ± {std_val:.4f}")

    report_lines.append("")
    report_lines.append("=" * 80)

    # 요약 리포트 저장
    summary_path = os.path.join(eval_output_dir, 'EVALUATION_SUMMARY.txt')
    with open(summary_path, 'w', encoding='utf-8') as f:
        f.write('\n'.join(report_lines))
    print(f"✅ 1. 요약 리포트 저장: EVALUATION_SUMMARY.txt")

    # 2. 상세 CSV 저장
    csv_path = os.path.join(eval_output_dir, 'detailed_results.csv')
    df_results.to_csv(csv_path, index=False, encoding='utf-8-sig')
    print(f"✅ 2. 상세 결과 CSV 저장: detailed_results.csv")

    # 3. 메트릭 JSON 저장
    all_metrics = {
        'summary': metrics_summary,
        'by_category': category_metrics,
        'individual_results': all_eval_results
    }

    metrics_path = os.path.join(eval_output_dir, 'metrics.json')
    with open(metrics_path, 'w', encoding='utf-8') as f:
        json.dump(all_metrics, f, indent=2, ensure_ascii=False)
    print(f"✅ 3. 메트릭 JSON 저장: metrics.json")

    print(f"\n" + "=" * 80)
    print(f"📂 모든 결과가 저장되었습니다:")
    print(f"   {eval_output_dir}")
    print(f"" + "=" * 80)
    print(f"\n⭐ 결과 확인: EVALUATION_SUMMARY.txt 파일을 먼저 읽어보세요!")

    # 요약 리포트 미리보기
    print(f"\n" + "=" * 80)
    print("📄 요약 리포트 미리보기:")
    print("=" * 80)
    print('\n'.join(report_lines[:50]))  # 처음 50줄만 표시
    if len(report_lines) > 50:
        print("\n... (전체 내용은 EVALUATION_SUMMARY.txt 참고) ...")
else:
    print("⚠️  저장할 결과가 없습니다")


💾 결과 저장 중...

✅ 1. 요약 리포트 저장: EVALUATION_SUMMARY.txt
✅ 2. 상세 결과 CSV 저장: detailed_results.csv
✅ 3. 메트릭 JSON 저장: metrics.json

📂 모든 결과가 저장되었습니다:
   /home/infidea/backup-data/paper-reco-agent/figures/evaluation_results/202510151948

⭐ 결과 확인: EVALUATION_SUMMARY.txt 파일을 먼저 읽어보세요!

📄 요약 리포트 미리보기:
평가 요약 리포트

📅 평가 시각: 202510151948
🤖 LLM 모델: Qwen/Qwen3-14B
🔍 임베딩 모델: intfloat/multilingual-e5-large
📊 테스트 케이스: 17/17 성공

주요 성능 지표 (k=5)

  NDCG       @5: 0.0588
  MRR        @5: 0.0588
  RECALL     @5: 0.0042
  PRECISION  @5: 0.0118

타입별 성능 (k=5)

[논문]
  NDCG      : 0.0588
  MRR       : 0.0588
  RECALL    : 0.0084
  PRECISION : 0.0118

[데이터셋]
  NDCG      : 0.3252
  MRR       : 0.3235
  RECALL    : 0.1571
  PRECISION : 0.2000

카테고리별 nDCG@5

  국내                            : 0.0667 (n=15)
  해외                            : 0.0000 (n=2)

전체 메트릭 (모든 k 값)

k=3:
----------------------------------------
  [전체]
    NDCG      : 0.0588 ± 0.2425
    MRR       : 0.0588 ± 0.2425

... (전체 내용은 EVALUATION_SUMMARY.tx

## 7. 평가 완료

**결과 파일 안내**
- 평가 결과는 `figures/evaluation_results/{timestamp}/` 디렉토리에 저장됩니다.

**파일 읽는 순서:**
1. `EVALUATION_SUMMARY.txt` ⭐⭐⭐
   - 가장 먼저 읽어야 할 파일
   - 주요 성능 지표와 카테고리별 결과 요약
   - 텍스트 에디터로 바로 열어볼 수 있음

2. `detailed_results.csv`
   - 엑셀이나 스프레드시트로 열어서 상세 분석
   - 각 테스트 케이스별 메트릭 포함
   - 필터링, 정렬, 차트 생성 가능

3. `recommend_result.json`
   - 평가 데이터 추천 결과

4. `metrics.json`
   - 프로그램으로 읽을 수 있는 메트릭 데이터
   - 자동화된 분석이나 비교에 사용

**주요 메트릭 설명**
- nDCG@k: 순위를 고려한 추천 품질 (0~1, 높을수록 좋음)
- MRR@k: 첫 번째 관련 항목의 순위 (0~1, 높을수록 좋음)
- Recall@k: 관련 항목 중 추천된 비율 (0~1, 높을수록 좋음)
- Precision@k: 추천 항목 중 관련된 비율 (0~1, 높을수록 좋음)