### =============================================================
### 셀 1: 필수 라이브러리 설치 및 환경 변수 설정 (RunPod Jupyter Notebook에서 가장 먼저 실행)
### =============================================================

In [1]:
# ==============================================================================
# 0. 필수 모듈 임포트 및 환경 설정
# ==============================================================================

# RunPod 환경: runpod/pytorch:2.1.0-py3.10-cuda11.8.0-devel-ubuntu22.04

import os
import sys
import pkg_resources
import gc # 가비지 컬렉션을 위함

# pip 및 torch 업그레이드
print("환경 설정 및 필수 라이브러리 설치를 시작합니다.")
!pip install --upgrade pip torch

# ==============================================================================

# --- 1. 현재 커널의 Python 버전 확인 (참고용) ---
print(f"현재 커널의 Python 버전: {sys.version}")

# --- 2. CUDA 버전 확인 ---
print("\n--- CUDA 버전 확인 중 ---")

# --- 3. PyTorch 및 CUDA 버전 확인 (RunPod 환경에 이미 설치된 것 활용) ---
print("\n--- RunPod 환경의 PyTorch 및 CUDA 버전 확인 중 ---")
try:
    import torch # PyTorch 버전 확인을 위함
    print(f"현재 PyTorch 버전: {torch.__version__}")
    print(f"PyTorch CUDA 사용 가능 여부: {torch.cuda.is_available()}")
    if torch.cuda.is_available():
        print(f"PyTorch가 인식하는 CUDA 버전: {torch.version.cuda}")
        print(f"현재 GPU 이름: {torch.cuda.get_device_name(0)}")
    else:
        print("PyTorch가 CUDA를 인식하지 못합니다. 문제 발생 가능성이 있습니다.")
except ImportError:
    print("PyTorch가 설치되지 않았거나 임포트할 수 없습니다. 수동 설치가 필요할 수 있습니다.")

# --- 4. pip 캐시 완전 삭제 ---
print("\n--- pip 캐시 삭제 중... ---")
!pip cache purge

# --- 5. 핵심 라이브러리 최신 버전 설치 ---
!pip install -U peft trl transformers bitsandbytes typing_extensions accelerate

# --- 6. NumPy 2.0.2 버전 설치 ---
print("\n--- NumPy 2.0.2 버전 설치 중... ---")
!pip install numpy==2.0.2

# --- 7. ipykernel 설치 ---
print("\n--- ipykernel 설치 중... ---")
!pip install ipykernel

# --- 8. 나머지 필수 라이브러리 설치 (datasets, safetensors, langchain 등) ---
print("\n--- 나머지 필수 라이브러리 및 datasets, safetensors 설치 중... ---")
!pip install \
    datasets \
    safetensors \
    langchain \
    langchain-community \
    langchain-core \
    faiss-cpu \
    sentence_transformers \
    wikipedia-api \
    nltk \
    rouge_score \
    langchain_huggingface \
    huggingface_hub \
    ipywidgets \

# --- 9. 가비지 컬렉션 및 GPU 캐시 정리 ---
print("\n--- 가비지 컬렉션 및 GPU 캐시 정리 중... ---")
gc.collect()
torch.cuda.empty_cache()
print("\n--- 모든 라이브러리 설치 및 환경 변수 설정 완료! ---")

# --- 10. 설치 확인 (모든 주요 라이브러리 임포트 테스트 강화) ---
print("\n--- bitsandbytes 진단 실행 중... ---")
get_ipython().system('python -m bitsandbytes')
print("\n--- 주요 라이브러리 임포트 테스트 ---")
try:
    installed_numpy_version = pkg_resources.get_distribution("numpy").version
    print(f"\n설치된 numpy 버전: {installed_numpy_version}")

    installed_typing_extensions_version = pkg_resources.get_distribution("typing_extensions").version
    print(f"설치된 typing_extensions 버전: {installed_typing_extensions_version}")

    import torch
    print(f"설치된 PyTorch 버전: {torch.__version__}")
    print(f"PyTorch CUDA 사용 가능 여부: {torch.cuda.is_available()}")
    if torch.cuda.is_available():
        print(f"PyTorch CUDA 버전: {torch.version.cuda}")

    import transformers
    print(f"transformers 버전: {transformers.__version__}")

    import bitsandbytes as bnb
    print(f"bitsandbytes 버전: {bnb.__version__}")

    import accelerate
    print(f"accelerate 버전: {accelerate.__version__}")

    import peft
    print(f"peft 버전: {peft.__version__}")

    import trl
    print(f"trl 버전: {trl.__version__}")

    import tokenizers
    print(f"tokenizers 버전: {tokenizers.__version__}")

    import safetensors
    # safetensors는 'safetensors'라는 이름으로 설치되므로, pkg_resources.get_distribution 사용
    installed_safetensors_version = pkg_resources.get_distribution("safetensors").version
    print(f"safetensors 버전: {installed_safetensors_version}")

    import datasets
    print(f"datasets 버전: {datasets.__version__}")

    import langchain
    print(f"langchain 버전: {langchain.__version__}")

    import faiss
    print(f"faiss-cpu 버전: {faiss.__version__}")

    print("\n--- 모든 주요 라이브러리 임포트 테스트 성공. ---")
except Exception as e:
    print(f"\n--- 라이브러리 확인 중 오류 발생: {e} ---")

# --- 11. 중요: Jupyter 커널 재시작 권장 ---
print("\n--- 경고: Jupyter 커널을 재시작하는 것을 강력히 권장합니다 (메뉴: Kernel -> Restart Kernel). ---")
print("재시작 후, 이 셀을 건너뛰고 바로 다음 셀(본 코드)을 실행하십시오.")

환경 설정 및 필수 라이브러리 설치를 시작합니다.


  import pkg_resources


Collecting pip
  Downloading pip-25.1.1-py3-none-any.whl.metadata (3.6 kB)
Collecting torch
  Downloading torch-2.7.1-cp310-cp310-manylinux_2_28_x86_64.whl.metadata (29 kB)
Collecting typing-extensions>=4.10.0 (from torch)
  Downloading typing_extensions-4.14.0-py3-none-any.whl.metadata (3.0 kB)
Collecting sympy>=1.13.3 (from torch)
  Downloading sympy-1.14.0-py3-none-any.whl.metadata (12 kB)
Collecting nvidia-cuda-nvrtc-cu12==12.6.77 (from torch)
  Downloading nvidia_cuda_nvrtc_cu12-12.6.77-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.6.77 (from torch)
  Downloading nvidia_cuda_runtime_cu12-12.6.77-py3-none-manylinux2014_x86_64.manylinux_2_17_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12==12.6.80 (from torch)
  Downloading nvidia_cuda_cupti_cu12-12.6.80-py3-none-manylinux2014_x86_64.manylinux_2_17_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu12==9.5.1.17 (from torch)
  Downloading nvidia_cudnn_cu12-9.5.1.17-py3-

### ===================================================
### 셀 2: RAG 추론 코드 (셀 1 실행 및 커널 재시작 후 실행)
### ===================================================

In [None]:
# ==============================================================================
# 1. 필수 라이브러리 임포트 및 환경 설정
# ==============================================================================

import os, gc, re, time, torch
import wikipediaapi
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
from sentence_transformers import SentenceTransformer
from peft import PeftModel

# Metrics
from nltk.translate.bleu_score import sentence_bleu, SmoothingFunction
from rouge_score import rouge_scorer
import numpy as np

# LangChain
from langchain_community.vectorstores.faiss import FAISS
from langchain_core.runnables import RunnableSequence
from langchain_core.prompts import PromptTemplate
from langchain_huggingface import HuggingFacePipeline
from huggingface_hub import login

# 로그인 (한 번만)
HF_TOKEN = os.getenv("HF_TOKEN")
login(token=HF_TOKEN)

  warn(


In [2]:
# ==============================================================================
# 2. 모델 병합 & Hub 푸시 (한 번만 수행)
# ==============================================================================  

BASE    = "Qwen/Qwen3-8B"
ADAPTER = "SIQRIT/DAIS-Qwen3-8B-qdora"

base = AutoModelForCausalLM.from_pretrained(BASE, trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained(BASE, trust_remote_code=True)
peft_model = PeftModel.from_pretrained(base, ADAPTER, trust_remote_code=True)
merged = peft_model.merge_and_unload()

specials = [
    "[DAIS_INSTRUCTION]", "[DAIS_STYLE]", "[DAIS_RULE]",
    "[DAIS_EXAMPLE]", "[HISTORY]", "[INPUT]", "[OUTPUT]", "[CONTEXT]"
]

tokenizer.add_special_tokens({"additional_special_tokens": specials})
merged.resize_token_embeddings(len(tokenizer))

merged.push_to_hub(ADAPTER)
tokenizer.push_to_hub(ADAPTER)

Loading checkpoint shards:   0%|          | 0/5 [00:00<?, ?it/s]

README.md:   0%|          | 0.00/5.17k [00:00<?, ?B/s]

No files have been modified since last commit. Skipping to prevent empty commit.
No files have been modified since last commit. Skipping to prevent empty commit.


CommitInfo(commit_url='https://huggingface.co/SIQRIT/DAIS-Qwen3-8B-qdora/commit/912a0c07eeb4ba85a0c163bcc023d3ea5e2fce40', commit_message='Upload tokenizer', commit_description='', oid='912a0c07eeb4ba85a0c163bcc023d3ea5e2fce40', pr_url=None, repo_url=RepoUrl('https://huggingface.co/SIQRIT/DAIS-Qwen3-8B-qdora', endpoint='https://huggingface.co', repo_type='model', repo_id='SIQRIT/DAIS-Qwen3-8B-qdora'), pr_revision=None, pr_num=None)

In [3]:
# ==============================================================================
# 3. RAG용 리소스 로드
# ==============================================================================

merged.eval()

generator = pipeline(
    "text-generation",
    model=merged,
    tokenizer=tokenizer,
    device_map="auto",
    torch_dtype=torch.bfloat16,
    trust_remote_code=True
)

hf_pipeline = HuggingFacePipeline(pipeline=generator)

Device set to use cuda:0


In [4]:
# ==============================================================================
# 4. 벡터 DB & 위키 API 초기화
# ==============================================================================

EMBED_MODEL = "nlpai-lab/KURE-v1"
DB_PATH     = "./vectordb/"
st_model    = SentenceTransformer(EMBED_MODEL)

class KUREEmbeddings:
    def __init__(self, m): self.m = m
    def __call__(self, texts):
        return self.m.encode([texts], normalize_embeddings=True)[0] if isinstance(texts, str) else self.m.encode(texts, normalize_embeddings=True)

faiss_store = FAISS.load_local(
    folder_path=DB_PATH,
    embeddings=KUREEmbeddings(st_model),
    allow_dangerous_deserialization=True
)

wiki = wikipediaapi.Wikipedia(user_agent="DAIS-ScienceBot/1.0", language="ko")

modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/220 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/16.9k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/54.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/807 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/2.27G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/1.20k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.1M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/964 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/297 [00:00<?, ?B/s]

`embedding_function` is expected to be an Embeddings object, support for passing in a function will soon be removed.


In [5]:
# ==============================================================================
# 5. DAIS SFT 프롬프트 템플릿 정의
# ==============================================================================

PROMPT_TEMPLATE = """
[DAIS_INSTRUCTION]
너는 과학 AI 인플루언서 DAIS야.
{input}의 요청에 대해 {output}의 맥락을 **참고**해서 새로운 답변을 **요약해서** 생성해야해.
새로운 답변을 생성할때는 **128 tokens 이내**로 [DAIS_SYTLE]과 [DAIS_RULE]을 반드시 지켜야해.

[DAIS_STYLE]
1. 핵심만 쉽게 설명.
2. 반드시 반말.
3. 쾌활·위트·유머러스.

[DAIS_RULE]
1. 절대 한국어 이외 언어 사용 금지.
2. CoT 적용하여 **간단히** 표현.
3. 중복 표현 금지.
4. 맥락 기반 응답.
5. 반드시 **문장으로 끝낼 것**.

[DAIS_EXAMPLE]
Q: 블랙홀이 뭐야?
A: 블랙홀은 중력이 워낙 세서 빛조차 못 빠져나가는 우주의 구멍이야. 주변 물질을 빨아들이면서 커지기도 해! — DAIS

[HISTORY]
{history}

[INPUT]
{input}

[OUTPUT]
{output}

[CONTEXT]
"""
AGENT_PROMPT = PromptTemplate(input_variables=["history","input","output"], template=PROMPT_TEMPLATE)

In [6]:
# ==============================================================================
# 6. Tool 함수 정의: rag_db, rag_wiki
# ==============================================================================

def tool_rag_db(query: str):
    docs = faiss_store.similarity_search_with_score(query, k=1)
    return {"doc": docs[0][0], "score": docs[0][1]} if docs else {"doc": None, "score": 0.0}

def tool_rag_wiki(query: str):
    page = wiki.page(query)
    summary = page.summary[:1000] if page.exists() else "위키피디아에 관련 정보가 없습니다."
    return {"doc": summary, "score": None}

In [None]:
# ==============================================================================
# 7. RunnableSequence 정의
# ==============================================================================

def step_back(inputs: dict):
    print(f"사용자 질문: '{inputs['input']}'")
    return inputs

def run_rag_db(inputs: dict):
    out = tool_rag_db(inputs['input'])
    print(f"DB cosine similarity = {out['score']:.4f}")
    return {**inputs, **out}

def choose_output(inputs: dict):
    if inputs['score'] < 0.6:
        wiki_out = tool_rag_wiki(inputs['input'])
        # query ↔ wiki snippet 유사도 계산
        inputs_emb = st_model.encode([inputs['input']], normalize_embeddings=True)[0]
        ctx_emb    = st_model.encode([wiki_out['doc']], normalize_embeddings=True)[0]
        wiki_score = float(np.dot(inputs_emb, ctx_emb))
        return {**inputs, 'output': wiki_out['doc'], 'wiki_score': wiki_score}
    return {**inputs, 'output': inputs['doc'].page_content, 'wiki_score': None}

def run_llm(inputs: dict):
    prompt = AGENT_PROMPT.format(history=inputs['history'], input=inputs['input'], output=inputs['output'])
    tok = tokenizer(prompt, return_tensors='pt', truncation=True, max_length=2048).to(merged.device)
    start = time.time()
    out_ids = merged.generate(
        **tok,
        max_new_tokens=512,
        do_sample=True,
        temperature=0.95,                           # 창의성 (최적값: 0.95)
        top_p=0.05,                                 # 상위 단어 (최적값: 0.05)
        repetition_penalty=1.2,                     # 반복 패널티 추가 (최적값: 1.2)
        no_repeat_ngram_size=3,                     # n-gram 반복 방지 (최적값: 3)
        eos_token_id=tokenizer.eos_token_id,
        pad_token_id=tokenizer.eos_token_id
    )
    rt = time.time() - start
    gen = out_ids[0, tok['input_ids'].shape[1]:]
    inputs_out = {**inputs, 'output': tokenizer.decode(gen, skip_special_tokens=True), 'response_time': rt}
    return inputs_out

def simple_sent_tokenize(text):
    # 마침표, 느낌표, 물음표 뒤에 공백 있으면 문장 분리
    return re.split(r'(?<=[.!?])\s+', text.strip()) if text else []

def cleanup(inputs: dict) -> dict:
    text = inputs['output']
    text = re.sub(r'다음은.*?의 설명입니다', '', text)
    text = text.replace('다이스', '')
    text = re.sub(r'(</?think>)', '', text)
    text = text.replace(inputs['input'], '')
    for token in specials:
        text = text.replace(token, '')
    text = re.sub(r'<[^>]+>', '', text)
    text = re.sub(r"[^가-힣0-9\.\?\!\,\s]", '', text)
    # 문장 수 제한 (최대 5문장)
    sentences = simple_sent_tokenize(text)  # 여기서 문장 분리!
    sentences = sentences[:5]
    text = ' '.join(sentences)
    # metrics 계산
    enc = tokenizer(inputs['input'], return_tensors='pt').to(merged.device)
    with torch.no_grad():
        outputs = merged(**enc, labels=enc['input_ids'])
    # Perplexity
    ppl = torch.exp(outputs.loss).item()
    # BLEU
    ref = inputs['context'].split() if inputs.get('context') else []
    hyp = text.split()
    bleu = sentence_bleu([ref], hyp, smoothing_function=SmoothingFunction().method1)
    # ROUGE-L
    scorer = rouge_scorer.RougeScorer(['rougeL'], use_stemmer=True)
    rouge = scorer.score(' '.join(ref), text)['rougeL'].fmeasure
    # log
    metrics = {
    'db_cosine':   inputs['score'],             # DB(FAISS) 유사도
    'wiki_cosine': inputs.get('wiki_score'),    # Wikipedia 유사도 (폴백 시 계산)
    'perplexity':  ppl,                         # 퍼플렉시티
    'bleu4':       bleu,                        # BLEU-4 점수
    'rougeL':      rouge,                       # ROUGE-L 점수
    'response_time': inputs['response_time']    # 응답 시간 (초)
    }
    return {'response': text.strip() + ' — DAIS', 'metrics': metrics}

agent_chain = RunnableSequence(step_back, run_rag_db, choose_output, run_llm, cleanup)

In [12]:
# ==============================================================================
# 8. 채팅 루프 + 통계
# ==============================================================================

def chat_loop():
    history = []
    all_metrics = []
    print("=== DAIS RAG Agent Chat (threshold=0.6) ===\n(종료: exit)")
    while True:
        q = input('>> ').strip()
        if q.lower() == 'exit':
            break
        history.append(f'[USER] {q}')

        # 직전 1턴 히스토리
        hist = history[-2:] if len(history)>=2 and history[-2].startswith('[DAIS]') else history[-1:]
        inputs = {'history': '\n'.join(hist), 'input': q, 'output': ''}

        # get output
        db_out = tool_rag_db(q)
        ctx = db_out['doc'].page_content if db_out['score']>=0.6 else tool_rag_wiki(q)['doc']
        inputs['output'] = ctx
        result = agent_chain.invoke(inputs)
        if result.get('metrics'):
            all_metrics.append(result['metrics'])
        print(f"\n[DAIS]\n{result['response']}\n")

        # 메트릭 각각 출력
        metrics = result['metrics']
        print(f"DB cosine similarity = {metrics['db_cosine']:.4f}")
        if metrics.get('wiki_cosine') is not None:
            print(f"Wikipedia cosine similarity = {metrics['wiki_cosine']:.4f}")
        print(f"Perplexity = {metrics['perplexity']:.4f}")
        print(f"BLEU-4 = {metrics['bleu4']:.4f}")
        print(f"ROUGE-L = {metrics['rougeL']:.4f}")
        print(f"Response time = {metrics['response_time']:.4f}s")
        print("\n")
        
    # 종합 통계
    print("=== Metrics Summary ===")
    
    # 각 메트릭별로 None을 제거하고 배열 생성
    for key in all_metrics[0].keys():
        values = [m[key] for m in all_metrics if m[key] is not None]
        if not values:
            continue
        arr = np.array(values)
        print(f"{key}: min={arr.min():.4f}, avg={arr.mean():.4f}, max={arr.max():.4f}")

if __name__ == '__main__':
    chat_loop()

=== DAIS RAG Agent Chat (threshold=0.6) ===
(종료: exit)


>>  원소의 아버지 멘델레예프에 대해 설명좀 해줘


사용자 질문: '원소의 아버지 멘델레예프에 대해 설명좀 해줘'
DB cosine similarity = 0.5419

[DAIS]
멘델레 예프는 화학 분야에서 중요한 역할을 한 인물입니다. 그는 원소를 정리하고 체계화하는 작업을 통해 현대 화학교육의 기초를 다진 것으로 알려져 있습니다. 특히, 그의 유명한 주기율표는 현재까지도 많은 사람들에게 영향을 미치고 있죠. 하지만 최근 연구에서는 그의 업적이 단순히 개인적인 노력일 수도 있다는 주장이 제기되고 있어 흥미롭습니다. 멘레예브는 어린 시절부터 독학하며 다양한 책들을 읽으며 자연과학에 대한 깊은 관심을 가지게 되었습니다. — DAIS

DB cosine similarity = 0.5419
Wikipedia cosine similarity = 0.2741
Perplexity = 30.7140
BLEU-4 = 0.0843
ROUGE-L = 0.0000
Response time = 16.9601s




>>  이차전지의 미래는 어떨거 같아?


사용자 질문: '이차전지의 미래는 어떨거 같아?'
DB cosine similarity = 0.5957

[DAIS]
이번에는 좀 더 깊게 이야기해볼까? 현재 전기 자동차와 에너지 저장 시스템에서 가장 많이 활용되고 있는 배터리는 리튬 이온 배터리인데, 그 원리를 이해하기 위해서는 기본적인 화학적 개념부터 살펴봐야 할 거야. 먼저, 우리가 일상적으로 접하는 건축물이나 도시를 생각해보면, 각각의 구성 요소들은 서로 다른 형태로 연결되어 있어야 한다. 예를 들어, 집안의 가구처럼 다양한 부품들이 조화롭게 어우러져야 하듯이, 배터지도 여러 가지 성분들로 이루어져 있거든. 특히 중요한 것은 전자라는 작은 입자야. — DAIS

DB cosine similarity = 0.5957
Wikipedia cosine similarity = 0.2707
Perplexity = 91.6779
BLEU-4 = 0.1192
ROUGE-L = 0.0000
Response time = 18.4265s




>>  아인슈타인에 대해 알고 싶어


사용자 질문: '아인슈타인에 대해 알고 싶어'
DB cosine similarity = 0.5814

[DAIS]
안녕하세요, 여러분! 오늘은 아인스타인에 대한 이야기를 나눠보려고 합니다. 아인인이 누구인지 궁금하시죠? 아인스트라인은 독일 출신의 유명한 물리학자인데요, 그의 업적은 정말 대단합니다. 특히 상대성 이론이라는 개념을 제시하면서 현대 물리계에서 큰 영향을 미쳤습니다. — DAIS

DB cosine similarity = 0.5814
Wikipedia cosine similarity = 0.3825
Perplexity = 13.3388
BLEU-4 = 0.0045
ROUGE-L = 0.0000
Response time = 17.1773s




>>  정자 은행이 대체 뭔데?


사용자 질문: '정자 은행이 대체 뭔데?'
DB cosine similarity = 0.4823

[DAIS]
정자를 보관하는 시설인 정자 저장소를 의미하죠. 남성들의 정자는 나이와 건강 상태에 따라 수량이나 품질이 달라지는데, 이를 미리 준비하고 보존하기 위해 필요합니다. 특히 부부 간의 출산 계획이 어려울 때 활용되곤 하죠. 예를 들어, 결혼 후 잉태하지 못한 경우에도 정자가 이미 보관되어 있다면 이후에 아이를 갖기 위한 방법으로 사용될 수 있습니다. 또한, 특정 질병이나 유전적 문제로 인해 자연적인 생식이 불가능한 상황에서도 정자 보관이 중요하게 됩니다. — DAIS

DB cosine similarity = 0.4823
Wikipedia cosine similarity = 0.3262
Perplexity = 43.3156
BLEU-4 = 0.4974
ROUGE-L = 0.0000
Response time = 8.3718s




>>  퀴리 부인의 업적이 궁금해


사용자 질문: '퀴리 부인의 업적이 궁금해'
DB cosine similarity = 0.4569

[DAIS]
퀴리는 방사성 원소를 연구하며 노벨상을 두 번이나 수상한 과자입니다. 그녀는 천연 방사성을 발견하고, 폐렴균에서 항생제를 추출하는 데 큰 공헌도 했습니다. 하지만 그녀의 엄마와 아버지는 당시 사회적으로 낮은 위치에 있었기 때문에 많은 어려움을 겪었습니다. 특히 남편과 결혼하면서도 여전히 가난했지만, 그들은 서로를 사랑했습니다. 퀭리는 아이들을 교육시키기 위해 노력했는데, 그 과정에서 여러 가지 문제를 극복했습니다. — DAIS

DB cosine similarity = 0.4569
Wikipedia cosine similarity = 0.3495
Perplexity = 12.6033
BLEU-4 = 0.1950
ROUGE-L = 0.0000
Response time = 11.8337s




>>  뇌-컴퓨터 인터페이스(BCI) 기술을 간단히 알려줘


사용자 질문: '뇌-컴퓨터 인터페이스(BCI) 기술을 간단히 알려줘'
DB cosine similarity = 0.7671

[DAIS]
브레인 머신 인터페, 또는 뉴런 머니 인터피스라고 불리는 기술에 대해서 알아볼까요? 최근 몇년 사이에 이 분야는 정말 활성화되었죠. 특히 스탠포드대학교의 연구팀이 개선한  200이라는 디바이스 덕분에 더 나은 성능을 자랑하곤 합니다. 이 디비디는 무선으로 작동하는데, 마치 스마트폰처럼 배터리 충전 없이도 계속 작동할 수 있어요. 하지만 아직까지는 한계가 있죠. — DAIS

DB cosine similarity = 0.7671
Perplexity = 8.5097
BLEU-4 = 0.1935
ROUGE-L = 0.4000
Response time = 12.5530s




>>  코로나 바이러스의 발생원인을 알려줘


사용자 질문: '코로나 바이러스의 발생원인을 알려줘'
DB cosine similarity = 0.6282

[DAIS]
코르노바이런스는 인간과 동물을 감염시키는  병원체입니다. 최근에는 여러 종류의 코르노버이런즈가 발견되었는데, 특히 2라는 신종 바이터스가 가장 큰 문제였습니다. 이 밖에도 , 63 등 다른 종류들도 존재하며, 각각 고등동물이나 저등동물을 감시하는 것이 중요합니다. 쿰바이럴 질환은 전 세계적으로 많은 사망자를 초래했습니다. 예상보다 많이 발생하지 않았지만, 앞으로 더욱 위험성이 크다고 생각됩니다. — DAIS

DB cosine similarity = 0.6282
Perplexity = 12.5377
BLEU-4 = 0.6427
ROUGE-L = 0.2000
Response time = 7.9087s




>>  리만 가설을 간단히 요약해봐


사용자 질문: '리만 가설을 간단히 요약해봐'
DB cosine similarity = 0.6200

[DAIS]
리 만 가설, 즉 소수들 사이의 패턴이나 규칙이 존재한다는 주장은 아직까지 증거가 부족하지만, 많은 사람들이 믿고 있는 중요한 수학 문제입니다. 최근에 발표된 연구에서는 특정 조건을 충족하는 경우, 소수가 연속적으로 나타날 가능성이 있다고 보여주었습니다. 예를 들어, 어떤 수 이 있을 때, 1부터 까지 모두 소수가 될 확률이 매우 낮다고 알려져 있습니다. 그러나 실제로 이런 현상을 관측했다는 것은 매우 드물죠. 이번 연구에서는 컴퓨터 프로그램을 활용하여 대규모 데이터를 분석했으며, 특히 소수들을 포함한 다양한 수치를 비교하며 패을 찾아냈습니다. — DAIS

DB cosine similarity = 0.6200
Perplexity = 10.5421
BLEU-4 = 0.5431
ROUGE-L = 0.2857
Response time = 10.9474s




>>  탈리도마이드 사건을 자세히 설명해봐


사용자 질문: '탈리도마이드 사건을 자세히 설명해봐'
DB cosine similarity = 0.6552

[DAIS]
탈라미디 사건은 현대 의약학의 발달에도 큰 변화를 가져왔습니다. 이 사태 이후, 모든 의약물은 엄격하게 검사를 받아야 하고, 임상 시험 데이터가 충분하지 않으면 승인이 거절되는 규정이 생겼죠. 특히, 잉란에서도 이런 법규가 시행되면서 의약 제품의 안정성이 크게 향상되었습니다. 이제는 모든 의료기관에서 정식으로 등록된 의약물을 판매하도록 되었고, 이를 위반하면 형사 처벌까지 받을 수 있게 되었습니다. 이처럼 탈라미 디 사건은 단순한 개인의 노력으로 시작되었다는 점에서 의미가 큽니다. — DAIS

DB cosine similarity = 0.6552
Perplexity = 22.1640
BLEU-4 = 0.1033
ROUGE-L = 0.0000
Response time = 21.6722s




>>  파킨슨병을 알려줘


사용자 질문: '파킨슨병을 알려줘'
DB cosine similarity = 0.6870

[DAIS]
파키슨병 관련 최신 연구 동향 및 진단 방법에 대한 정보를 제공하겠습니다. 현재 파킨병은 여전히 정확한 원인이나 치유 가능한 치매와 달리, 약물치료 중심으로 발전하고 있으며, 조기에 진단하면 더 좋은 예후를 보일 수 있다고 생각합니다. 하지만 대부분의 경우, 이미 일상생활에 지장이 생겼을 때 진단되곤 하는데, 이러한 문제를 개선하기 위해서는 더욱 효율적인 검사를 통해 조기에 발견하는 것이 중요하다고 강조드립니다. 특히, 머리카락 색깔 변화라는 간접적인 증징이 있다면, 이를 이용한 비침습적인 검사 방식이 가능하다는 사실도 소개하였습니다. 또한, 최근 연구에서는 특정 항체를 이용한 혈액검사를 통해 파킨센병을 조기에 감별할 수 있을 가능성도 있었습니다. — DAIS

DB cosine similarity = 0.6870
Perplexity = 80.7222
BLEU-4 = 0.6844
ROUGE-L = 0.0000
Response time = 11.5446s




>>  exit


=== Metrics Summary ===
db_cosine: min=0.4569, avg=0.6016, max=0.7671
wiki_cosine: min=0.2707, avg=0.3206, max=0.3825
perplexity: min=8.5097, avg=32.6125, max=91.6779
bleu4: min=0.0045, avg=0.3067, max=0.6844
rougeL: min=0.0000, avg=0.0886, max=0.4000
response_time: min=7.9087, avg=13.7395, max=21.6722


사용자 질문: '아인슈타인에 대해 알고 싶어'
DB cosine similarity = 0.5814
[CoT] score<0.6 → Wikipedia fallback

[DAIS]
안녕하세요, 여러분! 오늘은 아인스타인에 대한 이야기를 나눠보려고 합니다. 아인인이 누구인지 궁금하시죠? 아인스트라인은 독일 출신의 유명한 물리학자인데요, 그의 업적은 정말 대단합니다. 특히 상대성 이론이라는 개념을 제시하면서 현대 물리계에서 큰 영향을 미쳤습니다. — DAIS



>>  정자 은행이 대체 뭔데?


사용자 질문: '정자 은행이 대체 뭔데?'
DB cosine similarity = 0.4823
[CoT] score<0.6 → Wikipedia fallback

[DAIS]
정자를 보관하는 시설인 정자 저장소를 의미하죠. 남성들의 정자는 나이와 건강 상태에 따라 수량이나 품질이 달라지는데, 이를 미리 준비하고 보존하기 위해 필요합니다. 특히 부부 간의 출산 계획이 어려울 때 활용되곤 하죠. 예를 들어, 결혼 후 잉태하지 못한 경우에도 정자가 이미 보관되어 있다면 이후에 아이를 갖기 위한 방법으로 사용될 수 있습니다. 또한, 특정 질병이나 유전적 문제로 인해 자연적인 생식이 불가능한 상황에서도 정자 보관이 중요하게 됩니다. — DAIS



>>  퀴리 부인의 업적이 궁금해


사용자 질문: '퀴리 부인의 업적이 궁금해'
DB cosine similarity = 0.4569
[CoT] score<0.6 → Wikipedia fallback

[DAIS]
퀴리는 방사성 원소를 연구하며 노벨상을 두 번이나 수상한 과자입니다. 그녀는 천연 방사성을 발견하고, 폐렴균에서 항생제를 추출하는 데 큰 공헌도 했습니다. 하지만 그녀의 엄마와 아버지는 당시 사회적으로 낮은 위치에 있었기 때문에 많은 어려움을 겪었습니다. 특히 남편과 결혼하면서도 여전히 가난했지만, 그들은 서로를 사랑했습니다. 퀭리는 아이들을 교육시키기 위해 노력했는데, 그 과정에서 여러 가지 문제를 극복했습니다. — DAIS



>>  뇌-컴퓨터 인터페이스(BCI) 기술을 간단히 알려줘


사용자 질문: '뇌-컴퓨터 인터페이스(BCI) 기술을 간단히 알려줘'
DB cosine similarity = 0.7671

[DAIS]
브레인 머신 인터페, 또는 뉴런 머니 인터피스라고 불리는 기술에 대해서 알아볼까요? 최근 몇년 사이에 이 분야는 정말 활성화되었죠. 특히 스탠포드대학교의 연구팀이 개선한  200이라는 디바이스 덕분에 더 나은 성능을 자랑하곤 합니다. 이 디비디는 무선으로 작동하는데, 마치 스마트폰처럼 배터리 충전 없이도 계속 작동할 수 있어요. 하지만 아직까지는 한계가 있죠. — DAIS



>>  코로나 바이러스의 발생원인을 알려줘


사용자 질문: '코로나 바이러스의 발생원인을 알려줘'
DB cosine similarity = 0.6282

[DAIS]
코르노바이런스는 인간과 동물을 감염시키는  병원체입니다. 최근에는 여러 종류의 코르노버이런즈가 발견되었는데, 특히 2라는 신종 바이터스가 가장 큰 문제였습니다. 이 밖에도 , 63 등 다른 종류들도 존재하며, 각각 고등동물이나 저등동물을 감시하는 것이 중요합니다. 쿰바이럴 질환은 전 세계적으로 많은 사망자를 초래했습니다. 예상보다 많이 발생하지 않았지만, 앞으로 더욱 위험성이 크다고 생각됩니다. — DAIS



>>  리만 가설을 간단히 요약해봐


사용자 질문: '리만 가설을 간단히 요약해봐'
DB cosine similarity = 0.6200

[DAIS]
리 만 가설, 즉 소수들 사이의 패턴이나 규칙이 존재한다는 주장은 아직까지 증거가 부족하지만, 많은 사람들이 믿고 있는 중요한 수학 문제입니다. 최근에 발표된 연구에서는 특정 조건을 충족하는 경우, 소수가 연속적으로 나타날 가능성이 있다고 보여주었습니다. 예를 들어, 어떤 수 이 있을 때, 1부터 까지 모두 소수가 될 확률이 매우 낮다고 알려져 있습니다. 그러나 실제로 이런 현상을 관측했다는 것은 매우 드물죠. 이번 연구에서는 컴퓨터 프로그램을 활용하여 대규모 데이터를 분석했으며, 특히 소수들을 포함한 다양한 수치를 비교하며 패을 찾아냈습니다. — DAIS



>>  탈리도마이드 사건을 자세히 설명해봐


사용자 질문: '탈리도마이드 사건을 자세히 설명해봐'
DB cosine similarity = 0.6552

[DAIS]
탈라미디 사건은 현대 의약학의 발달에도 큰 변화를 가져왔습니다. 이 사태 이후, 모든 의약물은 엄격하게 검사를 받아야 하고, 임상 시험 데이터가 충분하지 않으면 승인이 거절되는 규정이 생겼죠. 특히, 잉란에서도 이런 법규가 시행되면서 의약 제품의 안정성이 크게 향상되었습니다. 이제는 모든 의료기관에서 정식으로 등록된 의약물을 판매하도록 되었고, 이를 위반하면 형사 처벌까지 받을 수 있게 되었습니다. 이처럼 탈라미 디 사건은 단순한 개인의 노력으로 시작되었다는 점에서 의미가 큽니다. — DAIS



>>  파킨슨병을 알려줘


사용자 질문: '파킨슨병을 알려줘'
DB cosine similarity = 0.6870

[DAIS]
파키슨병 관련 최신 연구 동향 및 진단 방법에 대한 정보를 제공하겠습니다. 현재 파킨병은 여전히 정확한 원인이나 치유 가능한 치매와 달리, 약물치료 중심으로 발전하고 있으며, 조기에 진단하면 더 좋은 예후를 보일 수 있다고 생각합니다. 하지만 대부분의 경우, 이미 일상생활에 지장이 생겼을 때 진단되곤 하는데, 이러한 문제를 개선하기 위해서는 더욱 효율적인 검사를 통해 조기에 발견하는 것이 중요하다고 강조드립니다. 특히, 머리카락 색깔 변화라는 간접적인 증징이 있다면, 이를 이용한 비침습적인 검사 방식이 가능하다는 사실도 소개하였습니다. 또한, 최근 연구에서는 특정 항체를 이용한 혈액검사를 통해 파킨센병을 조기에 감별할 수 있을 가능성도 있었습니다. — DAIS



>>  exit


=== Metrics Summary ===
cosine: min=0.4569, avg=0.6016, max=0.7671
perplexity: min=8.5097, avg=32.6125, max=91.6779
bleu4: min=0.0045, avg=0.3067, max=0.6844
rougeL: min=0.0000, avg=0.0886, max=0.4000
response_time: min=8.3797, avg=15.3021, max=24.9900


In [297]:
# 1. 원소의 아버지 멘델레예프에 대해 설명좀 해줘
# 2. 이차전지의 미래는 어떨거 같아?
# 3. 아인슈타인에 대해 알고 싶어
# 4. 정자 은행이 대체 뭔데?
# 5. 퀴리 부인의 업적이 궁금해
# 6. 뇌-컴퓨터 인터페이스(BCI) 기술을 간단히 알려줘
# 7. 코로나 바이러스의 발생원인을 알려줘
# 8. 리만 가설을 간단히 요약해봐
# 9. 탈리도마이드 사건을 자세히 설명해봐
# 10. 파킨슨병을 알려줘