# 오전1_데모 — HuggingFace 테스트 버전

> OpenAI 크레딧 없이 동작 확인용 노트북입니다.
>
> **테스트 순서**
> 1. `[Step 1]` 셀 실행 → 패키지 설치 + TF 충돌 방지
> 2. `[Step 2]` 셀 실행 → PDF 로딩 + 청킹
> 3. `[Step 3]` 셀 실행 → **HuggingFace 임베딩 + 벡터DB** (모델 다운로드 발생)
> 4. `[Step 4]` 셀 실행 → 검색 테스트 (여기까지 성공하면 파이프라인 OK)
> 5. `[Step 5]` 셀 실행 → LLM 답변 (선택사항 — Google Gemini 무료 API 사용)


In [1]:
# ============================================================
# [Step 1] 환경 설정
# ============================================================

import os

# TF + protobuf 충돌 방지
os.environ["USE_TF"] = "0"
os.environ["USE_TORCH"] = "1"
os.environ["TF_CPP_MIN_LOG_LEVEL"] = "3"
os.environ["TOKENIZERS_PARALLELISM"] = "false"
os.environ["HF_HUB_DISABLE_SYMLINKS_WARNING"] = "1"  # symlink 경고 숨김

# ★ CDN 차단 우회: 미러 서버 사용 (기본값 cdn-lfs.huggingface.co → 미러로 교체)
os.environ["HF_ENDPOINT"] = "https://hf-mirror.com"

from pathlib import Path
from IPython.display import display, HTML

print("[Step 1 완료] ✅ 미러 서버 설정 완료 (hf-mirror.com)")
print("패키지는 이미 설치되어 있다고 가정 (Step 2로 진행)")

[Step 1 완료] ✅ 미러 서버 설정 완료 (hf-mirror.com)
패키지는 이미 설치되어 있다고 가정 (Step 2로 진행)


In [2]:
# ============================================================
# [Step 2] PDF 로딩 + 청킹
# ============================================================

from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter

# PDF 위치 자동 탐색
pdf_name = "제품사양서_스마트냉장고_RF9000.pdf"
found = False
for root, dirs, files in os.walk(str(Path.cwd())):
    if pdf_name in files:
        os.chdir(root)
        found = True
        break
if not found:
    print(f"⚠️  PDF를 찾지 못했습니다. 현재 위치: {os.getcwd()}")

# PDF 로딩
pdf_files = [
    "제품사양서_스마트냉장고_RF9000.pdf",
    "시험성적서_스마트냉장고_RF9000.pdf"
]
all_docs = []
for pdf_path in pdf_files:
    loader = PyPDFLoader(pdf_path)
    docs = loader.load()
    all_docs.extend(docs)
    print(f"  {pdf_path} → {len(docs)}페이지 로딩")
print(f"총 {len(all_docs)}페이지 로딩 완료")

# 청킹
splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
chunks = splitter.split_documents(all_docs)
print(f"{len(chunks)}개 청크로 분할")
print("[Step 2 완료]")

  제품사양서_스마트냉장고_RF9000.pdf → 4페이지 로딩
  시험성적서_스마트냉장고_RF9000.pdf → 3페이지 로딩
총 7페이지 로딩 완료
11개 청크로 분할
[Step 2 완료]


In [3]:
# ============================================================
# [Step 3] HuggingFace 임베딩 + 벡터DB 구축
#
# ⚠️  처음 실행 시 모델 파일 다운로드 (~90MB) 발생
#     회사망/방화벽으로 다운로드가 0%에서 멈추면
#     → cdn-lfs.huggingface.co 차단 문제입니다
#     → 이 셀이 성공하면 이후는 전부 OK
# ============================================================

from langchain_huggingface import HuggingFaceEmbeddings
from langchain_community.vectorstores import Chroma

print("임베딩 모델 로딩 중...")
print("(최초 실행 시 sentence-transformers/all-MiniLM-L6-v2 다운로드, ~90MB)")

# all-MiniLM-L6-v2: 가장 작고 빠른 모델 (~90MB)
# 한국어 정확도보다 '동작 확인'이 목적이므로 영어 모델 사용
embeddings = HuggingFaceEmbeddings(
    model_name="sentence-transformers/all-MiniLM-L6-v2",
    model_kwargs={"device": "cpu"}  # GPU 없어도 동작
)
print("임베딩 모델 로딩 완료!")

# 벡터DB 저장
vectorstore = Chroma.from_documents(chunks, embeddings)
retriever = vectorstore.as_retriever(search_kwargs={"k": 3})
print(f"벡터DB 구축 완료 ({len(chunks)}개 청크 저장)")
print("[Step 3 완료] ✅ HuggingFace 임베딩 정상 동작")

임베딩 모델 로딩 중...
(최초 실행 시 sentence-transformers/all-MiniLM-L6-v2 다운로드, ~90MB)
임베딩 모델 로딩 완료!
벡터DB 구축 완료 (11개 청크 저장)
[Step 3 완료] ✅ HuggingFace 임베딩 정상 동작


In [4]:
# ============================================================
# [Step 4] 검색 테스트
# 여기까지 성공 = RAG 파이프라인 구조 정상
# ============================================================

test_queries = [
    "RF9000의 총 용량은?",
    "소비전력은 얼마인가요?",
    "에너지효율 등급은?"
]

for query in test_queries:
    docs = retriever.invoke(query)
    print(f"\n질문: {query}")
    print(f"검색된 조각: {len(docs)}개")
    for i, doc in enumerate(docs, 1):
        src = doc.metadata.get("source", "").split("/")[-1]
        page = doc.metadata.get("page", 0) + 1
        print(f"  [{i}] {src} (p.{page}): {doc.page_content[:80]}...")

print("\n[Step 4 완료] ✅ 검색 정상 — HuggingFace 파이프라인 OK")
print("\n→ 여기까지 성공했으면 Step 5(LLM)로 진행 가능")


질문: RF9000의 총 용량은?
검색된 조각: 3개
  [1] 시험성적서_스마트냉장고_RF9000.pdf (p.1): (주)한국전자시험원
Korea Electronics Testing Institute (KETI)
시 험 성 적 서
Test Report
성적서 ...
  [2] 제품사양서_스마트냉장고_RF9000.pdf (p.1): (주)스마트홈테크
제 품 사 양 서
Product Specification
문서번호: SHT-PS-2024-0042    보안등급: 사내 대외비...
  [3] 제품사양서_스마트냉장고_RF9000.pdf (p.3): +/-0.5 도C
일반 식품 보관
냉동실
-24 ~ -15 도C
+/-1.0 도C
냉동 식품, 급속 냉동
특수실
-2 ~ 8 도C
+/-0.3 ...

질문: 소비전력은 얼마인가요?
검색된 조각: 3개
  [1] 제품사양서_스마트냉장고_RF9000.pdf (p.4): 4. 에러코드 일람
본 제품의 디스플레이 패널에 표시되는 에러코드와 의미는 다음과 같다.
코드
명칭
원인
조치
E1
냉장실 온도 이상
냉장실 센...
  [2] 제품사양서_스마트냉장고_RF9000.pdf (p.3): 3. 핵심 기능
3.1 FoodAI 식품인식 시스템
냉장실 내부에 설치된 3개의 고해상도 카메라(800만 화소)가 도어 개폐 시 자동으로 내부를...
  [3] 제품사양서_스마트냉장고_RF9000.pdf (p.2): 1. 제품 개요
스마트냉장고 RF9000은 (주)스마트홈테크의 프리미엄 4도어 냉장고로, AI 기반 식품 인식 기술과
정밀 온도 제어 시스템을 ...

질문: 에너지효율 등급은?
검색된 조각: 3개
  [1] 제품사양서_스마트냉장고_RF9000.pdf (p.4): 이물질 확인, 서비스 센터 점검
E9
전원부 이상
메인보드 전원 공급 불안정
전원 플러그 및 콘센트 확인
5. 유지보수 및 필터 교체
항목
주기...
  [2] 제품사양서_스마트냉장고_RF9000.pdf (p.4): 4. 에러코드 일람
본 제품의 디스플레이 패널에 표시

---
## [Step 5] LLM 연결 (선택사항)

Step 4까지 성공했으면 LLM만 연결하면 완성입니다.

| LLM 옵션 | 비용 | 준비 방법 |
|----------|------|----------|
| **Google Gemini** | 무료 (월 150만 토큰) | [aistudio.google.com](https://aistudio.google.com) 에서 API 키 발급 |
| HuggingFace Hub | 무료 (느림) | [huggingface.co/settings/tokens](https://huggingface.co/settings/tokens) 에서 토큰 발급 |

아래 셀은 **Google Gemini** 버전입니다.  
`GOOGLE_API_KEY` 발급 후 실행하세요.

In [4]:
# ============================================================
# [Step 5] LLM 연결 — google.genai 직접 사용 (langchain 래퍼 불필요)
# ============================================================

import os
os.environ["GOOGLE_API_KEY"] = "AIzaSyCIoAs-a9TNMYlkiBx3GeEddlUAns-tTT4"  # ← 키 입력

from google import genai as google_genai
from IPython.display import display, HTML

client = google_genai.Client(api_key=os.environ["GOOGLE_API_KEY"])

PROMPT_TEMPLATE = """당신은 제조업 기술문서 전문 AI입니다.
다음 문서 내용만을 참고하여 질문에 정확하게 답하세요.

문서 내용:
{context}

질문: {query}

답변 규칙:
1. 반드시 문서에 있는 정보만 사용하세요
2. 문서에 없으면 "해당 정보를 찾을 수 없습니다"라고 답하세요
3. 수치는 단위를 반드시 포함하세요

답변:"""

# 사용할 모델 자동 선택
GEMINI_MODEL = None
for candidate in ["gemini-2.0-flash-lite", "gemini-flash-lite-latest", "gemini-2.0-flash-001", "gemini-2.5-flash"]:
    try:
        r = client.models.generate_content(model=candidate, contents="테스트")
        GEMINI_MODEL = candidate
        print(f"✅ 모델 선택: {candidate}")
        break
    except Exception as e:
        print(f"  {candidate} 실패: {str(e)[:80]}")

if GEMINI_MODEL is None:
    raise RuntimeError("사용 가능한 모델이 없습니다. 에러 메시지를 확인하세요.")

def ask(query):
    docs = retriever.invoke(query)
    context = "\n\n".join(doc.page_content for doc in docs)
    prompt = PROMPT_TEMPLATE.format(context=context, query=query)

    response = client.models.generate_content(model=GEMINI_MODEL, contents=prompt)
    answer = response.text

    sources = []
    seen = set()
    for doc in docs:
        src = doc.metadata.get("source", "").split("/")[-1]
        page = doc.metadata.get("page", -1) + 1
        key = f"{src}_p{page}"
        if key not in seen:
            seen.add(key)
            snippet = doc.page_content[:80].replace("\n", " ").strip()
            sources.append((src, page, snippet))

    src_html = ""
    for i, (src, page, snippet) in enumerate(sources, 1):
        src_html += f"""
        <div style='margin:4px 0; padding:6px 12px; background:#f0e6ff; border-radius:6px; font-size:13px;'>
        <b>[{i}]</b> {src} — <b>p.{page}</b>
        <br><span style='color:#8888aa; font-size:11px;'>"...{snippet}..."</span>
        </div>"""

    html = f"""
    <div style='max-width:800px; font-family:Arial,sans-serif;'>
    <div style='background:#4A1A6B; color:white; padding:12px 20px; border-radius:10px 10px 0 0; font-size:14px;'>
    <b>Q:</b> {query}
    </div>
    <div style='background:white; border:2px solid #E8DEF8; padding:16px 20px;'>
    <div style='font-size:15px; line-height:1.6; color:#1A1A2E;'>
    <b>답변:</b><br>{answer}
    </div>
    </div>
    <div style='background:#f5f1fa; padding:12px 20px; border-radius:0 0 10px 10px; border:1px solid #E8DEF8; border-top:none;'>
    <div style='font-size:13px; color:#7B2FBE; font-weight:bold; margin-bottom:6px;'>참조 출처:</div>
    {src_html}
    </div>
    </div>
    """
    display(HTML(html))

print("\n[Step 5 완료] ✅ ask() 사용 가능")
print('사용법: ask("질문")')

  gemini-2.0-flash-lite 실패: 429 RESOURCE_EXHAUSTED. {'error': {'code': 429, 'message': 'You exceeded your cu
✅ 모델 선택: gemini-flash-lite-latest

[Step 5 완료] ✅ ask() 사용 가능
사용법: ask("질문")


In [5]:
# Step 5 완료 후 테스트
ask("RF9000의 총 용량은 얼마인가요?")

In [6]:
ask("RF9000의 판매 가격은 얼마인가요?")