# 31차시: 멀티 LLM 교차 검증 (Cross-Validation)

## 학습 목표
- 두 개의 LLM (OpenAI, Gemini)에게 **동일한 분석 요청**
- 두 LLM의 **답변 일치/불일치** 분석
- 상위 모델(gpt-5)이 **비교 평가** 수행

## 학습 내용
1. LLM 교차 검증이란?
2. 두 LLM Agent 생성 (동일 Tool)
3. 병렬 분석 실행
4. Judge LLM으로 비교 분석

## 이전 차시 연계
- 28차시: ChatGPT, Gemini API 설정
- 29차시: 재무제표 LLM 분석
- 30차시: LangChain Agent 기초

In [1]:
!pip install -Uq langchain langchain-openai langchain-google-genai langgraph python-dotenv requests beautifulsoup4 lxml pykrx

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m61.1/61.1 kB[0m [31m1.7 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m53.3/53.3 kB[0m [31m1.9 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m45.2/45.2 kB[0m [31m809.8 kB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m84.7/84.7 kB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m65.6/65.6 kB[0m [31m2.3 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m64.7/64.7 kB[0m [31m1.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m107.7/107.7 kB[0m [31m3.7 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.2/2.2 MB[0m [31m20.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

In [2]:
import os
import pandas as pd
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
from dotenv import load_dotenv
from IPython.display import display, Markdown

# .env 파일 로드
try:
    from google.colab import files
    print("[.env 파일을 업로드해주세요]")
    uploaded = files.upload()
except ImportError:
    pass

load_dotenv()

[.env 파일을 업로드해주세요]


Saving .env to .env


True

In [3]:
# API 키 확인
OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')
GEMINI_API_KEY = os.getenv('GOOGLE_API_KEY')

if OPENAI_API_KEY:
    print(f"[OpenAI API 키 로드 완료]: {OPENAI_API_KEY[:10]}...")
else:
    print("[OpenAI API 키 미설정]")

if GEMINI_API_KEY:
    print(f"[Gemini API 키 로드 완료]: {GEMINI_API_KEY[:10]}...")
else:
    print("[Gemini API 키 미설정]")

[OpenAI API 키 로드 완료]: sk-FeQOBhF...
[Gemini API 키 로드 완료]: AIzaSyBARt...


---
## 1. LLM 교차 검증이란?

### 개념
여러 LLM에게 **동일한 질문**을 하고, 답변을 **비교 분석**하여 신뢰도를 높이는 방법

### 왜 필요한가?
- LLM마다 학습 데이터, 추론 방식이 다름
- 단일 LLM의 답변만으로는 **편향** 가능성 존재
- 여러 애널리스트의 의견을 비교하는 것과 동일한 원리

### 구조
```
사용자: "삼성전자를 종합 분석해줘"
       ↓
┌─────────────────┐    ┌─────────────────┐
│   OpenAI Agent                   │    │   Gemini Agent                   │
│   (gpt-5-mini)                       │    │(gemini-2.5-flash)                │
└────────┬────────┘    └────────┬────────┘
                       ↓                                                   ↓
                [분석 결과 A]                               [분석 결과 B]
                       └──────────┬───────────┘
                                                   ↓
                                   ┌───────────────┐
                                   │        Judge LLM             │
                                   │            (gpt-5)                │
                                   └───────┬───────┘
                                                        ↓
                                     [일치/불일치 분석 리포트]
```


---
## 2. Tool 정의 (공통)

두 Agent가 동일한 Tool을 사용합니다.

In [4]:
# 공통 설정
HEADERS = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'
}

from langchain.tools import tool

def get_company_name(stock_code):
    """종목코드로 회사명 조회"""
    url = f"https://finance.naver.com/item/main.nhn?code={stock_code}"
    try:
        response = requests.get(url, headers=HEADERS)
        soup = BeautifulSoup(response.text, 'html.parser')
        name_tag = soup.select_one('div.wrap_company h2 a')
        if name_tag:
            return name_tag.text.strip()
        return stock_code
    except Exception:
        return stock_code

In [5]:
# Tool 1: 재무제표
@tool
def fetch_financial_data(stock_code: str) -> str:
    """
    종목코드로 네이버 금융에서 재무제표를 가져옵니다.
    예시: fetch_financial_data("005930") -> 삼성전자 재무제표
    """
    print(f"  [Tool] 재무제표 수집: {stock_code}")
    url = f"https://finance.naver.com/item/main.nhn?code={stock_code}"

    try:
        tables = pd.read_html(url, encoding='euc-kr')
        financial_table = None
        for table in tables:
            table_str = str(table.columns) + str(table.values)
            if '매출액' in table_str or '영업이익' in table_str:
                financial_table = table
                break

        if financial_table is None:
            return f"{stock_code}: 재무제표를 찾을 수 없습니다."

        company_name = get_company_name(stock_code)
        lines = [f"[{company_name} 재무제표]", financial_table.to_string()]
        return "\n".join(lines)
    except Exception as e:
        return f"재무제표 수집 오류: {e}"

In [6]:
# Tool 2: 뉴스 헤드라인
@tool
def fetch_news_headlines(stock_code: str) -> str:
    """
    종목코드로 해당 기업의 최신 뉴스 헤드라인을 가져옵니다.
    """
    print(f"  [Tool] 뉴스 수집: {stock_code}")
    url = f"https://finance.naver.com/item/news.naver?code={stock_code}"

    try:
        response = requests.get(url, headers=HEADERS)
        soup = BeautifulSoup(response.text, 'html.parser')

        news_items = soup.select('table.type5 tr')
        headlines = []

        for item in news_items[:7]:
            title_tag = item.select_one('a.tit')
            date_tag = item.select_one('td.date')
            if title_tag:
                title = title_tag.get_text(strip=True)
                date = date_tag.get_text(strip=True) if date_tag else ""
                headlines.append(f"- [{date}] {title}")

        if not headlines:
            return f"{stock_code}: 뉴스를 찾을 수 없습니다."

        company_name = get_company_name(stock_code)
        return f"[{company_name} 최신 뉴스]\n" + "\n".join(headlines)
    except Exception as e:
        return f"뉴스 수집 오류: {e}"

In [7]:
# Tool 3: 주가 데이터
@tool
def fetch_stock_price(stock_code: str) -> str:
    """
    종목코드로 최근 30일간 주가 데이터를 가져옵니다.
    """
    print(f"  [Tool] 주가 수집: {stock_code}")

    try:
        from pykrx import stock

        end_date = datetime.now().strftime('%Y%m%d')
        start_date = (datetime.now() - timedelta(days=45)).strftime('%Y%m%d')

        df = stock.get_market_ohlcv(start_date, end_date, stock_code)

        if df.empty:
            return f"{stock_code}: 주가 데이터를 찾을 수 없습니다."

        df = df.tail(30)

        company_name = get_company_name(stock_code)
        latest_price = df['종가'].iloc[-1]
        price_30d_ago = df['종가'].iloc[0]
        return_30d = (latest_price - price_30d_ago) / price_30d_ago * 100
        high_30d = df['고가'].max()
        low_30d = df['저가'].min()

        lines = [
            f"[{company_name} 주가 현황 (최근 30거래일)]",
            f"- 현재가: {latest_price:,.0f}원",
            f"- 30일 수익률: {return_30d:+.2f}%",
            f"- 30일 최고가: {high_30d:,.0f}원",
            f"- 30일 최저가: {low_30d:,.0f}원",
        ]

        return "\n".join(lines)
    except Exception as e:
        return f"주가 수집 오류: {e}"

In [8]:
# 공통 Tool 목록
tools = [fetch_financial_data, fetch_news_headlines, fetch_stock_price]
print(f"[공통 Tool]: {[t.name for t in tools]}")

[공통 Tool]: ['fetch_financial_data', 'fetch_news_headlines', 'fetch_stock_price']


---
## 3. 두 LLM Agent 생성

In [9]:
from langchain.chat_models import init_chat_model
from langchain.agents import create_agent
from langgraph.checkpoint.memory import InMemorySaver

print("[LLM 모델 초기화]")
print("=" * 60)

# 분석용 모델 (하위 모델)
model_openai = init_chat_model("gpt-5-mini", model_provider="openai")
print("Agent 1: gpt-5-mini (OpenAI)")

model_gemini = init_chat_model("gemini-2.5-flash", model_provider="google_genai")
print("Agent 2: gemini-2.5-flash (Google)")

# 비교 분석용 모델 (상위 모델)
model_judge = init_chat_model("gpt-5", model_provider="openai")
print("Judge: gpt-5 (OpenAI)")

[LLM 모델 초기화]
Agent 1: gpt-5-mini (OpenAI)
Agent 2: gemini-2.5-flash (Google)
Judge: gpt-5 (OpenAI)


In [10]:
# 시스템 프롬프트 (두 Agent 공통)
system_prompt = """당신은 15년 경력의 CFA 자격증을 보유한 투자 분석 전문가입니다.

사용자 질문에 따라 적절한 도구를 선택하여 분석합니다:
- 재무제표 분석 요청 → fetch_financial_data
- 뉴스/이슈 확인 요청 → fetch_news_headlines
- 주가 추이 확인 요청 → fetch_stock_price
- "종합 분석" 요청 → 3개 도구 모두 활용

분석 결과를 종합하여 다음을 포함한 인사이트를 제공합니다:
- 재무 상태 평가
- 최근 이슈 및 시장 반응
- 주가 추이와 투자 포인트
- 리스크 요인

한국어로 답변합니다."""

In [11]:
# 두 Agent 생성 (동일 Tool, 다른 LLM)
agent_openai = create_agent(
    model=model_openai,
    tools=tools,
    system_prompt=system_prompt,
    checkpointer=InMemorySaver()
)
print("[OpenAI Agent 생성 완료]")

agent_gemini = create_agent(
    model=model_gemini,
    tools=tools,
    system_prompt=system_prompt,
    checkpointer=InMemorySaver()
)
print("[Gemini Agent 생성 완료]")

[OpenAI Agent 생성 완료]
[Gemini Agent 생성 완료]


---
## 4. 병렬 분석 실행

동일한 질문을 두 Agent에게 전달하고 답변을 수집합니다.

In [12]:
def analyze_with_both_agents(question):
    """두 Agent에게 동일한 질문을 하고 답변 수집"""
    print(f"\n[질문] {question}")
    print("=" * 60)

    config_openai = {"configurable": {"thread_id": "openai_session"}}
    config_gemini = {"configurable": {"thread_id": "gemini_session"}}

    # OpenAI Agent 분석
    print("\n[1] OpenAI (gpt-5-mini) 분석 중...")
    result_openai = agent_openai.invoke(
        {"messages": [{"role": "user", "content": question}]},
        config_openai
    )
    answer_openai = result_openai["messages"][-1].content

    # Gemini Agent 분석
    print("\n[2] Gemini (gemini-2.5-flash) 분석 중...")
    result_gemini = agent_gemini.invoke(
        {"messages": [{"role": "user", "content": question}]},
        config_gemini
    )
    answer_gemini = result_gemini["messages"][-1].content

    return answer_openai, answer_gemini

In [13]:
# 삼성전자 종합 분석 요청
question = "삼성전자(005930)를 종합 분석해줘. 재무제표, 최근 뉴스, 주가 추이를 모두 확인해줘."

answer_openai, answer_gemini = analyze_with_both_agents(question)


[질문] 삼성전자(005930)를 종합 분석해줘. 재무제표, 최근 뉴스, 주가 추이를 모두 확인해줘.

[1] OpenAI (gpt-5-mini) 분석 중...
  [Tool] 재무제표 수집: 005930
  [Tool] 뉴스 수집: 005930
  [Tool] 주가 수집: 005930

[2] Gemini (gemini-2.5-flash) 분석 중...
  [Tool] 재무제표 수집: 005930
  [Tool] 뉴스 수집: 005930
  [Tool] 주가 수집: 005930


In [14]:
# OpenAI 분석 결과
print("[OpenAI (gpt-5-mini) 분석 결과]")
print("=" * 60)
display(Markdown(answer_openai))

[OpenAI (gpt-5-mini) 분석 결과]


요청하신 대로 재무제표·최근 뉴스·주가(30일)를 모두 확인하여 삼성전자(005930)를 종합 분석해 드립니다. (데이터 출처: 제공된 네이버 금융 스냅샷 및 30일 주가 요약)

요약(한줄)
- 2023년 반도체 경기 영향으로 실적이 급락했다가 2024년에 의미 있게 회복했고, 최근 30일간 주가가 큰 폭 반등(+33%)하여 시장의 기대가 높아진 상태입니다. 재무건전성은 양호하나 반도체 업황·밸류에이션 변동성이 핵심 리스크입니다.

1) 재무 상태 평가 (주요 지표 요약)
- 매출: 2023년에 2022년 대비 감소(약 2,589,355 → 2023), 2024년에 회복(약 3,008,709). (표의 연도별 수치 참조)
- 영업이익: 2022년 433,766 → 2023년 대폭 하락 65,670 → 2024년 327,260로 회복. (반도체 사이클 영향 반영)
- 당기순이익: 2022년 556,541 → 2023년 154,871 → 2024년 344,514로 개선.
- 이익률: 2024년 영업이익률 약 10.9%, 순이익률 약 11.5%로 정상화(2023년 저점 대비 개선).
- 수익성 지표: 2024년 ROE 약 9.0%(2022년 17% → 2023년 4.2% → 2024년 회복). EPS(원): 2024년 약 4,950원.
- 재무건전성: 부채비율 약 27.9% 수준으로 낮아 안정적(레버리지 부담 적음). BPS(원): 2024년 약 57,981원으로 장부가치 대비 주가(아래 밸류에이션 참조) 확인 필요.
- 배당: 주당배당금은 연도별로 거의 유지(예: 2024년 약 1,446원 수준), 배당수익률은 2024년 기준 약 2.7% 수준(표상).

해석 요약:
- 회사는 2023년 메모리 등 업황 약세로 실적이 크게 악화됐으나 2024년에 수요 회복 등으로 매출·이익이 상당 부분 회복됨.
- 재무구조(낮은 부채비율, 안정적 배당 정책)는 양호. 다만 이익의 변동폭이 크므로 이익의 지속성(업황 의존성)에 유의해야 함.

2) 최근 이슈 및 시장 반응 (뉴스·심리)
- 제공된 뉴스 헤드라인 검색에서는 별도 주요 헤드라인을 자동 수집하지 못했습니다(도구 한계). 다만 시장 반응은 주가에 반영되어 있음(아래).
- 최근 30일 시장 반응: 현재가 128,500원, 30일 수익률 +33.16%, 30일 최고 128,500원·최저 94,500원 — 단기간 강한 랠리 발생.
- 해석: 주가의 급등은 (가능성 있는) 실적 개선 기대, 반도체 업황 개선 신호, 또는 외부 모멘텀(예: 글로벌 AI 수요 기대·업종 랠리·대형 매수 등)에 따른 수급 쏠림의 결과일 수 있음. 구체 원인은 개별 뉴스·기업 공시(실적·가이던스·자사주·배당 변경 등)를 추가로 확인할 필요가 있음.

3) 주가 추이와 투자 포인트
- 단기(30일) 성과: +33% 급등 — 투자자 관심이 집중되는 구간.
- 밸류에이션(제공표 기준):
  - 2024년 실적 기준 PER 약 10.8배(표준치), EPS 회복세로 PER이 낮은 편에 속함(역사적·업종 비교 필요).
  - PBR은 2024년에 약 0.92배(장부가치 대비 저평가) → 다만 최근 주가 상승으로 단기적으로 밸류에이션이 불안정(표상 분기별 PER 변동성 큼).
- 투자 포인트(관찰 포인트):
  1. 반도체(메모리) 가격·수요 추이: 실적의 핵심 동인. 서버/AI 수요, 재고 조정 여부 관찰.
  2. 스마트폰·디스플레이·기타 사업부 실적과 가이던스(비메모리 성장성).
  3. 자본환원(배당·자사주 소각) 정책 변화 및 대규모 투자(설비투자 CAPEX) 계획.
  4. 글로벌 거시(환율·금리)와 지정학적 리스크(공급망 영향).

4) 리스크 요인
- 업황 싸이클 리스크: 메모리 등 핵심 부문은 경기·수요에 민감해 실적 변동성이 큼.
- 재고·가격 리스크: 고객사의 재고 조정 또는 메모리 가격 급락 시 이익 급감 가능.
- 밸류에이션 리스크: 단기 급등 후 밸류에이션(특히 PER)이 높아지면 조정 위험 존재.
- 거시·정책 리스크: 환율 변동, 금리 상승, 글로벌 수요 약화, 무역·규제 이슈 등.
- 경쟁·기술 리스크: 파운드리·비메모리 경쟁 심화, 기술 투자 실패 시 장기 성장 저해.

결론 및 권고
- 펀더멘털(재무건전성, 현금흐름, 배당)은 양호한 편이며 2024년에 실적이 회복된 점은 긍정적입니다. 다만 실적의 회복이 반도체 업황에 크게 의존하므로 업황 신호(메모리 가격·수요 지속성)와 분기 실적·가이던스, 자본정책 공시를 모니터링해야 합니다.
- 투자성향별 제안:
  - 중장기 가치 투자자: 밸류에이션이 합리적일 때(예: 실적 대비 PER이 합리적 구간 또는 분할 매수 기회) 관심 가질 만함.
  - 단기 트레이더: 최근 급등 구간은 변동성·조정 위험이 크므로 손절·비중 관리 필요.
  - 보수적 투자자: 업황 리스크가 남아 있으므로 추가 확인(분기 실적, 메모리 가격 동향) 후 진입 권장.

원하시면 다음을 추가로 해드리겠습니다.
- 최근 3개월·6개월 주가 차트와 거래량 분석(추세·지지·저항 레벨 도출)
- 최신 공시·분기실적 전문(어떤 항목이 개선되었는지 상세 분석)
- 관련 업종(메모리/파운드리) 주요 리포트 요약 및 경쟁사 비교

어떤 추가 분석을 원하시나요?

In [24]:
# Gemini 분석 결과
print("[Gemini (gemini-2.5-flash) 분석 결과]")
print("=" * 60)
display(Markdown(answer_gemini[0]['text']))

[Gemini (gemini-2.5-flash) 분석 결과]


## 삼성전자(005930) 종합 분석

CFA 15년 경력의 투자 분석 전문가로서 삼성전자(005930)에 대한 종합적인 분석 결과를 제공합니다.

### 1. 재무 상태 평가

삼성전자는 2023년 어려운 한 해를 보냈으나, 2024년과 2025년에는 매출액, 영업이익, 당기순이익 모두 상당한 회복이 예상됩니다.

*   **매출액 및 수익성:** 2023년 매출액은 전년 대비 감소했으나, 2024년과 2025년에는 각각 3,008,709억 원, 3,288,209억 원으로 크게 증가할 것으로 전망됩니다. 영업이익 또한 2023년 65,670억 원에서 2024년 327,260억 원, 2025년 399,041억 원으로 급증하며 수익성이 대폭 개선될 것으로 보입니다. 영업이익률도 2023년 2.54%에서 2024년 10.88%, 2025년 12.14%로 회복될 것으로 예상됩니다.
*   **재무 건전성:** 2023년 기준 부채비율은 25.36%, 당좌비율은 189.46%, 유보율은 39114.28%로 매우 안정적인 재무 구조를 유지하고 있습니다. 이는 회사의 뛰어난 유동성과 재무적 안정성을 보여주며, 향후 투자 및 위기 대응 능력에 긍정적인 요소로 작용합니다.
*   **주당순이익(EPS):** 2023년 2,131원에서 2024년 4,950원, 2025년 5,727원으로 크게 증가할 것으로 예상되어, 주주 가치도 향상될 것으로 기대됩니다.

종합적으로 볼 때, 삼성전자는 일시적인 실적 부진을 겪었으나, 핵심 사업의 회복과 견고한 재무 기반을 바탕으로 향후 실적 턴어라운드가 강력하게 기대되는 상황입니다.

### 2. 최근 이슈 및 시장 반응

현재 확인된 최신 뉴스 헤드라인은 없습니다. 일반적으로 삼성전자와 같은 대기업은 다양한 언론을 통해 뉴스가 실시간으로 보도되므로, 이는 시스템적인 일시적 제한으로 해석될 수 있습니다.

다만, 주가 추이를 통해 시장의 반응을 유추해 볼 수 있습니다. 최근 주가 상승은 반도체 업황 회복에 대한 기대감, 고대역폭 메모리(HBM) 등 AI 반도체 시장에서의 경쟁력 강화, 그리고 스마트폰 등 주요 제품의 수요 회복 전망 등이 복합적으로 작용한 결과로 보입니다.

### 3. 주가 추이와 투자 포인트

*   **주가 현황:** 최근 30거래일 동안 삼성전자의 주가는 **128,500원**으로, 30일 수익률은 **+33.16%**를 기록했습니다. 30일 최고가와 현재가가 동일하여 최근 강한 상승세를 보였음을 알 수 있습니다. 30일 최저가는 94,500원이었습니다.
*   **투자 포인트:** 최근 주가의 급등은 시장이 삼성전자의 실적 턴어라운드를 강하게 기대하고 있음을 명확히 보여줍니다. 특히, 2024년과 2025년의 예상되는 큰 폭의 이익 성장은 현재 주가 상승의 주요 동력으로 작용하고 있습니다. 반도체 부문의 회복 가시화, 파운드리 경쟁력 강화, 그리고 AI 시대를 맞아 신기술 개발에 대한 기대감 등이 긍정적인 투자 포인트로 작용할 수 있습니다. EPS 전망치 상향 조정 또한 장기적인 주주 가치 상승에 대한 기대를 높입니다.

### 4. 리스크 요인

*   **반도체 업황 변동성:** 삼성전자의 실적은 메모리 반도체(DRAM, NAND) 시장 상황에 크게 좌우됩니다. 예상보다 업황 회복이 더디거나, 공급 과잉 이슈가 재발할 경우 실적 및 주가에 부정적인 영향을 미 미칠 수 있습니다.
*   **글로벌 경기 침체:** 글로벌 경기 침체가 심화될 경우 스마트폰, 가전 등 세트 사업 부문의 수요가 위축될 수 있습니다.
*   **경쟁 심화:** 파운드리, 메모리, 스마트폰 시장에서 글로벌 경쟁사들과의 경쟁이 심화될 경우, 시장 점유율 및 수익성 확보에 어려움을 겪을 수 있습니다. 특히, AI 반도체 시장에서의 기술 경쟁은 더욱 치열해질 것으로 예상됩니다.
*   **환율 변동성:** 수출 비중이 높은 삼성전자의 특성상 급격한 환율 변동은 외화 환산 손익에 영향을 미 미쳐 실적 변동성을 키울 수 있습니다.
*   **지정학적 리스크:** 미중 갈등 등 지정학적 리스크가 심화될 경우 글로벌 공급망에 차질이 발생하거나 특정 시장에서의 사업 활동에 제약이 생길 수 있습니다.

### 결론

삼성전자는 2023년의 부진을 뒤로하고 2024년과 2025년에 걸쳐 강력한 실적 회복이 기대되는 매우 긍정적인 상황에 있습니다. 견고한 재무 상태를 바탕으로 반도체 업황 회복과 AI 등 신성장 동력에 대한 시장의 높은 기대감이 주가에 적극적으로 반영되고 있습니다. 최근 주가 급등은 이러한 기대감을 선반영한 것으로 보이며, 향후 실제 실적 개선 여부가 중요할 것입니다. 투자자는 반도체 업황, 글로벌 경제 동향, 그리고 신기술 개발 및 시장 침투 상황을 지속적으로 주시하며 투자 결정을 내릴 필요가 있습니다.

---
## 5. Judge LLM으로 비교 분석

상위 모델(gpt-5)이 두 분석 결과의 일치/불일치를 평가합니다.

In [25]:
def compare_analyses(question, answer_a, answer_b):
    """두 분석 결과를 비교 평가"""

    judge_prompt = f"""당신은 금융 분석 전문가입니다.
두 AI 애널리스트(OpenAI, Gemini)의 분석 결과를 비교 평가해주세요.

## 원래 질문
{question}

## OpenAI (gpt-5-mini) 분석
{answer_a}

## Gemini (gemini-2.5-flash) 분석
{answer_b}

---

다음 형식으로 비교 분석해주세요:

## 1. 핵심 결론 비교
| 항목 | OpenAI | Gemini | 일치 여부 |
|------|--------|--------|----------|
(주요 분석 포인트 비교)

## 2. 일치하는 부분
- 두 분석이 동의하는 핵심 포인트

## 3. 불일치하는 부분
- 의견이 다른 부분과 그 이유

## 4. 분석 품질 평가
| 항목 | OpenAI | Gemini |
|------|--------|--------|
| 데이터 활용도 | (평가) | (평가) |
| 논리적 일관성 | (평가) | (평가) |
| 실용적 인사이트 | (평가) | (평가) |

## 5. 종합 판정
- 신뢰도: (높음/중간/낮음)
- 추천 의견: (투자자가 참고할 최종 의견)
"""

    print("\n[Judge LLM (gpt-5) 비교 분석 중...]")
    print("=" * 60)

    response = model_judge.invoke(judge_prompt)
    return response.content

In [26]:
# 비교 분석 실행
comparison_result = compare_analyses(question, answer_openai, answer_gemini)

print("[비교 분석 결과]")
print("=" * 60)
display(Markdown(comparison_result))


[Judge LLM (gpt-5) 비교 분석 중...]
[비교 분석 결과]


## 1. 핵심 결론 비교
| 항목 | OpenAI | Gemini | 일치 여부 |
|------|--------|--------|----------|
| 2023 저조 → 2024 회복 국면 | 2023 급락, 2024 의미 있는 회복 | 2024·2025 큰 폭 회복 전망 | 일치 |
| 재무건전성 평가 | 부채비율 낮고 안정적 | 부채·유동성 우수(당좌비율·유보율 제시) | 일치 |
| 최근 30일 주가 | 128,500원, +33.16%, 94,500~128,500 | 128,500원, +33.16%, 94,500~128,500 | 일치 |
| 뉴스 커버리지 | 주요 헤드라인 수집 실패(도구 한계) | 동일(시스템 제한 언급) | 일치 |
| 2024 수치 활용 | 2024 매출·이익·EPS 제시 | 2024 수치 제시 + 2025 전망 | 부분 일치 |
| 밸류에이션 판단 | PER 10.8배, PBR 0.92배로 저평가 주장 | PER/PBR 직접 제시 없음(정량 밸류에이션 미제시) | 불일치 |
| 리스크 인식 | 반도체 사이클·밸류 변동성 등 | 반도체 업황·경쟁·환율·지정학 | 일치 |
| 투자 조언 톤 | 성향별 제안(단기 변동성 유의) | 실적 현실화 모니터링 강조 | 부분 일치 |

## 2. 일치하는 부분
- 2023년 반도체 업황 악화로 실적 저하, 2024년 회복 국면 진입.
- 재무구조(낮은 부채, 충분한 유동성) 양호.
- 최근 30일 주가 급등(약 +33%)으로 기대 선반영.
- 핵심 리스크: 반도체 사이클/가격, 글로벌 경기·환율, 경쟁·공급망.

## 3. 불일치하는 부분
- 밸류에이션 정확성:
  - OpenAI: PER(10.8배), PBR(0.92배) 제시는 제시된 EPS(약 4,950원)와 현재가(128,500원)와 모순. 해당 수치면 실제 PER≈26배, PBR≈2.2배 수준으로, OpenAI의 밸류 판단은 계산 오류 가능성이 큼.
  - Gemini: 밸류에이션 수치를 직접 계산·제시하지 않아 보수적이지만, 비교 가능성은 낮음.
- 전망 커버리지:
  - OpenAI: 2024 중심, 보수적 톤.
  - Gemini: 2025까지 구체 전망 수치 제시(성장 확대 톤).
- 표현/신뢰성:
  - Gemini: “CFA 15년 경력” 등 자격 주장 표현은 검증 불가·부적절.
  - OpenAI: 출처(네이버 금융) 명시 및 투자자 유형별 실무 조언이 구체적.

## 4. 분석 품질 평가
| 항목 | OpenAI | Gemini |
|------|--------|--------|
| 데이터 활용도 | 중간: 재무·주가 지표 폭넓게 활용했으나 PER/PBR 계산 오류로 신뢰성 저하 | 중간: 2024·2025 전망 및 재무비율 제시 좋으나 출처·밸류에이션 부재 |
| 논리적 일관성 | 보통 이하: 밸류에이션 수치가 자체 제시 데이터와 불일치 | 양호: 내러티브와 수치 대체로 정합, 다만 자격 주장 등 신뢰 훼손 요소 |
| 실용적 인사이트 | 중간: 업황·자본정책·투자자 유형별 가이드 유용 | 중간: AI/HBM·파운드리 등 테마 연결 좋으나 실행적 밸류에이션 코멘트 부족 |

## 5. 종합 판정
- 신뢰도: 중간 (Gemini가 서술 일관성은 더 낫지만, 자격 주장 표현은 감점. OpenAI는 밸류에이션 계산 오류로 감점)
- 추천 의견:
  - 단기적으로는 Gemini의 사이클·성장 동력 정리와 2025 전망을 기본 참고하되, 수치 출처 확인과 실제 밸류에이션(현재가 기준 PER/PBR 재계산) 보완이 필요.
  - OpenAI 분석은 리스크 체크리스트와 투자자 유형별 포지셔닝 조언이 유용하나, 제시한 PER/PBR은 사용하지 말고 재계산 권장.
  - 공통 보완: 최신 공시/컨퍼런스콜과 HBM·메모리 가격, 환율 추이, 자본환원 정책 업데이트, 그리고 최근 뉴스 헤드라인을 별도로 확인 후 의사결정할 것.

---
## 추가 예시: 다른 기업 분석

In [27]:
# SK하이닉스 분석
question2 = "SK하이닉스(000660)의 투자 매력도를 분석해줘."

answer_openai2, answer_gemini2 = analyze_with_both_agents(question2)
comparison_result2 = compare_analyses(question2, answer_openai2, answer_gemini2)

display(Markdown(comparison_result2))


[질문] SK하이닉스(000660)의 투자 매력도를 분석해줘.

[1] OpenAI (gpt-5-mini) 분석 중...
  [Tool] 재무제표 수집: 000660
  [Tool] 뉴스 수집: 000660
  [Tool] 주가 수집: 000660

[2] Gemini (gemini-2.5-flash) 분석 중...
  [Tool] 재무제표 수집: 000660
  [Tool] 주가 수집: 000660
  [Tool] 뉴스 수집: 000660

[Judge LLM (gpt-5) 비교 분석 중...]


## 1. 핵심 결론 비교
| 항목 | OpenAI | Gemini | 일치 여부 |
|------|--------|--------|----------|
| 투자 매력 결론 | 중장기 매력 높음, 단기 변동성 큼 | 매력적이며 강한 턴어라운드 기대 | 대체로 일치 |
| 실적 전망(24~25) | 2024 대폭 회복 강조(매출·영업익·EPS) | 2024 회복 + 2025 고성장 수치 제시 | 대체로 일치(범위는 Gemini가 더 확장) |
| 핵심 드라이버 | AI/데이터센터 수요, 업황 회복 | HBM 기술·시장 지배력 중심 + 업황 회복 | 부분 일치(Gemini가 HBM 더 강하게 강조) |
| 밸류에이션 | 2024 기준 저PER·적정 PBR 주장(예: PER 6.4배) | 명시적 멀티플 언급 없음 | 불일치(및 OpenAI 계산 신뢰도 이슈) |
| 리스크 인식 | 메모리 사이클, CAPEX, 경쟁, 환율/거시 | 사이클, HBM 경쟁 심화, 거시/환율, 투자부담 | 일치 |
| 투자전략 제안 | 분할매수·트리거·손절·청산 룰 등 실무 팁 | 모니터링 포인트 중심의 전략적 접근 | 부분 일치(OpenAI가 더 실무적) |

## 2. 일치하는 부분
- 2023 저점 이후 2024 실적 급반등, 사이클 회복 국면 진입 판단
- AI/데이터센터 수요가 구조적 성장 동력이라는 인식
- 사이클 변동성, 경쟁 심화, CAPEX/환율/거시 리스크 공통 제시
- 최근 주가의 강한 랠리와 기대감 반영 언급

## 3. 불일치하는 부분
- 밸류에이션: OpenAI는 2024E PER 약 6.4배라고 제시했으나, 제시된 EPS(예: 27,182원)와 현재가(약 677,000원)를 단순 대입하면 PER는 대략 25배 수준으로 추정되어 수치 불일치가 큼. 또한 “EPS 상승 → PER 상승”이라는 논지는 논리적 오류. Gemini는 멀티플 언급을 회피해 이 부분의 오류가 없음.
- 포커스: Gemini는 HBM 경쟁우위를 핵심로직에 두고 2025까지의 성장 가시성을 강조. OpenAI는 HBM 직접 언급이 약하고 대신 밸류와 실무적 매매전략을 더 강조.
- 범위와 깊이: Gemini가 2025E(매출·영업이익·EPS·유동성 지표)까지 폭넓게 다뤄 전망의 연속성을 제시. OpenAI는 2024 중심, 대신 트리거/리스크 관리 등 실행 인사이트가 더 풍부.

## 4. 분석 품질 평가
| 항목 | OpenAI | Gemini |
|------|--------|--------|
| 데이터 활용도 | 중: 2024 중심의 재무·밸류 활용은 좋으나 PER 계산 및 서술 오류로 신뢰도 저하 | 중상: 2024~2025 재무/유동성 지표 폭넓게 제시하나 밸류에이션 멀티플 부재 |
| 논리적 일관성 | 중하: 밸류에이션 구간에서 계산/논리 불일치 존재 | 중상: 서술 일관성 양호, 핵심 논리(HBM·수요) 분명 |
| 실용적 인사이트 | 상: 분할매수, 트리거, 손절/청산 룰 등 실행 가능 아이디어 풍부 | 중: 모니터링 포인트는 명확하나 구체적 실행 가이드는 제한적 |

## 5. 종합 판정
- 신뢰도: 중간
  - 이유: 두 분석 모두 큰 방향(턴어라운드, HBM/AI 수혜, 사이클 리스크)은 일치하고 타당. 다만 OpenAI의 PER 수치·서술 오류가 있어 수치 해석은 별도 검증 필요. Gemini는 멀티플 공백이 있어 밸류 판단의 완결성은 아쉬움.
- 추천 의견:
  - 중장기 관점의 투자 매력은 높다(업황 회복 + HBM/AI 레버리지). 다만 단기 급등 구간의 변동성/과열 리스크를 고려해 분할 접근 권장.
  - 체크리스트: HBM 증설·수율과 고객 믹스, 동종사(삼성·마이크론) 증설/가격 정책, 메모리 가격지표(ASP/재고), 2025 CAPEX/마진 가이던스.
  - 밸류에이션은 최신 컨센서스 EPS 기준으로 재산출해 적정 멀티플(메모리 업사이클 평균 PER 밴드)과 비교한 뒤 비중 결정이 바람직.

---
## 학습 정리

### 1. LLM 교차 검증 구조
```
질문 → [Agent A (OpenAI)] → 분석 A
     → [Agent B (Gemini)] → 분석 B
               ↓
       [Judge LLM (gpt-5)]
               ↓
        비교 분석 리포트
```

### 2. 모델 구성
| 역할 | 모델 | 용도 |
|------|------|------|
| Agent 1 | gpt-5-mini | 분석 A |
| Agent 2 | gemini-2.5-flash | 분석 B |
| Judge | gpt-5 | 비교 평가 |

### 3. 핵심 코드
```python
# 두 Agent 생성 (동일 Tool, 다른 LLM)
agent_openai = create_agent(model_openai, tools, system_prompt)
agent_gemini = create_agent(model_gemini, tools, system_prompt)

# 동일 질문으로 두 Agent 분석
answer_openai = agent_openai.invoke({"messages": [...]})
answer_gemini = agent_gemini.invoke({"messages": [...]})

# Judge LLM으로 비교
comparison = model_judge.invoke(judge_prompt)
```

### 4. 활용 포인트
- 단일 LLM 편향 방지
- 다양한 관점의 분석 확보
- 신뢰도 높은 투자 의사결정 지원

---

## 모듈 3 완료

| 차시 | 주제 | 핵심 개념 |
|------|------|----------|
| 19-22 | 머신러닝 | Scikit-learn, 회귀/분류, 평가 |
| 23-24 | 딥러닝 | LSTM, 시계열 예측 |
| 25-26 | NLP | 토큰화, 감성분석 |
| 27-28 | LLM API | OpenAI, Gemini 설정 |
| 29 | LLM 활용 | 재무제표 분석 |
| 30 | LangChain | Agent + Memory |
| 31 | 통합 | **멀티 LLM 교차 검증** |

---

### 다음 모듈 예고
- 모듈 4: 분석 자동화 및 대시보드
  - Streamlit 대시보드
  - 자동 리포트 생성
  - 이메일 발송 자동화