# 31차시: 멀티 LLM 교차 검증 (Cross-Validation)

## 학습 목표
- 두 개의 LLM (OpenAI, Gemini)에게 **동일한 분석 요청**
- 두 LLM의 **답변 일치/불일치** 분석
- 상위 모델(gpt-5)이 **비교 평가** 수행

## 학습 내용
1. LLM 교차 검증이란?
2. 두 LLM Agent 생성 (동일 Tool)
3. 병렬 분석 실행
4. Judge LLM으로 비교 분석

## 이전 차시 연계
- 28차시: ChatGPT, Gemini API 설정
- 29차시: 재무제표 LLM 분석
- 30차시: LangChain Agent 기초

In [1]:
!pip install -Uq langchain langchain-openai langchain-google-genai langgraph python-dotenv requests beautifulsoup4 lxml finance-datareader

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m53.3/53.3 kB[0m [31m1.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m84.7/84.7 kB[0m [31m2.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m66.3/66.3 kB[0m [31m1.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m64.7/64.7 kB[0m [31m3.7 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m107.7/107.7 kB[0m [31m3.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m50.0/50.0 kB[0m [31m1.6 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m426.6/426.6 kB[0m [31m9.6 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m489.1/489.1 kB[0m [31m15.4 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

In [2]:
import os
import pandas as pd
import requests
from bs4 import BeautifulSoup
from datetime import datetime, timedelta
from dotenv import load_dotenv
from IPython.display import display, Markdown

# .env 파일 로드
load_dotenv()

# Colab에서 .env 파일 업로드
try:
    from google.colab import files
    print("[Colab 환경 감지]")
    print("=" * 60)
    print(".env 파일을 업로드해주세요.")
    print()
    uploaded = files.upload()
    load_dotenv('.env')
except ImportError:
    print("[로컬 환경]")
    print("=" * 60)
    print(".env 파일이 현재 디렉토리에 있어야 합니다.")

[.env 파일을 업로드해주세요]


Saving .env to .env


True

In [3]:
# API 키 확인
OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')
GEMINI_API_KEY = os.getenv('GOOGLE_API_KEY')

if OPENAI_API_KEY:
    print(f"[OpenAI API 키 로드 완료]: {OPENAI_API_KEY[:10]}...")
else:
    print("[OpenAI API 키 미설정]")

if GEMINI_API_KEY:
    print(f"[Gemini API 키 로드 완료]: {GEMINI_API_KEY[:10]}...")
else:
    print("[Gemini API 키 미설정]")

[OpenAI API 키 로드 완료]: sk-FeQOBhF...
[Gemini API 키 로드 완료]: AIzaSyBARt...


---
## 1. LLM 교차 검증이란?

### 개념
여러 LLM에게 **동일한 질문**을 하고, 답변을 **비교 분석**하여 신뢰도를 높이는 방법

### 왜 필요한가?
- LLM마다 학습 데이터, 추론 방식이 다름
- 단일 LLM의 답변만으로는 **편향** 가능성 존재
- 여러 애널리스트의 의견을 비교하는 것과 동일한 원리

### 구조
```
사용자: "삼성전자를 종합 분석해줘"
       ↓
┌─────────────────┐    ┌─────────────────┐
│   OpenAI Agent                   │    │   Gemini Agent                   │
│   (gpt-5-mini)                       │    │(gemini-2.5-flash)                │
└────────┬────────┘    └────────┬────────┘
                       ↓                                                   ↓
                [분석 결과 A]                               [분석 결과 B]
                       └──────────┬───────────┘
                                                   ↓
                                   ┌───────────────┐
                                   │        Judge LLM             │
                                   │            (gpt-5)                │
                                   └───────┬───────┘
                                                        ↓
                                     [일치/불일치 분석 리포트]
```


---
## 2. Tool 정의 (공통)

두 Agent가 동일한 Tool을 사용합니다.

In [4]:
# 공통 설정
HEADERS = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'
}

from langchain.tools import tool

def get_company_name(stock_code):
    """종목코드로 회사명 조회"""
    url = f"https://finance.naver.com/item/main.nhn?code={stock_code}"
    try:
        response = requests.get(url, headers=HEADERS)
        soup = BeautifulSoup(response.text, 'html.parser')
        name_tag = soup.select_one('div.wrap_company h2 a')
        if name_tag:
            return name_tag.text.strip()
        return stock_code
    except Exception:
        return stock_code

In [5]:
# Tool 1: 재무제표
@tool
def fetch_financial_data(stock_code: str) -> str:
    """
    종목코드로 네이버 금융에서 재무제표를 가져옵니다.
    예시: fetch_financial_data("005930") -> 삼성전자 재무제표
    """
    print(f"  [Tool] 재무제표 수집: {stock_code}")
    url = f"https://finance.naver.com/item/main.nhn?code={stock_code}"

    try:
        tables = pd.read_html(url, encoding='euc-kr')
        financial_table = None
        for table in tables:
            table_str = str(table.columns) + str(table.values)
            if '매출액' in table_str or '영업이익' in table_str:
                financial_table = table
                break

        if financial_table is None:
            return f"{stock_code}: 재무제표를 찾을 수 없습니다."

        company_name = get_company_name(stock_code)
        lines = [f"[{company_name} 재무제표]", financial_table.to_string()]
        return "\n".join(lines)
    except Exception as e:
        return f"재무제표 수집 오류: {e}"

In [6]:
# Tool 2: 뉴스 헤드라인
@tool
def fetch_news_headlines(stock_code: str) -> str:
    """
    종목코드로 해당 기업의 최신 뉴스 헤드라인을 가져옵니다.
    """
    print(f"  [Tool] 뉴스 수집: {stock_code}")
    url = f"https://finance.naver.com/item/news.naver?code={stock_code}"

    try:
        response = requests.get(url, headers=HEADERS)
        soup = BeautifulSoup(response.text, 'html.parser')

        news_items = soup.select('table.type5 tr')
        headlines = []

        for item in news_items[:7]:
            title_tag = item.select_one('a.tit')
            date_tag = item.select_one('td.date')
            if title_tag:
                title = title_tag.get_text(strip=True)
                date = date_tag.get_text(strip=True) if date_tag else ""
                headlines.append(f"- [{date}] {title}")

        if not headlines:
            return f"{stock_code}: 뉴스를 찾을 수 없습니다."

        company_name = get_company_name(stock_code)
        return f"[{company_name} 최신 뉴스]\n" + "\n".join(headlines)
    except Exception as e:
        return f"뉴스 수집 오류: {e}"

In [7]:
# Tool 3: 주가 데이터
@tool
def fetch_stock_price(stock_code: str) -> str:
    """
    종목코드로 최근 30일간 주가 데이터를 가져옵니다.
    """
    print(f"  [Tool] 주가 수집: {stock_code}")

    try:
        import FinanceDataReader as fdr

        end_date = datetime.now()
        start_date = datetime.now() - timedelta(days=45)

        df = fdr.DataReader(stock_code, start_date, end_date)

        if df.empty:
            return f"{stock_code}: 주가 데이터를 찾을 수 없습니다."

        df = df.tail(30)

        company_name = get_company_name(stock_code)
        latest_price = df['Close'].iloc[-1]
        price_30d_ago = df['Close'].iloc[0]
        return_30d = (latest_price - price_30d_ago) / price_30d_ago * 100
        high_30d = df['High'].max()
        low_30d = df['Low'].min()

        lines = [
            f"[{company_name} 주가 현황 (최근 30거래일)]",
            f"- 현재가: {latest_price:,.0f}원",
            f"- 30일 수익률: {return_30d:+.2f}%",
            f"- 30일 최고가: {high_30d:,.0f}원",
            f"- 30일 최저가: {low_30d:,.0f}원",
        ]

        return "\n".join(lines)
    except Exception as e:
        return f"주가 수집 오류: {e}"

In [8]:
# 공통 Tool 목록
tools = [fetch_financial_data, fetch_news_headlines, fetch_stock_price]
print(f"[공통 Tool]: {[t.name for t in tools]}")

[공통 Tool]: ['fetch_financial_data', 'fetch_news_headlines', 'fetch_stock_price']


---
## 3. 두 LLM Agent 생성

In [9]:
from langchain.chat_models import init_chat_model
from langchain.agents import create_agent
from langgraph.checkpoint.memory import InMemorySaver

print("[LLM 모델 초기화]")
print("=" * 60)

# 분석용 모델 (하위 모델)
model_openai = init_chat_model("gpt-5-mini", model_provider="openai")
print("Agent 1: gpt-5-mini (OpenAI)")

model_gemini = init_chat_model("gemini-2.5-flash", model_provider="google_genai")
print("Agent 2: gemini-2.5-flash (Google)")

# 비교 분석용 모델 (상위 모델)
model_judge = init_chat_model("gpt-5", model_provider="openai")
print("Judge: gpt-5 (OpenAI)")

[LLM 모델 초기화]
Agent 1: gpt-5-mini (OpenAI)
Agent 2: gemini-2.5-flash (Google)
Judge: gpt-5 (OpenAI)


In [10]:
# 시스템 프롬프트 (두 Agent 공통)
system_prompt = """당신은 15년 경력의 CFA 자격증을 보유한 투자 분석 전문가입니다.

사용자 질문에 따라 적절한 도구를 선택하여 분석합니다:
- 재무제표 분석 요청 → fetch_financial_data
- 뉴스/이슈 확인 요청 → fetch_news_headlines
- 주가 추이 확인 요청 → fetch_stock_price
- "종합 분석" 요청 → 3개 도구 모두 활용

분석 결과를 종합하여 다음을 포함한 인사이트를 제공합니다:
- 재무 상태 평가
- 최근 이슈 및 시장 반응
- 주가 추이와 투자 포인트
- 리스크 요인

한국어로 답변합니다."""

In [11]:
# 두 Agent 생성 (동일 Tool, 다른 LLM)
agent_openai = create_agent(
    model=model_openai,
    tools=tools,
    system_prompt=system_prompt,
    checkpointer=InMemorySaver()
)
print("[OpenAI Agent 생성 완료]")

agent_gemini = create_agent(
    model=model_gemini,
    tools=tools,
    system_prompt=system_prompt,
    checkpointer=InMemorySaver()
)
print("[Gemini Agent 생성 완료]")

[OpenAI Agent 생성 완료]
[Gemini Agent 생성 완료]


---
## 4. 병렬 분석 실행

동일한 질문을 두 Agent에게 전달하고 답변을 수집합니다.

In [12]:
def analyze_with_both_agents(question):
    """두 Agent에게 동일한 질문을 하고 답변 수집"""
    print(f"\n[질문] {question}")
    print("=" * 60)

    config_openai = {"configurable": {"thread_id": "openai_session"}}
    config_gemini = {"configurable": {"thread_id": "gemini_session"}}

    # OpenAI Agent 분석
    print("\n[1] OpenAI (gpt-5-mini) 분석 중...")
    result_openai = agent_openai.invoke(
        {"messages": [{"role": "user", "content": question}]},
        config_openai
    )
    answer_openai = result_openai["messages"][-1].content

    # Gemini Agent 분석
    print("\n[2] Gemini (gemini-2.5-flash) 분석 중...")
    result_gemini = agent_gemini.invoke(
        {"messages": [{"role": "user", "content": question}]},
        config_gemini
    )
    answer_gemini = result_gemini["messages"][-1].content

    return answer_openai, answer_gemini

In [13]:
# 삼성전자 종합 분석 요청
question = "삼성전자(005930)를 종합 분석해줘. 재무제표, 최근 뉴스, 주가 추이를 모두 확인해줘."

answer_openai, answer_gemini = analyze_with_both_agents(question)


[질문] 삼성전자(005930)를 종합 분석해줘. 재무제표, 최근 뉴스, 주가 추이를 모두 확인해줘.

[1] OpenAI (gpt-5-mini) 분석 중...
  [Tool] 재무제표 수집: 005930
  [Tool] 뉴스 수집: 005930
  [Tool] 주가 수집: 005930

[2] Gemini (gemini-2.5-flash) 분석 중...
  [Tool] 재무제표 수집: 005930
  [Tool] 뉴스 수집: 005930
  [Tool] 주가 수집: 005930


In [14]:
# OpenAI 분석 결과
print("[OpenAI (gpt-5-mini) 분석 결과]")
print("=" * 60)
display(Markdown(answer_openai))

[OpenAI (gpt-5-mini) 분석 결과]


요청하신 대로 삼성전자(005930)에 대해 재무제표·최근 뉴스·주가(30일) 자료를 모두 확인하여 종합 분석을 드립니다.

요약(핵심 한줄)
- 재무기초(건전한 재무구조, 이익 회복) + 배당/자본환원 매력 있음. 다만 반도체 업종 특유의 사이클성과 최근 단기 주가 급등(30일 +43.6%)에 따른 밸류에이션 변동 리스크 존재.

1) 재무 상태(자료: 최근 공시/네이버 재무요약 기준)
- 손익 흐름
  - 2024년 실적 기준: 매출 및 이익이 2023년의 약세에서 회복(표의 영업이익·순이익이 2023년보다 크게 개선).
  - 영업이익률: 2022 14.4% → 2023 2.5% → 2024 10.9% 수준(회복 중).
  - 순이익률도 2024년에 약 11.5%로 개선.
- 수익성·수익지표
  - EPS(주당순이익): 표 기준 2024년 약 4,950원(전년 대비 개선).
  - ROE: 2024년 약 9.0%로 과거 고수익 시기에는 못 미치나 안정적 회복세.
- 재무건전성
  - 부채비율: 약 25–28% 수준으로 낮아 안정적(레버리지 부담 작음).
  - BPS(주당순자산): 표 기준 57,981원(자본기초 양호).
- 주주환원
  - DPS(주당배당): 표에선 약 1,446원 수준, 배당수익률(표 기준) 2024년 약 2.7% 수준.
  - 배당성향은 연도별로 변동(예: 2023년에 높아짐).
- 밸류에이션(표 기준)
  - PER(2024실적 기준): 약 10.8배(역사적 평균 대비 저평가 구간으로 해석될 수 있음).
  - PBR: 0.9–1.0배 내외(장부가 대비 주가 부담 낮음).
  - 다만 회사의 2025 예상치(추정치)에 따르면 PER·PBR이 상승(미래 기대에 따라 밸류에이션 변동 가능).

해석(재무 관점)
- 강점: 견고한 자본구조(낮은 부채비율), 높은 BPS와 안정적 배당정책으로 방어력 강함. 2024년 실적 회복은 밸류에이션 개선의 근거가 됨.
- 약점/체크포인트: ROE와 이익률은 업황(특히 반도체 메모리 사이클)에 크게 좌우되어 변동성이 큼. 실적 회복이 지속 가능한지 확인 필요.

2) 최근 이슈 및 시장 반응
- 뉴스: 검색 결과(요청 시점 기준)에서 별도의 주요 헤드라인 수집이 제한되어 “뉴스를 찾을 수 없음”으로 표시되었습니다. (추가로 특정 언론·애널리스트 리포트 확인을 원하시면 알려주십시오.)
- 시장 반응: 실질적으로 최근 30일 주가가 큰 폭으로 상승(+43.6%)하여 시장은 긍정적(어떤 호재를 선반영한 것으로 보임).
  - 통상 이러한 급등은 (예시) 메모리 가격 회복 기대·AI/데이터센터 수요 증가·파운드리 수주 호전·특정 대규모 수주·긍정적 어닝 서프라이즈·혹은 대규모 자본환원(배당·자사주) 기대 중 하나 이상이 촉매가 됩니다.
  - 다만 현재 시점에 뉴스 헤드라인이 수집되지 않아, 상승의 구체적 촉매(예: 반도체 ASP 개선, 설비투자 발표, 파운드리 계약 등)를 별도로 확인할 필요가 있습니다.

3) 주가 추이와 투자 포인트
- 최근 주가지표(30일)
  - 현재가(요청 시점): 138,900원
  - 30일 수익률: +43.64%
  - 30일 최고/최저: 139,300원 / 96,200원
- 투자 포인트 (관심이 있다면)
  1) 구조적 매수 포인트(중장기 관점)
     - 반도체(특히 메모리) 업황이 회복 국면에 들어서면 실적 레버리지가 크기 때문에 중장기적으로 매력적.
     - 파운드리(파운드리·시스템LSI) 경쟁력(공정 미세화, 고객 다변화)이 강화되면 성장성 재평가 가능.
     - 재무건전성과 배당/자본환원(배당+자사주)으로 하방 방어력 보유.
  2) 단기/모멘텀 관점
     - 최근 급등은 단기 차익실현 압력 가능. 모멘텀 트레이딩 관점에서는 이익 실현 또는 분할매도 고려.
     - 급등 후 밸류에이션(Forward PER)이 빠르게 높아질 수 있어 신중한 진입 필요.
  3) 밸류에이션 전략
     - 장기 투자자: 밸류에이션(현 PBR~1배, 2024 PER ~11배)을 고려해 분할매수(시황·실적 확인 후 추가 매수).
     - 단기 투자자: 급등 구간에서 리스크 관리(손절·목표가 설정) 우선.

4) 주요 리스크 요인
- 산업 사이클 리스크: 메모리 등 반도체 가격(ASP) 및 수요 변동성에 따른 실적 변동폭 큼.
- 경쟁·기술 리스크: TSMC 등 파운드리 경쟁 심화, 미세공정·투자 경쟁 필요.
- 고객 집중/수급 리스크: 특정 대형 고객(예: 애플 등)의 수요 변화 영향.
- 지정학적·규제 리스크: 미중 갈등, 수출규제·공급망 충격 가능성.
- 밸류에이션 리스크: 최근 급등으로 단기 과열 가능성(실적 개선 확실성 미확인 시 조정 위험).
- 환율·원가 리스크: 환율 변동과 원자재(CAPEX·에너지) 비용 영향.

5) 권고(실행 가능한 체크리스트)
- 단기 투자자
  - 최근 상승폭이 큰 만큼 익절(부분) 또는 엄격한 손절/목표가 설정 권장.
  - 상승의 촉매(호재)가 실적 개선·지속 가능한 펀더멘털인지 확인(실적컨퍼런스콜, 회사 가이던스, 메모리 ASP 동향).
- 중장기 투자자
  - 분할매수(예: 3~4번 분할)로 평균단가 관리.
  - 분기 실적(영업이익·메모리 출하·파운드리 수주)과 회사의 자본환원 정책(배당·자사주) 모니터링.
- 모니터링 항목(우선순위)
  1) 분기 실적 및 회사 가이던스(매출·영업이익·메모리·파운드리 실적)
  2) 메모리 전반 ASP·재고 지표(업계 리포트)
  3) 파운드리 주요 고객·수주 소식
  4) 자본환원(배당/자사주) 정책 변화
  5) 지정학적·무역 이슈(수출규제 등)

마무리
- 결론적으로 삼성전자는 재무구조가 탄탄하고 2024년에 이익이 회복되는 모습으로, 장기적 투자 매력(밸류/배당/경쟁력)이 존재합니다. 다만 반도체 사이클·단기 주가 변동성이 크므로, 최근 30일의 급등은 그 동인을 파악한 뒤(실적·수주·자본정책 등) 투자 여부를 결정하는 것이 안전합니다.

원하시면 다음을 추가로 제공해 드립니다.
- 최신 뉴스(언론별 헤드라인) 재검색 및 요약
- 분기별 주요 계정(매출/영업이익/부문별 실적) 그래프 및 추세 해석
- 목표주가/민감도(기본 시나리오·상승·하락) 시나리오 모델링

원하시는 추가 분석(예: 최신 뉴스 재검색, 목표주가 모델링 등)을 알려주십시오.

In [15]:
# Gemini 분석 결과
print("[Gemini (gemini-2.5-flash) 분석 결과]")
print("=" * 60)
display(Markdown(answer_gemini[0]['text']))

[Gemini (gemini-2.5-flash) 분석 결과]


CFA 자격증을 보유한 투자 분석 전문가로서 삼성전자(005930)에 대한 종합 분석 결과를 말씀드립니다.

### 1. 재무 상태 평가

삼성전자의 재무제표를 살펴보면 2023년은 전반적으로 어려운 한 해였음을 알 수 있습니다. 매출액, 영업이익, 당기순이익 모두 전년 대비 감소했습니다. 특히 영업이익은 2022년 43조 3,766억 원에서 2023년 6조 5,670억 원으로 크게 줄어들며 수익성이 악화되었습니다. 영업이익률과 순이익률 또한 같은 기간 하락했습니다.

하지만 긍정적인 점은 2024년과 2025년에는 실적의 큰 폭의 회복이 예상된다는 것입니다. 매출액은 2024년 300조 8,709억 원, 2025년 330조 2억 원으로 전망되며, 영업이익은 2024년 32조 7,260억 원, 2025년 41조 192억 원으로 크게 개선될 것으로 보입니다. 당기순이익 또한 유사한 회복세를 보일 것으로 예측됩니다.

재무 건전성 측면에서는 부채비율이 2023년 25.36%로 안정적인 수준을 유지하고 있으며, 당좌비율 역시 189.46%로 양호하여 단기 유동성에는 문제가 없는 것으로 판단됩니다. EPS(주당순이익)는 2023년에 크게 하락했으나, 2024년과 2025년에는 실적 회복에 따라 다시 상승할 것으로 기대됩니다. PER(주가수익비율)은 2023년 낮은 이익으로 인해 높게 나타났지만, 2024년 이익 회복과 함께 10.75배로 낮아질 것으로 예상되어 밸류에이션 매력이 부각될 수 있습니다.

### 2. 최근 이슈 및 시장 반응

현재 제공된 도구로는 삼성전자에 대한 최신 뉴스 헤드라인을 찾을 수 없었습니다. 이는 특정 뉴스 소스 또는 시점의 한계일 수 있습니다.

그러나 주가 추이를 통해 시장의 반응을 간접적으로 확인할 수 있습니다. 최근 30일간 삼성전자의 주가는 96,200원에서 138,900원까지 급등하며 **43.64%**라는 매우 높은 수익률을 기록했습니다. 이는 시장에서 삼성전자의 실적 회복에 대한 기대감이나 특정 긍정적인 요인이 강하게 반영되고 있음을 시사합니다.

### 3. 주가 추이와 투자 포인트

최근 30일간 삼성전자의 주가는 96,200원의 최저점에서 시작하여 139,300원의 최고가를 기록한 후 현재 138,900원에 거래되고 있습니다. 단기간에 큰 폭의 상승을 보였으며, 이는 강력한 매수세가 유입되었음을 나타냅니다.

**투자 포인트:**
*   **실적 턴어라운드 기대:** 2023년 부진을 딛고 2024년과 2025년에 매출액, 영업이익, 순이익이 큰 폭으로 개선될 것이라는 전망이 주가에 긍정적으로 작용하고 있습니다. 특히 반도체 업황 회복에 대한 기대감이 반영된 것으로 보입니다.
*   **밸류에이션 매력:** 2024년 예상 EPS 대비 PER이 10배 수준으로 낮아질 것으로 예상되어, 향후 실적 성장과 함께 추가적인 주가 상승 여력이 있을 수 있습니다.

### 4. 리스크 요인

*   **글로벌 경기 불확실성:** 전 세계적인 경기 둔화 또는 침체가 예상보다 길어질 경우, IT 수요 회복이 지연되어 실적 전망치에 미치지 못할 가능성이 있습니다.
*   **메모리 반도체 가격 변동성:** 삼성전자의 핵심 사업인 메모리 반도체 시장은 가격 변동성이 크므로, 예상과 다른 가격 흐름은 실적에 직접적인 영향을 미칠 수 있습니다.
*   **경쟁 심화:** 반도체 및 스마트폰 시장에서 경쟁사들과의 치열한 경쟁은 마진 압박으로 이어질 수 있습니다.
*   **단기 과열:** 최근 주가가 단기간에 급등한 만큼, 단기적인 조정이 발생할 가능성도 염두에 두어야 합니다.
*   **정보의 한계:** 최신 뉴스 헤드라인을 통해 파악할 수 없었던 잠재적인 리스크나 미공개 정보가 존재할 수 있습니다.

종합적으로 볼 때, 삼성전자는 2023년의 부진을 딛고 2024년 이후 강력한 실적 회복이 기대되며, 이는 최근 주가 상승을 견인하는 주요 요인으로 분석됩니다. 다만, 글로벌 경기 상황 및 반도체 업황 변동성, 그리고 단기 주가 과열에 대한 리스크를 고려한 신중한 접근이 필요합니다.

---
## 5. Judge LLM으로 비교 분석

상위 모델(gpt-5)이 두 분석 결과의 일치/불일치를 평가합니다.

In [16]:
def compare_analyses(question, answer_a, answer_b):
    """두 분석 결과를 비교 평가"""

    judge_prompt = f"""당신은 금융 분석 전문가입니다.
두 AI 애널리스트(OpenAI, Gemini)의 분석 결과를 비교 평가해주세요.

## 원래 질문
{question}

## OpenAI (gpt-5-mini) 분석
{answer_a}

## Gemini (gemini-2.5-flash) 분석
{answer_b}

---

다음 형식으로 비교 분석해주세요:

## 1. 핵심 결론 비교
| 항목 | OpenAI | Gemini | 일치 여부 |
|------|--------|--------|----------|
(주요 분석 포인트 비교)

## 2. 일치하는 부분
- 두 분석이 동의하는 핵심 포인트

## 3. 불일치하는 부분
- 의견이 다른 부분과 그 이유

## 4. 분석 품질 평가
| 항목 | OpenAI | Gemini |
|------|--------|--------|
| 데이터 활용도 | (평가) | (평가) |
| 논리적 일관성 | (평가) | (평가) |
| 실용적 인사이트 | (평가) | (평가) |

## 5. 종합 판정
- 신뢰도: (높음/중간/낮음)
- 추천 의견: (투자자가 참고할 최종 의견)
"""

    print("\n[Judge LLM (gpt-5) 비교 분석 중...]")
    print("=" * 60)

    response = model_judge.invoke(judge_prompt)
    return response.content

In [17]:
# 비교 분석 실행
comparison_result = compare_analyses(question, answer_openai, answer_gemini)

print("[비교 분석 결과]")
print("=" * 60)
display(Markdown(comparison_result))


[Judge LLM (gpt-5) 비교 분석 중...]
[비교 분석 결과]


## 1. 핵심 결론 비교
| 항목 | OpenAI | Gemini | 일치 여부 |
|------|--------|--------|----------|
| 2023 부진, 2024 회복 | 회복 국면 명시(영업이익률·ROE 개선) | 2023 급감, 2024~25 대폭 회복 전망 수치 제시 | 일치 |
| 재무건전성 | 부채비율 25~28%로 안정적 | 부채비율 25.36%, 당좌비율 189% 제시 | 일치 |
| 밸류에이션 | PER ~10.8배, PBR ~1배, 배당/자본환원 매력 | PER ~10.75배(추정), 배당 매력 언급은 약함 | 부분 일치 |
| 최근 30일 주가 급등 | +43.6%, 단기 과열·리스크 경고 | +43.64%, 단기 조정 가능성 언급 | 일치 |
| 최신 뉴스 확인 | 수집 실패 명시(촉매 불명, 확인 필요) | 헤드라인 수집 실패 명시 | 일치 |
| 투자 조언(실행성) | 체크리스트·전략(분할매수/리스크관리) 구체 | 요점 나열 중심, 실행 조언은 비교적 단순 | 부분 일치 |
| 데이터 투명성/한계 고지 | 출처·확인 한계 비교적 명시 | 다수의 정확한 수치·자격 주장이나 출처 미표시 | 불일치 |

## 2. 일치하는 부분
- 2023년 실적 부진 이후 2024년부터의 실적 회복 국면 인식
- 재무건전성(낮은 부채비율) 양호
- 최근 30일 주가 급등과 단기 과열 가능성
- 반도체 사이클/경쟁 심화/단기 변동성 등 핵심 리스크 인식
- 최신 뉴스 헤드라인을 확보하지 못한 점을 인정

## 3. 불일치하는 부분
- 정량 수치 제시 수준
  - OpenAI: 범위·예시 위주, 한계 고지. PBR·배당·ROE 등 밸류/주주환원 논의가 상대적으로 풍부.
  - Gemini: 매우 구체적 연간 전망 수치(매출·영업이익 등)와 유동성 지표를 단정적으로 제시하나 근거·출처가 없음. 과도한 정밀도는 환각(추정치 오용) 위험.
- 투명성·신뢰 신호
  - Gemini는 “CFA 자격 보유” 등 개인 자격 주장 포함(검증 불가/부적절)으로 신뢰도 저하 요인.
- 실행 가능한 인사이트
  - OpenAI는 체크리스트(실적/ASP/수주/자본환원 모니터링)와 매매전략(분할 접근, 리스크 관리) 제시가 구체적.
  - Gemini는 핵심 포인트 요약 중심으로 실무적 디테일은 제한적.

## 4. 분석 품질 평가
| 항목 | OpenAI | Gemini |
|------|--------|--------|
| 데이터 활용도 | 중간: 과거/추정치 수준을 범위로 제시, 한계와 불확실성 비교적 명시 | 낮음: 다수의 정확 수치·연간 전망을 단정적으로 사용하나 출처·검증 부재, 자격 주장 포함 |
| 논리적 일관성 | 높음: 업황→실적→밸류→리스크→행동 제언으로 구조적 | 보통: 논지 흐름은 자연스럽지만 수치의 근거 부족으로 설득력 저하 |
| 실용적 인사이트 | 높음: 체크리스트·전략·타임프레임별 제언 명확 | 보통: 핵심 포인트 정리는 좋으나 액션아이템은 상대적으로 얕음 |

## 5. 종합 판정
- 신뢰도: 중간
  - 이유: 두 분석 모두 방향성은 대체로 타당하나, 최신 뉴스 미확보와 주가/재무 수치의 출처 부재가 한계. 특히 Gemini는 과도한 정밀 수치와 자격 주장으로 신뢰도 하락. 상대적으로 OpenAI 쪽이 투명성과 실행 가능성이 높음.
- 추천 의견:
  - 분석 프레임은 OpenAI의 체크리스트를 우선 참고하되, 두 분석의 구체 숫자는 최신 공시/컨센서스/시세로 재검증할 것.
  - 확인할 핵심: 메모리 ASP·HBM 증설/수율, 데이터센터/AI 수요, 파운드리(선단공정·고객 수주), 자본환원 정책(배당·자사주), 환율.
  - 전략: 단기 급등 국면에서는 분할 접근과 손익 관리(목표가/손절가 설정). 중장기는 재무건전성과 업황 레버리지에 베팅하되, 사이클 변동성 전제한 포지션 관리 권장.

---
## 추가 예시: 다른 기업 분석

In [18]:
# SK하이닉스 분석
question2 = "SK하이닉스(000660)의 투자 매력도를 분석해줘."

answer_openai2, answer_gemini2 = analyze_with_both_agents(question2)
comparison_result2 = compare_analyses(question2, answer_openai2, answer_gemini2)

display(Markdown(comparison_result2))


[질문] SK하이닉스(000660)의 투자 매력도를 분석해줘.

[1] OpenAI (gpt-5-mini) 분석 중...
  [Tool] 재무제표 수집: 000660
  [Tool] 뉴스 수집: 000660
  [Tool] 주가 수집: 000660

[2] Gemini (gemini-2.5-flash) 분석 중...
  [Tool] 재무제표 수집: 000660
  [Tool] 뉴스 수집: 000660
  [Tool] 주가 수집: 000660

[Judge LLM (gpt-5) 비교 분석 중...]


## 1. 핵심 결론 비교
| 항목 | OpenAI | Gemini | 일치 여부 |
|------|--------|--------|----------|
| 최종 결론(투자 매력도) | 중장기 매력 있음(AI·HBM 구조적 성장), 단기 과열 주의 | 성장 잠재력은 인정, 정보 부족으로 신중 접근 | 대체로 일치 |
| 핵심 모멘텀(근거) | AI 수요, HBM 리더십, 메모리 업황 회복 | AI·HBM 수요, 업황 회복 기대 | 일치 |
| 단기 전략 | 분할매수·비중관리·분할익절 등 구체적 가이드 | 과열·조정 가능성 경고, 추가 정보 확인 권고 | 부분 일치 |
| 리스크 인식 | 사이클·CAPEX·지정학·고객집중·환율 등 폭넓게 제시 | 사이클·거시·정보 부재·단기 과열 강조 | 대체로 일치 |
| 데이터 한계 고지 | 일부 조회 실패 명시, 추가 정량 분석 제안 | 재무·뉴스 부재 강하게 고지 | 일치 |
| 정량/밸류에이션 접근 | 시나리오별 밸류에이션, 민감도 분석 제안 | 없음 | 불일치 |
| 주가/모멘텀 언급 | 30일 +39.6%, 726,000원 부근 | 30일 +39.62%, 726,000원 부근 | 일치 |
| 톤과 실행가능성 | 비교적 실행지향(전략·비중 제시) | 보수적(검증 전 신중) | 부분 불일치 |

## 2. 일치하는 부분
- AI·HBM이 장기 투자 스토리의 핵심 동력이라는 평가
- 최근 30일 주가 급등으로 단기 과열·변동성 리스크 존재
- 메모리 사이클 민감도(ASP·재고)가 실적의 핵심 변수
- 최신 데이터(재무·뉴스) 부재가 분석 신뢰도를 제한
- 투자 전 추가 확인(실적·업황·뉴스)이 필요

## 3. 불일치하는 부분
- 구체성/실행력: OpenAI는 분할매수·비중 가이드·밸류에이션 프레임 제시(실행 가능), Gemini는 원칙적 유의 수준에 그침
- 리스크 범위: OpenAI는 지정학·고객집중·환율까지 폭넓게, Gemini는 거시/과열 중심
- 결론 톤: OpenAI는 “중장기 매력+리스크 관리”로 상대적으로 적극적, Gemini는 “정보 미확인 전 보수적”
- 정량화 의지: OpenAI는 시나리오/민감도 분석 추진 의사, Gemini는 정량화 부재

## 4. 분석 품질 평가
| 항목 | OpenAI | Gemini |
|------|--------|--------|
| 데이터 활용도 | 보통: 부분 조회 실패를 보완해 업황·제품·주가 정보를 종합 | 낮음: 주가 정보 중심, 정량/정밀 데이터 부재 |
| 논리적 일관성 | 높음: 구조적 스토리–모멘텀–리스크–전략 흐름이 명확 | 보통: 논리 흐름은 일관적이나 근거 폭이 제한 |
| 실용적 인사이트 | 높음: 분할매수·비중·익절/손절·밸류에이션 프레임 제시 | 낮음~보통: 신중론 위주, 구체적 실행 가이드 부족 |

## 5. 종합 판정
- 신뢰도: 중간
  - 이유: 두 분석 모두 최신 재무·뉴스 데이터 결핍. 다만 OpenAI가 더 구조적·실행지향적 인사이트 제공.
- 추천 의견:
  - 단기: 급등 구간인 점을 감안해 추격매수보다는 분할 접근과 포지션 한도 관리 권장. 변동성 확대 시 분할익절/재진입 규칙 설정.
  - 중장기: AI/HBM 주도 구조적 성장 가설은 유효. 다만 투자 전 반드시 다음을 확인:
    - 최신 분기 실적(영업이익 턴어라운드, DRAM/NAND 출하·ASP, 재고/가동률)
    - HBM 증설 계획·수율·고객 다변화(엔비디아 등 주요 고객 의존도)
    - 2025~26 CAPEX 가이던스와 FCF 전환 시점
    - 미·중 규제 노출(중국향 매출/장비 승인 이슈) 및 환율 민감도
    - 밸류에이션(시가총액 대비 PBR, EV/EBITDA)과 동종업체 대비 프리미엄 합리성
  - 종합적으로, 두 분석 중에서는 OpenAI의 프레임을 기본 레퍼런스로 삼되, Gemini의 경고(데이터 검증 전 신중)를 병행할 것을 권장. 최신 데이터로 밸류에이션 시나리오를 갱신한 뒤 단계적 매수 여부를 결정하는 접근이 바람직합니다.

---
## 학습 정리

### 1. LLM 교차 검증 구조
```
질문 → [Agent A (OpenAI)] → 분석 A
     → [Agent B (Gemini)] → 분석 B
               ↓
       [Judge LLM (gpt-5)]
               ↓
        비교 분석 리포트
```

### 2. 모델 구성
| 역할 | 모델 | 용도 |
|------|------|------|
| Agent 1 | gpt-5-mini | 분석 A |
| Agent 2 | gemini-2.5-flash | 분석 B |
| Judge | gpt-5 | 비교 평가 |

### 3. 핵심 코드
```python
# 두 Agent 생성 (동일 Tool, 다른 LLM)
agent_openai = create_agent(model_openai, tools, system_prompt)
agent_gemini = create_agent(model_gemini, tools, system_prompt)

# 동일 질문으로 두 Agent 분석
answer_openai = agent_openai.invoke({"messages": [...]})
answer_gemini = agent_gemini.invoke({"messages": [...]})

# Judge LLM으로 비교
comparison = model_judge.invoke(judge_prompt)
```

### 4. 활용 포인트
- 단일 LLM 편향 방지
- 다양한 관점의 분석 확보
- 신뢰도 높은 투자 의사결정 지원

---

## 모듈 3 완료

| 차시 | 주제 | 핵심 개념 |
|------|------|----------|
| 19-22 | 머신러닝 | Scikit-learn, 회귀/분류, 평가 |
| 23-24 | 딥러닝 | LSTM, 시계열 예측 |
| 25-26 | NLP | 토큰화, 감성분석 |
| 27-28 | LLM API | OpenAI, Gemini 설정 |
| 29 | LLM 활용 | 재무제표 분석 |
| 30 | LangChain | Agent + Memory |
| 31 | 통합 | **멀티 LLM 교차 검증** |

---

### 다음 모듈 예고
- 모듈 4: 분석 자동화 및 대시보드
  - Streamlit 대시보드
  - 자동 리포트 생성
  - 이메일 발송 자동화