# 29차시: [실습] ChatGPT API와 재무제표 요약 및 분석

## 학습 목표
- 네이버 금융에서 실제 재무제표 데이터 수집
- OpenAI / Gemini API를 활용한 재무제표 분석 실습
- 프롬프트 엔지니어링으로 분석 품질 향상

## 학습 내용
1. 네이버 금융에서 재무 데이터 수집
2. 데이터 전처리 및 포맷팅
3. 프롬프트 설계
4. ChatGPT / Gemini API로 분석
5. 기업 비교 분석

## 이전 차시 연계
- 15차시: 네이버 금융 크롤링 (`pd.read_html`)
- 27차시: 프롬프트 엔지니어링
- 28차시: ChatGPT, Gemini API 설정

In [None]:
# !pip install openai google-genai python-dotenv requests beautifulsoup4 lxml

In [1]:
import os
import json
import pandas as pd
import requests
from bs4 import BeautifulSoup
from datetime import datetime
from IPython.display import display, Markdown, HTML
from dotenv import load_dotenv

# .env 파일 로드
try:
    from google.colab import files
    print("[.env 파일을 업로드해주세요]")
    uploaded = files.upload()
except ImportError:
    pass

load_dotenv()

True

---
## API 클라이언트 설정

28차시에서 설정한 OpenAI와 Gemini API를 모두 사용할 수 있습니다.

In [2]:
# API 키 확인
OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')
GEMINI_API_KEY = os.getenv('GOOGLE_API_KEY')

if OPENAI_API_KEY:
    print(f"[OpenAI API 키 로드 완료]")
    print(f"키: {OPENAI_API_KEY[:10]}...")
else:
    print("[OpenAI API 키 미설정]")

if GEMINI_API_KEY:
    print(f"[Gemini API 키 로드 완료]")
    print(f"키: {GEMINI_API_KEY[:10]}...")
else:
    print("[Gemini API 키 미설정]")

[OpenAI API 키 로드 완료]
키: sk-FeQOBhF...
[Gemini API 키 로드 완료]
키: AIzaSyBARt...


In [4]:
# 사용할 API 선택 (openai 또는 gemini)
USE_API = "gemini"  # "openai" 또는 "gemini"

---
## 1. 네이버 금융에서 재무 데이터 수집

15차시에서 배운 `pd.read_html()`을 활용하여 네이버 금융에서 실제 재무제표를 수집합니다.

In [5]:
# 공통 헤더 설정
HEADERS = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'
}

def get_company_name(stock_code):
    """
    종목코드(stock_code)를 입력받아
    네이버 금융 페이지에서 회사명을 크롤링하여 반환하는 함수
    """

    url = f"https://finance.naver.com/item/main.nhn?code={stock_code}"

    try:
        # HTTP GET 요청을 보내 HTML 페이지 가져오기
        response = requests.get(url, headers=HEADERS)

        soup = BeautifulSoup(response.text, 'html.parser')

        # 회사명이 위치한 HTML 태그 선택
        name_tag = soup.select_one('div.wrap_company h2 a')

        # 회사명 태그가 존재하면 텍스트(회사명) 반환
        if name_tag:
            return name_tag.text.strip()

        # 회사명을 찾지 못한 경우 종목코드 그대로 반환
        return stock_code

    except Exception:
        return stock_code


def get_financial_summary(stock_code):
    """네이버 금융에서 재무 요약 정보 수집"""
    url = f"https://finance.naver.com/item/main.nhn?code={stock_code}"

    try:
        # 모든 테이블 읽기
        tables = pd.read_html(url, encoding='euc-kr')

        # 재무 요약 테이블 찾기 (보통 '매출액' 포함)
        financial_table = None
        for table in tables:
            table_str = str(table.columns) + str(table.values)
            if '매출액' in table_str or '영업이익' in table_str:
                financial_table = table
                break

        if financial_table is None:
            return None

        # 회사명 조회
        company_name = get_company_name(stock_code)

        return {
            'company_name': company_name,
            'stock_code': stock_code,
            'table': financial_table
        }
    except Exception as e:
        print(f"[오류] {stock_code} 데이터 수집 실패: {e}")
        return None

In [6]:
# 삼성전자 재무 데이터 수집
print("[네이버 금융에서 재무 데이터 수집]")
print("=" * 60)

samsung_data = get_financial_summary("005930")

if samsung_data:
    print(f"\n회사명: {samsung_data['company_name']}")
    print(f"종목코드: {samsung_data['stock_code']}")
    print("\n[재무 요약 테이블]")
    display(samsung_data['table'])
else:
    print("데이터 수집 실패")

[네이버 금융에서 재무 데이터 수집]

회사명: 삼성전자
종목코드: 005930

[재무 요약 테이블]


Unnamed: 0_level_0,주요재무정보,최근 연간 실적,최근 연간 실적,최근 연간 실적,최근 연간 실적,최근 분기 실적,최근 분기 실적,최근 분기 실적,최근 분기 실적,최근 분기 실적,최근 분기 실적
Unnamed: 0_level_1,주요재무정보,2022.12,2023.12,2024.12,2025.12(E),2024.09,2024.12,2025.03,2025.06,2025.09,2025.12(E)
Unnamed: 0_level_2,주요재무정보,IFRS연결,IFRS연결,IFRS연결,IFRS연결,IFRS연결,IFRS연결,IFRS연결,IFRS연결,IFRS연결,IFRS연결
0,매출액,3022314.0,2589355.0,3008709.0,3288209.0,790987.0,757883.0,791405.0,745663.0,860617.0,892173.0
1,영업이익,433766.0,65670.0,327260.0,399041.0,91834.0,64927.0,66853.0,46761.0,121661.0,164545.0
2,당기순이익,556541.0,154871.0,344514.0,395991.0,101009.0,77544.0,82229.0,51164.0,122257.0,151677.0
3,영업이익률,14.35,2.54,10.88,12.14,11.61,8.57,8.45,6.27,14.14,18.44
4,순이익률,18.41,5.98,11.45,12.04,12.77,10.23,10.39,6.86,14.21,17.0
5,ROE(지배주주),17.07,4.15,9.03,9.53,8.79,9.03,9.24,7.95,8.37,
6,부채비율,26.41,25.36,27.93,,27.19,27.93,26.99,26.36,26.64,
7,당좌비율,211.68,189.46,187.8,,190.56,187.8,187.68,190.87,204.62,
8,유보율,38144.29,39114.28,41772.84,,41198.62,41772.84,42056.84,42340.19,43418.06,
9,EPS(원),8057.0,2131.0,4950.0,5727.0,1440.0,1115.0,1186.0,733.0,1783.0,2290.0


---
## 2. 데이터 전처리 및 포맷팅

수집한 테이블 데이터를 LLM 분석에 적합한 형태로 변환합니다.

In [7]:
def format_for_llm(raw_data):
    """수집한 데이터를 LLM 입력용 텍스트로 변환"""
    if raw_data is None:
        return "데이터가 없습니다."

    lines = []
    lines.append(f"회사명: {raw_data['company_name']}")
    lines.append(f"종목코드: {raw_data['stock_code']}")
    lines.append(f"데이터 출처: 네이버 금융")
    lines.append(f"수집 일시: {datetime.now().strftime('%Y-%m-%d %H:%M')}")
    lines.append("\n[재무제표 데이터]")
    lines.append(raw_data['table'].to_string())

    return "\n".join(lines)

In [8]:
# 데이터 변환
samsung_text = format_for_llm(samsung_data)

print("[LLM 입력용 텍스트]")
print("=" * 60)
print(samsung_text)

[LLM 입력용 텍스트]
회사명: 삼성전자
종목코드: 005930
데이터 출처: 네이버 금융
수집 일시: 2026-01-03 06:15

[재무제표 데이터]
       주요재무정보    최근 연간 실적                                       최근 분기 실적                                                       
       주요재무정보     2022.12     2023.12     2024.12  2025.12(E)    2024.09    2024.12    2025.03    2025.06    2025.09 2025.12(E)
       주요재무정보      IFRS연결      IFRS연결      IFRS연결      IFRS연결     IFRS연결     IFRS연결     IFRS연결     IFRS연결     IFRS연결     IFRS연결
0         매출액  3022314.00  2589355.00  3008709.00  3288209.00  790987.00  757883.00  791405.00  745663.00  860617.00  892173.00
1        영업이익   433766.00    65670.00   327260.00   399041.00   91834.00   64927.00   66853.00   46761.00  121661.00  164545.00
2       당기순이익   556541.00   154871.00   344514.00   395991.00  101009.00   77544.00   82229.00   51164.00  122257.00  151677.00
3       영업이익률       14.35        2.54       10.88       12.14      11.61       8.57       8.45       6.27      14.14      18.44
4        순이익률   

---
## 3. 프롬프트 설계

27차시에서 배운 프롬프트 엔지니어링을 활용하여 재무 분석용 프롬프트를 설계합니다.

In [9]:
def create_analysis_prompt(financial_text):
    """
    재무제표 분석용 시스템 프롬프트와 사용자 프롬프트를 생성하는 함수
    - 분석 유형 분기 제거
    - 항상 종합 재무 분석 프롬프트를 반환
    """

    # 시스템 프롬프트: LLM의 역할과 분석 기준 정의
    system_prompt = """
당신은 15년 경력의 CFA 자격증을 보유한 증권 애널리스트입니다.
기업 재무제표를 분석하여 투자자에게 유용한 인사이트를 제공합니다.
분석은 객관적 데이터에 기반하며, 긍정적/부정적 요소를 균형 있게 제시합니다.
한국어로 답변합니다.
"""

    # 사용자 프롬프트: 실제 분석 요청 내용
    user_prompt = f"""
다음은 네이버 금융에서 수집한 재무제표입니다. 이를 기반으로 종합 분석해주세요.

{financial_text}

다음 형식으로 분석 결과를 작성해주세요:

## 1. 수익성 분석
- 매출액, 영업이익, 당기순이익 추이 평가
- 영업이익률 및 순이익률 수준과 변화

## 2. 안정성 분석
- 부채비율, 유동비율 등 주요 재무 안정성 지표
- 재무 구조의 안정성 평가

## 3. 성장성 분석
- 매출 및 이익 성장 추이
- 중장기 성장 가능성 평가

## 4. 투자 포인트
- 강점 2~3가지
- 리스크 요인 2~3가지

## 5. 종합 의견
- 투자 관점에서 100자 이내 요약
"""

    return system_prompt, user_prompt

In [10]:
# 프롬프트 확인
system_prompt, user_prompt = create_analysis_prompt(samsung_text)
print("[시스템 프롬프트]")
print("=" * 60)
print(system_prompt)
print("\n[사용자 프롬프트 - 일부]")
print("=" * 60)
print(user_prompt[:500] + "...")

[시스템 프롬프트]

당신은 15년 경력의 CFA 자격증을 보유한 증권 애널리스트입니다.
기업 재무제표를 분석하여 투자자에게 유용한 인사이트를 제공합니다.
분석은 객관적 데이터에 기반하며, 긍정적/부정적 요소를 균형 있게 제시합니다.
한국어로 답변합니다.


[사용자 프롬프트 - 일부]

다음은 네이버 금융에서 수집한 재무제표입니다. 이를 기반으로 종합 분석해주세요.

회사명: 삼성전자
종목코드: 005930
데이터 출처: 네이버 금융
수집 일시: 2026-01-03 06:15

[재무제표 데이터]
       주요재무정보    최근 연간 실적                                       최근 분기 실적                                                       
       주요재무정보     2022.12     2023.12     2024.12  2025.12(E)    2024.09    2024.12    2025.03    2025.06    2025.09 2025.12(E)
       주요재무정보      IFRS연결      IFRS연결      IFRS연결      IFRS연결     IFRS연결     IFRS연결     IFRS연결     IFRS연결     IFRS연결     IF...


---
## 4. ChatGPT / Gemini API로 분석

28차시에서 설정한 API를 사용하여 재무제표를 분석합니다.

In [13]:
def analyze_with_openai(financial_text):
    """OpenAI API로 재무제표 분석 (Responses API)"""
    system_prompt, user_prompt = create_analysis_prompt(financial_text)

    try:
        response = openai_client.responses.create(
            model="gpt-5-mini",
            input=[
                {"role": "system", "content": system_prompt},
                {"role": "user", "content": user_prompt}
            ]
        )
        return response.output_text
    except Exception as e:
        return f"오류 발생: {str(e)}"

def analyze_with_gemini(financial_text):
    """Gemini API로 재무제표 분석"""
    system_prompt, user_prompt = create_analysis_prompt(financial_text)

    # Gemini는 system prompt를 user prompt에 포함
    full_prompt = f"""[시스템 지시사항]
{system_prompt}

[분석 요청]
{user_prompt}"""

    try:
        response = gemini_client.models.generate_content(
            model="gemini-2.5-flash",
            contents=full_prompt
        )
        return response.text
    except Exception as e:
        return f"오류 발생: {str(e)}"


def analyze_financial_statements(financial_text, api="openai"):
    """통합 재무제표 분석 함수"""
    if api == "openai":
        return analyze_with_openai(financial_text)
    elif api == "gemini":
        return analyze_with_gemini(financial_text)
    else:
        return "지원하지 않는 API입니다."

In [14]:
# 삼성전자 종합 분석 실행
print(f"[{USE_API.upper()} 재무제표 종합 분석 - 삼성전자]")
print("=" * 60)

result = analyze_financial_statements(samsung_text, USE_API)

display(Markdown(result))

[GEMINI 재무제표 종합 분석 - 삼성전자]


## 삼성전자 (005930) 종합 재무제표 분석 (2026-01-03 기준)

본 분석은 네이버 금융에서 수집된 삼성전자(005930)의 재무제표 데이터를 기반으로 작성되었습니다. 2024년 12월까지의 실적은 확정 또는 추정치이며, 2025년 실적은 추정치(E)임을 감안하여 주시기 바랍니다.

---

## 1. 수익성 분석

*   **매출액, 영업이익, 당기순이익 추이 평가:**
    삼성전자의 매출액은 2022년 302조 2,314억 원에서 2023년 258조 9,355억 원으로 감소하며 IT 업황 둔화의 영향을 받았습니다. 그러나 2024년 300조 8,709억 원, 2025년 328조 8,209억 원으로 회복 및 성장이 예상되며, 이는 반도체 업황 회복과 신제품 출시에 따른 것으로 보입니다.
    영업이익은 2022년 43조 3,766억 원에서 2023년 6조 5,670억 원으로 크게 감소하며 수익성 악화가 두드러졌습니다. 하지만 2024년 32조 7,260억 원, 2025년 39조 9,041억 원으로 가파른 회복이 전망됩니다. 당기순이익 역시 2023년 침체 후 2024년과 2025년에 걸쳐 유사한 회복 추세를 보이고 있습니다.
    분기별 실적을 보면, 2024년 3분기 9조 1,834억 원에서 4분기 6조 4,927억 원으로 일시적 감소 후 2025년 1분기 6조 6,853억 원, 2분기 4조 6,761억 원으로 조정을 거쳤습니다. 이후 2025년 3분기 12조 1,661억 원, 4분기 16조 4,545억 원으로 예상되며, 2025년 하반기 강력한 실적 턴어라운드가 기대됩니다.

*   **영업이익률 및 순이익률 수준과 변화:**
    2022년 각각 14.35%, 18.41%였던 영업이익률과 순이익률은 2023년 2.54%, 5.98%로 크게 하락하며 수익성 훼손이 심화되었습니다. 하지만 2024년 각각 10.88%, 11.45%로 개선된 후 2025년에는 12.14%, 12.04% 수준을 회복할 것으로 전망됩니다.
    분기별로는 2025년 2분기 6.27%(영업이익률), 6.86%(순이익률)까지 하락했으나, 2025년 3분기 14.14%, 14.21%로 급등하고 4분기에는 18.44%, 17.00%로 2022년 연간 수준을 상회하는 강력한 수익성 개선이 예상됩니다. 이는 주로 메모리 반도체 가격 상승과 고부가 제품 판매 확대에 기인할 것으로 판단됩니다.

## 2. 안정성 분석

*   **부채비율, 당좌비율 등 주요 재무 안정성 지표:**
    삼성전자의 부채비율은 2022년 26.41%, 2023년 25.36%, 2024년 27.93%로 매우 낮은 수준을 유지하고 있습니다. 이는 차입금 의존도가 낮고 자기자본을 기반으로 한 안정적인 재무구조를 의미합니다.
    당좌비율은 2022년 211.68%에서 2024년 187.80%로 소폭 하락했으나, 여전히 100%를 훨씬 상회하는 매우 높은 수준으로 단기 부채 상환 능력이 탁월함을 보여줍니다.
    유보율은 2022년 38144.29%에서 2024년 41772.84%로 꾸준히 증가하며, 기업의 이익을 사내에 축적하여 재투자 여력과 재무적 완충 능력을 강화하고 있음을 시사합니다.

*   **재무 구조의 안정성 평가:**
    삼성전자는 매우 보수적이고 안정적인 재무 구조를 갖추고 있습니다. 낮은 부채비율, 높은 당좌비율, 지속적으로 증가하는 유보율은 외부 충격에 대한 탁월한 방어 능력을 제공하며, 대규모 투자를 안정적으로 실행할 수 있는 기반이 됩니다. 이는 동사의 글로벌 시장 지위와 함께 핵심 경쟁력 중 하나로 평가됩니다.

## 3. 성장성 분석

*   **매출 및 이익 성장 추이:**
    2023년 침체기를 겪었으나, 2024년과 2025년에 걸쳐 매출액과 이익 모두 상당한 회복과 성장이 전망됩니다. 특히 2025년 예상 매출액은 2022년 최고치를 경신할 것으로 보이며, 영업이익은 2023년 대비 2025년 약 6배 이상의 급격한 성장이 예상됩니다. 이는 사이클 산업의 특성이 반영된 것으로, 턴어라운드 국면에서의 강력한 이익 개선이 기대됩니다. EPS 또한 2023년 2,131원에서 2025년 5,727원으로 급증할 것으로 예측됩니다.

*   **중장기 성장 가능성 평가:**
    삼성전자의 중장기 성장성은 반도체(메모리, 파운드리), 스마트폰, 디스플레이 등 핵심 사업부문의 기술 리더십과 시장 수요 변화에 달려 있습니다. AI 시대 도래에 따른 고대역폭 메모리(HBM) 및 첨단 파운드리 수요 증가, 폴더블폰 등 프리미엄 스마트폰 시장 확장, 그리고 전장용 및 IT 기기용 고부가 디스플레이 수요 증가는 긍정적인 성장 동력으로 작용할 것입니다. 막대한 R&D 투자와 CAPEX 집행을 통해 미래 기술 및 생산 능력 확보에 집중하고 있으며, 이는 장기적인 경쟁력 강화로 이어질 것으로 판단됩니다.

## 4. 투자 포인트

*   **강점:**
    1.  **반도체 업황 회복에 따른 강력한 실적 턴어라운드:** 2023년 최악의 시기를 지나 2024년과 2025년 메모리 반도체 가격 상승 및 수요 회복에 힘입어 매출과 이익이 큰 폭으로 증가할 것으로 예상되며, 특히 이익률 개선이 두드러질 전망입니다.
    2.  **압도적인 재무 안정성:** 낮은 부채비율과 높은 유동성을 바탕으로 어떠한 시장 변화에도 유연하게 대응하고 대규모 투자를 지속할 수 있는 견고한 재무적 기반을 갖추고 있습니다.
    3.  **다변화된 사업 포트폴리오와 시장 지배력:** 메모리 반도체, 스마트폰, 디스플레이, 가전 등 핵심 사업부문에서 글로벌 선두 지위를 유지하며 안정적인 캐시플로우를 창출하고 있습니다.

*   **리스크 요인:**
    1.  **글로벌 경기 변동 및 IT 수요 불확실성:** 예상보다 더딘 글로벌 경기 회복 또는 IT 기기 수요 둔화는 반도체 업황 회복 속도를 늦추고 실적 추정치에 하향 압력을 가할 수 있습니다.
    2.  **경쟁 심화 및 기술 패권 경쟁:** 파운드리 시장에서의 TSMC와의 경쟁, HBM 등 신기술 분야에서의 경쟁 심화, 그리고 중국 기업의 추격은 지속적인 수익성 압박 요인이 될 수 있습니다.
    3.  **환율 변동성 및 지정학적 리스크:** 수출 비중이 높아 환율 변동에 민감하며, 미-중 기술 갈등과 같은 지정학적 리스크는 공급망 및 해외 사업에 영향을 미칠 수 있습니다.

## 5. 종합 의견

삼성전자는 2023년 업황 부진을 겪었으나, 2024-2025년 반도체 사이클 회복과 AI 수요 증가에 힘입어 매출과 이익의 강력한 턴어라운드가 기대됩니다. 탁월한 재무 안정성과 글로벌 시장 지배력을 바탕으로 중장기 성장 잠재력이 높으나, 경기 변동성 및 경쟁 심화는 주시해야 할 리스크입니다.

---
## 5. 기업 비교 분석

두 기업의 재무제표를 수집하여 비교 분석합니다.

In [15]:
# SK하이닉스 재무 데이터 수집
print("[SK하이닉스 재무 데이터 수집]")
print("=" * 60)

skhynix_data = get_financial_summary("000660")

if skhynix_data:
    print(f"\n회사명: {skhynix_data['company_name']}")
    print(f"종목코드: {skhynix_data['stock_code']}")
    print("\n[재무 요약 테이블]")
    display(skhynix_data['table'])
else:
    print("데이터 수집 실패")

[SK하이닉스 재무 데이터 수집]

회사명: SK하이닉스
종목코드: 000660

[재무 요약 테이블]


Unnamed: 0_level_0,주요재무정보,최근 연간 실적,최근 연간 실적,최근 연간 실적,최근 연간 실적,최근 분기 실적,최근 분기 실적,최근 분기 실적,최근 분기 실적,최근 분기 실적,최근 분기 실적
Unnamed: 0_level_1,주요재무정보,2022.12,2023.12,2024.12,2025.12(E),2024.09,2024.12,2025.03,2025.06,2025.09,2025.12(E)
Unnamed: 0_level_2,주요재무정보,IFRS연결,IFRS연결,IFRS연결,IFRS연결,IFRS연결,IFRS연결,IFRS연결,IFRS연결,IFRS연결,IFRS연결
0,매출액,446216.0,327657.0,661930.0,936677.0,175731.0,197670.0,176391.0,222320.0,244489.0,293321.0
1,영업이익,68094.0,-77303.0,234673.0,431584.0,70300.0,80828.0,74405.0,92129.0,113834.0,151095.0
2,당기순이익,22417.0,-91375.0,197969.0,393849.0,57534.0,80065.0,81082.0,69962.0,125975.0,133844.0
3,영업이익률,15.26,-23.59,35.45,46.08,40.0,40.89,42.18,41.44,46.56,51.51
4,순이익률,5.02,-27.89,29.91,42.05,32.74,40.5,45.97,31.47,51.53,45.63
5,ROE(지배주주),3.55,-15.61,31.06,42.5,17.31,31.06,37.94,39.27,43.2,
6,부채비율,64.12,87.52,62.15,,65.95,62.15,52.24,48.13,48.43,
7,당좌비율,60.27,75.97,113.24,,93.09,113.24,104.14,117.87,134.9,
8,유보율,1668.32,1397.12,1911.2,,1703.85,1911.2,2114.39,2298.84,2636.87,
9,EPS(원),3063.0,-12517.0,27182.0,54181.0,7897.0,10990.0,11136.0,9612.0,17301.0,16327.0


In [16]:
# SK하이닉스 데이터 변환
skhynix_text = format_for_llm(skhynix_data)

In [18]:
def compare_with_openai(company1_text, company2_text):
    """OpenAI로 두 기업 비교 분석"""

    system_prompt = """당신은 15년 경력의 증권 애널리스트입니다.
두 기업의 재무제표를 비교 분석하여 투자자에게 인사이트를 제공합니다.
객관적 데이터에 기반하여 분석하고, 한국어로 답변합니다."""

    user_prompt = f"""다음 두 기업의 재무제표를 비교 분석해주세요.

[기업 1]
{company1_text}

[기업 2]
{company2_text}

다음 형식으로 비교 분석 결과를 작성해주세요:

## 1. 요약 비교표
| 항목 | 기업1 | 기업2 | 비교 |
|------|-------|-------|------|
(주요 지표 비교)

## 2. 수익성 비교
- 영업이익률, 순이익률 비교

## 3. 안정성 비교
- 부채비율, 유동비율 비교

## 4. 투자 매력도 비교
- 각 기업의 강점/약점
- 어느 기업이 더 투자 가치가 있는지

## 5. 결론
- 100자 이내 요약
"""

    try:
        response = openai_client.responses.create(
            model="gpt-5-mini",
            input=[
                {"role": "system", "content": system_prompt},
                {"role": "user", "content": user_prompt}
            ],
            max_output_tokens=2000
        )
        return response.output_text
    except Exception as e:
        return f"오류: {str(e)}"

def compare_with_gemini(company1_text, company2_text):
    """Gemini로 두 기업 비교 분석"""
    if not gemini_client:
        return None

    prompt = f"""당신은 15년 경력의 증권 애널리스트입니다.
두 기업의 재무제표를 비교 분석하여 투자자에게 인사이트를 제공합니다.
객관적 데이터에 기반하여 분석하고, 한국어로 답변합니다.

다음 두 기업의 재무제표를 비교 분석해주세요.

[기업 1]
{company1_text}

[기업 2]
{company2_text}

다음 형식으로 비교 분석 결과를 작성해주세요:

## 1. 요약 비교표
| 항목 | 기업1 | 기업2 | 비교 |
|------|-------|-------|------|
(주요 지표 비교)

## 2. 수익성 비교
## 3. 안정성 비교
## 4. 투자 매력도 비교
## 5. 결론 (100자 이내)
"""

    try:
        response = gemini_client.models.generate_content(
            model="gemini-2.5-flash",
            contents=prompt
        )
        return response.text
    except Exception as e:
        return f"오류: {str(e)}"


def compare_companies(company1_text, company2_text, api="openai"):
    """통합 기업 비교 함수"""
    if api == "openai":
        return compare_with_openai(company1_text, company2_text)
    elif api == "gemini":
        return compare_with_gemini(company1_text, company2_text)
    else:
        return "지원하지 않는 API입니다."

In [19]:
# 삼성전자 vs SK하이닉스 비교 분석
print(f"[{USE_API.upper()} 기업 비교 분석: 삼성전자 vs SK하이닉스]")
print("=" * 60)

comparison_result = compare_companies(samsung_text, skhynix_text, api=USE_API)

display(Markdown(comparison_result))

[GEMINI 기업 비교 분석: 삼성전자 vs SK하이닉스]


## 15년 경력 애널리스트의 기업 재무제표 비교 분석 (삼성전자 vs. SK하이닉스)

투자자 여러분 안녕하십니까. 15년 경력의 증권 애널리스트로서 삼성전자(005930)와 SK하이닉스(000660) 두 기업의 재무제표를 객관적으로 분석하여 투자 인사이트를 제공해 드리겠습니다. 두 기업 모두 대한민국 반도체 산업을 대표하는 기업이지만, 사업 구조와 재무 상태에서 뚜렷한 차이를 보이며, 이는 투자 매력도에도 영향을 미칩니다.

### 1. 요약 비교표 (2025년 예상 실적 기준)

| 항목 | 삼성전자 (005930) | SK하이닉스 (000660) | 비교 (2025년 예상 기준) |
|:-----|:-------------------|:--------------------|:-------------------------------------------------------|
| 매출액 | 3,288,209억 원 | 936,677억 원 | 삼성전자가 압도적인 규모 (약 3.5배) |
| 영업이익률 | 12.14% | 46.08% | SK하이닉스가 월등히 높음 (메모리 업사이클 영향) |
| 순이익률 | 12.04% | 42.05% | SK하이닉스가 월등히 높음 |
| ROE(지배주주) | 9.53% | 42.50% | SK하이닉스가 압도적으로 높음 |
| 부채비율 (2024.12) | 27.93% | 62.15% | 삼성전자가 훨씬 안정적 |
| 당좌비율 (2024.12) | 187.80% | 113.24% | 삼성전자가 더 높은 유동성 |
| EPS(원) | 5,727원 | 54,181원 | SK하이닉스의 주당 이익 성장률이 더 높음 |
| PER(배) | 22.44배 | 12.50배 | SK하이닉스가 이익 대비 저평가 (성장성 고려 시) |
| PBR(배) | 2.03배 | 4.18배 | SK하이닉스가 자산 대비 고평가 (높은 성장 기대) |
| 주당배당금(원) | 1,527원 | 1,791원 | SK하이닉스가 높으나 변동성 존재 |
| 시가배당률(%) (2024.12) | 2.72% | 1.27% | 삼성전자가 더 높은 배당 수익률 |

### 2. 수익성 비교

**삼성전자:**
삼성전자는 2023년 메모리 업황 악화로 실적 부진을 겪었으나, 2024년부터 점진적인 회복세를 보이며 2025년에는 매출액 328조 원, 영업이익 39조 원을 넘어설 것으로 예상됩니다. 영업이익률과 순이익률은 10%대 초중반을 꾸준히 유지할 것으로 보이며, 이는 다각화된 사업 포트폴리오(반도체, 스마트폰, 가전 등) 덕분에 메모리 사이클의 변동성을 일정 부분 상쇄하기 때문입니다. ROE는 9%대 중반으로, 대규모 자본을 효율적으로 활용하고 있음을 보여줍니다.

**SK하이닉스:**
SK하이닉스는 메모리 반도체 전문 기업으로, 2023년 기록적인 적자를 기록하며 극심한 업황 침체를 겪었습니다. 하지만 2024년부터 메모리 업황 회복, 특히 AI 반도체 수요 증가에 힘입어 폭발적인 실적 턴어라운드를 달성하고 있습니다. 2025년에는 매출액 93조 원, 영업이익 43조 원을 상회하며 전년 대비 높은 성장을 보일 것으로 예상됩니다. 특히, 2025년 예상 영업이익률과 순이익률은 각각 46.08%, 42.05%로 삼성전자를 압도하며, ROE 역시 42.50%에 달해 메모리 업사이클 국면에서 매우 높은 수익성을 보여줄 것으로 전망됩니다.

**결론:** SK하이닉스는 메모리 업사이클 효과로 2025년 압도적인 수익성 개선이 예상되나, 삼성전자는 상대적으로 안정적인 수익 구조를 유지합니다. SK하이닉스는 고성장/고수익 잠재력을 가졌지만, 사이클에 따른 변동성이 매우 큽니다.

### 3. 안정성 비교

**삼성전자:**
삼성전자는 매우 견고하고 안정적인 재무 구조를 자랑합니다. 부채비율은 20%대 후반으로 매우 낮으며, 당좌비율은 180% 이상으로 유동성 또한 풍부합니다. 유보율은 4만%를 넘어설 정도로 압도적인 내부 유보 자금을 보유하고 있어, 외부 환경 변화에 대한 방어력이 매우 뛰어납니다. 대규모 투자나 위기 상황에서도 안정적으로 대응할 수 있는 '재무적 요새'와 같은 기업입니다.

**SK하이닉스:**
SK하이닉스는 2023년 대규모 적자로 인해 부채비율이 일시적으로 상승했으나, 2024년 실적 개선과 함께 62.15% 수준으로 하락하여 안정화되는 추세입니다. 당좌비율도 110%대로 개선되며 유동성이 회복되고 있습니다. 하지만 삼성전자에 비해서는 여전히 부채 부담이 높고 유동성이 낮은 편입니다. 메모리 산업의 특성상 대규모 설비 투자가 수반되므로 상대적으로 높은 부채비율을 가질 수밖에 없으며, 업황에 따라 재무 안정성이 영향을 받을 수 있습니다.

**결론:** 삼성전자는 타의 추종을 불허하는 압도적인 재무 안정성을 보유하고 있습니다. SK하이닉스는 업황 회복과 함께 재무 안정성이 빠르게 개선되고 있으나, 삼성전자 대비 낮은 수준이며 메모리 사이클에 더 민감합니다.

### 4. 투자 매력도 비교

**성장성:** 2025년 예상치를 기준으로 볼 때, SK하이닉스는 2023년 적자에서 벗어나며 매출액, 영업이익, EPS 측면에서 삼성전자 대비 훨씬 높은 성장률을 기록할 것으로 예상됩니다. 이는 메모리 반도체 업황의 강력한 회복과 AI 시대의 핵심인 고대역폭 메모리(HBM) 시장에서의 선도적 위치가 반영된 결과입니다. 삼성전자도 꾸준한 성장을 이어가겠지만, SK하이닉스만큼의 폭발적인 성장률은 기대하기 어렵습니다.

**밸류에이션:**
*   **PER (주가수익비율):** 2025년(E) 기준 SK하이닉스(12.50배)의 PER이 삼성전자(22.44배)보다 낮게 형성되어 있습니다. 이는 SK하이닉스의 예상 이익 증가 폭이 주가 상승을 아직 완전히 반영하지 못했거나, 과거의 높은 변동성에 대한 시장의 보수적인 시각이 남아있을 수 있음을 시사합니다. 높은 성장률을 감안하면 SK하이닉스의 PER은 상대적으로 매력적일 수 있습니다.
*   **PBR (주가순자산비율):** 2025년(E) 기준 SK하이닉스(4.18배)의 PBR이 삼성전자(2.03배)보다 높습니다. 이는 SK하이닉스가 자산 가치 대비 높은 프리미엄을 받고 있음을 의미하며, 이는 2025년 예상 ROE가 압도적으로 높은 것과 일맥상통합니다. 시장은 SK하이닉스의 높은 미래 수익 창출 능력에 더 큰 기대를 걸고 있다고 해석할 수 있습니다.

**배당 매력:** 삼성전자는 주당배당금(DPS)이 1,500원대 초반으로 꾸준하며, 2024년 기준 시가배당률이 2.72%로 안정적인 배당 수익을 제공합니다. 배당성향도 20~30%대로 건전하게 관리됩니다. 반면, SK하이닉스는 2023년 적자로 인해 배당 변동성이 컸고, 2025년 예상 DPS는 삼성전자보다 높지만 시가배당률(1.27%)은 삼성전자보다 낮은 편입니다. 삼성전자는 배당을 통한 주주환원 정책이 더욱 뚜렷하고 안정적입니다.

### 5. 결론 (100자 이내)

삼성전자는 압도적 재무 안정성과 다각화된 사업으로 꾸준한 성장을 추구하며 배당 매력이 높은 기업입니다. 반면 SK하이닉스는 메모리 업사이클과 AI 성장 동력을 바탕으로 2025년 폭발적 수익 개선이 기대되는 고성장/고변동성 기업으로, 성장 잠재력에 대한 높은 기대와 함께 리스크를 감수할 투자자에게 적합합니다.

---
## 학습 정리

### 1. 재무 분석 워크플로우
```
네이버 금융 크롤링 → 데이터 전처리 → 프롬프트 설계 → API 분석 → 결과 활용
```

### 2. API 사용법 비교

| 항목 | OpenAI | Gemini |
|------|--------|--------|
| 패키지 | `openai` | `google-genai` |
| 클라이언트 | `OpenAI()` | `genai.Client()` |
| 모델 | `gpt-5-mini` | `gemini-2.5-flash` |
| 호출 | `client.responses.create()` | `client.models.generate_content()` |
| 응답 | `response.output_text` | `response.text` |

### 3. OpenAI Responses API 코드
```python
from openai import OpenAI
client = OpenAI(api_key=api_key)

response = client.responses.create(
    model="gpt-5-mini",
    input=[
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": user_prompt}
    ],
    max_output_tokens=2000
)
result = response.output_text
```

### 4. Gemini API 코드
```python
from google import genai
client = genai.Client(api_key=api_key)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents=prompt
)
result = response.text
```

### 5. 이전 차시 연계
| 차시 | 활용 내용 |
|------|----------|
| 15차시 | 네이버 금융 크롤링 (`pd.read_html`) |
| 27차시 | 프롬프트 엔지니어링 |
| 28차시 | OpenAI, Gemini API 설정 |

---

### 다음 차시 예고
- 30차시: [실습] LangChain으로 만드는 나만의 '투자 분석 봇'
  - LangChain 프레임워크 소개
  - RAG (검색 증강 생성) 개념
  - 외부 데이터 연동