# 29차시: [실습] ChatGPT API와 재무제표 요약 및 분석

## 학습 목표
- 네이버 금융에서 실제 재무제표 데이터 수집
- OpenAI / Gemini API를 활용한 재무제표 분석 실습
- 프롬프트 엔지니어링으로 분석 품질 향상

## 학습 내용
1. 네이버 금융에서 재무 데이터 수집
2. 데이터 전처리 및 포맷팅
3. 프롬프트 설계
4. ChatGPT / Gemini API로 분석
5. 기업 비교 분석

## 이전 차시 연계
- 15차시: 네이버 금융 크롤링 (`pd.read_html`)
- 27차시: 프롬프트 엔지니어링
- 28차시: ChatGPT, Gemini API 설정

In [None]:
# !pip install openai google-genai python-dotenv requests beautifulsoup4 lxml

In [None]:
# .env 파일 로드
# Colab에서 .env 파일 업로드

---
## API 클라이언트 설정

28차시에서 설정한 OpenAI와 Gemini API를 모두 사용할 수 있습니다.

In [None]:
# API 키 확인

In [None]:
# 사용할 API 선택 (openai 또는 gemini)

---
## 1. 네이버 금융에서 재무 데이터 수집

15차시에서 배운 `pd.read_html()`을 활용하여 네이버 금융에서 실제 재무제표를 수집합니다.

In [None]:
# 공통 헤더 설정
def get_company_name(stock_code):
        # HTTP GET 요청을 보내 HTML 페이지 가져오기
        # 회사명이 위치한 HTML 태그 선택
        # 회사명 태그가 존재하면 텍스트(회사명) 반환
        # 회사명을 찾지 못한 경우 종목코드 그대로 반환
def get_financial_summary(stock_code):
        # 모든 테이블 읽기
        # 재무 요약 테이블 찾기 (보통 '매출액' 포함)
        # 회사명 조회

In [None]:
# 삼성전자 재무 데이터 수집

---
## 2. 데이터 전처리 및 포맷팅

수집한 테이블 데이터를 LLM 분석에 적합한 형태로 변환합니다.

In [None]:
def format_for_llm(raw_data):
    # 리스트에 저장된 모든 줄을 개행 문자로 결합하여 하나의 문자열로 반환

In [None]:
# 데이터 변환

---
## 3. 프롬프트 설계

27차시에서 배운 프롬프트 엔지니어링을 활용하여 재무 분석용 프롬프트를 설계합니다.

In [None]:
def create_analysis_prompt(financial_text):
    # 시스템 프롬프트: LLM의 역할과 분석 기준 정의
    # 사용자 프롬프트: 실제 분석 요청 내용
## 1. 수익성 분석
## 2. 안정성 분석
## 3. 성장성 분석
## 4. 투자 포인트
## 5. 종합 의견

In [None]:
# 프롬프트 확인

---
## 4. ChatGPT / Gemini API로 분석

28차시에서 설정한 API를 사용하여 재무제표를 분석합니다.

In [None]:
def analyze_with_openai(financial_text):
def analyze_with_gemini(financial_text):
    # Gemini는 system prompt를 user prompt에 포함
def analyze_financial_statements(financial_text, api="openai"):

In [None]:
# 삼성전자 종합 분석 실행

---
## 5. 기업 비교 분석

두 기업의 재무제표를 수집하여 비교 분석합니다.

In [None]:
# SK하이닉스 재무 데이터 수집

In [None]:
# SK하이닉스 데이터 변환

In [None]:
def compare_with_openai(company1_text, company2_text):
## 1. 요약 비교표
## 2. 수익성 비교
## 3. 안정성 비교
## 4. 투자 매력도 비교
## 5. 결론
def compare_with_gemini(company1_text, company2_text):
## 1. 요약 비교표
## 2. 수익성 비교
## 3. 안정성 비교
## 4. 투자 매력도 비교
## 5. 결론 (100자 이내)
def compare_companies(company1_text, company2_text, api="openai"):

In [None]:
# 삼성전자 vs SK하이닉스 비교 분석

---
## 학습 정리

### 1. 재무 분석 워크플로우
```
네이버 금융 크롤링 → 데이터 전처리 → 프롬프트 설계 → API 분석 → 결과 활용
```

### 2. API 사용법 비교

| 항목 | OpenAI | Gemini |
|------|--------|--------|
| 패키지 | `openai` | `google-genai` |
| 클라이언트 | `OpenAI()` | `genai.Client()` |
| 모델 | `gpt-5-mini` | `gemini-2.5-flash` |
| 호출 | `client.responses.create()` | `client.models.generate_content()` |
| 응답 | `response.output_text` | `response.text` |

### 3. 이전 차시 연계
| 차시 | 활용 내용 |
|------|----------|
| 15차시 | 네이버 금융 크롤링 (`pd.read_html`) |
| 27차시 | 프롬프트 엔지니어링 |
| 28차시 | OpenAI, Gemini API 설정 |

---

### 다음 차시 예고
- 30차시: [실습] LangChain으로 만드는 나만의 '투자 분석 봇'
  - LangChain 프레임워크 소개
  - RAG (검색 증강 생성) 개념
  - 외부 데이터 연동