# 27차시: 생성형 AI / LLM을 활용한 투자 리서치

## 학습 목표
- 생성형 AI와 LLM의 기본 개념 이해
- 금융/투자 분야에서의 LLM 활용 방법 학습
- **좋은 프롬프트 작성법** 익히기

## 학습 내용
1. 생성형 AI / LLM 개요
2. 금융 분야 활용 사례
3. 프롬프트 엔지니어링 실습

In [10]:
!pip -q install finance-datareader koreanize-matplotlib

---
## 1. 생성형 AI / LLM 개요

### 정의
- **생성형 AI**: 학습한 데이터를 바탕으로 새로운 콘텐츠(텍스트, 이미지, 코드)를 생성하는 AI
- **LLM (Large Language Model)**: 대규모 텍스트 데이터로 학습한 언어 모델 (GPT-4, Gemini, Claude 등)

### 금융에서 LLM이 유용한 이유
| 기존 방식 | LLM 활용 |
|----------|---------|
| 재무제표 직접 분석 | "이 재무제표 핵심 요약해줘" |
| 뉴스 하나씩 읽기 | "오늘 금융 뉴스 요약해줘" |
| 코드 직접 작성 | "주가 수집 코드 작성해줘" |

---
## 2. 금융 분야 활용 사례

### 활용 영역
| 활용 | 설명 |
|------|------|
| 재무제표 분석 | 숫자 해석 및 요약 |
| 뉴스 요약 | 대량 뉴스 빠른 파악 |
| 기업 분석 | 사업 모델, 경쟁력 분석 |
| 코드 생성 | 데이터 분석 코드 작성 |

---
## 3. 프롬프트 엔지니어링 실습

### 좋은 프롬프트의 요소
1. **역할 부여**: "당신은 10년 경력의 애널리스트입니다"
2. **명확한 지시**: 무엇을 원하는지 구체적으로
3. **맥락 제공**: 배경 정보, 데이터 제공
4. **형식 지정**: 출력 형태 명시

In [11]:
# 나쁜 vs 좋은 프롬프트 비교
print("[나쁜 프롬프트 vs 좋은 프롬프트]")
print("=" * 70)

print("\n[나쁜 프롬프트]")
print("삼성전자 알려줘")
print("→ 문제점: 모호함, 원하는 정보 불명확")

print("\n" + "-" * 70)

print("\n[좋은 프롬프트]")
good_prompt = """
당신은 10년 경력의 증권 애널리스트입니다.

삼성전자에 대해 다음 항목을 분석해주세요:
1. 사업 구조 (주요 사업부문과 매출 비중)
2. 최근 실적 동향
3. 투자 포인트 (강점)
4. 리스크 요인 (약점)

각 항목을 2-3문장으로 간결하게 설명해주세요.
""".strip()
print(good_prompt)
print("\n→ 개선점: 역할 부여, 구체적 요청, 형식 지정")

[나쁜 프롬프트 vs 좋은 프롬프트]

[나쁜 프롬프트]
삼성전자 알려줘
→ 문제점: 모호함, 원하는 정보 불명확

----------------------------------------------------------------------

[좋은 프롬프트]
당신은 10년 경력의 증권 애널리스트입니다.

삼성전자에 대해 다음 항목을 분석해주세요:
1. 사업 구조 (주요 사업부문과 매출 비중)
2. 최근 실적 동향
3. 투자 포인트 (강점)
4. 리스크 요인 (약점)

각 항목을 2-3문장으로 간결하게 설명해주세요.

→ 개선점: 역할 부여, 구체적 요청, 형식 지정


---
### 실전 프롬프트 예시 1: 재무제표 분석

In [12]:
prompt_1 = """
당신은 CFA 자격증을 보유한 재무 분석가입니다.

다음 삼성전자 2024년 3분기 재무 데이터를 분석해주세요:

[재무 데이터]
- 매출액: 79조 1,000억원
- 영업이익: 9조 1,800억원
- 순이익: 7조 2,600억원
- 전년 동기 영업이익: 2조 4,300억원

다음 항목을 분석해주세요:
1. 영업이익률과 순이익률 계산
2. 전년 동기 대비 영업이익 증감률
3. 이 실적이 의미하는 것 (반도체 업황 관점)
4. 투자자 관점에서 주의할 점

표 형식으로 정리해주세요.
""".strip()

print("[프롬프트 1: 재무제표 분석]")
print("=" * 70)
print(prompt_1)
print("\n" + "=" * 70)
print("↑ 위 프롬프트를 ChatGPT에 복사해서 사용하세요")

[프롬프트 1: 재무제표 분석]
당신은 CFA 자격증을 보유한 재무 분석가입니다.

다음 삼성전자 2024년 3분기 재무 데이터를 분석해주세요:

[재무 데이터]
- 매출액: 79조 1,000억원
- 영업이익: 9조 1,800억원
- 순이익: 7조 2,600억원
- 전년 동기 영업이익: 2조 4,300억원

다음 항목을 분석해주세요:
1. 영업이익률과 순이익률 계산
2. 전년 동기 대비 영업이익 증감률
3. 이 실적이 의미하는 것 (반도체 업황 관점)
4. 투자자 관점에서 주의할 점

표 형식으로 정리해주세요.

↑ 위 프롬프트를 ChatGPT에 복사해서 사용하세요


---
### 실전 프롬프트 예시 2: 뉴스 감성 분석

In [13]:
prompt_2 = """
당신은 퀀트 애널리스트입니다. 뉴스 헤드라인을 분석하여 시장 감성을 평가합니다.

다음 뉴스 헤드라인들을 분석해주세요:

[뉴스 헤드라인]
1. 코스피, 외국인 순매수에 2,500선 돌파
2. 미 연준 금리 동결 시사, 시장 안도
3. 삼성전자 반도체 수출 3개월 연속 증가
4. 원/달러 환율 1,400원 근접, 수입물가 우려
5. 중국 경기 둔화 우려에 수출주 약세

각 뉴스를 다음 기준으로 분류해주세요:
- 감성: 긍정(+) / 부정(-) / 중립(0)
- 영향 섹터: 어떤 업종에 영향?
- 중요도: 상/중/하

마지막에 전체 시장 분위기를 한 문장으로 요약해주세요.
""".strip()

print("[프롬프트 2: 뉴스 감성 분석]")
print("=" * 70)
print(prompt_2)
print("\n" + "=" * 70)
print("↑ 위 프롬프트를 ChatGPT에 복사해서 사용하세요")

[프롬프트 2: 뉴스 감성 분석]
당신은 퀀트 애널리스트입니다. 뉴스 헤드라인을 분석하여 시장 감성을 평가합니다.

다음 뉴스 헤드라인들을 분석해주세요:

[뉴스 헤드라인]
1. 코스피, 외국인 순매수에 2,500선 돌파
2. 미 연준 금리 동결 시사, 시장 안도
3. 삼성전자 반도체 수출 3개월 연속 증가
4. 원/달러 환율 1,400원 근접, 수입물가 우려
5. 중국 경기 둔화 우려에 수출주 약세

각 뉴스를 다음 기준으로 분류해주세요:
- 감성: 긍정(+) / 부정(-) / 중립(0)
- 영향 섹터: 어떤 업종에 영향?
- 중요도: 상/중/하

마지막에 전체 시장 분위기를 한 문장으로 요약해주세요.

↑ 위 프롬프트를 ChatGPT에 복사해서 사용하세요


---
### 실전 프롬프트 예시 3: 투자 아이디어 정리

In [14]:
prompt_3 = """
당신은 투자 전략가입니다.

현재 시장 상황을 고려하여 2차전지 섹터 투자 아이디어를 정리해주세요.

[고려할 사항]
- 전기차 판매 둔화 우려
- 유럽 전기차 보조금 축소
- 배터리 원자재 가격 하락
- 국내 2차전지 기업: LG에너지솔루션, 삼성SDI, SK온

다음 형식으로 분석해주세요:

## 1. 섹터 현황
(현재 2차전지 업황 요약)

## 2. 긍정 요인
- 요인 1: 설명
- 요인 2: 설명

## 3. 부정 요인
- 요인 1: 설명
- 요인 2: 설명

## 4. 투자 전략
(매수/관망/비중축소 중 하나와 그 근거)

## 5. 주요 모니터링 지표
(향후 주시해야 할 지표 3가지)
""".strip()

print("[프롬프트 3: 투자 아이디어 정리]")
print("=" * 70)
print(prompt_3)
print("\n" + "=" * 70)
print("↑ 위 프롬프트를 ChatGPT에 복사해서 사용하세요")

[프롬프트 3: 투자 아이디어 정리]
당신은 투자 전략가입니다.

현재 시장 상황을 고려하여 2차전지 섹터 투자 아이디어를 정리해주세요.

[고려할 사항]
- 전기차 판매 둔화 우려
- 유럽 전기차 보조금 축소
- 배터리 원자재 가격 하락
- 국내 2차전지 기업: LG에너지솔루션, 삼성SDI, SK온

다음 형식으로 분석해주세요:

## 1. 섹터 현황
(현재 2차전지 업황 요약)

## 2. 긍정 요인
- 요인 1: 설명
- 요인 2: 설명

## 3. 부정 요인
- 요인 1: 설명
- 요인 2: 설명

## 4. 투자 전략
(매수/관망/비중축소 중 하나와 그 근거)

## 5. 주요 모니터링 지표
(향후 주시해야 할 지표 3가지)

↑ 위 프롬프트를 ChatGPT에 복사해서 사용하세요


---
### 실전 프롬프트 예시 4: Python 코드 생성

In [15]:
prompt_4 = """
당신은 금융 데이터 분석 전문 Python 개발자입니다.

다음 조건에 맞는 Python 코드를 작성해주세요:

[요구사항]
1. FinanceDataReader 라이브러리를 사용하여 삼성전자(005930)의 최근 3개월 주가 데이터 수집
2. 5일, 20일 이동평균선 계산
3. Matplotlib으로 차트 그리기:
   - 종가와 이동평균선을 같은 차트에 표시
   - 한글 폰트 설정 포함
   - 범례, 제목, 그리드 포함
4. Google Colab에서 바로 실행 가능하도록 작성

코드에 주석을 달아 각 부분이 무슨 역할인지 설명해주세요.
""".strip()

print("[프롬프트 4: Python 코드 생성]")
print("=" * 70)
print(prompt_4)
print("\n" + "=" * 70)
print("↑ 위 프롬프트를 ChatGPT에 복사해서 사용하세요")

[프롬프트 4: Python 코드 생성]
당신은 금융 데이터 분석 전문 Python 개발자입니다.

다음 조건에 맞는 Python 코드를 작성해주세요:

[요구사항]
1. FinanceDataReader 라이브러리를 사용하여 삼성전자(005930)의 최근 3개월 주가 데이터 수집
2. 5일, 20일 이동평균선 계산
3. Matplotlib으로 차트 그리기:
   - 종가와 이동평균선을 같은 차트에 표시
   - 한글 폰트 설정 포함
   - 범례, 제목, 그리드 포함
4. Google Colab에서 바로 실행 가능하도록 작성

코드에 주석을 달아 각 부분이 무슨 역할인지 설명해주세요.

↑ 위 프롬프트를 ChatGPT에 복사해서 사용하세요


## 생성된 코드 예시

In [16]:
# # ================================
# # 삼성전자(005930) 최근 3개월 주가 + 이동평균 + 차트
# # - FinanceDataReader로 데이터 수집
# # - 5일/20일 이동평균 계산
# # ================================
# from IPython.display import display, Markdown
# import pandas as pd
# import matplotlib.pyplot as plt
# import matplotlib as mpl
# import os
# from datetime import datetime, timedelta

# import FinanceDataReader as fdr
# import koreanize_matplotlib

# # 최근 3개월 날짜 계산
# end = datetime.today()
# start = end - timedelta(days=92)  # "최근 3개월"을 넉넉히 92일로 잡음(주말/휴일 고려)

# ticker = "005930"  # 삼성전자

# df = fdr.DataReader(ticker, start, end)

# # 종가(Close)에 대해 5일, 20일 이동평균을 계산
# df["MA5"] = df["Close"].rolling(window=5).mean()
# df["MA20"] = df["Close"].rolling(window=20).mean()


# # 차트 그리기 (종가 + 이동평균선)
# plt.figure(figsize=(14, 6))

# plt.plot(df.index, df["Close"], label="종가", linewidth=1.8)
# plt.plot(df.index, df["MA5"], label="MA 5일", linewidth=1.6)
# plt.plot(df.index, df["MA20"], label="MA 20일", linewidth=1.6)

# plt.title("삼성전자(005930) 최근 3개월 종가 및 이동평균선", fontsize=14)
# plt.xlabel("날짜")
# plt.ylabel("가격(원)")

# plt.grid(True, alpha=0.3)
# plt.legend()

# plt.tight_layout()
# plt.show()

---
### 실전 프롬프트 예시 5: 기업 비교 분석

In [17]:
prompt_5 = """
당신은 10년 경력의 반도체 섹터 담당 애널리스트입니다.

삼성전자와 SK하이닉스를 비교 분석해주세요.

[분석 항목]
1. 사업 포트폴리오 비교
2. 기술 경쟁력 (메모리 vs 비메모리)
3. 주요 고객사 및 시장 점유율
4. 재무 안정성
5. 밸류에이션 (PER, PBR 관점)

다음 형식으로 작성해주세요:

| 항목 | 삼성전자 | SK하이닉스 | 우위 |
|------|---------|-----------|------|
| 사업 포트폴리오 | ... | ... | ... |
| ... | ... | ... | ... |

표 작성 후, 각 기업의 투자 매력도를 별점(★)으로 평가하고
어떤 투자자에게 어떤 종목이 적합한지 한 문장으로 정리해주세요.
""".strip()

print("[프롬프트 5: 기업 비교 분석]")
print("=" * 70)
print(prompt_5)
print("\n" + "=" * 70)
print("↑ 위 프롬프트를 ChatGPT에 복사해서 사용하세요")

[프롬프트 5: 기업 비교 분석]
당신은 10년 경력의 반도체 섹터 담당 애널리스트입니다.

삼성전자와 SK하이닉스를 비교 분석해주세요.

[분석 항목]
1. 사업 포트폴리오 비교
2. 기술 경쟁력 (메모리 vs 비메모리)
3. 주요 고객사 및 시장 점유율
4. 재무 안정성
5. 밸류에이션 (PER, PBR 관점)

다음 형식으로 작성해주세요:

| 항목 | 삼성전자 | SK하이닉스 | 우위 |
|------|---------|-----------|------|
| 사업 포트폴리오 | ... | ... | ... |
| ... | ... | ... | ... |

표 작성 후, 각 기업의 투자 매력도를 별점(★)으로 평가하고
어떤 투자자에게 어떤 종목이 적합한지 한 문장으로 정리해주세요.

↑ 위 프롬프트를 ChatGPT에 복사해서 사용하세요


---
## LLM 활용 시 주의사항

### 1. 환각 (Hallucination)
- LLM이 사실이 아닌 정보를 생성할 수 있음
- **대응**: 중요 정보는 반드시 교차 검증

### 2. 지식 컷오프
- 학습 데이터 시점 이후 정보는 모름
- **대응**: 최신 정보는 직접 제공

### 3. 보안
- 민감한 정보 입력 주의
- **대응**: 개인정보, 기업 기밀 입력 금지

In [18]:
print("[프롬프트 작성 체크리스트]")
print("=" * 70)

checklist = """
[ ] 역할을 부여했는가? (예: "당신은 애널리스트입니다")
[ ] 요청이 구체적인가? (모호하지 않은가?)
[ ] 필요한 데이터/맥락을 제공했는가?
[ ] 출력 형식을 지정했는가? (표, 리스트, 단계별 등)
[ ] 결과를 교차 검증할 계획이 있는가?
[ ] 민감한 정보가 포함되지 않았는가?
"""
print(checklist)

[프롬프트 작성 체크리스트]

[ ] 역할을 부여했는가? (예: "당신은 애널리스트입니다")
[ ] 요청이 구체적인가? (모호하지 않은가?)
[ ] 필요한 데이터/맥락을 제공했는가?
[ ] 출력 형식을 지정했는가? (표, 리스트, 단계별 등)
[ ] 결과를 교차 검증할 계획이 있는가?
[ ] 민감한 정보가 포함되지 않았는가?



---
## 학습 정리

### 좋은 프롬프트의 4요소
1. **역할 부여**: "당신은 ~입니다"
2. **구체적 지시**: 무엇을, 어떻게
3. **맥락/데이터 제공**: 필요한 정보 포함
4. **형식 지정**: 표, 리스트, 단계별 등

### 금융 활용 프롬프트 패턴
| 목적 | 핵심 요소 |
|------|----------|
| 재무 분석 | 수치 데이터 + 계산 요청 + 해석 |
| 뉴스 분석 | 헤드라인 + 감성 분류 기준 |
| 코드 생성 | 라이브러리 + 요구사항 + 환경 |
| 기업 비교 | 비교 항목 + 출력 형식 |

---

### 다음 차시 예고
- 28차시: ChatGPT, Gemini API Key 등록 방법
  - OpenAI API 설정
  - Google Gemini API 설정
  - .env 파일로 키 관리