37차시: AI 분석 리포트 자동화 (PDF/Excel)
=========================================

학습 목표:
- Python으로 PDF 리포트 자동 생성
- Excel 보고서에 데이터와 차트 삽입
- 분석 결과를 문서로 정리하는 파이프라인 구축

학습 내용:
1. 차트 이미지 생성
2. 통계 계산 함수
3. PDF 리포트 생성 함수 (독립 실행)
4. Excel 리포트 생성 함수 (독립 실행)

In [None]:
# !pip install -Uq reportlab koreanize-matplotlib

In [14]:
from reportlab.lib import colors
from reportlab.lib.pagesizes import A4
from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle
from reportlab.lib.units import cm
from reportlab.platypus import SimpleDocTemplate, Paragraph, Spacer, Table, TableStyle, Image
from reportlab.pdfbase import pdfmetrics
from reportlab.pdfbase.ttfonts import TTFont
import openpyxl
from openpyxl.styles import Font, Alignment, PatternFill, Border, Side
from openpyxl.utils.dataframe import dataframe_to_rows
from openpyxl.drawing.image import Image as XLImage
import matplotlib.pyplot as plt
import koreanize_matplotlib
import pandas as pd
import numpy as np
import os
from datetime import datetime, date, timedelta
import FinanceDataReader as fdr

## 1. 폰트 설정

한글 폰트를 등록하여 PDF와 차트에서 한글이 정상적으로 표시되도록 합니다.

In [15]:
# ============================================
# 1. 한글 폰트 등록
# ============================================
font_paths = [
    'C:/Windows/Fonts/malgun.ttf',  # Windows
    '/usr/share/fonts/truetype/nanum/NanumGothic.ttf',  # Linux/Colab
    '/System/Library/Fonts/AppleGothic.ttf'  # Mac
]

font_registered = False
for path in font_paths:
    # 해당 경로에 폰트 파일이 실제로 존재하는지 확인
    if os.path.exists(path):
        try:
            # 폰트 파일을 ReportLab에 'Korean' 이라는 이름으로 등록
            pdfmetrics.registerFont(TTFont('Korean', path))
            print(f"[폰트 등록 성공]: {path}")
            # 한글 폰트 등록 성공 여부 플래그 설정
            font_registered = True
            break
        except Exception as e:
            print(f"[폰트 등록 실패]: {e}")
            continue

if not font_registered:
    print("[경고] 한글 폰트를 찾을 수 없습니다. 영문만 사용됩니다.")

# ============================================
# 출력 폴더 설정
# ============================================
OUTPUT_DIR = "output"
os.makedirs(OUTPUT_DIR, exist_ok=True)

[폰트 등록 성공]: C:/Windows/Fonts/malgun.ttf


## 2. 데이터 수집

In [18]:
end = date.today()
start = end - timedelta(days=90)

df_samsung = fdr.DataReader("005930", start, end)

print(f"[데이터 수집 완료]")
print(f"  종목: 삼성전자 (005930)")
print(f"  기간: {start} ~ {end}")
print(f"  데이터 수: {len(df_samsung)}일")

df_samsung.head()

[데이터 수집 완료]
  종목: 삼성전자 (005930)
  기간: 2025-10-15 ~ 2026-01-13
  데이터 수: 62일


Unnamed: 0_level_0,Open,High,Low,Close,Volume,Change
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2025-10-15,92300,95300,92100,95000,21050111,0.037118
2025-10-16,95300,97700,95000,97700,28141060,0.028421
2025-10-17,97200,99100,96700,97900,22730809,0.002047
2025-10-20,97900,98300,96000,98100,17589756,0.002043
2025-10-21,98500,99900,97300,97500,22803830,-0.006116


## 3. 차트 이미지 생성

matplotlib을 사용하여 주가 차트 이미지를 생성합니다.

In [21]:
def create_stock_chart_image(df: pd.DataFrame, stock_name: str, output_path: str):
    """주가 차트 이미지 생성"""
    fig, axes = plt.subplots(2, 1, figsize=(10, 8), gridspec_kw={'height_ratios': [3, 1]})
    
    # 종가 차트 (FDR은 영문 컬럼명 사용)
    axes[0].plot(df.index, df['Close'], 'b-', linewidth=1.5)
    axes[0].set_title(f'{stock_name} 주가 추이')
    axes[0].set_ylabel('주가 (원)')
    axes[0].grid(True, alpha=0.3)
    
    # 거래량 차트
    bar_colors = ['red' if c >= o else 'blue' for c, o in zip(df['Close'], df['Open'])]
    axes[1].bar(df.index, df['Volume'], color=bar_colors, alpha=0.7)
    axes[1].set_ylabel('거래량')
    axes[1].set_xlabel('날짜')
    
    plt.tight_layout()
    plt.savefig(output_path, dpi=150, bbox_inches='tight')
    plt.close()
    
    # 이미지 파일이 제대로 생성되었는지 확인
    if not os.path.exists(output_path):
        raise FileNotFoundError(f"차트 이미지 파일이 생성되지 않았습니다: {output_path}")
    
    print(f"[차트 이미지 생성 완료]: {output_path}")
    return output_path

create_stock_chart_image(df_samsung, stock_name="삼성전자", output_path = os.path.join(OUTPUT_DIR, f"test.png"))

[차트 이미지 생성 완료]: output\test.png


'output\\test.png'

## 4. 통계 계산 함수

주가 데이터로부터 통계를 계산합니다.

In [22]:
# ============================================
# 3. 통계 계산 함수
# ============================================
def calculate_stock_stats(df: pd.DataFrame) -> dict:
    """
    주가 데이터로부터 통계를 계산합니다.
    
    Parameters:
        df: OHLCV 데이터
    
    Returns:
        dict: 통계 정보 딕셔너리
    """
    stats = {
        '시작일': df.index[0].strftime('%Y-%m-%d'),
        '종료일': df.index[-1].strftime('%Y-%m-%d'),
        '시작가': f"{df['Close'].iloc[0]:,.0f}원",
        '종료가': f"{df['Close'].iloc[-1]:,.0f}원",
        '최고가': f"{df['High'].max():,.0f}원",
        '최저가': f"{df['Low'].min():,.0f}원",
        '평균 거래량': f"{df['Volume'].mean():,.0f}",
        '기간 수익률': f"{((df['Close'].iloc[-1] / df['Close'].iloc[0]) - 1) * 100:.2f}%"
    }
    return stats

In [24]:
calculate_stock_stats(df_samsung)

{'시작일': '2025-10-15',
 '종료일': '2026-01-13',
 '시작가': '95,000원',
 '종료가': '137,600원',
 '최고가': '144,500원',
 '최저가': '92,100원',
 '평균 거래량': '23,619,205',
 '기간 수익률': '44.84%'}

## 5. PDF 리포트 생성 함수

주식 데이터를 분석하여 PDF 리포트를 생성합니다.

In [25]:
# ============================================
# 4. PDF 리포트 생성 함수
# ============================================
def generate_pdf_report(stock_code: str, stock_name: str, df: pd.DataFrame, 
                       chart_path: str, output_dir: str = ".") -> str:
    """
    주식 분석 PDF 리포트 생성
    
    Parameters:
        stock_code: 종목코드
        stock_name: 종목명
        df: OHLCV 데이터
        chart_path: 차트 이미지 경로
        output_dir: 출력 디렉토리
    
    Returns:
        str: 생성된 PDF 파일 경로
    """
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")  # 파일명 중복 방지를 위한 타임스탬프
    pdf_path = os.path.join(output_dir, f"report_{stock_code}_{timestamp}.pdf")  # PDF 저장 경로
    
    # 통계 계산
    stats = calculate_stock_stats(df)
    
    # PDF 문서 생성
    doc = SimpleDocTemplate(pdf_path, pagesize=A4)  # A4 사이즈 PDF 문서 객체 생성
    styles = getSampleStyleSheet()       # 기본 스타일 시트 로드
    
    # 한글 스타일 추가 (한글 폰트가 등록된 경우)
    if font_registered:
        if 'Korean' not in [s.name for s in styles.byName.values()]:  # 중복 등록 방지
            styles.add(ParagraphStyle(
                name='Korean',       # ReportLab에서 만든 본문 한글 스타일 이름
                fontName='Korean',   # 한글 폰트 사용
                fontSize=12,         # 기본 글자 크기
                leading=16           # 줄 간격
            ))
            styles.add(ParagraphStyle(
                name='KoreanTitle',    # 제목 한글 스타일
                fontName='Korean',     # 한글 폰트 사용
                fontSize=18,           # 제목 글자 크기
                leading=22,            # 제목 줄 간격
                spaceAfter=20          # 제목 아래 여백
            ))
    
    story = []    # PDF에 순서대로 들어갈 요소(문단, 표, 이미지 등) 리스트
    
    # 제목
    if font_registered:   # 한글 폰트 사용 가능 시
        story.append(Paragraph(f"{stock_name} ({stock_code}) 분석 리포트", styles['KoreanTitle']))
    else:
        story.append(Paragraph(f"{stock_name} ({stock_code}) Analysis Report", styles['Title']))
    story.append(Spacer(1, 20))   # 제목과 본문 사이 여백 추가
    
    # 통계 테이블 헤더 설정
    if font_registered:
        table_headers = [['항목', '값']]    # 한글 테이블 헤더
    else:
        table_headers = [['Item', 'Value']]  # 영문 테이블 헤더
    
    table_data = [[k, v] for k, v in stats.items()]   # 통계 딕셔너리를 테이블 행 데이터로 변환
    table = Table(table_headers + table_data)     # 헤더 + 데이터로 테이블 생성
    
    # 테이블 스타일 설정
    table_style = [
        ('BACKGROUND', (0, 0), (-1, 0), colors.grey),   # 헤더 배경색
        ('TEXTCOLOR', (0, 0), (-1, 0), colors.whitesmoke),   # 헤더 글자색
        ('ALIGN', (0, 0), (-1, -1), 'CENTER'),          # 전체 중앙 정렬
        ('GRID', (0, 0), (-1, -1), 1, colors.black),    # 테이블 테두리
        ('BACKGROUND', (0, 1), (-1, -1), colors.beige),   # 데이터 영역 배경색
        ('FONTSIZE', (0, 0), (-1, -1), 10)               # 테이블 글자 크기
    ]
    
    if font_registered:
        table_style.append(('FONTNAME', (0, 0), (-1, -1), 'Korean'))  # 테이블에 한글 폰트 적용
    
    table.setStyle(TableStyle(table_style))   # 테이블 스타일 적용
    story.append(table)                       # 테이블을 PDF 스토리에 추가
    story.append(Spacer(1, 20))               # 테이블 아래 여백 추가
    
    # 차트 이미지 삽입
    if os.path.exists(chart_path):
        try:
            img = Image(chart_path, width=15*cm, height=10*cm)   # 이미지 크기 지정
            story.append(img)                 # PDF에 차트 이미지 추가
            print(f"[PDF에 차트 이미지 삽입 성공]")
        except Exception as e:
            print(f"[PDF에 차트 이미지 삽입 실패]: {e}")
            if font_registered:
                story.append(Paragraph(f"[차트 이미지 로드 실패: {str(e)}]", styles['Korean']))
            else:
                story.append(Paragraph(f"[차트 이미지 로드 실패: {str(e)}]", styles['Normal']))
    else:
        error_msg = f"[차트 이미지 파일을 찾을 수 없습니다: {chart_path}]"
        if font_registered:
            story.append(Paragraph(error_msg, styles['Korean']))
        else:
            story.append(Paragraph(error_msg, styles['Normal']))
    
    doc.build(story)       # PDF 문서 최종 생성
    print(f"[PDF 리포트 생성 완료]: {pdf_path}")
    return pdf_path        # 생성된 PDF 파일 경로 반환

## 6. PDF 리포트 생성 실행

실제 데이터를 수집하여 PDF 리포트를 생성합니다.

In [26]:
# 차트 이미지 생성
timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
chart_path = os.path.join(OUTPUT_DIR, f"chart_005930_{timestamp}.png")
create_stock_chart_image(df_samsung, "삼성전자", chart_path)
print()

# PDF 리포트 생성
print("[PDF 리포트 생성 중...]")
pdf_path = generate_pdf_report(
    stock_code="005930",
    stock_name="삼성전자",
    df=df_samsung,
    chart_path=chart_path,
    output_dir=OUTPUT_DIR
)
print()

print("=" * 60)
print("PDF 리포트 생성 완료!")
print("=" * 60)
print(f"PDF:   {pdf_path}")
print(f"Chart: {chart_path}")

[차트 이미지 생성 완료]: output\chart_005930_20260113_204548.png

[PDF 리포트 생성 중...]
[PDF에 차트 이미지 삽입 성공]
[PDF 리포트 생성 완료]: output\report_005930_20260113_204548.pdf

PDF 리포트 생성 완료!
PDF:   output\report_005930_20260113_204548.pdf
Chart: output\chart_005930_20260113_204548.png


## 7. Excel 보고서 생성

openpyxl을 사용하여 Excel 보고서를 생성합니다.

Excel 파일에 차트 이미지를 추가합니다.

In [27]:
def add_chart_to_excel(filename: str, chart_path: str, cell: str = 'F3'):
    wb = openpyxl.load_workbook(filename)  # 기존 Excel 파일 열기
    ws = wb.active        # 현재 활성화된 시트 가져오기
    
    if os.path.exists(chart_path):
        img = XLImage(chart_path)  # 이미지 파일을 Excel 이미지 객체로 로드
        img.width = 500    # 이미지 가로 크기 설정 (픽셀 단위)
        img.height = 300   # 이미지 세로 크기 설정 (픽셀 단위)
        
        # 지정한 셀 위치에 이미지 삽입
        ws.add_image(img, cell)

    wb.save(filename)
    return filename

## 8. Excel 리포트 생성 함수

주식 데이터를 분석하여 Excel 리포트를 생성합니다.

In [28]:
def generate_excel_report(stock_code: str, stock_name: str, df: pd.DataFrame,
                          chart_path: str, output_dir: str = ".") -> str:
    """
    주식 분석 Excel 리포트 생성
    
    Parameters:
        stock_code: 종목코드
        stock_name: 종목명
        df: OHLCV 데이터
        chart_path: 차트 이미지 경로
        output_dir: 출력 디렉토리
    
    Returns:
        str: 생성된 Excel 파일 경로
    """
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
    excel_path = os.path.join(output_dir, f"report_{stock_code}_{timestamp}.xlsx")
    
    # 통계 계산
    stats = calculate_stock_stats(df)
    
    # # openpyxl 엔진으로 Excel 파일 생성
    with pd.ExcelWriter(excel_path, engine='openpyxl') as writer:
        # 주가 데이터 시트
        df.to_excel(writer, sheet_name='주가데이터')  # OHLCV 원본 데이터를 저장하는 시트
        
        # 통계 시트
        stats_df = pd.DataFrame(list(stats.items()), columns=['항목', '값'])  # 통계 항목과 값을 테이블 형태로 변환
        stats_df.to_excel(writer, sheet_name='통계', index=False)       # 계산된 통계 지표를 저장하는 시트
    
    # 차트 이미지 추가
    if os.path.exists(chart_path):
        add_chart_to_excel(excel_path, chart_path, 'E3')
        print(f"[Excel에 차트 이미지 추가 완료]")
    
    print(f"[Excel 리포트 생성 완료]: {excel_path}")
    return excel_path

## 9. Excel 리포트 생성 실행

실제 데이터를 수집하여 Excel 리포트를 생성합니다.

In [29]:
# 데이터 수집
end = date.today()
start = end - timedelta(days=90)

df_samsung = fdr.DataReader("005930", start, end)

print(f"[데이터 수집 완료]")
print(f"  종목: 삼성전자 (005930)")
print(f"  기간: {start} ~ {end}")
print(f"  데이터 수: {len(df_samsung)}일")
print()

# 차트 이미지 생성
timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
chart_path = os.path.join(OUTPUT_DIR, f"chart_005930_{timestamp}.png")
create_stock_chart_image(df_samsung, "삼성전자", chart_path)
print()

# Excel 리포트 생성
print("[Excel 리포트 생성 중...]")
excel_path = generate_excel_report(
    stock_code="005930",
    stock_name="삼성전자",
    df=df_samsung,
    chart_path=chart_path,
    output_dir=OUTPUT_DIR
)
print()

print("=" * 60)
print("Excel 리포트 생성 완료!")
print("=" * 60)
print(f"Excel: {excel_path}")
print(f"Chart: {chart_path}")

[데이터 수집 완료]
  종목: 삼성전자 (005930)
  기간: 2025-10-15 ~ 2026-01-13
  데이터 수: 62일

[차트 이미지 생성 완료]: output\chart_005930_20260113_204917.png

[Excel 리포트 생성 중...]
[Excel에 차트 이미지 추가 완료]
[Excel 리포트 생성 완료]: output\report_005930_20260113_204918.xlsx

Excel 리포트 생성 완료!
Excel: output\report_005930_20260113_204918.xlsx
Chart: output\chart_005930_20260113_204917.png


## 학습 정리

### 1. PDF 생성 (reportlab)
| 요소 | 클래스/함수 |
|------|------------|
| 문서 | SimpleDocTemplate |
| 텍스트 | Paragraph |
| 테이블 | Table, TableStyle |
| 이미지 | Image |
| 간격 | Spacer |

### 2. Excel 생성 (openpyxl)
| 작업 | 방법 |
|------|------|
| 파일 생성 | Workbook() |
| DataFrame 변환 | pd.ExcelWriter |
| 스타일 | Font, PatternFill, Border |
| 이미지 추가 | ws.add_image() |

### 3. 리포트 생성 흐름
1. 데이터 수집 (FinanceDataReader)
2. 통계 계산 (`calculate_stock_stats`)
3. 차트 이미지 생성 (`create_stock_chart_image`)
4. PDF 리포트 생성 (`generate_pdf_report`) - 독립 실행 가능
5. Excel 리포트 생성 (`generate_excel_report`) - 독립 실행 가능

**다음 차시**: 38차시 - 일일 주식 리포트 자동 생성 및 이메일 발송