# 04차시: Pandas로 금융 데이터 다루기 (읽기, 쓰기, 선택, 필터링)

## 학습 목표
- pykrx를 사용하여 한국 주가 데이터 가져오기
- CSV, Excel 파일로 데이터 저장하고 불러오기
- 특정 날짜, 기간의 데이터 선택하기
- 조건에 맞는 데이터 필터링하기

## 학습 내용
1. pykrx로 한국 주가 데이터 가져오기
2. CSV 파일 읽기/쓰기
3. Excel 파일 읽기/쓰기
4. 날짜/기간 데이터 선택
5. 조건 필터링
6. 종합 실습

## 구분
실습

---
실제 한국 주가 데이터를 활용하여 Pandas의 핵심 기능을 실습합니다.


## 1. pykrx로 한국 주가 데이터 가져오기

### pykrx란?
- 한국거래소(KRX)에서 주가 데이터를 무료로 가져오는 라이브러리
- KOSPI, KOSDAQ 상장 종목의 데이터 제공
- OHLCV (시가, 고가, 저가, 종가, 거래량) 데이터 제공

### 주요 함수
```python
from pykrx import stock

# 일별 OHLCV 조회
stock.get_market_ohlcv_by_date(fromdate, todate, ticker)

# 종목 코드로 종목명 조회
stock.get_market_ticker_name(ticker)
```
- `fromdate`: 시작 날짜 (예: '20220101')
- `todate`: 종료 날짜 (예: '20241231')
- `ticker`: 종목 코드 (예: '005930')


In [2]:
# pykrx 설치
%pip install pykrx -q

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m61.1/61.1 kB[0m [31m2.6 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m45.2/45.2 kB[0m [31m3.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.2/2.2 MB[0m [31m33.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m52.6/52.6 kB[0m [31m4.3 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m264.7/264.7 kB[0m [31m20.4 MB/s[0m eta [36m0:00:00[0m
[?25h

In [3]:
from pykrx import stock
import pandas as pd
import numpy as np

In [9]:
# 삼성전자(005930) 주가 데이터 다운로드
print("[삼성전자 주가 데이터 다운로드]")
print("=" * 60)

# 종목 정보
ticker = "005930"
종목명 = stock.get_market_ticker_name(ticker)
print(f"종목코드: {ticker}")
print(f"종목명: {종목명}")

# 주가 데이터 조회 (2022년 1월 1일부터 현재까지)
df = stock.get_market_ohlcv_by_date("20220101", "20241231", ticker)

print(f"\n데이터 기간: {df.index[0].strftime('%Y-%m-%d')} ~ {df.index[-1].strftime('%Y-%m-%d')}")
print(f"데이터 크기: {df.shape[0]}행 x {df.shape[1]}열")
print(f"\n열 이름: {df.columns.tolist()}")

df.head()

[삼성전자 주가 데이터 다운로드]
종목코드: 005930
종목명: 삼성전자

데이터 기간: 2022-01-03 ~ 2024-12-30
데이터 크기: 735행 x 6열

열 이름: ['시가', '고가', '저가', '종가', '거래량', '등락률']


Unnamed: 0_level_0,시가,고가,저가,종가,거래량,등락률
날짜,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2022-01-03,79400,79800,78200,78600,13502112,0.383142
2022-01-04,78800,79200,78300,78700,12427416,0.127226
2022-01-05,78800,79000,76400,77400,25470640,-1.651842
2022-01-06,76700,77600,76600,76900,12931954,-0.645995
2022-01-07,78100,78400,77400,78300,15163757,1.820546


In [6]:
# OHLCV 데이터 구조 이해
print("[OHLCV 데이터 구조]")
print("=" * 60)
print("시가   : 당일 첫 거래 가격")
print("고가   : 당일 최고 가격")
print("저가   : 당일 최저 가격")
print("종가   : 당일 마지막 거래 가격")
print("거래량 : 당일 거래된 주식 수")
print("거래대금 : 당일 거래된 총 금액")
print("등락률 : 전일 대비 변동률 (%)")

print(df.dtypes)
df.describe()

[OHLCV 데이터 구조]
시가   : 당일 첫 거래 가격
고가   : 당일 최고 가격
저가   : 당일 최저 가격
종가   : 당일 마지막 거래 가격
거래량 : 당일 거래된 주식 수
거래대금 : 당일 거래된 총 금액
등락률 : 전일 대비 변동률 (%)
시가       int64
고가       int64
저가       int64
종가       int64
거래량      int64
등락률    float64
dtype: object


Unnamed: 0,시가,고가,저가,종가,거래량,등락률
count,735.0,735.0,735.0,735.0,735.0,735.0
mean,67738.639456,68304.761905,67103.673469,67657.142857,16590840.0,-0.039437
std,8115.310205,8103.165975,8003.216322,8066.077586,7509756.0,1.62244
min,50200.0,51800.0,49900.0,49900.0,5767902.0,-10.301508
25%,60850.0,61400.0,60300.0,60750.0,11690530.0,-1.026651
50%,67800.0,68500.0,67400.0,67900.0,14559250.0,-0.129199
75%,73400.0,73950.0,72800.0,73300.0,19291360.0,0.750375
max,88500.0,88800.0,87100.0,87800.0,57691270.0,7.214429


## 2. CSV 파일 읽기/쓰기

### CSV란?
- Comma Separated Values (쉼표로 구분된 값)
- 가장 널리 사용되는 데이터 저장 형식
- 텍스트 기반이라 용량이 작고 호환성이 높음

### 주요 함수
| 함수 | 설명 |
|------|------|
| `df.to_csv('파일명.csv')` | DataFrame을 CSV로 저장 |
| `pd.read_csv('파일명.csv')` | CSV를 DataFrame으로 읽기 |

### 주요 옵션
- `index=False`: 인덱스 저장 안함
- `index_col=0`: 첫 번째 열을 인덱스로 사용
- `parse_dates=True`: 날짜 자동 변환
- `encoding='utf-8'`: 인코딩 지정


In [7]:
# CSV 파일로 저장
print("[CSV 파일 저장]")
print("=" * 60)

# 기본 저장
df.to_csv('삼성전자_stock.csv')
print("저장 완료: 삼성전자_stock.csv")

# 저장된 파일 확인
!ls -la 삼성전자_stock.csv

# CSV 파일 내용 미리보기 (처음 5줄)
print("\n[CSV 파일 내용 미리보기]")
!head -5 삼성전자_stock.csv

[CSV 파일 저장]
저장 완료: 삼성전자_stock.csv
-rw-r--r-- 1 root root 46024 Dec 31 01:29 삼성전자_stock.csv

[CSV 파일 내용 미리보기]
날짜,시가,고가,저가,종가,거래량,등락률
2022-01-03,79400,79800,78200,78600,13502112,0.38314176245210724
2022-01-04,78800,79200,78300,78700,12427416,0.1272264631043257
2022-01-05,78800,79000,76400,77400,25470640,-1.6518424396442184
2022-01-06,76700,77600,76600,76900,12931954,-0.6459948320413437


In [8]:
# CSV 파일 불러오기
print("[CSV 파일 불러오기]")
print("=" * 60)

# 기본 읽기
df_csv = pd.read_csv('삼성전자_stock.csv')
print("기본 읽기 결과:")
print(df_csv.head(3))
print(f"\n인덱스 타입: {type(df_csv.index)}")

print("\n" + "=" * 60)
# 날짜를 인덱스로 설정하여 읽기
df_csv = pd.read_csv('삼성전자_stock.csv', index_col=0, parse_dates=True)

df_csv.head()

[CSV 파일 불러오기]
기본 읽기 결과:
           날짜     시가     고가     저가     종가       거래량       등락률
0  2022-01-03  79400  79800  78200  78600  13502112  0.383142
1  2022-01-04  78800  79200  78300  78700  12427416  0.127226
2  2022-01-05  78800  79000  76400  77400  25470640 -1.651842

인덱스 타입: <class 'pandas.core.indexes.range.RangeIndex'>



Unnamed: 0_level_0,시가,고가,저가,종가,거래량,등락률
날짜,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2022-01-03,79400,79800,78200,78600,13502112,0.383142
2022-01-04,78800,79200,78300,78700,12427416,0.127226
2022-01-05,78800,79000,76400,77400,25470640,-1.651842
2022-01-06,76700,77600,76600,76900,12931954,-0.645995
2022-01-07,78100,78400,77400,78300,15163757,1.820546


## 3. Excel 파일 읽기/쓰기

### Excel 파일 장점
- 시트(Sheet) 기능으로 여러 데이터 관리 가능
- 서식, 차트 등 풍부한 기능
- 비개발자와의 협업에 용이

### 주요 함수
| 함수 | 설명 |
|------|------|
| `df.to_excel('파일명.xlsx')` | DataFrame을 Excel로 저장 |
| `pd.read_excel('파일명.xlsx')` | Excel을 DataFrame으로 읽기 |

### 주의사항
- `openpyxl` 라이브러리 필요
- CSV보다 파일 크기가 큼


In [10]:
# openpyxl 설치 (Excel 파일 처리용)
# %pip install openpyxl -q

# Excel 파일로 저장
print("[Excel 파일 저장]")
print("=" * 60)

df.to_excel('삼성전자_stock.xlsx', sheet_name='주가데이터')
print("저장 완료: 삼성전자_stock.xlsx")

# 저장된 파일 확인
!ls -la 삼성전자_stock.xlsx

[Excel 파일 저장]
저장 완료: 삼성전자_stock.xlsx
-rw-r--r-- 1 root root 40234 Dec 31 01:30 삼성전자_stock.xlsx


In [11]:
# Excel 파일 불러오기
print("[Excel 파일 불러오기]")
print("=" * 60)

df_excel = pd.read_excel('삼성전자_stock.xlsx', index_col=0)
print("불러온 데이터:")
print(df_excel.head(3))

print("\n" + "=" * 60)
# 여러 시트에 데이터 저장
print("[여러 시트에 데이터 저장]")

# 2022년, 2023년 데이터 분리
df_2022 = df[df.index.year == 2022]
df_2023 = df[df.index.year == 2023]

# ExcelWriter로 여러 시트 저장
with pd.ExcelWriter('삼성전자_yearly.xlsx') as writer:
    df_2022.to_excel(writer, sheet_name='2022년')
    df_2023.to_excel(writer, sheet_name='2023년')

print("저장 완료: 삼성전자_yearly.xlsx")
print(f"  - 2022년 시트: {len(df_2022)}행")
print(f"  - 2023년 시트: {len(df_2023)}행")

[Excel 파일 불러오기]
불러온 데이터:
               시가     고가     저가     종가       거래량       등락률
날짜                                                        
2022-01-03  79400  79800  78200  78600  13502112  0.383142
2022-01-04  78800  79200  78300  78700  12427416  0.127226
2022-01-05  78800  79000  76400  77400  25470640 -1.651842

[여러 시트에 데이터 저장]
저장 완료: 삼성전자_yearly.xlsx
  - 2022년 시트: 246행
  - 2023년 시트: 245행


## 4. 날짜/기간 데이터 선택

### 날짜 인덱스의 장점
- 문자열로 직관적인 날짜 선택 가능
- 기간 슬라이싱 지원
- 연도, 월, 일 단위 필터링

### 주요 방법
| 방법 | 예시 |
|------|------|
| 특정 날짜 | `df.loc['2023-01-02']` |
| 기간 선택 | `df.loc['2023-01-01':'2023-06-30']` |
| 연도 필터 | `df[df.index.year == 2023]` |
| 월 필터 | `df[df.index.month == 1]` |


In [12]:
# 특정 날짜 데이터 선택
print("[특정 날짜 데이터 선택]")
print("=" * 60)

# 특정 날짜
print("2023년 1월 3일 데이터:")
print(df.loc['2023-01-03'])

print("\n" + "=" * 60)
# 기간 선택 (슬라이싱)
print("[기간 선택: 2023년 상반기]")
df_2023_h1 = df.loc['2023-01-01':'2023-06-30']
print(f"데이터 개수: {len(df_2023_h1)}개")
print("\n처음 3행:")
print(df_2023_h1.head(3))
print("\n마지막 3행:")
print(df_2023_h1.tail(3))

[특정 날짜 데이터 선택]
2023년 1월 3일 데이터:
시가     5.540000e+04
고가     5.600000e+04
저가     5.450000e+04
종가     5.540000e+04
거래량    1.354703e+07
등락률   -1.801802e-01
Name: 2023-01-03 00:00:00, dtype: float64

[기간 선택: 2023년 상반기]
데이터 개수: 123개

처음 3행:
               시가     고가     저가     종가       거래량       등락률
날짜                                                        
2023-01-02  55500  56100  55200  55500  10031448  0.361664
2023-01-03  55400  56000  54500  55400  13547030 -0.180180
2023-01-04  55700  58000  55600  57800  20188071  4.332130

마지막 3행:
               시가     고가     저가     종가       거래량       등락률
날짜                                                        
2023-06-28  72600  72700  72000  72700   8783093  0.137741
2023-06-29  73100  73400  72400  72400  12229967 -0.412655
2023-06-30  72500  72700  71700  72200  11694765 -0.276243


In [13]:
# 연도/월 기준 필터링
print("[연도/월 기준 필터링]")
print("=" * 60)

# 2023년 데이터만
df_2023 = df[df.index.year == 2023]
print(f"2023년 데이터: {len(df_2023)}개")

# 1월 데이터만 (모든 연도)
df_jan = df[df.index.month == 1]
print(f"1월 데이터 (전체 연도): {len(df_jan)}개")

# 2023년 12월 데이터
df_2023_dec = df[(df.index.year == 2023) & (df.index.month == 12)]
print(f"2023년 12월 데이터: {len(df_2023_dec)}개")
print("\n2023년 12월 데이터:")
print(df_2023_dec)

# 월요일 데이터만
print("\n" + "=" * 60)
print("[요일 기준 필터링: 월요일만]")
df_monday = df[df.index.dayofweek == 0]  # 0=월요일
print(f"월요일 데이터 개수: {len(df_monday)}개")
df_monday.head()

[연도/월 기준 필터링]
2023년 데이터: 245개
1월 데이터 (전체 연도): 62개
2023년 12월 데이터: 19개

2023년 12월 데이터:
               시가     고가     저가     종가       거래량       등락률
날짜                                                        
2023-12-01  72400  72500  71700  72000   9871284 -1.098901
2023-12-04  72800  72900  72400  72600  10229267  0.833333
2023-12-05  72300  72400  71200  71200  12129682 -1.928375
2023-12-06  71800  72100  71600  71700   8123087  0.702247
2023-12-07  71800  71900  71100  71500   8862017 -0.278940
2023-12-08  72100  72800  71900  72600  10859463  1.538462
2023-12-11  72800  73000  72200  73000   9861960  0.550964
2023-12-12  73300  73500  73100  73500  13758646  0.684932
2023-12-13  73300  73500  72800  72800  13116766 -0.952381
2023-12-14  74100  74300  72500  73100  27567593  0.412088
2023-12-15  73800  74000  73200  73300  15419815  0.273598
2023-12-18  73300  73400  72800  72900   9690551 -0.545703
2023-12-19  73000  73400  72800  73400   8907632  0.685871
2023-12-20  74200  74900  7380

Unnamed: 0_level_0,시가,고가,저가,종가,거래량,등락률
날짜,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2022-01-03,79400,79800,78200,78600,13502112,0.383142
2022-01-10,78100,78100,77100,78000,9947422,-0.383142
2022-01-17,77600,77800,76900,77500,8785122,0.258732
2022-01-24,75400,75800,74700,75100,13691134,-0.661376
2022-02-07,73500,73600,72400,73000,14240838,-1.351351


## 5. 조건 필터링

### 조건 필터링 기본 문법
```python
df[조건식]
```

### 비교 연산자
| 연산자 | 의미 |
|--------|------|
| `==` | 같다 |
| `!=` | 다르다 |
| `>`, `<` | 크다, 작다 |
| `>=`, `<=` | 크거나 같다, 작거나 같다 |

### 논리 연산자 (복합 조건)
| 연산자 | 의미 |
|--------|------|
| `&` | AND (그리고) |
| `\|` | OR (또는) |
| `~` | NOT (부정) |

**주의**: 각 조건은 괄호로 감싸야 합니다.


In [15]:
# 가격 조건 필터링
print("[가격 조건 필터링]")
print("=" * 60)

# 종가 70,000원 이상인 날
high_price = df[df['종가'] >= 70000]
print(f"종가 70,000원 이상: {len(high_price)}일")
print(high_price[['종가', '거래량']].head())

print("\n" + "=" * 60)
# 종가 60,000원 이하인 날
low_price = df[df['종가'] <= 60000]
print(f"종가 60,000원 이하: {len(low_price)}일")
print(low_price[['종가', '거래량']].head())

[가격 조건 필터링]
종가 70,000원 이상: 311일
               종가       거래량
날짜                         
2022-01-03  78600  13502112
2022-01-04  78700  12427416
2022-01-05  77400  25470640
2022-01-06  76900  12931954
2022-01-07  78300  15163757

종가 60,000원 이하: 156일
               종가       거래량
날짜                         
2022-06-17  59800  29053450
2022-06-20  58700  34111306
2022-06-21  58500  25148109
2022-06-22  57600  23334687
2022-06-23  57400  28338608


In [16]:
# 거래량 조건 필터링
print("[거래량 조건 필터링]")
print("=" * 60)

# 거래량 3천만주 이상인 날 (대량 거래일)
high_volume = df[df['거래량'] >= 30_000_000]
print(f"거래량 3천만주 이상: {len(high_volume)}일")
print("\n대량 거래일 (거래량 순 정렬):")
print(high_volume.sort_values('거래량', ascending=False)[['종가', '거래량']].head(10))

[거래량 조건 필터링]
거래량 3천만주 이상: 39일

대량 거래일 (거래량 순 정렬):
               종가       거래량
날짜                         
2024-01-11  73200  57691266
2024-08-05  71400  54608790
2024-11-13  50600  52527995
2024-03-20  76900  50106297
2024-09-19  63100  49402713
2024-11-14  49900  48510715
2024-11-18  56700  48095234
2024-08-06  72500  47295226
2024-11-15  53500  46774485
2024-07-05  87100  45791193


In [17]:
# 복합 조건 필터링
print("[복합 조건 필터링]")
print("=" * 60)

# 종가 65,000원 이상 AND 거래량 2천만주 이상
condition1 = df['종가'] >= 65000
condition2 = df['거래량'] >= 20_000_000
filtered = df[condition1 & condition2]
print(f"종가 65,000원 이상 AND 거래량 2천만주 이상: {len(filtered)}일")
print(filtered[['종가', '거래량']].head())

print("\n" + "=" * 60)
# 상승일 찾기 (종가 > 시가)
df['상승여부'] = df['종가'] > df['시가']
up_days = df[df['상승여부'] == True]
print(f"상승일 (종가 > 시가): {len(up_days)}일")
print(f"상승률: {len(up_days) / len(df) * 100:.1f}%")

print("\n" + "=" * 60)
# 변동폭이 큰 날 (고가 - 저가 > 2,000원)
df['변동폭'] = df['고가'] - df['저가']
volatile_days = df[df['변동폭'] > 2000]
print(f"변동폭 2,000원 초과일: {len(volatile_days)}일")
print(volatile_days[['시가', '고가', '저가', '종가', '변동폭']].head())

[복합 조건 필터링]
종가 65,000원 이상 AND 거래량 2천만주 이상: 92일
               종가       거래량
날짜                         
2022-01-05  77400  25470640
2022-01-27  71300  22274777
2022-01-28  73300  21367447
2022-03-10  71200  21159248
2022-03-24  69800  37943357

상승일 (종가 > 시가): 312일
상승률: 42.4%

변동폭 2,000원 초과일: 52일
               시가     고가     저가     종가   변동폭
날짜                                          
2022-01-05  78800  79000  76400  77400  2600
2022-01-27  73800  74000  71300  71300  2700
2022-01-28  71300  73700  71200  73300  2500
2022-04-29  65100  67600  65000  67400  2600
2022-07-07  56400  58700  56300  58200  2400


## 6. 종합 실습: 주가 데이터 분석 리포트

배운 내용을 종합하여 Apple 주가 분석 리포트를 작성합니다.

### 분석 항목
1. 연도별 평균 종가 비교
2. 월별 거래량 패턴
3. 최고가/최저가 기록일
4. 분석 결과 파일로 저장


In [18]:
# 종합 실습: 삼성전자 주가 분석 리포트
print("=" * 60)
print("[삼성전자 주가 분석 리포트]")
print("=" * 60)

# 기본 정보
print(f"\n분석 기간: {df.index[0].strftime('%Y-%m-%d')} ~ {df.index[-1].strftime('%Y-%m-%d')}")
print(f"총 거래일: {len(df)}일")

# 1. 연도별 평균 종가
print("\n" + "-" * 60)
print("[1. 연도별 평균 종가]")
yearly_avg = df.groupby(df.index.year)['종가'].mean()
for year, avg in yearly_avg.items():
    print(f"  {year}년: {avg:,.0f}원")

# 2. 전체 기간 통계
print("\n" + "-" * 60)
print("[2. 전체 기간 통계]")
print(f"  평균 종가: {df['종가'].mean():,.0f}원")
print(f"  최고 종가: {df['종가'].max():,}원")
print(f"  최저 종가: {df['종가'].min():,}원")
print(f"  평균 거래량: {df['거래량'].mean():,.0f}주")

[삼성전자 주가 분석 리포트]

분석 기간: 2022-01-03 ~ 2024-12-30
총 거래일: 735일

------------------------------------------------------------
[1. 연도별 평균 종가]
  2022년: 63,935원
  2023년: 67,457원
  2024년: 71,610원

------------------------------------------------------------
[2. 전체 기간 통계]
  평균 종가: 67,657원
  최고 종가: 87,800원
  최저 종가: 49,900원
  평균 거래량: 16,590,844주


In [19]:
# 3. 최고가/최저가 기록일
print("[3. 최고가/최저가 기록일]")
print("-" * 60)

# 최고 종가 기록일
max_close_date = df['종가'].idxmax()
max_close_value = df.loc[max_close_date, '종가']
print(f"  최고 종가 기록일: {max_close_date.strftime('%Y-%m-%d')}")
print(f"  종가: {max_close_value:,}원")

# 최저 종가 기록일
min_close_date = df['종가'].idxmin()
min_close_value = df.loc[min_close_date, '종가']
print(f"\n  최저 종가 기록일: {min_close_date.strftime('%Y-%m-%d')}")
print(f"  종가: {min_close_value:,}원")

# 최대 거래량 기록일
max_vol_date = df['거래량'].idxmax()
max_vol_value = df.loc[max_vol_date, '거래량']
print(f"\n  최대 거래량 기록일: {max_vol_date.strftime('%Y-%m-%d')}")
print(f"  거래량: {max_vol_value:,}주")

[3. 최고가/최저가 기록일]
------------------------------------------------------------
  최고 종가 기록일: 2024-07-09
  종가: 87,800원

  최저 종가 기록일: 2024-11-14
  종가: 49,900원

  최대 거래량 기록일: 2024-01-11
  거래량: 57,691,266주


In [20]:
# 4. 분석 결과 저장
print("[4. 분석 결과 저장]")
print("-" * 60)

# 월별 요약 데이터 생성
monthly_summary = df.groupby(df.index.to_period('M')).agg({
    '시가': 'first',
    '고가': 'max',
    '저가': 'min',
    '종가': 'last',
    '거래량': 'sum'
})
monthly_summary.index = monthly_summary.index.astype(str)
monthly_summary.columns = ['시가', '최고가', '최저가', '종가', '총거래량']

print("월별 요약 데이터 (최근 6개월):")
print(monthly_summary.tail(6))

# CSV로 저장
monthly_summary.to_csv('삼성전자_monthly_summary.csv')
print("\n저장 완료: 삼성전자_monthly_summary.csv")

# Excel로 저장 (여러 시트)
with pd.ExcelWriter('삼성전자_analysis_report.xlsx') as writer:
    df.to_excel(writer, sheet_name='일별데이터')
    monthly_summary.to_excel(writer, sheet_name='월별요약')
    yearly_avg.to_frame('평균종가').to_excel(writer, sheet_name='연도별평균')

print("저장 완료: 삼성전자_analysis_report.xlsx")
print("=" * 60)

[4. 분석 결과 저장]
------------------------------------------------------------
월별 요약 데이터 (최근 6개월):
            시가    최고가    최저가     종가       총거래량
날짜                                            
2024-07  81500  88800  80000  83900  477159149
2024-08  86000  86100  70200  74300  402010176
2024-09  74500  74700  61500  61500  516679519
2024-10  60500  61900  55700  59200  537302984
2024-11  59000  59600  49900  54200  581402427
2024-12  54300  56600  51900  53200  387381948

저장 완료: 삼성전자_monthly_summary.csv
저장 완료: 삼성전자_analysis_report.xlsx


## 배운 내용 정리

### 1. pykrx
- `stock.get_market_ohlcv_by_date()`: 한국 주식 데이터를 무료로 가져오기
- OHLCV (시가, 고가, 저가, 종가, 거래량) 데이터 구조 이해

### 2. CSV 파일
- `df.to_csv()`: DataFrame을 CSV로 저장
- `pd.read_csv()`: CSV를 DataFrame으로 읽기
- 옵션: `index_col`, `parse_dates`, `encoding`

### 3. Excel 파일
- `df.to_excel()`: DataFrame을 Excel로 저장
- `pd.read_excel()`: Excel을 DataFrame으로 읽기
- `ExcelWriter`: 여러 시트에 데이터 저장

### 4. 날짜/기간 선택
- `df.loc['날짜']`: 특정 날짜 선택
- `df.loc['시작':'종료']`: 기간 슬라이싱
- `df.index.year`, `df.index.month`: 연도/월 필터링

### 5. 조건 필터링
- `df[조건]`: 조건에 맞는 행 선택
- `&` (AND), `|` (OR): 복합 조건

---

## 다음 차시 예고
다음 차시에서는 **데이터 시각화 (Matplotlib, Plotly)**를 배웁니다.
- 주가 차트 그리기
- 캔들스틱 차트
- 이동평균선 시각화
