# CartPole-v1 DQN 강화학습 프로젝트

이 노트북은 Google Colab에서 CartPole-v1 환경에서 DQN 알고리즘을 학습하는 코드입니다.

---

## 1. 환경 설정 및 라이브러리 설치

In [None]:
# 필요한 라이브러리 설치
!pip install -q gymnasium[classic_control] torch numpy matplotlib tqdm

In [None]:
# 한글 폰트 설치 (Google Colab)
!apt-get install -y fonts-nanum > /dev/null 2>&1

# 폰트 캐시 삭제 및 재생성
import matplotlib.font_manager as fm
import shutil
import os

font_cache_dir = os.path.expanduser('~/.cache/matplotlib')
if os.path.exists(font_cache_dir):
    shutil.rmtree(font_cache_dir)

print("한글 폰트 설치 완료!")

## 2. GitHub 리포지토리에서 코드 가져오기

In [None]:
# GitHub 리포지토리 클론
!git clone https://github.com/taeryol/RL-CartPole-Project.git
%cd RL-CartPole-Project

## 3. DQN 에이전트 학습

학습을 시작합니다. 목표 점수 195점 달성 시 자동으로 종료됩니다.

In [None]:
# 학습 실행
!python train.py

## 4. 학습 결과 그래프 확인

In [None]:
from IPython.display import Image, display

# 학습 결과 그래프 표시
display(Image('result_graph.png'))

## 5. 학습된 모델 테스트

In [None]:
# 모델 테스트 (렌더링 없이 성능만 확인)
!python test.py

## 6. 결과 파일 다운로드

학습된 모델과 그래프를 다운로드합니다.

In [None]:
from google.colab import files

# 모델 파일 다운로드
files.download('cartpole_dqn.pth')

# 그래프 파일 다운로드
files.download('result_graph.png')

---

## 추가: 수동으로 학습 실행하기

위의 방법 대신 코드를 직접 실행하고 싶다면 아래 셀을 사용하세요.

In [None]:
import gymnasium as gym
import numpy as np
import matplotlib.pyplot as plt
import torch
import random
from dqn_agent import DQNAgent
from tqdm import tqdm

# 한글 폰트 설정
plt.rcParams['font.family'] = 'NanumGothic'
plt.rcParams['axes.unicode_minus'] = False

# train.py의 train_dqn 함수 실행
from train import train_dqn

train_dqn(
    n_episodes=1000,
    max_steps=500,
    target_score=195.0,
    print_interval=100,
    model_save_path='cartpole_dqn.pth'
)