# FESeq Model Training on TossCTR Dataset

이 노트북은 TossCTR 데이터셋에서 FESeq 모델을 훈련하기 위한 Colab 환경을 제공합니다.

## 📋 실행 순서
1. 환경 설정 및 패키지 설치
2. 코드 및 데이터 업로드
3. 데이터 전처리
4. FESeq 모델 훈련
5. 결과 분석


## 🚀 Step 1: 환경 설정 및 GPU 확인


In [None]:
# GPU 사용 가능 여부 확인
import torch
print(f"CUDA available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"GPU device: {torch.cuda.get_device_name(0)}")
    print(f"GPU memory: {torch.cuda.get_device_properties(0).total_memory / 1e9:.1f} GB")
else:
    print("⚠️  GPU not available, using CPU")


## 📦 Step 2: 기본 패키지 설치


In [None]:
# 기본 패키지 설치
%pip install pandas numpy scikit-learn PyYAML h5py tqdm pyarrow

# PyTorch 설치 (GPU 버전)
%pip install torch torchvision --index-url https://download.pytorch.org/whl/cu118


## 📁 Step 3: GitHub에서 코드 클론


In [None]:
# GitHub에서 TossCTR 레포지토리 클론
import os

print("📥 GitHub에서 TossCTR 레포지토리를 클론합니다...")
!git clone https://github.com/kwonhwijun/TossCTR.git

# colab_feseq 디렉토리로 이동
print("📁 colab_feseq 디렉토리로 이동...")
%cd TossCTR/colab_feseq

# 현재 디렉토리 구조 확인
print("\n📁 현재 디렉토리 구조:")
!ls -la

# 중요한 파일들이 있는지 확인
print("\n🔍 중요 파일 확인:")
print("✅ run_feseq.py:", "존재" if os.path.exists("run_feseq.py") else "❌ 없음")
print("✅ FESeq 모델:", "존재" if os.path.exists("model_zoo/FESeq") else "❌ 없음") 
print("✅ 데이터:", "존재" if os.path.exists("data/tossctr") else "❌ 없음")


## ⚙️ Step 4: FuxiCTR 환경 설정


In [None]:
# FuxiCTR 설치
import sys
import os

# PYTHONPATH 설정
current_dir = os.getcwd()
if current_dir not in sys.path:
    sys.path.insert(0, current_dir)

os.environ['PYTHONPATH'] = current_dir
print(f"✅ PYTHONPATH: {current_dir}")

# setup.py 설치 시도
try:
    print("📦 FuxiCTR 설치 중...")
    !python setup.py develop
    print("✅ FuxiCTR 환경 설정 완료")
except Exception as e:
    print(f"⚠️  setup.py 설치 실패: {e}")
    print("📦 pip으로 대체 설치 시도...")
    %pip install -e .
    print("✅ FuxiCTR 환경 설정 완료 (pip 방식)")


## 🧠 Step 5: FESeq 모델 훈련 실행


In [None]:
# 현재 디렉토리 확인
import os
print(f"📍 현재 작업 디렉토리: {os.getcwd()}")

# 필수 파일들이 있는지 다시 한번 확인
required_files = ["run_feseq.py", "setup.py", "model_zoo/FESeq/run_expid.py"]
missing_files = []

for file in required_files:
    if os.path.exists(file):
        print(f"✅ {file}")
    else:
        print(f"❌ {file} - 없음")
        missing_files.append(file)

if missing_files:
    print(f"\n⚠️  다음 파일들이 없습니다: {missing_files}")
    print("디렉토리를 다시 확인하세요.")
else:
    # GPU 설정
    import torch
    gpu_id = 0 if torch.cuda.is_available() else -1
    print(f"\n🎯 사용할 디바이스: {'GPU ' + str(gpu_id) if gpu_id >= 0 else 'CPU'}")
    
    # FESeq 실험 실행
    print("\n🚀 FESeq 실험을 시작합니다...")
    !python run_feseq.py --expid FESeq_tossctr --gpu {gpu_id}


## 🔧 Step 6: 문제 해결 (필요시)


In [None]:
# 문제가 있을 경우 수동으로 디렉토리 확인 및 이동
import os

print("🔍 현재 위치와 파일 구조 확인:")
print(f"현재 디렉토리: {os.getcwd()}")

# 가능한 위치들 확인
possible_locations = [
    ".",
    "/content/TossCTR/colab_feseq", 
    "/content/TossCTR",
    "/content"
]

for location in possible_locations:
    if os.path.exists(location):
        print(f"\n📁 {location} 내용:")
        try:
            files = os.listdir(location)
            for f in files[:10]:  # 처음 10개만 출력
                print(f"  - {f}")
            if len(files) > 10:
                print(f"  ... 그외 {len(files)-10}개 파일")
        except:
            print(f"  접근 불가")

# run_feseq.py 파일 찾기
print(f"\n🔍 run_feseq.py 파일 찾기:")
!find /content -name "run_feseq.py" 2>/dev/null

# 올바른 디렉토리로 이동 (수동)
# 위에서 run_feseq.py가 발견된 디렉토리로 이동하세요
# 예: %cd /content/TossCTR/colab_feseq


## 🔧 Step 6-2: 직접 실행 (대안 방법)


In [None]:
# run_feseq.py가 실패할 경우 직접 실행하는 방법
import os
import sys

# 현재 디렉토리 확인
print(f"📍 현재 위치: {os.getcwd()}")

# FESeq 모델 디렉토리로 이동
%cd model_zoo/FESeq

# PYTHONPATH 재설정
original_dir = "/content/TossCTR/colab_feseq"  # 또는 상위 디렉토리 
current_dir = os.getcwd()

if original_dir not in sys.path:
    sys.path.insert(0, original_dir)
if current_dir not in sys.path:
    sys.path.insert(0, current_dir)

os.environ['PYTHONPATH'] = f"{original_dir}:{current_dir}"
print(f"✅ PYTHONPATH: {os.environ['PYTHONPATH']}")

# 설정 파일 확인
print("\n🔍 설정 파일 확인:")
config_files = ["config/dataset_config.yaml", "config/model_config.yaml"]
for config_file in config_files:
    exists = "✅" if os.path.exists(config_file) else "❌"
    print(f"{exists} {config_file}")

# 데이터 파일 확인
print("\n🔍 데이터 파일 확인:")
data_dir = "../../data/tossctr"
if os.path.exists(data_dir):
    data_files = os.listdir(data_dir)
    for file in data_files:
        print(f"✅ {file}")
else:
    print(f"❌ 데이터 디렉토리 없음: {data_dir}")

print("\n🚀 직접 run_expid.py 실행 준비 완료!")


In [None]:
# 최종 실행 - 직접 run_expid.py 호출
import torch

# GPU 설정
gpu_id = 0 if torch.cuda.is_available() else -1
print(f"🎯 GPU ID: {gpu_id}")

# FESeq 실험 실행
print("🚀 FESeq 실험 시작...")
!python run_expid.py --expid FESeq_tossctr --gpu {gpu_id}
