# 01. 환경 설정

이 노트북에서는 Iceberg 실습에 필요한 환경을 구성합니다.

1. Python 패키지 설치
2. Iceberg Spark Runtime JAR 다운로드
3. Spark + Iceberg 세션 생성 확인
4. 데이터 생성 유틸리티 동작 확인

## 1. 패키지 설치

In [None]:
import sys
sys.path.append('..')

from utils.spark_setup import install_packages

install_packages()

## 2. Iceberg JAR 다운로드

In [None]:
from utils.spark_setup import download_iceberg_jar

download_iceberg_jar()

## 3. Spark + Iceberg 세션 생성

In [None]:
from utils.spark_setup import create_spark_session

spark = create_spark_session()

# 카탈로그 확인
spark.sql("SHOW CATALOGS").show()

## 4. 실습용 데이터베이스 생성

In [None]:
spark.sql("CREATE DATABASE IF NOT EXISTS demo.lab")
print("demo.lab 데이터베이스 생성 완료")

spark.sql("SHOW DATABASES IN demo").show()

## 5. 데이터 생성 유틸리티 확인

In [None]:
from utils.data_generator import generate_orders, to_spark_df

# 샘플 데이터 5건 생성
sample = generate_orders(5, seed=42)
for row in sample:
    print(row)

In [None]:
# Spark DataFrame 변환 확인
df = to_spark_df(spark, sample)
df.printSchema()
df.show(truncate=False)

## 6. 파일 탐색 유틸리티 확인

In [None]:
from utils.file_explorer import show_tree

# warehouse 디렉토리 구조 확인
show_tree("/home/jovyan/data/warehouse", max_depth=2)

## 환경 설정 완료

모든 유틸리티가 정상 동작합니다. 다음 노트북부터 본격적인 실습을 시작합니다.

**다음 단계:** `1_fundamentals/01-architecture-overview.ipynb`