## データのアップロード方法

1. Databricks UIの左メニューから「Data」を選択
2. 「Upload File」をクリック
3. 生成した sample_data フォルダ内のファイルをアップロード<br>または、AWS S3 / Azure Blob Storage / ADLS Gen2 からマウント

In [None]:
# Databricks Notebook
# ===================================
# Setup: データのアップロードと確認
# ===================================

# データのアップロード先確認
dbutils.fs.ls("/FileStore/")

# サンプルデータをアップロード後、以下のパスに配置されていると仮定
# /FileStore/sample_data/items/
# /FileStore/sample_data/digital_ads/
# /FileStore/sample_data/transactions/
# /FileStore/sample_data/ad_clicks/

# データの確認
print("=== Items ===")
display(dbutils.fs.ls("/FileStore/sample_data/items/"))

print("\n=== Digital Ads ===")
display(dbutils.fs.ls("/FileStore/sample_data/digital_ads/"))

print("\n=== Transactions ===")
display(dbutils.fs.ls("/FileStore/sample_data/transactions/"))

## データベースとストレージの設定

In [None]:
# Databricks Notebook
# ===================================
# 01_Setup_Database
# ===================================

from pyspark.sql.functions import *

# データベース名
DATABASE_NAME = "ad_analytics"

# Deltaテーブル保存先（DBFSパス）
BASE_PATH = "/mnt/lakehouse"  # または "/user/hive/warehouse/ad_analytics.db"

# ブロンズ、シルバー、ゴールドのパス
BRONZE_PATH = f"{BASE_PATH}/bronze"
SILVER_PATH = f"{BASE_PATH}/silver"
GOLD_PATH = f"{BASE_PATH}/gold"

# データベース作成
spark.sql(f"CREATE DATABASE IF NOT EXISTS {DATABASE_NAME}")
spark.sql(f"USE {DATABASE_NAME}")

print(f"✓ データベース '{DATABASE_NAME}' を作成しました")
print(f"✓ 保存先: {BASE_PATH}")

# ディレクトリ構造確認
print("\n【ディレクトリ構造】")
print(f"Bronze: {BRONZE_PATH}")
print(f"Silver: {SILVER_PATH}")
print(f"Gold: {GOLD_PATH}")