# Databricks SQL サンプルノートブック

このノートブックは Databricks への接続と SQL クエリの実行例を示します。

## 前提条件

- ~/.databrickscfg が正しく設定されていること
- DATABRICKS_CONFIG_PROFILE 環境変数が設定されていること (デフォルト: prod)

In [None]:
# Databricks 接続確認
from databricks import sql
import os

# 環境変数から設定を読み込み
profile = os.getenv('DATABRICKS_CONFIG_PROFILE', 'prod')
print(f"Using profile: {profile}")

# 接続情報の確認
print("\nDatabricks configuration:")
print(f"DATABRICKS_HOST: {os.getenv('DATABRICKS_HOST', 'Not set')}")
print(f"DATABRICKS_CONFIG_PROFILE: {profile}")

In [None]:
# サンプル SQL クエリ (Databricks SQL Warehouse 経由)
# NOTE: 実際のテーブル名は環境に合わせて変更してください

sample_query = """
SELECT 
    'Hello from Databricks!' as message,
    current_timestamp() as timestamp,
    current_database() as current_db
"""

print("Executing query:")
print(sample_query)

In [None]:
# 結果の表示
# NOTE: このセルを実行するには、Databricks カーネルまたは Spark セッションが必要です

# Databricks カーネルを使用する場合:
# spark.sql(sample_query).show()

# または Python SQL connector を使用する場合:
# with sql.connect(
#     server_hostname=os.getenv('DATABRICKS_HOST'),
#     http_path=os.getenv('DATABRICKS_HTTP_PATH'),
#     credentials_provider=lambda: (
#         os.getenv('DATABRICKS_CLIENT_ID'),
#         os.getenv('DATABRICKS_CLIENT_SECRET')
#     )
# ) as connection:
#     with connection.cursor() as cursor:
#         cursor.execute(sample_query)
#         result = cursor.fetchall()
#         for row in result:
#             print(row)

print("\nTo execute this query, use Databricks kernel or configure SQL connector.")
print("Run: uv run jupyter execute notebooks/sample.ipynb --kernel_name=databricks")