# ブロンズテーブル - ロボットイベントの取り込み
![](img/bronze.png)

このスクリプトは**Databricks Lakeflow Declarative Pipeline**を使用して、  
指定されたボリュームパス（`data_path`）からJSONファイルをストリーミングし、**ブロンズテーブル**に取り込みます。

## 主な特徴
- **Lakeflow Declarative Pipeline テーブル名**: `bronze_robot_events`
- **コメント**: `"Raw ingested robot events"`
- **データソース**: `data_path`ディレクトリ内のJSONファイル（Autoloaderベース）
- **スキーマ推論**: `cloudFiles.inferColumnTypes = true`オプションを使用

## コードの説明
python
@dlt.table(name="bronze_robot_events", comment="Raw ingested robot events")
def bronze_robot_events():
    return (
        spark.readStream.format("cloudFiles")
        .option("cloudFiles.format", "json")
        .option("cloudFiles.inferColumnTypes", "true")
        .load(data_path)
    )

@dlt.table(...) : Lakeflow Declarative Pipelineでブロンズテーブルを作成するデコレーター

.format("cloudFiles") : Databricks Autoloaderを使ってストリーミングモードでファイルを読み込む

.option("cloudFiles.format", "json") : 入力データフォーマットを指定

.option("cloudFiles.inferColumnTypes", "true") : カラム型を自動推論

.load(data_path) : 指定したパスからストリーミングモードでデータを読み込む

## 使い方
`data_path`を自分のボリュームパスに変更してください

このスクリプトをLakeflow Declarative Pipelineに登録して実行してください

In [0]:
import dlt
from pyspark.sql.functions import input_file_name

# Please change `data_path` to your own volume path.
data_path = "/Volumes/haley_b_demo/bronze/managed_volume/sample_json_output/"

@dlt.table(name="bronze_robot_events", comment="Raw ingested robot events")
def bronze_robot_events():
    return (
        spark.readStream.format("cloudFiles")
        .option("cloudFiles.format", "json")
        .option("cloudFiles.inferColumnTypes", "true")
        .load(data_path)
    )