Apache Beam がサポートする分散処理バックエンドのGCP版
データの並列処理パイプラインを構築するのがとても楽
Javaを使います。
他にGoやpythonもありますが、型があること、Javaが優先されてサポートされている雰囲気からJavaにしています。
Goは最近サポートされ始めたこともありなにか踏みそうな予感もしているので避けています
./gradlew run \
-Penv=foo \
-PotherProject=bar \
-Pgcp.project=baz \
-PnumWorkers=1 \
-PmaxNumWorkers=1 \
-PserviceAccount=foobar@baz.iam.gserviceaccount.com \
-PworkerMachineType=n1-standard-1
./gradlew run \
-Penv=foo \
-PotherProject=bar \
-Pgcp.project=baz \
-PnumWorkers=1 \
-PmaxNumWorkers=1 \
-PserviceAccount=foobar@baz.iam.gserviceaccount.com \
-PworkerMachineType=n1-standard-1
-Pupdate=true
- Gladle dependency locking
- JSON to Java