Skip to content

SpringMT/apache-beam-gradle-sample

Repository files navigation

apache beam gradle sample

Dataflowとは

Apache Beam がサポートする分散処理バックエンドのGCP版

データの並列処理パイプラインを構築するのがとても楽

https://beam.apache.org/

Apache Beam

Apache Beamの概要

SDKの選定

Javaを使います。

他にGoやpythonもありますが、型があること、Javaが優先されてサポートされている雰囲気からJavaにしています。

Goは最近サポートされ始めたこともありなにか踏みそうな予感もしているので避けています

Deploy to Dataflow

Create Pipeline

./gradlew run \
  -Penv=foo \
  -PotherProject=bar \
  -Pgcp.project=baz \
  -PnumWorkers=1 \
  -PmaxNumWorkers=1 \
  -PserviceAccount=foobar@baz.iam.gserviceaccount.com \
  -PworkerMachineType=n1-standard-1

Update Pipeline

./gradlew run \
  -Penv=foo \
  -PotherProject=bar \
  -Pgcp.project=baz \
  -PnumWorkers=1 \
  -PmaxNumWorkers=1 \
  -PserviceAccount=foobar@baz.iam.gserviceaccount.com \
  -PworkerMachineType=n1-standard-1
  -Pupdate=true

Reference

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages