Scala関西2018 向け Databricksサンプルコード
- databricks cli をインストールしてください.
- databricks configure --token で環境変数を登録してください.
- host名: https://{account}.cloud.databricks.com/
- token: [https://{account}.cloud.databricks.com/#setting/account] で発行したAccess Tokensを入力
- 環境変数、$(DBC_USER)に自分のDatabricksのメールアドレスを入力してください. 後続のnotebook開発で利用します.
-
デプロイ済みノートブックをdatabricksからローカルにpullする/あるいはgithubからgit pullする
- make dbc_pull_prd
- git pull origin/master
-
自分のworkspaceにノートブックをpushする
- make dbc_push_dev
/Users/$(DBC_USER)/workspace/
にプッシュされます
-
開発完了後ローカルに開発済みのモジュールをpullしてローカルに持ってくる
- make dbc_pull_dev
- ./notebooks/1-SparkExample.html
- Sparkによる簡単なサンプルコード
- ./notebooks/2-CollaborativeFiltering.html
- 協調フィルタリングをするサンプルコード
- ./notebooks/3-MagicNumberAnalyze.html
- マジックナンバー分析をするサンプルコード