Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

kaisenのtodo #25

Closed
14 of 17 tasks
ksnt opened this issue Aug 20, 2020 · 0 comments
Closed
14 of 17 tasks

kaisenのtodo #25

ksnt opened this issue Aug 20, 2020 · 0 comments

Comments

@ksnt
Copy link
Collaborator

ksnt commented Aug 20, 2020

課題 (パート1 貿易収支)

  • TAが出来る程度には内容を理解しておく(ノートブックすべてに目を通す)
    ※厳しいかも(改めて、やっぱり厳しいかも 8/24)

課題 (パート2 家計調査)

  • TAが出来る程度には内容を理解しておく(ノートブックすべてに目を通す)
    ※厳しいかも(改めて、やっぱり厳しいかも 8/24)

課題 (パート3 地理データ)

  • Mapbox API keyの取得が必要であることを参加者に念押ししておきたい
  • 相談: パッケージの使い方のノートブックをいくつかつくってもらったので、チュートリアル前に受講者と共有しておくのはどうか?(前もって準備になる/ しかし、このhannari-python/tutorialリポジトリの全体はカオスではある)
  • 出典説明とは何か? どこかに書いておく必要がある?どこ?
  • ノートブックに日本語の説明文章をつける
  • binder上での実演のリハーサル
  • 路線価データの説明のための理解
  • 路線価データの説明のための理解の確認 (小川さんに確認)
  • 相談: 「自分で手を動かしてもらう時間を取りたい」とのことだったが、パート3ではそれは最後だけになりそうだがよいか。
  • ローカルで動いているノートブックをgithubにpushする(最新のものをbinder上で動くようにする)
  • データ出典の記載をちゃんと書く

binderへの資源リクエストの確認 #1

  • binderが使えなかったときのバックアップ体制の確認
  • 資源リクエストが出来ているかどうかの確認

8月22日〜8月27日の間に2回個人リハーサル(2時間)をやってみる

地理データの可視化 15:00 ~ 17:00

1. 大阪の平均路線価の可視化 (40min)

  • データ・ソフトウェアの紹介(出典説明) (10min)
  • binderの使い方 (10min)
    • binderの説明 (5min)
    • mapbox api key のセットの仕方 (5min)
  • データ前処理 (15min)
    • データ読み込み (5min)
      • geopandasを用いた大阪の地価(shp)の読み込み
    • CRSから緯度経度情報の変換 (5min)
    • 緯度および経度のデータが入ったカラムの作成 (5min)
  • pydeckで可視化 (15min)
    • GridCellLayerを使う (0min)
    • パラメタの説明 (10min)
    • パラメタやレイヤを変更してようすを見てみる (5min)

2. 平均路線価と自転車盗難数の可視化 (25min)

  • データの紹介 (5min)
  • データ前処理 (10min)
    • 市町村コードと緯度・経度の対応表を作成
      • 特定サイト内のテーブルからデータの抜き出し(スクレイピング)
    • 自転車盗難数に関するデータを読み込みんでデータフレームを作成
      • 地区コード別の自転車盗難発生回数の計算(groupby, size())
  • pydeckで可視化(発展版)(10min)
    • multi layer
      • GridCellLayerを使う
      • ScreenGridLayerを使う
    • 複数データタイプの組み合わせ
      • 路線価データと自転車盗難数データ

3. 平均路線価の可視化と自転車盗難数データのより正確な可視化 (25min)

  • データの紹介 (5min)
  • データ前処理 (10min)
  • pydeckで可視化(発展版)(10min)
    • GridCellLayerを使う
    • PolygonLayerを使う

4. Streamlitでアプリケーション化 (10min)

  • streamlitでアプリ化 ※binderで使えない場合はローカルのPCでやってみる -> GAE上にデプロイしたものがあるので、チャットでURLを教えて手元で使ってもらう
    • plotの透明度を変化させて見やすいグラフを探る
    • レイヤーをつけたり(?)消したりして見やすいグラフを探る

5. 課題(ハンズオン) (20min)

  • 参加者が地理データ活用をしてくれることを期待するような流れに
  • 自分が調べたいデータを探し、当日やったことをひと通りやってみる
  • データを探すコツとして、緯度と経度があるデータを探すことを勧める。
  • 他に、市町村コードというコードがついていると、ESRI社が提供している全国市区町村界データと組み合わせることで階級区分図を作成することができるということを伝える。
  • 時間があれば実際に手を動かしてみてもらう

できれば課題

  • 自転車盗難データの可視化に使っている色のグラデーションを例えば緑〜黃〜赤にして見やすくしたい
    └ linear gradientという方法を使う?
  • GAEにデプロイしたStreamlitアプリケーションがしばしばエラーを吐くので解決したい
    └Dockerfileの書き方の問題のような気もする
@ksnt ksnt closed this as completed Aug 29, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant