Skip to content
武蔵中原近隣のウーバーイーツ加盟店の分析
Jupyter Notebook Python
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
.vscode
data
images
notebooks
rawdata
tmp
ubereats
.gitignore
LICENSE
README.md
env.yaml
merge_shop.py
merge_trip.py
tasks.py

README.md

UberEats Analysis

Open Source Love

top-page

  • Python 3.7
  • Scrapy 1.8

See more detail at env.yaml(anaconda config file)

概要

武蔵中原のウーバーイーツ加盟店の情報を収集して分析するためリポジトリです。

メンテナンスが大変なので、武蔵中原以外の地域は私の気まぐれで分析します。全国とか、とても対応できません。 このプロジェクトはオープンソースでコードを公開しているので、武蔵中原以外の地域はぜひ仲間になってプロジェクトにコントリビューションしてください!

武蔵中原ウーバーマップ

https://drive.google.com/open?id=1Lt-zlVv4_A1y5v58Efbh9AsFg5Gw8X9q&usp=sharing

分析結果と考察

Jupyter Notebook は以下。

以下は、分析結果からの抜粋。

  • 店舗数は、武蔵小杉(新丸子):溝の口(高津):武蔵中原:武蔵新城 = 2:2:1:1 の割合。
    • 拠点とするならば、武蔵小杉(新丸子)か武蔵溝ノ口(高津)の2択。
  • 武蔵小杉の方が溝の口よりも、レビュー数が少ないにも関わらず評価ポイントの合計が高い。
    • 武蔵小杉のほうが溝の口よりも評価的視点で優良なお店が多い。
  • 武蔵小杉エリアはタワマンが多数あり、タワマンは時間がかかる。溝の口エリアはほぼない。
  • チェーン店は、武蔵小杉よりも溝の口のほうが 1 割ほど多い。
  • 中原区と高津区では、中原区の方が高津区よりも人口密度と店舗密度が高い。
    • 中原区の方が高津区よりも移動距離が短くて楽になる可能性が高い。

Usage

タスクランナーに invokeを使用している。

店舗情報の取得

武蔵中原駅近辺の店舗情報をwww.ubereats.comからスクレイピング。 rawdata/shopsに CSV 形式で保存される。

$ inv crawl

主な取得項目は、以下のとおり。

  • 店名
  • レビュー数
  • 評価
  • 郵便番号
  • 住所
  • 店舗 URL
  • 緯度
  • 経度
  • 開始時刻
  • 終了時刻

人気のチェーン店ほど、検索結果に表示されないことがよくあるため、その場合は個別に取得する。 rawdata/shops/shop.csvに 1 レコードが吐き出される。

$ inv post [url]

配達ログの取得

個人の配達ログをpartners.uber.comから取得。

ログイン認証が必要。 pitをつかって UserId とパスワードを外部ファイルから読み出して利用している。 ~/.pit/default.yamlを作成して、以下を追記する。

uber_auth:
  userId: [xxx]
  password: [xxx]

日付を引数として渡して、以下でスクリプトを走らせる。 rawdata/trips配下に CSV として出力される。

$ inv trip [year] [month] [day]

主な取得項目は、以下のとおり。

  • 日時
  • 曜日
  • 時間
  • 距離
  • ピックアップ時刻
  • ピックアップ場所
  • 到着時刻
  • 支払い額

公開情報以外は、GitHub にデータをアップロードしてはいけない。特にドロップ先の情報は絶対に GitHub にアップロードしてはいけない。

Authors

@tsu-nera

You can’t perform that action at this time.