# ステーションごとの特徴やネットワークに着目した分析

### モジュールのインポート  

table.ipynbをモジュールとして読み込み, CSVファイルの内容ごとに結合・前処理したDataFrameにアクセスする．

主なDataFrameは以下の5種類．  

- table.station：station_data  
- table.status：status_data  
- table.trip：trip_data
- table.weather：weather_data
- table.feature：table.tripにtable.stationとtable.weatherの必要な情報を結合したDataFrame  

＊結合前の各CSVファイルにもアクセスできる(例：table.station_201608)

In [None]:
# table.ipynb
import sys
import notebookutil as nbu
sys.meta_path.append(nbu.NotebookFinder())
import table

# その他に必要なモジュール(機械学習用のモジュールは使用時に読み込む)
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

## 可視化

### Landmarkごとに色分けしてマッピング

In [None]:
import gmaps
gmaps.configure(api_key="AIzaSyBpe5yZOyiRztKKWaP7lJ-r7RraFIFk0DU")
fig = gmaps.Map()

landmark_list = ["San Francisco", "Redwood City", "Palo Alto", "Mountain View",  "San Jose"]
color_list = ["rgba(255,69,0,1)", "rgba(255,140,0,1)", "rgba(255,255,0,1)", "rgba(50,205,50, 1)", "rgba(30,144,255, 1)"]

for i in range(len(landmark_list)):
    landmark = landmark_list[i]
    color = color_list[i]
    locations = np.array(table.station[table.station.landmark == landmark][["lat", "long"]])
    if i == 1:
        landmark_layer = gmaps.symbol_layer([(37.491405, -122.23305)], fill_color=color, stroke_color=color, scale=2)
    else :
        locations = np.array(table.station[table.station.landmark == landmark][["lat", "long"]])
        landmark_layer = gmaps.symbol_layer(locations, fill_color=color, stroke_color=color, scale=2)
    fig.add_layer(landmark_layer)

print("\t\t\tred : San Francisco", "\torange : Redwood City", "\tyello : Palo Alto\t", "green : Mountain View\t",  "\tblue : San Jose")
fig

## バスケット分析  
目的  
stationの接続行列をつくり, 各station間のつながりの強さ(有向)を把握する  
年ごとや季節ごとの接続行列を比較し, station間のつながりの変化がないか調べる

In [None]:
M = table.trip[["Start Terminal", "End Terminal"]].groupby(["Start Terminal","End Terminal"]).size().to_frame("Count")
M= M.reset_index(level=[0, 1])
M= M.pivot(index ="Start Terminal", columns="End Terminal", values="Count").fillna(0).apply(lambda x: x/x.sum(), axis=1)
M.head()