## Download Data

In [3]:
import pandas as pd

# --- plotly ---
from plotly import tools, subplots
import plotly.offline as py
py.init_notebook_mode(connected=True)
import plotly.graph_objs as go
import plotly.express as px
import plotly.figure_factory as ff
import plotly.io as pio
pio.templates.default = "plotly_dark"

In [4]:
def download_data(sheet_id, page_id, path, format='csv'):
    url = f'https://docs.google.com/spreadsheets/d/{sheet_id}/export?format={format}&gid={page_id}'
    result = pd.read_csv(url)
    if path:
        result.to_csv(path)
    return result

In [5]:
# make directorey
os.makedirs('./datasets/signate', exist_ok=True)

# 接触場所マスタ
contact_master = download_data('1CnQOf6eN18Kw5Q6ScE_9tFoyddk4FBwFZqZpt_tMOm4', '103322372', './datasets/signate/contact_master.csv')

# 罹患者トランザクション
patients_transaction = download_data('1CnQOf6eN18Kw5Q6ScE_9tFoyddk4FBwFZqZpt_tMOm4', '400937719', './datasets/signate/patients_transaction.csv')

# 罹患者関係
patients_relationship = download_data('1CnQOf6eN18Kw5Q6ScE_9tFoyddk4FBwFZqZpt_tMOm4', '57719256', './datasets/signate/patients_relationship.csv')

# 居住地マスタ
residence_master = download_data('1CnQOf6eN18Kw5Q6ScE_9tFoyddk4FBwFZqZpt_tMOm4', '72903316', './datasets/signate/residence_master.csv')

# 罹患者
patients = download_data('1CnQOf6eN18Kw5Q6ScE_9tFoyddk4FBwFZqZpt_tMOm4', '0', './datasets/signate/patients.csv')

# トランザクションマスタ
transaction_master = download_data('1CnQOf6eN18Kw5Q6ScE_9tFoyddk4FBwFZqZpt_tMOm4', '13238635', './datasets/signate/transaction_master.csv')

# 都道府県マスタ
prefecture_master = download_data('1CnQOf6eN18Kw5Q6ScE_9tFoyddk4FBwFZqZpt_tMOm4', '1940307536', './datasets/signate/prefecture_master.csv')

In [6]:
patients.head()

Unnamed: 0,罹患者id,都道府県コード,都道府県別罹患者No,症状・経過,行動歴,医療従事者ﾌﾗｸﾞ,基礎疾患ﾌﾗｸﾞ,公表日,ステータス,受診都道府県,...,職業,海外渡航歴ﾌﾗｸﾞ,海外渡航先,帰国日,ﾀﾞｲﾔﾓﾝﾄﾞﾌﾟﾘﾝｾｽ号乗船ﾌﾗｸﾞ,濃厚接触者状況,情報源,idチェック済ﾌﾗｸﾞ,idチェック日,id不備有りﾌﾗｸﾞ
0,1-1,1,1,1月21日に来日し、22日より北海道を観光。\n1月26日 体調不良のため外出せず。夜間に咳...,海外渡航歴なし。濃厚接触者は、現時点で家族、同僚等43名を特定し、健康観察実施中。,,,2020/01/28,0.0,北海道,...,,1,中国,2020/01/21,0.0,濃厚接触者を特定し\n健康観察終了,http://www.pref.hokkaido.lg.jp/hf/kth/kak/hass...,1.0,2020/04/03,0.0
1,1-2,1,2,1月31日 発熱、咳、倦怠感が出現。\n2月 3日 石狩振興局管内の医療機関Aを受診。\n2...,,,,2020/02/14,0.0,北海道,...,自営業,0,-,-,0.0,健康観察実施中,http://www.pref.hokkaido.lg.jp/hf/kth/kak/hass...,1.0,2020/04/03,0.0
2,1-3,1,3,2月 8日 倦怠感、筋肉痛、関節痛が出現\n2月12日 発熱、咳が出現\n2月13日 札幌市...,2月1日から2月12日までの期間、No.5の男性（2月19日感染判明）とともに、雪まつり大通...,,,2020/02/19,0.0,北海道,...,会社員,0,-,-,0.0,札幌市公表中\nid:1-5,http://www.pref.hokkaido.lg.jp/hf/kth/kak/hass...,1.0,2020/04/03,0.0
3,1-4,1,4,2月 3日 微熱、咽頭痛。\n2月 7日 渡島総合振興局管内の医療機関Aを受診。\n2月13...,本人からの申告によれば、海外渡航歴は無し。\n濃厚接触者48名について保健所が健康観察を行う...,,,2020/02/19,0.0,北海道,...,議会議員,0,-,-,0.0,濃厚接触者を特定し健康観察終了\nid:1-12,http://www.pref.hokkaido.lg.jp/hf/kth/kak/hass...,1.0,2020/04/03,0.0
4,1-5,1,5,2月15日 悪寒、発汗、倦怠感、筋肉痛、関節痛が出現。\n2月18日 発熱、筋肉痛、咳、痰が...,2月1日から2月12日までの期間、id:1-3の男性（2月18日感染判明）とともに、雪まつり...,,,2020/02/20,0.0,北海道,...,会社員,0,-,-,0.0,札幌市公表中\nid:1-3,http://www.pref.hokkaido.lg.jp/hf/kth/kak/hass...,1.0,2020/04/03,0.0


In [7]:
patients.columns

Index(['罹患者id', '都道府県コード', '都道府県別罹患者No', '症状・経過', '行動歴', '医療従事者ﾌﾗｸﾞ',
       '基礎疾患ﾌﾗｸﾞ', '公表日', 'ステータス', '受診都道府県', '受診都道府県緯度', '受診都道府県経度', '居住地',
       '居住地緯度', '居住地経度', '年代', '性別', '職業', '海外渡航歴ﾌﾗｸﾞ', '海外渡航先', '帰国日',
       'ﾀﾞｲﾔﾓﾝﾄﾞﾌﾟﾘﾝｾｽ号乗船ﾌﾗｸﾞ', '濃厚接触者状況', '情報源', 'idチェック済ﾌﾗｸﾞ', 'idチェック日',
       'id不備有りﾌﾗｸﾞ'],
      dtype='object')

In [8]:
# rename column name
target_columns = {'罹患者id': 'patient_id', '都道府県コード': 'prefecture_code', '都道府県別罹患者No': 'patient_no_by_prefecture', '症状・経過': 'symptom', '行動歴': 'behavior_history', '医療従事者ﾌﾗｸﾞ': 'medical_worker_flag', '基礎疾患ﾌﾗｸﾞ': 'underlying_disease', '公表日': 'publication_date', 'ステータス': 'status', '受診都道府県': 'prefecture_received_medical_examination', '受診都道府県緯度': 'exam_latitude', '受診都道府県経度': 'exam_longtitude', '居住地': 'residence', '居住地緯度': 'residence_latitude', '居住地経度': 'residence_longtitude', '年代': 'age', '性別' :'sex', '職業': 'occupation', '海外渡航歴ﾌﾗｸﾞ': 'travelling_overseas', '海外渡航先': 'destination', '帰国日': 'return_date','ﾀﾞｲﾔﾓﾝﾄﾞﾌﾟﾘﾝｾｽ号乗船ﾌﾗｸﾞ': 'diamond_princess_flag', '濃厚接触者状況': 'situation_of_close_contact', '情報源': 'source_of_info', 'idチェック済ﾌﾗｸﾞ': 'id_checked', 'idチェック日': 'date_of_checking_id', 'id不備有りﾌﾗｸﾞ': 'defected_id_flag'}
patients_renamed = patients.rename(columns=target_columns)

In [10]:
patients_renamed.head()

Unnamed: 0,patient_id,prefecture_code,patient_no_by_prefecture,symptom,behavior_history,medical_worker_flag,underlying_disease,publication_date,status,prefecture_received_medical_examination,...,occupation,travelling_overseas,destination,return_date,diamond_princess_flag,situation_of_close_contact,source_of_info,id_checked,date_of_checking_id,defected_id_flag
0,1-1,1,1,1月21日に来日し、22日より北海道を観光。\n1月26日 体調不良のため外出せず。夜間に咳...,海外渡航歴なし。濃厚接触者は、現時点で家族、同僚等43名を特定し、健康観察実施中。,,,2020/01/28,0.0,北海道,...,,1,中国,2020/01/21,0.0,濃厚接触者を特定し\n健康観察終了,http://www.pref.hokkaido.lg.jp/hf/kth/kak/hass...,1.0,2020/04/03,0.0
1,1-2,1,2,1月31日 発熱、咳、倦怠感が出現。\n2月 3日 石狩振興局管内の医療機関Aを受診。\n2...,,,,2020/02/14,0.0,北海道,...,自営業,0,-,-,0.0,健康観察実施中,http://www.pref.hokkaido.lg.jp/hf/kth/kak/hass...,1.0,2020/04/03,0.0
2,1-3,1,3,2月 8日 倦怠感、筋肉痛、関節痛が出現\n2月12日 発熱、咳が出現\n2月13日 札幌市...,2月1日から2月12日までの期間、No.5の男性（2月19日感染判明）とともに、雪まつり大通...,,,2020/02/19,0.0,北海道,...,会社員,0,-,-,0.0,札幌市公表中\nid:1-5,http://www.pref.hokkaido.lg.jp/hf/kth/kak/hass...,1.0,2020/04/03,0.0
3,1-4,1,4,2月 3日 微熱、咽頭痛。\n2月 7日 渡島総合振興局管内の医療機関Aを受診。\n2月13...,本人からの申告によれば、海外渡航歴は無し。\n濃厚接触者48名について保健所が健康観察を行う...,,,2020/02/19,0.0,北海道,...,議会議員,0,-,-,0.0,濃厚接触者を特定し健康観察終了\nid:1-12,http://www.pref.hokkaido.lg.jp/hf/kth/kak/hass...,1.0,2020/04/03,0.0
4,1-5,1,5,2月15日 悪寒、発汗、倦怠感、筋肉痛、関節痛が出現。\n2月18日 発熱、筋肉痛、咳、痰が...,2月1日から2月12日までの期間、id:1-3の男性（2月18日感染判明）とともに、雪まつり...,,,2020/02/20,0.0,北海道,...,会社員,0,-,-,0.0,札幌市公表中\nid:1-3,http://www.pref.hokkaido.lg.jp/hf/kth/kak/hass...,1.0,2020/04/03,0.0
