In [16]:
#02

#気象庁
#①最新の最高気温のデータを取得
#②過去のtsと統合してtimeseriesを更新

#https://www.data.jma.go.jp/stats/data/mdrr/docs/csv_dl_readme.html
#最新は1時間毎の更新（毎時00分の観測データを50分過ぎに更新）
#過去７日はウェブ上のデータは毎日5:00ごろ更新＋修正は13:00、19:00、翌日1:00ごろの更新で反映-->github上で30分遅れで取得しているものを呼び出す
#定期実行

import pandas as pd

#観測地点の一覧
url = 'https://raw.githubusercontent.com/Nikkei-Visual-Data-Journalism/Heatwave/main/data-maxtemp/meta/points_list.csv'
points = pd.read_csv(url)

#最新データの取得
url = 'https://www.data.jma.go.jp/stats/data/mdrr/tem_rct/alltable/mxtemsadext00_rct.csv'
data = pd.read_csv(url, encoding='Shift-JIS')

#日付
yyyymmdd = f"{data['現在時刻(年)'][0]}{data.loc[0,['現在時刻(月)','現在時刻(日)']].apply(lambda x: str(x).zfill(2)).sum()}"
yyyymmdd_dt = pd.to_datetime(yyyymmdd, format='%Y%m%d')

#最新データをcsvで出力
##ファイル名
filename = f"./data-maxtemp/daily-data/jma-maxtemp-{yyyymmdd}.csv"
##記載
data['date'] = yyyymmdd_dt
##csv
data.to_csv(filename, index=False)
data.to_csv("./data-maxtemp/daily-data/jma-maxtemp-latest.csv")

#真夏日・猛暑日の数をかぞえる
rename_dic = {col:'maxtemp' for col in data.columns if '最高気温(℃)' in col}
data = data.rename(columns=rename_dic)

#計算
data['over30'] = data.maxtemp >= 30
data['over35'] = data.maxtemp >= 35
data['over40'] = data.maxtemp >= 40
data['total'] = 1
data['null_values'] = data.maxtemp.isna()

#集計1: 猛暑・真夏日の観測地点数（全国）
##最新分
heat_points_latest = data[['over30','over35','over40','total','null_values']].sum()
heat_points_latest['date'] = yyyymmdd_dt
##過去分
filename = "./data-maxtemp/timeseries-data/jma-maxtemp-heatpoints-ts.csv"
heat_points = pd.read_csv(filename)
heat_points.date = pd.to_datetime(heat_points.date)
##統合
heat_points = pd.concat([heat_points, heat_points_latest.to_frame().T])
heat_points = heat_points.loc[~heat_points.duplicated(subset=['date'], keep='last')].reset_index(drop=True)
heat_points = heat_points.dropna(subset='date').sort_values(by='date')
##出力
heat_points.to_csv(filename, index=False)

#最終更新時刻を記録
##動的テキスト表示用（使えるかは未定）
update_log = f"{yyyymmdd_dt.strftime('%Y年%-m月%-d日')}{data['現在時刻(時)'][0]}時時点"
with open('./data-maxtemp/timeseries-data/update_log.txt', 'w') as f:
    f.write(update_log)

In [14]:
past_table = pd.read_csv('./data-maxtemp/timeseries-data/jma-maxtemp-table-ts.csv')

In [26]:
data['pref'] = data['観測所番号'].map(points.set_index(['観測所番号']).pref.to_dict())
data['capitol'] = data['観測所番号'].isin(points[points.capitol==1]['観測所番号']).astype(int)

In [27]:
data

Unnamed: 0,観測所番号,都道府県,地点,国際地点番号,現在時刻(年),現在時刻(月),現在時刻(日),現在時刻(時),現在時刻(分),maxtemp,...,昨日までの8月の1位の値の起日（日）,統計開始年,date,over30,over35,over40,total,null_values,pref,capitol
0,11001,北海道宗谷地方,宗谷岬（ソウヤミサキ）,,2023,8,7,19,0,20.4,...,1,1978,2023-08-07,False,False,False,1,False,北海道,0
1,11016,北海道宗谷地方,稚内（ワッカナイ）,47401.0,2023,8,7,19,0,21.5,...,7,1938,2023-08-07,False,False,False,1,False,北海道,0
2,11046,北海道宗谷地方,礼文（レブン）,,2023,8,7,19,0,21.4,...,7,2003,2023-08-07,False,False,False,1,False,北海道,0
3,11061,北海道宗谷地方,声問（コエトイ）,,2023,8,7,19,0,21.3,...,7,2003,2023-08-07,False,False,False,1,False,北海道,0
4,11076,北海道宗谷地方,浜鬼志別（ハマオニシベツ）,,2023,8,7,19,0,19.5,...,1,1978,2023-08-07,False,False,False,1,False,北海道,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
910,94062,沖縄県,西表島（イリオモテジマ）,47917.0,2023,8,7,19,0,32.9,...,14,1954,2023-08-07,True,False,False,1,False,沖縄県,0
911,94081,沖縄県,石垣島（イシガキジマ）,47918.0,2023,8,7,19,0,32.6,...,20,1896,2023-08-07,True,False,False,1,False,沖縄県,0
912,94086,沖縄県,盛山（モリヤマ）,,2023,8,7,19,0,33.3,...,24,2013,2023-08-07,True,False,False,1,False,沖縄県,0
913,94101,沖縄県,大原（オオハラ）,,2023,8,7,19,0,31.7,...,4,1978,2023-08-07,True,False,False,1,False,沖縄県,0
