# combined csvを読み込み，警報の分類により分類し，各csvを保存するプログラム

## Read csv and pre-fix

In [10]:
url_input_file_='./kurashiki/raw/combined_output.csv'
url_output_directory='./kurashiki/output'

In [11]:
import pandas as pd


df = pd.read_csv(url_input_file_,header=None)
    

# 日付順並び替え / 一行目の削除
df_tmp = df.iloc[::-1].reset_index(drop=True)
df_checked = df_tmp.drop(df.columns[0], axis=1) #1行目と最後の行を削除
df_checked


Unnamed: 0,1,2,3,4,5,6
0,20130114050900-26-3320200,着雪注意報,倉敷市,2013-01-14 05:09:00+09,2013-01-14 10:34:00+09,0日05時25分00秒間
1,20130114041100-16-3320200,波浪注意報,倉敷市,2013-01-14 04:11:00+09,2013-01-15 04:15:00+09,1日00時04分00秒間
2,20130114041100-15-3320200,強風注意報,倉敷市,2013-01-14 04:11:00+09,2013-01-15 04:15:00+09,1日00時04分00秒間
3,20130119041300-21-3320200,乾燥注意報,倉敷市,2013-01-19 04:13:00+09,2013-01-20 21:28:00+09,1日17時15分00秒間
4,20130124162800-16-3320200,波浪注意報,倉敷市,2013-01-24 16:28:00+09,2013-01-26 19:10:00+09,2日02時42分00秒間
...,...,...,...,...,...,...
3094,20240910100800-14-3320200,雷注意報,倉敷市,2024-09-10 10:08:00+09,2024-09-10 20:31:00+09,0日10時23分00秒間
3095,20240911133400-18-3320200,洪水注意報,倉敷市,2024-09-11 13:34:00+09,2024-09-11 17:23:00+09,0日03時49分00秒間
3096,20240911100300-14-3320200,雷注意報,倉敷市,2024-09-11 10:03:00+09,2024-09-11 23:20:00+09,0日13時17分00秒間
3097,20240912100600-14-3320200,雷注意報,倉敷市,2024-09-12 10:06:00+09,2024-09-12 21:10:00+09,0日11時04分00秒間


## フィルターを用意して，フィルターごとにcsvファイルを保存する．

In [12]:
import pandas as pd
import os
from my_vars import get_warning_list

# 使用する警報のオンオフ設定（True: 使用する, False: 使用しない）
alerts_status = get_warning_list()
for warning_name,is_active in alerts_status.items():
    if is_active:
        print(warning_name)

print()


# 各警報ごとにフィルタリングしてデータフレームを作成
for alert, status in alerts_status.items():
    if status:
        filtered_df = df_checked[df_checked[2] == alert]
        # 結果を表示（またはCSVに出力）
        # print(f'Filtered data for {alert}:')
        # print(filtered_df)
        # フィルタリングされた結果を新しいCSVに保存
        output_file = os.path.join(url_output_directory,f'{alert}_filtered_alerts.csv')
        
        filtered_df.to_csv(output_file, index=False, encoding='UTF-8')
        print(f'{output_file}に保存しました．')

雷注意報
大雨注意報
洪水注意報
強風注意報
大雨警報
洪水警報
暴風警報
大雨特別警報

./kurashiki/output/雷注意報_filtered_alerts.csvに保存しました．
./kurashiki/output/大雨注意報_filtered_alerts.csvに保存しました．
./kurashiki/output/洪水注意報_filtered_alerts.csvに保存しました．
./kurashiki/output/強風注意報_filtered_alerts.csvに保存しました．
./kurashiki/output/大雨警報_filtered_alerts.csvに保存しました．
./kurashiki/output/洪水警報_filtered_alerts.csvに保存しました．
./kurashiki/output/暴風警報_filtered_alerts.csvに保存しました．
./kurashiki/output/大雨特別警報_filtered_alerts.csvに保存しました．


## 読み込む時の日付フォーマット

In [13]:
from datetime import datetime

# 文字列をdatetimeに変換
date_format = '%Y-%m-%d %H:%M'  # タイムゾーン付きフォーマット

for k in range(len(df)):
    # print(k)
    # 文字列をdatetimeオブジェクトに変換
    df.iloc[k,4] = datetime.strptime(df.iloc[k,4][:16], date_format)
    df.iloc[k,5] = datetime.strptime(df.iloc[k,5][:16], date_format)