#災害の移り変わり
#私は時代が進むのにつれて発生しやすくなった災害と発生しにくくなった災害に違いがあるかどうか気になり調べました。

#今回のデータは1990年から2024年の合計125年分のデータ。125は5できれいに割れるので25年ごとにデータを5つに分けていく。

In [None]:
import pandas as pd

# 元のCSVファイルを読み込む
df = pd.read_csv("emdat.csv")

# 年代ごとの条件を定義
periods = [
    (1900, 1924),
    (1925, 1949),
    (1950, 1974),
    (1975, 1999),
    (2000, 2024)
]

# 各期間ごとにCSVファイルを保存
for start, end in periods:
    label = f"{start}-{end}"
    # 条件に合う行を抽出
    filtered = df[(df["Start Year"] >= start) & (df["Start Year"] <= end)]
    # CSVファイルとして保存
    filtered.to_csv(f"disaster_{label}.csv", index=False)



# disaster_1900-1924.csv、disaster_1925-1949.csv、disaster_1950-1974.csv、disaster_1975-1999.csv、disaster_2000-2024.csvという名前のcsvファイルを5つの期間1900-1924、1925-1949、1950-1974、1975-1999、2000-2024ごとにそれぞれ作った。作ったファイルは以下のようになっている。

In [None]:
print( pd.read_csv("disaster_1900-1924.csv").head())

# この後それぞれの期間ごとにDisaster Type列の中で発生数が多い災害TOP5を求め、求めたトップ5を横軸に災害名、縦軸に発生回数の棒グラフを作り25年ごとに発生回数が多い災害が変化しているか知らべる。

In [None]:
# --- 関数定義 ---
def get_top5_from_csv(filename):
    """
    CSVファイルを読み込み、Disaster Type列の発生回数TOP5を返す
    """
    df = pd.read_csv(filename)
    counts = df["Disaster Type"].value_counts().head(5)
    return counts

# --- 対象となるCSVファイル一覧 ---
csv_files = [
    "disaster_1900-1924.csv",
    "disaster_1925-1949.csv",
    "disaster_1950-1974.csv",
    "disaster_1975-1999.csv",
    "disaster_2000-2024.csv"
]

# --- 各ファイルごとにTOP5を表示 ---
for file in csv_files:
    print(f"\n{file} のトップ5災害タイプ")
    top5 = get_top5_from_csv(file)
    print(top5)


# 5つの期間のトップ5を求められたので次はそれぞれを縦軸を発生回数、横軸を災害タイプの棒グラフを作る。

In [None]:
import matplotlib.pyplot as plt

# --- 各CSVファイルごとにTOP5を求めて棒グラフを描画 ---
for file in csv_files:
    # 関数でトップ5を取得
    top5 = get_top5_from_csv(file)


    # グラフ描画
    plt.figure(figsize=(8,6))
    top5.plot(kind="bar", color="skyblue")
    plt.title(f"Top 5 Disaster Types in {file}")
    plt.xlabel("Disaster Type")
    plt.ylabel("Occurrences")
    plt.xticks(rotation=45)
    plt.tight_layout()
    plt.show()


# 上のグラフを見比べるといくつかわかったことがある。地震、洪水、嵐はこの125年では必ずトップ5にランクインしている。干ばつ1900年からランクインしており時間がたつにつれて他と比べると発生件数は少なくなっていることがわかる。1975年から2024になると流行り病による件数が増加し始めていることが分かった。この結果から地震、洪水、嵐はいつの期間でも発生件数が多く多くの割合を占めていることが分かった。それ以外だと干ばつは時がたつにつれて減っている傾向があるとわかった。