<a href="https://colab.research.google.com/github/addone/datascience-gt/blob/main/ML_prediction_practice.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Prophetによる気象データ時系列予測

この演習では、過去の気温データを用いて、非線形回帰モデル（Prophet）による時系列予測を行います。

【学ぶキーワード】

* 非線形回帰: 直線ではなく、波打つようなグラフで予測すること。
* [Prophet](https://facebook.github.io/prophet/): 季節変動（毎年繰り返す波）に強いAIライブラリ。
* トレンドと周期性: 「温暖化で全体的に上がっているのか（トレンド）」と「夏だから暑いのか（周期性）」を分解して見る。


## ステップ１：データの読み込みと整形

今回は、[気象庁](https://www.data.jma.go.jp/gmd/risk/obsdl/index.php)が公開している過去の気温データを使います。このデータを使用して、過去の気温の傾向や、気候変動の影響を分析することができます。

データをダウンロードする際に、過去20年間の「**日別最高気温**」を選んでください。このデータには、日付と気温の2つの列があります。

CSVファイル形式でデータをダウンロードできたら、まずはColabに接続して、CSVファイルをアップロードしてください。
（*接続を解除したら自動で削除されるため、使うたびにアップロードが必要です。*）

次に、データを読み込み、中身を確認しましょう。

In [None]:
import pandas as pd
from prophet import Prophet

# データの読み込み（気象庁からダウンロードしたCSVファイル）
df = pd.read_csv(_____)

# データの中身を見てみる
print("--- 元のデータ ---")
df.head()


Prophetを使うには、絶対に守らなければならないデータ形式のルールがあります：

1. 日付の列名を `ds` (datestamp) にする。
2. 予測したい数値の列名を `y` にする。

読み込んだデータをProphet用に列名を変更する必要があります。

In [None]:
# 整形：Prophet用に列名を変更
df_prophet = ____

# 'ds' 列に NaN がある行を削除する
df_prophet.dropna(subset=['ds'], inplace=True)
df_prophet.reset_index(drop=True, inplace=True)

# 整形後の確認
print("\n--- Prophet用に整形したデータ ---")
df_prophet.head()

## ステップ２：データの季節性を可視化

まずはAIに入れる前に、人間が目で見て確認します。

毎年、夏に上がり冬に下がる、綺麗な「波」が見えますか？これが非線形（直線ではない）データの特徴です。

In [None]:
# 元データの可視化
import plotly.express as px
px.line(______)

## ステップ３：非線形回帰モデルによる学習と予測

いよいよAIに予測させます。Prophetのすごいところは、たった数行で「学習」から「未来予測」までやってくれる点です。

In [None]:
from prophet import Prophet
# モデルの作成（AIの脳を作る）

# 学習（過去のデータを食べさせる）

# 「未来の枠」を作る（向こう1年／365日分、日別）

# 予測を実行する

# 予測結果の一部を表示（'yhat' という列がAIの予測値です）
print("--- 予測結果 ---")
forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail()

## ステップ４：予測結果の可視化

まずは、予測結果を可視化します。黒い点が「実測値」、青い線が「AIの予測」です。

In [None]:
from prophet import plot as prophet_plot
# 予測結果の可視化


さらに、Prophetの真骨頂である「要素分解（Components）」を行います。 これにより、気温の変化を「トレンド（長期的傾向）」と「季節性（1年周期の波）」に分けて見ることができます。

In [None]:
# 要素分解結果の可視化


## 考察・問い

1. トレンド分析: 京都の気温は過去5年間で右肩上がり（温暖化）ですか？それとも横ばいですか？
2. 1年の中で、気温がピークになる（最も暑い）のは「何月何日頃」になっていますか？
3. ビジネス決断: 京都の「着物レンタル店」の店長として、「浴衣キャンペーン（夏）」期間を設定したい。着物を着て歩くのが辛くなる「最高気温30℃」を超える時期は、大体いつからいつまでですか？

In [None]:
# 答え：
# 1.
# 2.
# 3.

---

その他参考資料（Youtube動画）：

- [Prophetモデルの検証、評価と調整（チューニング）](https://facebook.github.io/prophet/docs/diagnostics.html)
- [実践的応用のためのProphetの使い方](https://qiita.com/tchih11/items/42fc0d52a1486ba64b5d)
- [LLM（大規模言語モデル）はあくまでも次単語予測に過ぎない](https://youtube.com/shorts/KHEtJUlpqcg?si=XtAmgO40DcSzLt0e)
