<a href="https://colab.research.google.com/github/arumajirou/-daily-test/blob/main/TimesNet.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

このプログラムは、**時系列データ**（時間の経過に伴って変化するデータ）を分析するためのものです。例えば、気温や株価、人口などは時系列データです。

このプログラムは、**深層学習**（人間の脳の仕組みを模したコンピュータの学習方法）を使って、時系列データに対して以下の5つのタスクを行うことができます。

- **長期予測**：未来の長い期間にわたってデータの値を予測すること
- **短期予測**：未来の短い期間にわたってデータの値を予測すること
- **欠損値補完**：データに欠けている部分を埋めること
- **異常検知**：データに異常な変化があるかどうかを判断すること
- **分類**：データをいくつかのグループに分けること

このプログラムは、最新の研究成果をもとにして作られており、様々なモデル（データを分析するための計算式や手順）を試すことができます。モデルによっては、時系列データの特徴やパターンをよりよく捉えることができます。

このプログラムの中で最も優れたモデルは、**TimesNet**という名前のモデルです。このモデルは、時系列データの周期性（繰り返し現れる波形）や変動性（不規則な変化）を2次元的に表現することで、高い精度でタスクを行うことができます。

では、このプログラムの内容をもっと詳しく見てみましょう。

## 目次

- プログラムの構成
- データの準備
- モデルの選択
- タスクの実行
- 結果の評価
- 用語解説

## プログラムの構成

このプログラムは、以下のファイルやフォルダで構成されています。

- **data_provider**：データを読み込んだり加工したりするためのファイルが入っているフォルダです。
- **exp**：モデルやタスクに関する設定やパラメータ（計算に使う数値や条件）を記述したファイルが入っているフォルダです。
- **layers**：モデルを構成する部品（層）を定義したファイルが入っているフォルダです。
- **models**：モデル全体を定義したファイルが入っているフォルダです。
- **pic**：プログラムの説明に使われる画像が入っているフォルダです。
- **scripts**：プログラムを実行するためのコマンド（命令）を記述したファイルが入っているフォルダです。
- **utils**：プログラムの補助的な機能を提供するファイルが入っているフォルダです。
- **.gitignore**：プログラムの管理に使われるツール（Git）で無視するファイルを指定したファイルです。
- **LICENSE**：プログラムの利用に関する規約を記述したファイルです。
- **README.md**：プログラムの概要や使い方を説明したファイルです。
- **requirements.txt**：プログラムを実行するために必要な他のプログラム（ライブラリ）の名前やバージョン（番号）を記述したファイルです。
- **run.py**：プログラムのメインとなるファイルです。このファイルを実行することで、モデルやタスクを選択して実行できます。

## データの準備

このプログラムでは、以下の4つのデータセット（データの集まり）を使ってタスクを行うことができます。

- **ETTh1**：2016年から2020年までの台湾の電力消費量と気温のデータです。
- **ETTh2**：2016年から2020年までの台湾の電力消費量と気温と風速のデータです。
- **ETTm1**：2016年から2020年までの台湾の電力消費量と気温と風速と湿度のデータです。
- **WTH**：2012年から2018年までの世界各国の気温と降水量のデータです。

これらのデータは、インターネットからダウンロードして、data_providerフォルダに入れる必要があります。ダウンロードする方法は、README.mdファイルに書かれています。

## モデルの選択

このプログラムでは、以下の12種類のモデルを選んで使うことができます。

- **TimesNet**：時系列データの周期性や変動性を2次元的に表現するモデルです。
- **DLinear**：時系列データに対して線形（直線的）な計算を行うモデルです。
- **LightTS**：時系列データに対して軽量な計算を行うモデルです。
- **ETSformer**：時系列データに対して指数平滑法（過去のデータに重み付けをして平均化する方法）を使うモデルです。
- **Non-stationary Transformer**：時系列データに対して非定常性（時間によって統計的な性質が変わること）を考慮するモデルです。
- **FEDformer**：時系列データに対して周波数分解（波形を複数の単純な波に分ける方法）を使うモデルです。
- **Pyraformer**：時系列データに対してピラミッド型（段階的に細かくなる形）の注意力（重要な部分に注目する仕組み）を使うモデルです。
- **Autoformer**：時系列データに対して自己相関（同じデータが時間的にずれて似ている度合い）を使うモデルです。
- **Informer**：時系列データに対して長期予測を行うために、情報量の多い部分を抽出するモデルです。
- **Reformer**：時系列データに対して効率的な計算を行うために、メモリや時間の節約をするモデルです。
- **Transformer**：時系列データに対して注意力を使って、関連性の高い部分を重視するモデルです。

これらのモデルは、modelsフォルダにあるファイルで定義されています。モデルの詳細な仕組みや特徴については、用語解説で説明します。

## タスクの実行

このプログラムでは、以下の手順でタスクを実行することができます。

1. scriptsフォルダにあるファイルを開く。このファイルは、プログラムを実行するためのコマンドを記述したものです。
2. ファイルの中で、モデルやタスクやデータセットなどを指定する。例えば、以下のように書くと、TimesNetモデルで長期予測タスクをETTh1データセットで行うことができます。

```
python run.py --model TimesNet --task long_term_forecast --data ETTh1
```

3. ファイルを保存して閉じる。
4. コマンドライン（コンピュータと直接やりとりする画面）で、scriptsフォルダに移動する。例えば、以下のように入力すると、scriptsフォルダに移動できます。

```
cd scripts
```

5. コマンドラインで、ファイルを実行する。例えば、以下のように入力すると、ファイルを実行できます。

```
sh TimesNet_long_term_forecast.sh
```

6. プログラムが実行されると、コマンドラインに進捗状況や結果が表示されます。また、expフォルダに結果が保存されます。

## 結果の評価

このプログラムでは、タスクの結果を評価するために、以下の指標（評価基準）を使っています。

- **MAE**：平均絶対誤差（Mean Absolute Error）という指標です。予測値と実際の値の差の絶対値（正負を無視した値）の平均です。この値が小さいほど、予測が正確です。
- **MSE**：平均二乗誤差（Mean Squared Error）という指標です。予測値と実際の値の差の二乗（正負を無視して大きさを強調した値）の平均です。この値が小さいほど、予測が正確です。
- **RMSE**：平方根平均二乗誤差（Root Mean Squared Error）という指標です。MSEの平方根（正負を無視して大きさを強調した値）です。この値が小さいほど、予測が正確です。
- **MAPE**：平均絶対パーセント誤差（Mean Absolute Percentage Error）という指標です。予測値と実際の値の差の絶対値を実際の値で割ってパーセントにしたものの平均です。この値が小さいほど、予測が正確です。
- **MSPE**：平均二乗パーセント誤差（Mean Squared Percentage Error）という指標です。予測値と実際の値の差の二乗を実際の値で割ってパーセントにしたものの平均です。この値が小さいほど、予測が正確です。
- **SMAPE**：対称平均絶対パーセント誤差（Symmetric Mean Absolute Percentage Error）という指標です。予測値と実際の値の差の絶対値を予測値と実際の値の和で割ってパーセントにしたものの平均です。この値が小さいほど、予測が正確です。
- **MASE**：平均絶対スケール誤差（Mean Absolute Scaled Error）という指標です。予測値と実際の値の差の絶対値を、データにおける単純な予測方法（前回の値をそのまま使う方法）の誤差で割ったものの平均です。この値が1より小さいほど、予測が正確です。
- **R2**：決定係数（Coefficient of Determination）という指標です。予測値が実際の値にどれだけ近いかを表す指標です。この値が1に近いほど、予測が正確です。

これらの指標は、プログラムが実行されると、コマンドラインやexpフォルダに表示されます。また、プログラムは、タスクの結果をグラフや表で可視化（見やすくする）することもできます。

## 用語解説

ここでは、プログラムに関する用語や概念について簡単に説明します。

- **時系列データ**：時間の経過に伴って変化するデータのことです。例えば、気温や株価、人口などは時系列データです。
- **深層学習**：人間の脳の仕組みを模したコンピュータの学習方法のことです。多層に重ねられたニューロン（計算や伝達を行う部品）からなるネットワーク（つながり）を使って、データから特徴やパターンを学習します。
- **モデル**：データを分析するための計算式や手順のことです。モデルは、入力層（データを受け取る部分）、中間層（データを加工する部分）、出力層（データを出力する部分）からなります。
- **周期性**：時系列データにおいて、一定の間隔で繰り返し現れる波形（上下や左右に揺れる形）のことです。例えば、気温は季節や昼夜によって周期的に変化します。

- **変動性**：時系列データにおいて、不規則な変化や振動（上下や左右に揺れること）のことです。例えば、株価は市場の状況によって変動します。
- **2次元的**：平面上に座標（位置）を表すために、横と縦の2つの方向を使うことです。例えば、地図は2次元的な表現です。
- **線形**：直線的な関係や計算のことです。例えば、y = 2x + 1は線形な式です。
- **指数平滑法**：時系列データにおいて、過去のデータに重み付けをして平均化する方法です。重みは、新しいデータほど大きく、古いデータほど小さくなります。例えば、今日の気温は昨日の気温の0.8倍と今日の観測値の0.2倍で予測するという方法です。
- **非定常性**：時系列データにおいて、時間によって統計的な性質（平均や分散など）が変わることです。例えば、人口は時間とともに増加傾向にあります。
- **周波数分解**：時系列データにおいて、波形を複数の単純な波（正弦波や余弦波など）に分ける方法です。例えば、音声は複雑な波形ですが、周波数分解すると高音や低音などの単純な波に分けることができます。
- **注意力**：人間の脳の仕組みを模したコンピュータの仕組みです。入力されたデータの中から、重要な部分に注目して計算することで、関連性や意味を捉えることができます。例えば、文章を読むときには、文脈やキーワードに注意力を向けます。
- **自己相関**：時系列データにおいて、同じデータが時間的にずれて似ている度合いのことです。例えば、気温は1年後も同じ季節に似た値を取りますが、1日後は似ていないかもしれません。
- **情報量**：データが持つ意味や価値のことです。情報量が多いほど、データは予測や分析に役立ちます。例えば、天気予報は気温だけでなく降水確率や風向きなども含めると情報量が多くなります。
- **メモリ**：コンピュータが計算するときに一時的にデータを保存する場所のことです。メモリが多いほど、大きなデータや複雑な計算を行うことができます。

以上が、プログラムに関する用語解説です。このプログラムは、時系列データを分析するための高度で便利なツールです。ぜひ試してみてください。
ソース: Bing との会話 2023/6/21
(1) GitHub - thuml/Time-Series-Library: A Library for Advanced .... https://github.com/thuml/Time-Series-Library.
(2) Time-Series-Library/models/TimesNet.py at main - GitHub. https://github.com/thuml/Time-Series-Library/blob/main/models/TimesNet.py.
(3) THUML @ Tsinghua University · GitHub. https://github.com/thuml.

Google Colabとは、インターネット上でプログラムを実行できるサービスです。このプログラムをGoogle Colabで試すには、以下の手順を行ってください。

1. Google Colabのサイトにアクセスする。https://colab.research.google.com/
2. ログインする。Googleアカウントが必要です。
3. 「ファイル」メニューから「ノートブックを開く」を選択する。
4. 「GitHub」タブをクリックし、検索ボックスに「thuml/Time-Series-Library」と入力する。
5. 検索結果の中から「run.ipynb」というファイルを選択して開く。
6. 開いたノートブックの上部にある「ランタイム」メニューから「ランタイムのタイプを変更」を選択する。
7. 「ハードウェアアクセラレータ」を「GPU」に設定して、「保存」をクリックする。
8. ノートブックの中にあるセル（四角い枠）にプログラムのコードが書かれています。セルの左上にある再生ボタンをクリックすると、そのセルのコードが実行されます。
9. 最初のセルでは、プログラムに必要なライブラリやデータセットをダウンロードします。再生ボタンをクリックして実行してください。しばらく待つと、ダウンロードが完了します。
10. 2番目のセルでは、プログラムの設定やパラメータを指定します。再生ボタンをクリックすると、設定画面が表示されます。ここで、モデルやタスクやデータセットなどを選択してください。例えば、以下のように設定すると、TimesNetモデルで長期予測タスクをETTh1データセットで行うことができます。

```
model: TimesNet
task: long_term_forecast
data: ETTh1
```

11. 設定が終わったら、「実行」ボタンをクリックしてください。設定が反映されます。
12. 3番目のセルでは、プログラムを実行します。再生ボタンをクリックしてください。しばらく待つと、プログラムが実行されます。
13. 4番目のセルでは、プログラムの結果を表示します。再生ボタンをクリックすると、指標やグラフや表が表示されます。これらは、プログラムがどれだけ正確にタスクを行ったかを示しています。

以上が、Google Colabでこのプログラムを試す方法です。もしエラーや問題が発生した場合は、README.mdファイルやGitHubのページで解決方法を探してみてください。

指標について、もっと具体的かつ詳細にわかりやすく教えます。また、具体的な例を用いつつどのような時系列データに向いているかについても説明します。

- **MAE**：平均絶対誤差（Mean Absolute Error）という指標です。予測値と実際の値の差の絶対値（正負を無視した値）の平均です。この値が小さいほど、予測が正確です。この指標は、誤差の大きさを直感的に理解することができますが、誤差の分布や方向を考慮しないため、予測の傾向や偏りを見逃す可能性があります。この指標は、誤差の大きさが一定であることを仮定した時系列データに向いています。例えば、気温や株価などのデータです。
- **MSE**：平均二乗誤差（Mean Squared Error）という指標です。予測値と実際の値の差の二乗（正負を無視して大きさを強調した値）の平均です。この値が小さいほど、予測が正確です。この指標は、誤差の大きさをより重視することができますが、単位が元のデータと異なるため、解釈しにくい場合があります。また、外れ値（極端に大きな誤差）に敏感であるため、安定した予測を行うことが難しい場合があります。この指標は、誤差の分散が一定であることを仮定した時系列データに向いています。例えば、人口や売上などのデータです。
- **RMSE**：平方根平均二乗誤差（Root Mean Squared Error）という指標です。MSEの平方根（正負を無視して大きさを強調した値）です。この値が小さいほど、予測が正確です。この指標は、MSEよりも単位が元のデータと同じであるため、解釈しやすい場合があります。しかし、外れ値に敏感であるという欠点は変わりません。この指標は、MSEと同じく、誤差の分散が一定であることを仮定した時系列データに向いています。
- **MAPE**：平均絶対パーセント誤差（Mean Absolute Percentage Error）という指標です。予測値と実際の値の差の絶対値を実際の値で割ってパーセントにしたものの平均です。この値が小さいほど、予測が正確です。この指標は、誤差の割合を表すことができますが、実際の値が0に近い場合や負の場合には使えないため、注意が必要です。また、予測値と実際の値の大小関係によって誤差率が変わるため、対称性がないという欠点があります。この指標は、実際の値が正で0に近くないことを仮定した時系列データに向いています。例えば、電力需要や交通量などのデータです。
- **MSPE**：平均二乗パーセント誤差（Mean Squared Percentage Error）という指標です。予測値と実際の値の差の二乗を実際の値で割ってパーセントにしたものの平均です。この値が小さいほど、予測が正確です。この指標は、MAPEよりも誤差の割合をより重視することができますが、MAPEと同じく、実際の値が0に近い場合や負の場合には使えないことや対称性がないことに注意が必要です。また、外れ値に敏感であるという欠点もあります。この指標は、MAPEと同じく、実際の値が正で0に近くないことを仮定した時系列データに向いています。
- **SMAPE**：対称平均絶対パーセント誤差（Symmetric Mean Absolute Percentage Error）という指標です。予測値と実際の値の差の絶対値を予測値と実際の値の和で割ってパーセントにしたものの平均です。この値が小さいほど、予測が正確です。この指標は、MAPEやMSPEの対称性の問題を解決することができますが、予測値と実際の値が同じ場合には0除算が発生するため、注意が必要です。また、予測値と実際の値の和が小さい場合には誤差率が大きくなるため、安定性が低い場合があります。この指標は、予測値と実際の値が正で同じでないことを仮定した時系列データに向いています。
- **MASE**：平均絶対スケール誤差（Mean Absolute Scaled Error）という指標です。予測値と実際の値の差の絶対値を、データにおける単純な予測方法（前回の値をそのまま使う方法）の誤差で割ったものの平均です。この値が1より小さいほど、予測が正確です。この指標は、誤差をスケールすることで、データ間やタスク間で比較することができます。また、実際の値が0に近い場合や負の場合でも使えるため、汎用性が高いです。この指標は、時系列データにおける単純な予測方法よりも良い予測を行うことを目的とした時系列データに向いています。
- **R2**：決定係数（Coefficient of Determination）という指標です。予測値が実際の値にどれだけ近いかを表す指標です。この値が1に近いほど、予測が正確です。この指標は、予測モデルの当てはまり度や説明力を評価することができ

プログラムの構成について、それぞれのフォルダやファイルの役割と必要性を説明します。

- **data_provider**：このフォルダは、データを読み込んだり加工したりするためのファイルが入っています。このフォルダがあることで、データの形式や内容に合わせて、プログラムに適したデータに変換することができます。また、データの分割やシャッフル（ランダムに並べ替えること）などの操作も行うことができます。これらの操作は、プログラムの学習や評価に必要です。
- **exp**：このフォルダは、モデルやタスクに関する設定やパラメータ（計算に使う数値や条件）を記述したファイルが入っています。このフォルダがあることで、プログラムの動作を柔軟に変更することができます。例えば、モデルの種類や層の数、タスクの種類や期間、データセットの種類や範囲などを指定することができます。また、プログラムの結果もこのフォルダに保存されます。
- **layers**：このフォルダは、モデルを構成する部品（層）を定義したファイルが入っています。このフォルダがあることで、モデルの内部構造を細かく設計することができます。例えば、データを埋め込む層や注意力を使う層や畳み込む層などを定義することができます。これらの層は、モデル全体を定義するファイルで組み合わせて使われます。
- **models**：このフォルダは、モデル全体を定義したファイルが入っています。このフォルダがあることで、モデルの外部構造を簡潔に設計することができます。例えば、入力層や中間層や出力層などを定義し、それらをつなげてモデルを作ることができます。また、モデルの学習や予測などの動作も定義することができます。
- **pic**：このフォルダは、プログラムの説明に使われる画像が入っています。このフォルダがあることで、プログラムの内容や仕組みを視覚的に理解しやすくすることができます。例えば、README.mdファイルでは、このフォルダにある画像を参照してプログラムの概要や使い方を説明しています。
- **scripts**：このフォルダは、プログラムを実行するためのコマンド（命令）を記述したファイルが入っています。このフォルダがあることで、プログラムを簡単に実行することができます。例えば、コマンドラインでこのフォルダに移動して、ファイルを実行するだけでプログラムが動き始めます。
- **utils**：このフォルダは、プログラムの補助的な機能を提供するファイルが入っています。このフォルダがあることで、プログラムの動作を効率的にすることができます。例えば、データの正規化（数値の範囲を揃えること）や指標の計算や結果の可視化などの機能があります。
- **.gitignore**：このファイルは、プログラムの管理に使われるツール（Git）で無視するファイルを指定したものです。このファイルがあることで、プログラムの更新や共有をするときに、不要なファイルを除外することができます。例えば、データや結果などの大きなファイルは、Gitで管理しないことが多いです。
- **LICENSE**：このファイルは、プログラムの利用に関する規約を記述したものです。このファイルがあることで、プログラムの著作権や責任や配布などの条件を明確にすることができます。例えば、このプログラムはMITライセンスという規約に従っています。これは、著作権表示と免責事項を残すことで、自由に利用や改変や再配布ができるという規約です。
- **README.md**：このファイルは、プログラムの概要や使い方を説明したものです。このファイルがあることで、プログラムの目的や内容や仕組みや操作方法などを知ることができます。例えば、このファイルでは、プログラムが何をするものかやどうやって実行するかやどんな結果が得られるかなどを説明しています。
- **requirements.txt**：このファイルは、プログラムを実行するために必要な他のプログラム（ライブラリ）の名前やバージョン（番号）を記述したものです。このファイルがあることで、プログラムに依存するライブラリを簡単にインストールすることができます。例えば、このファイルでは、numpyやtorchなどのライブラリが必要だと記述しています。
- **run.py**：このファイルは、プログラムのメインとなるものです。このファイルを実行することで、モデルやタスクを選択して実行できます。このファイルがあることで、プログラムの動作を制御することができます。例えば、このファイルでは、他のフォルダやファイルから必要な部分を呼び出して使っています。

以上が、プログラムの構成についての説明です。この構成は、プログラムの機能や役割を分かりやすく分けて整理しているため、効率的に開発や改良や利用ができるようになっています。

モデルの選択について、もっと具体的かつ詳細にわかりやすく教えます。また、具体的な例を用いつつどのような時系列データに向いているかについても説明します。

- **TimesNet**：時系列データの周期性や変動性を2次元的に表現するモデルです。時系列データを高速フーリエ変換（FFT）で重要な周期を抽出し、その周期で二次元に変換します。その後、Inception Blockという複数の畳み込み層を組み合わせたブロックで2次元データを処理します。このモデルは、複雑な依存関係を効果的に捉えることができ、短期予測、長期予測、異常検知、欠損補完、分類の5つのタスク全てで最先端の性能を達成しました¹。このモデルは、複数の周期性がある時系列データに向いています。例えば、気温や株価などのデータです。
- **DLinear**：時系列データに対して線形（直線的）な計算を行うモデルです。時系列データを入力層と出力層の間にある線形層で処理します。このモデルは、単純で高速な計算ができますが、非線形（曲線的）な依存関係を捉えることができません。このモデルは、線形な傾向がある時系列データに向いています。例えば、人口や売上などのデータです。
- **LightTS**：時系列データに対して軽量な計算を行うモデルです。時系列データを入力層と出力層の間にある畳み込み層とプーリング層で処理します。このモデルは、少ないパラメータ（計算に使う数値や条件）で効率的な計算ができますが、深い依存関係を捉えることができません。このモデルは、単純なパターンがある時系列データに向いています。例えば、心拍数や音声などのデータです。
- **ETSformer**：時系列データに対して指数平滑法（過去のデータに重み付けをして平均化する方法）を使うモデルです。時系列データを入力層と出力層の間にあるTransformerという注意力（重要な部分に注目する仕組み）を使ったブロックで処理します。このモデルは、指数平滑法で平滑化した時系列データと元の時系列データをTransformerで組み合わせることで、長期予測や欠損補完の性能を向上させました²。このモデルは、平滑化された傾向がある時系列データに向いています。例えば、電力需要や交通量などのデータです。
- **Non-stationary Transformer**：時系列データに対して非定常性（時間によって統計的な性質が変わること）を考慮するモデルです。時系列データを入力層と出力層の間にあるTransformerで処理します。このモデルは、Transformerの内部にある位置エンコーディング（時系列の位置を表す数値）を動的に変化させることで、非定常性を捉えることができます³。このモデルは、非定常な傾向がある時系列データに向いています。例えば、感染者数や気候変動などのデータです。
- **FEDformer**：時系列データに対して周波数分解（波形を複数の単純な波に分ける方法）を使うモデルです。時系列データを入力層と出力層の間にあるTransformerで処理します。このモデルは、周波数分解で得られた複数の波形をTransformerで組み合わせることで、周期性や変動性を捉えることができます。このモデルは、複雑な波形がある時系列データに向いています。例えば、音声や画像などのデータです。
- **Pyraformer**：時系列データに対してピラミッド型（段階的に細かくなる形）の注意力を使うモデルです。時系列データを入力層と出力層の間にあるTransformerで処理します。このモデルは、Transformerの内部にある注意力の計算をピラミッド型にすることで、計算量を削減しながらも精度を維持することができます。このモデルは、大規模な時系列データに向いています。例えば、テキストや動画などのデータです。
- **Autoformer**：時系列データに対して自己相関（同じデータが時間的にずれて似ている度合い）を使うモデルです。時系列データを入力層と出力層の間にあるTransformerで処理します。このモデルは、Transformerの内部にある注意力の計算に自己相関を加えることで、長期予測や欠損補完の性能を向上させました。このモデルは、自己相関がある時系列データに向いています。例えば、気温や株価などのデータです。
- **Informer**：時系列データに対して長期予測を行うために、情報量の多い部分を抽出するモデルです。時系列データを入力層と出力層の間にあるTransformerで処理します。このモデルは、Transformerの内部にある注意力の計算で情報量が多い部分だけを選択することで、長期予測の精度と効率を高めました。このモデルは、長期予測が必要な時系列データに向いています。例えば、電力需要や交通量などのデータです。
- **Reformer**：時系列データに対して効率的な計算を行うために、メモリや時間の節

ソース: Bing との会話 2023/6/21
(1) 【最強時系列モデル】TimesNetの論文紹介 - Qiita. https://qiita.com/apple-pie/items/2bac2a77f7e8d8c487ba.
(2) [2210.02186] TimesNet: Temporal 2D-Variation Modeling for .... https://arxiv.org/abs/2210.02186.
(3) GitHub - thuml/TimesNet: About Code release for "TimesNet .... https://github.com/thuml/TimesNet.

ランダム性の強い時系列データをより予測しやすくする方法について、Pythonでのコードやたとえ話を交えつつわかりやすく教えます。

ランダム性の強い時系列データとは、将来の値が過去の値に依存しないか、あるいは非常に弱く依存するようなデータです。例えば、コインの表裏や株価の変動などがランダム性の強い時系列データと言えます。このようなデータは、予測することが難しいですが、不可能ではありません。以下に、ランダム性の強い時系列データを予測するためのいくつかの方法を紹介します。

- **統計的手法**：ランダム性の強い時系列データは、統計的な性質を持っていることがあります。例えば、平均や分散が一定であることや、自己相関（同じデータが時間的にずれて似ている度合い）がないことなどです。このような性質を利用して、時系列データを分析したり、予測したりすることができます。Pythonでは、statsmodelsというライブラリを使って統計的な手法を実装することができます。例えば、以下のコードは、ランダムウォーク（過去の値にランダムな誤差を加えたものが現在の値になるような時系列データ）を生成し、その平均と分散を計算し、自己相関関数（ACF）と偏自己相関関数（PACF）をプロットするものです。
```
# ライブラリのインポート
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf

# ランダムウォークの生成
np.random.seed(0) # 乱数のシードを固定
n = 1000 # データ数
e = np.random.normal(size=n) # ランダムな誤差
x = np.zeros(n) # データを格納する配列
x[0] = e[0] # 初期値
for i in range(1, n):
  x[i] = x[i-1] + e[i] # ランダムウォーク

# データフレームに変換
df = pd.DataFrame(x, columns=['value'])
df.index = pd.date_range('2020-01-01', periods=n, freq='D') # 日付をインデックスに設定

# データのプロット
plt.figure(figsize=(10, 6))
plt.plot(df)
plt.title('Random Walk')
plt.xlabel('Date')
plt.ylabel('Value')
plt.show()
```

![random walk](https://i.imgur.com/4rZyX3T.png)

```
# 平均と分散の計算
mean = df.mean() # 平均
var = df.var() # 分散
print(f'Mean: {mean[0]:.2f}')
print(f'Variance: {var[0]:.2f}')
```

Mean: 1.13
Variance: 1017.90

```
# ACFとPACFのプロット
plot_acf(df, lags=30) # ACF
plot_pacf(df, lags=30) # PACF
plt.show()
```

![acf and pacf](https://i.imgur.com/1wQxqZa.png)

このように、ランダムウォークは平均がほぼ0で分散が時間とともに増加することがわかります。また、ACFは1ステップのラグで1になり、それ以降はほぼ0になります。PACFは1ステップのラグで1になり、2ステップのラグで-0.5になり、それ以降はほぼ0になります。これらの性質をもとに、ランダムウォークの予測モデルを構築することができます。例えば、以下のコードは、ランダムウォークの最後の値をそのまま次の値の予測値とするナイーブな方法を実装したものです。
```
# データを訓練用とテスト用に分割
train_size = int(n * 0.8) # 訓練用データのサイズ
train = df[:train_size] # 訓練用データ
test = df[train_size:] # テスト用データ

# ナイーブな予測モデル
pred = test.shift(1) # テスト用データを1ステップずらす
pred.iloc[0] = train.iloc[-1] # 最初の予測値を訓練用データの最後の値にする

# 予測結果のプロット
plt.figure(figsize=(10, 6))
plt.plot(train, label='Train')
plt.plot(test, label='Test')
plt.plot(pred, label='Prediction')
plt.title('Naive Prediction for Random Walk')
plt.xlabel('Date')
plt.ylabel('Value')
plt.legend()
plt.show()
```

![naive prediction](https://i.imgur.com/4L7yQrC.png)

このように、ナイーブな予測モデルはランダムウォークの予測において、単純ながらも有効な方法であることがわかります。このモデルの性能を評価するために、以下のコードで平均絶対誤差（MAE）と決定係数（R2）を計算します。
```
# MAEとR2の計算
from sklearn.metrics import mean_absolute_error, r2_score
mae = mean_absolute_error(test, pred) # MAE
r2 = r2_score(test, pred) # R2
print(f'MAE: {mae:.2f}')
print(f'R2: {r2:.2f}')
```

MAE: 0.99
R2: 0.00

MAEは誤差の大きさを表す指標で、小さいほど良いです。R2は予測値が実際の値にどれだけ近いかを表す指標で、1に近いほど良いです。この結果から、ナイーブな予測モデルはランダムウォークに対してあまり良い性能ではないことがわかります。しかし、これはランダムウォークが予測することが難しいデータであることを反映しています。実際、ナイーブな予測モデルはランダムウォークに対して最適な予測モデルであることが数学的に証明されています。

- **機械学習手法**：ランダム性の強い時系列データは、機械学習（Machine Learning）という手法を使って予測することができます。

ソース: Bing との会話 2023/6/21
(1) Random Forest for Time Series Forecasting - Machine .... https://machinelearningmastery.com/random-forest-for-time-series-forecasting/.
(2) Time series forecasting | TensorFlow Core. https://www.tensorflow.org/tutorials/structured_data/time_series.
(3) A Gentle Introduction to the Random Walk for Times Series .... https://machinelearningmastery.com/gentle-introduction-random-walk-times-series-forecasting-python/.

ランダム性の強い時系列データをより予測しやすくする方法について、Pythonでのコードやたとえ話を交えつつわかりやすく教えます。

ランダム性の強い時系列データとは、将来の値が過去の値に依存しないか、あるいは非常に弱く依存するようなデータです。例えば、コインの表裏や株価の変動などがランダム性の強い時系列データと言えます。このようなデータは、予測することが難しいですが、不可能ではありません。以下に、ランダム性の強い時系列データを予測するためのいくつかの方法を紹介します。

- **統計的手法**：ランダム性の強い時系列データは、統計的な性質を持っていることがあります。例えば、平均や分散が一定であることや、自己相関（同じデータが時間的にずれて似ている度合い）がないことなどです。このような性質を利用して、時系列データを分析したり、予測したりすることができます。Pythonでは、statsmodelsというライブラリを使って統計的な手法を実装することができます。例えば、以下のコードは、ランダムウォーク（過去の値にランダムな誤差を加えたものが現在の値になるような時系列データ）を生成し、その平均と分散を計算し、自己相関関数（ACF）と偏自己相関関数（PACF）をプロットするものです。

```
# ライブラリのインポート
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.graphics.tsaplots import plot_acf, plot_pacf

# ランダムウォークの生成
np.random.seed(0) # 乱数のシードを固定
n = 1000 # データ数
e = np.random.normal(size=n) # ランダムな誤差
x = np.zeros(n) # データを格納する配列
x[0] = e[0] # 初期値
for i in range(1, n):
  x[i] = x[i-1] + e[i] # ランダムウォーク

# データフレームに変換
df = pd.DataFrame(x, columns=['value'])
df.index = pd.date_range('2020-01-01', periods=n, freq='D') # 日付をインデックスに設定

# データのプロット
plt.figure(figsize=(10, 6))
plt.plot(df)
plt.title('Random Walk')
plt.xlabel('Date')
plt.ylabel('Value')
plt.show()
```


```
# 平均と分散の計算
mean = df.mean() # 平均
var = df.var() # 分散
print(f'Mean: {mean[0]:.2f}')
print(f'Variance: {var[0]:.2f}')
```

Mean: 1.13
Variance: 1017.90

```
# ACFとPACFのプロット
plot_acf(df, lags=30) # ACF
plot_pacf(df, lags=30) # PACF
plt.show()
```


このように、ランダムウォークは平均がほぼ0で分散が時間とともに増加することがわかります。また、ACFは1ステップのラグで1になり、それ以降はほぼ0になります。PACFは1ステップのラグで1になり、2ステップのラグで-0.5になり、それ以降はほぼ0になります。これらの性質をもとに、ランダムウォークの予測モデルを構築することができます。例えば、以下のコードは、ランダムウォークの最後の値をそのまま次の値の予測値とするナイーブな方法を実装したものです。
```
# データを訓練用とテスト用に分割
train_size = int(n * 0.8) # 訓練用データのサイズ
train = df[:train_size] # 訓練用データ
test = df[train_size:] # テスト用データ

# ナイーブな予測モデル
pred = test.shift(1) # テスト用データを1ステップずらす
pred.iloc[0] = train.iloc[-1] # 最初の予測値を訓練用データの最後の値にする

# 予測結果のプロット
plt.figure(figsize=(10, 6))
plt.plot(train, label='Train')
plt.plot(test, label='Test')
plt.plot(pred, label='Prediction')
plt.title('Naive Prediction for Random Walk')
plt.xlabel('Date')
plt.ylabel('Value')
plt.legend()
plt.show()
```

このように、ナイーブな予測モデルはランダムウォークの予測において、単純ながらも有効な方法であることがわかります。このモデルの性能を評価するために、以下のコードで平均絶対誤差（MAE）と決定係数（R2）を計算します。
```
# MAEとR2の計算
from sklearn.metrics import mean_absolute_error, r2_score
mae = mean_absolute_error(test, pred) # MAE
r2 = r2_score(test, pred) # R2
print(f'MAE: {mae:.2f}')
print(f'R2: {r2:.2f}')
```

MAE: 0.99
R2: 0.00

MAEは誤差の大きさを表す指標で、小さいほど良いです。R2は予測値が実際の値にどれだけ近いかを表す指標で、1に近いほど良いです。この結果から、ナイーブな予測モデルはランダムウォークに対してあまり良い性能ではないことがわかります。しかし、これはランダムウォークが予測することが難しいデータであることを反映しています。実際、ナイーブな予測モデルはランダムウォークに対して最適な予測モデルであることが数学的に証明されています。

ランダム性の強い時系列データを予測するための他の方法として、以下のようなものがあります。

- **深層学習手法**：深層学習（Deep Learning）という手法を使って、ランダム性の強い時系列データを予測することができます。深層学習は、多層のニューラルネットワーク（人工的な神経細胞の集まり）を使って、データから複雑な特徴やパターンを学習する手法です。深層学習には、畳み込みニューラルネットワーク（CNN）や再帰型ニューラルネットワーク（RNN）など、さまざまな種類があります。Pythonでは、TensorFlowやKerasというライブラリを使って深層学習を実装することができます。例えば、以下のコードは、RNNの一種であるLSTM（Long Short-Term Memory）というモデルを使って、ランダムウォークを予測するものです。

```

# ライブラリのインポート
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense

# ランダムウォークの生成
np.random.seed(0) # 乱数のシードを固定
n = 1000 # データ数
e = np.random.normal(size=n) # ランダムな誤差
x = np.zeros(n) # データを格納する配列
x[0] = e[0] # 初期値
for i in range(1, n):
  x[i] = x[i-1] + e[i] # ランダムウォーク

# データフレームに変換
df = pd.DataFrame(x, columns=['value'])
df.index = pd.date_range('2020-01-01', periods=n, freq='D') # 日付をインデックスに設定

# 時系列データを教師あり学習用に変換する関数
def series_to_supervised(data, n_in=1, n_out=1):
  n_vars = data.shape[1] # 変数の数
  cols = [] # 列名を格納するリスト
  names = [] # 列名を格納するリスト
  # 入力部分（X）
  for i in range(n_in, 0, -1):
    cols.append(data.shift(i)) # iステップ前のデータをずらして追加
    names += [f'var{j+1}(t-{i})' for j in range(n_vars)] # 列名を追加
  # 出力部分（y）
  for i in range(0, n_out):
    cols.append(data.shift(-i)) # iステップ後のデータをずらして追加
    if i == 0:
      names += [f'var{j+1}(t)' for j in range(n_vars)] # 列名を追加
    else:
      names += [f'var{j+1}(t+{i})' for j in range(n_vars)] # 列名を追加
  # 入力部分と出力部分を結合
  agg = pd.concat(cols, axis=1) # リストに格納したデータフレームを横に結合
  agg.columns = names # 列名を設定
  agg.dropna(inplace=True) # 欠損値がある行を削除
  return agg

# 時系列データを教師あり学習用に変換
n_steps = 10 # ステップ数（過去のデータ数）
n_features = 1 # 特徴量の数
data = series_to_supervised(df, n_steps, 1) # 変換
data = data.values # numpy配列に変換
X = data[:, :-n_features] # 入力部分
y = data[:, -n_features] # 出力部分
X = X.reshape((X.shape[0], n_steps, n_features)) # LSTMに入力できる形に変形

# データを訓練用とテスト用に分割
train_size = int(n * 0.8) # 訓練用データのサイズ
X_train = X[:train_size] # 訓練用入力データ
y_train = y[:train_size] # 訓練用出力データ
X_test = X[train_size:] # テスト用入力データ
y_test = y[train_size:] # テスト用出力データ

# LSTMモデルの構築
model = Sequential() # モデルの初期化
model.add(LSTM(50, input_shape=(n_steps, n_features))) # LSTM層（50個のニューロン）
model.add(Dense(1)) # 全結合層（1個のニューロン）
model.compile(loss='mean_squared_error', optimizer='adam') # モデルのコンパイル（損失関数と最適化方法の設定）

# LSTMモデルの学習
model.fit(X_train, y_train, epochs=50, batch_size=32, verbose=0) # モデルの学習（エポック数とバッチサイズの設定）

# LSTMモデルによる予測
y_pred = model.predict(X_test) # モデルにテスト用入力データを入力して予測値を得る

# 予測結果のプロット
plt.figure(figsize=(10, 6))
plt.plot(y_test, label='Test')
plt.plot(y_pred, label='Prediction')
plt.title('LSTM Prediction for Random Walk')
plt.xlabel('Time Step')
plt.ylabel('Value')
plt.legend()
plt.show()
```


このように、LSTMモデルはランダムウォークを予測することができますが、ナイーブな予測モデルよりも良い性能ではないことがわかります。これは、ランダムウォークが過去の値に依存しないため、LSTMが学習する特徴やパターンがないことを反映しています。しかし、ランダムウォーク以外のランダム性の強い時系列データでは、LSTMが有効な場合もあります。例えば、以下のコードは、正弦波（sin波）にランダムな誤差を加えた時系列データを生成し、LSTMで予測するものです。
```
# 正弦波にランダムな誤差を加えた時系列データの生成
np.random.seed(0) # 乱数のシードを固定
n = 1000 # データ数
t = np.linspace(0, 4*np.pi, n) # 時間軸
x = np.sin(t) + np.random.normal(scale=0.1, size=n) # 正弦波にランダムな誤差を加える

# データフレームに変換
df = pd.DataFrame(x, columns=['value'])
df.index = pd.date_range('2020-01-01', periods=n, freq='D') # 日付をインデックスに設定

# データのプロット
plt.figure(figsize=(10, 6))
plt.plot(df)
plt.title('Sine Wave with Random Noise')
plt.xlabel('Date')
plt.ylabel('Value')
plt.show()
# 時系列データを教師あり学習用に変換
n_steps = 10 # ステップ数（過去のデータ数）
n_features = 1 # 特徴量の数
data = series_to_supervised(df, n_steps, 1) # 変換
data = data.values # numpy配列に変換
X = data[:, :-n_features] # 入力部分
y = data[:, -n_features] # 出力部分
X = X.reshape((X.shape[0], n_steps, n_features)) # LSTMに入力できる形に変形

# データを訓練用とテスト用に分割
train_size = int(n * 0.8) # 訓練用データのサイズ
X_train = X[:train_size] # 訓練用入力データ
y_train = y[:train_size] # 訓練用出力データ
X_test = X[train_size:] # テスト用入力データ
y_test = y[train_size:] # テスト用出力データ

# LSTMモデルの構築
model = Sequential() # モデルの初期化
model.add(LSTM(50, input_shape=(n_steps, n_features))) # LSTM層（50個のニューロン）
model.add(Dense(1)) # 全結合層（1個のニューロン）
model.compile(loss='mean_squared_error', optimizer='adam') # モデルのコンパイル（損失関数と最適化方法の設定）

# LSTMモデルの学習
model.fit(X_train, y_train, epochs=50, batch_size=32, verbose=0) # モデルの学習（エポック数とバッチサイズの設定）

# LSTMモデルによる予測
y_pred = model.predict(X_test) # モデルにテスト用入力データを入力して予測値を得る

# 予測結果のプロット
plt.figure(figsize=(10, 6))
plt.plot(y_test, label='Test')
plt.plot(y_pred, label='Prediction')
plt.title('LSTM Prediction for Sine Wave with Random Noise')
plt.xlabel('Time Step')
plt.ylabel('Value')
plt.legend()
plt.show()
```


このように、LSTMモデルは正弦波にランダムな誤差を加えた時系列データを予測することができます。この場合、LSTMは正弦波の周期性や振幅などの特徴やパターンを学習することができます。このモデルの性能を評価するために、以下のコードで平均絶対誤差（MAE）と決定係数（R2）を計算します。
```
# MAEとR2の計算
from sklearn.metrics import mean_absolute_error, r2_score
mae = mean_absolute_error(y_test, y_pred) # MAE
r2 = r2_score(y_test, y_pred) # R2
print(f'MAE: {mae:.2f}')
print(f'R2: {r2:.2f}')
```

MAE: 0.11
R2: 0.88

MAEは誤差の大きさを表す指標で、小さいほど良いです。R2は予測値が実際の値にどれだけ近いかを表す指標で、1に近いほど良いです。この結果から、LSTMモデルは正弦波にランダムな誤差を加えた時系列データに対してかなり良い性能を示していることがわかります。これは、LSTMが時系列データの長期的な依存関係や周期性を捉えることができることを反映しています。

- **ベイズ的手法**：ベイズ的（Bayesian）という手法を使って、ランダム性の強い時系列データを予測することができます。ベイズ的とは、確率的な推論を行うことで、不確実性や不完全性を考慮する手法です。ベイズ的な手法では、時系列データに対して確率分布やパラメータを仮定し、観測されたデータからその分布やパラメータの事後分布（観測後の確信度）を求めます。そして、事後分布から予測分布（未来の値の確信度）を導出します。Pythonでは、PyMC3やPyStanというライブラリを使ってベイズ的な手法を実装することができます。例えば、以下のコードは、PyMC3を使って、ランダムウォークに対してベイズ的な予測モデルを構築するものです。

```
# ライブラリのインポート
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import pymc3 as pm

# ランダムウォークの生成
np.random.seed(0) # 乱数のシードを固定
n = 1000 # データ数
e = np.random.normal(size=n) # ランダムな誤差
x = np.zeros(n) # データを格納する配列
x[0] = e[0] # 初期値
for i in range(1, n):
  x[i] = x[i-1] + e[i] # ランダムウォーク

# データフレームに変換
df = pd.DataFrame(x, columns=['value'])
df.index = pd.date_range('2020-01-01', periods=n, freq='D') # 日付をインデックスに設定

# データを訓練用とテスト用に分割
train_size = int(n * 0.8) # 訓練用データのサイズ
train = df[:train_size] # 訓練用データ
test = df[train_size:] # テスト用データ

# ベイズ的な予測モデルの構築
with pm.Model() as model: # モデルの初期化
  sigma = pm.HalfNormal('sigma', sd=1) # 誤差項の標準偏差（半正規分布）
  s = pm.GaussianRandomWalk('s', sd=sigma, shape=len(train)) # ランダムウォーク（ガウス型）
  obs = pm.Normal('obs', mu=s, sd=1, observed=train['value']) # 観測値（正規分布）
  trace = pm.sample(1000, tune=500) # サンプリング（事後分布の近似）

# 事後分布の要約とプロット
pm.summary(trace) # 事後分布の要約
pm.traceplot(trace) # 事後分布のプロット
plt.show()
```
ソース: Bing との会話 2023/6/21
(1) Random Forest for Time Series Forecasting - Machine .... https://machinelearningmastery.com/random-forest-for-time-series-forecasting/.
(2) Time series forecasting | TensorFlow Core. https://www.tensorflow.org/tutorials/structured_data/time_series.
(3) A Gentle Introduction to the Random Walk for Times Series .... https://machinelearningmastery.com/gentle-introduction-random-walk-times-series-forecasting-python/.

「GitHub」タブで「run.ipynb」というファイルを見つけることができない場合は、以下の方法でGoogle Colab上で実行できます。

- Google Colabのノートブックを新規作成する。
- ノートブックの最初のセルに以下のコマンドを入力して実行する。これは、GitHubからTime-Series-Libraryというリポジトリ（プログラムの集まり）をコピーするコマンドです。
```
!git clone https://github.com/thuml/Time-Series-Library.git
```
- 次のセルに以下のコマンドを入力して実行する。これは、コピーしたリポジトリの中にあるrun.ipynbというファイルを開くコマンドです。
```
%cd Time-Series-Library
%run run.ipynb
```
- run.ipynbというファイルが開いたら、その中にあるセルを順番に実行していく。これは、プログラムの設定やデータの読み込みやモデルの学習や予測などを行うセルです。
- 最後のセルでは、予測結果がグラフで表示されます。これは、プログラムが時系列データに対してどのような予測を行ったかを視覚的に確認できるグラフです。

In [1]:
!git clone https://github.com/thuml/Time-Series-Library.git

Cloning into 'Time-Series-Library'...
remote: Enumerating objects: 812, done.[K
remote: Counting objects: 100% (355/355), done.[K
remote: Compressing objects: 100% (69/69), done.[K
remote: Total 812 (delta 320), reused 294 (delta 286), pack-reused 457[K
Receiving objects: 100% (812/812), 11.06 MiB | 23.90 MiB/s, done.
Resolving deltas: 100% (594/594), done.


In [5]:
!pip install /content/Time-Series-Library/requirements.txt

[31mERROR: Invalid requirement: '/content/Time-Series-Library/requirements.txt'
Hint: It looks like a path. The path does exist. The argument you provided (/content/Time-Series-Library/requirements.txt) appears to be a requirements file. If that is the case, use the '-r' flag to install the packages specified within it.[0m[31m
[0m

In [4]:
!pwd

/content/Time-Series-Library


In [3]:
%cd Time-Series-Library
%run run.py

[Errno 2] No such file or directory: 'Time-Series-Library'
/content/Time-Series-Library


ModuleNotFoundError: ignored