# 時系列データ・適応型ソフトセンサー

# プロセス制御・プロセス管理・ソフトセンサー
* 化学プラント・産業プラントは、いろいろなプロセス変数（温度・圧力・流量・濃度）を制御しながら運転する必要がある
    * 例１：製品の生産量を増やしたい・減らしたいとき、目標の生産量にするため、原料の量や反応器内の温度などを適切に変える
    * 例２；プラント周辺の環境を変える要因（外乱）がある中で、プラントで作る製品の品質・量を、一定に保つよう制御する
* うまく制御・管理できないケース
    1. たくさんのプロセス変数をまとめて管理する (多変量プロセス管理)のが困難
        1. 正常なデータが存在する適切なデータ領域を決める
        2. 異常と診断されたときにどのプロセス変数が異常に関わっているか診断する
        3. 異常の原因を解明する
    2. プロセス変数の値がすぐに測定できないとき、推定しながら制御する必要がある。  
        * 例：現在の車の速度がわからない中で、車を運転するようなもの
        * 測定が難しいプロセス変数の値を、推定するモデル = ソフトセンサー  
            実際に値を測定するセンサー = ハードセンサー （温度計、圧力計など）
        * 過去に測定されたデータを用いて、温度・圧力などの簡単に測定できるプロセス変数と、  
            濃度・密度などの測定が難しいプロセス変数との間で作成した、回帰モデルのこと
* ソフトセンサーの問題点・注意点
    1. モデルの劣化
        化学プラントは長期的に運転されるため、その間に反応器内の部品の劣化などが起こり、  
        プロセス変数の間の関係が変化 → ソフトセンサーの推定性能が落ちる。  
        解決策：適応的ソフトセンサー  
        = 最新の測定値を使って、新たなソフトセンサーとして自動的に作り直す。
    2. 推定性能が悪くなるときはどんなときか？ を判断できるようになることも重要
        適応的ソフトセンサーを使っても、完璧に推定することはできない。
        モデルの適用範囲・適用領域と、推定誤差のばらつきとの間の関係を定量的に求める必要がある。

# 適応型ソフトセンサー
* 基本的には、通常通りの回帰モデル y=f(X)
* X をリアルイムに測定できる変数にして、y を測定が難しい変数にする。
* X の値を y=f(X) に入力することで y の値をリアルタイムに推定できる。
* 最も大きな問題の一つが、モデルの劣化
    * 原因の一つはプラントにおけるプロセス状態が変化（下記例示）すること。
        これにより、X と y との関係が、モデルを構築したときの関係から変わってしまう。
        * 原料におけるいろいろな化合物の組成が変わる
        * 反応器における触媒が劣化する
        * 配管などに汚れがつく
        * 外気温が変わる

* 対策：トレーニングデータ更新
    * y は測定が困難なプロセス変数とはいっても、ある程度定期的に測定されている。
    * 新たに測定されたサンプルには、新たなプロセス状態の情報が含まれていると考えて、
        このサンプルも活用して新たなソフトセンサー (回帰モデル) を構築しなおします。
    * このようなソフトセンサーのことを、適応型ソフトセンサーといいます。

* 適応型ソフトセンサーは大きく３種類に分けることができる。
    1. Moving Window (MW) モデル  
        新しいサンプルをトレーニングデータに追加し、最も古いサンプルを削除して、再度回帰モデルを構築
    2. Just-In-Time (JIT) モデル  
        推定したい X の値と近いトレーニングデータにおけるサンプルのみ用いたり、  
        推定したい X の値と近いほどトレーニングデータの重みを大きくしたりして回帰モデルが構築されます         例：LWPLS
    3. 時間差分 (Time Difference, TD) モデル
        X の時間差分の値と y の時間差分の値との間で回帰モデルが構築されます。  
        回帰モデルは再構築されません。  
        更新されるのは、推定された y の時間差分の値に足し合わされる、直近の y の推定値です  

* どの適応型ソフトセンサーがよいのか？
* 経験的にはプラントごとに良し悪しは変わる


# 時系列データを扱うときの３つの注意点(ソフトセンサー解析など)
1. トレーニングデータが更新される
    モデルでyを推定 → 実際にyを測定 → 新しいyの値をトレーニングデータに追加 → モデルを再構築 → 次のyを推定 → ...  
    このように、最新のサンプルも活用してモデルを構築して y の値を推定するソフトセンサーを、適応型ソフトセンサーと呼ぶ

2. 目的変数 y の測定には時間がかかり、トレーニングデータ更新のときにその時間を考慮しなければならない
    測定が終わり y の値が得られるまでは、トレーニングデータにサンプルを入れられない。

3. 説明変数 X について、時間的に遅れて y と関係していることがある
    1. プラントの出口付近で、y の値が測定。
    2. プラントの入口付近（など）で、Xの値が測定。温度や圧力など。
    3. 大きなプラントになればなるほど、入口から出口までモノが移動するのに時間がかかる。 
    4. よって、ある時刻における y の値と関係しているのは、同時刻のXの値ではなく、過去の X の値
    5. X としてある時間を遅らせたプロセス変数を用いることが一般的





# 参考文献
* 時系列データを扱うときの３つの注意点(ソフトセンサー解析など)[データ解析用のPythonプログラム付き]  
    https://datachemeng.com/pointsoftimeseriesdataanalysis/
* 適応型ソフトセンサーで産業プラントにおけるプロセス状態等の変化に対応する (Adaptive Soft Sensor)  
    https://datachemeng.com/adaptivesoftsensors/
* プロセス制御・プロセス管理・ソフトセンサーの概要と研究の方向性 (化学プラントにおけるデータベース利用)  
    https://datachemeng.com/processcontrolsoftsensor/
* 適応型ソフトセンサーを検証できる Python コードを作りましたので、ぜひご自身のデータセットでお試しください  
    https://datachemeng.com/adaptive_soft_sensor_python_code/
