# モデルの出力結果(mongodb)とデータアプリケーション(Nodejs)を連携してみよう

今回はモデルの結果はmongodbに格納済み  
格納したデータをデータアプリケーションであるWebアプリから取得していきます。

「express.js」をもとに話を進めていきましょう。

## 通常の決済画面も何回かデータを送っておきましょう

### 買い上げ完了画面
http://localhost:3001/done/?id=1

# 施作効果を確認してみよう

ここまでで、MlOpsの単純な流れは一度みたことになります。  
いくつか、初期の段階よりもデータが増えているはずです、まずはデータの確認から始めましょう

## データの確認

```
df = spark.read.parquet("/tmp/share_file/datalake/web_actions/")
```

ad_throuth_Aとad_throuth_Bが増えてます。

こちらもデータの取得と蓄積作業の一部で、  
このようにしておくと施策の効果としてad_throuth_Aでの売上がいくらとか、ad_throuth_Bでの売上がいくら
となって他のキャンペーンとかに邪魔されずデータを絞り込んだり、取得することができるようになってきます。

## groupbyでそれぞれのアクションごとの売り上げを見てみましょう

```
import pyspark.sql.functions as F
df3 = df2.withColumn("money", F.col("money").cast("integer")).groupby("action", "id").sum("money")
```

果たして、全体の売上が10%上がったでしょうか？それとも？
1200円

```
df2.withColumn("money", F.col("money").cast("integer")).select(F.sum("money")).show()
df2.withColumn("money", F.col("money").cast("integer")).select(F.sum("money").alias("allmoney")).withColumn("kpi", F.col("allmoney") / F.lit("1200") ).show()
```

## おまけ　時間で絞るとより正確に

```
df3 = df2.filter(F.col("sendtime") > F.unix_timestamp(F.lit("2022-08-23 13:40:48"))).withColumn("money", F.col("money").cast("integer")).groupby("action", "id").sum("money")
```


# モデルの再学習を検討しよう

モデルは一度学習しただけで完了ではありません。
モニタリングや結果を確認した上で、思った通りの結果が出なかったり、最初は調子良かったが、外部の影響などで途中から悪くなったりします。

売上が思った以上に伸びなかった。さらに伸ばしたいという際は再度学習することも考慮に入れます。

指標は様々ですが、

- KPIとして定めた指標が悪い方向に変動を始めたらモデルの再学習を検討し始める
- 毎日定期的にモデルを更新する

今回は、KMeans.pyを使って再学習をおこなってみましょう。

## Kmeans.pyを使って再学習
データの保存先はpart2に保存するようにしてみましょう

# モデルを継続的にデプロイしよう

モデルの学習が完了したら

## mongodbへの保存を行なっていきます

```
pyspark --packages org.mongodb.spark:mongo-spark-connector_2.12:3.0.3 \
        --conf spark.mongodb.input.uri=mongodb://action:pass123@mongo_data_mlops:27017/user_prediction \
        --conf spark.mongodb.output.uri=mongodb://action:pass123@mongo_data_mlops:27017/user_prediction
```

## parquetの読み込み

```
df = spark.read.parquet("/tmp/share_file/datamodel/part2")
```

## mongodbへの書き込みを行う

```
df.repartition(1).write.mode('overwrite') \
    .format('com.mongodb.spark.sql.DefaultSource') \
    .option( "uri", "mongodb://action:pass123@mongo_data_mlops:27017/user_prediction.prediction") \
    .save()
```