<a href="https://colab.research.google.com/github/AdmiralHonda/ml_intro/blob/main/appendix/Class_Select_App.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
#@title おまじない（ちょっと追加）
# 下準備
# 形態素分析ライブラリーMeCab と 辞書(mecab-ipadic-NEologd)のインストール 
!apt-get -q -y install sudo file mecab libmecab-dev mecab-ipadic-utf8 git curl python-mecab > /dev/null # mecabの利用に必要なライブラリのインストール
!git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git > /dev/null                    # gitから辞書ファイルのクローン
!echo yes | mecab-ipadic-neologd/bin/install-mecab-ipadic-neologd -n > /dev/null 2>&1                   # クローンした辞書のインストール
!pip install mecab-python3==0.7 > /dev/null                                                             # 0.7以外だと謎のエラーが発生して安定しないことがある

# シンボリックリンクによるエラー回避
!ln -s /etc/mecabrc /usr/local/etc/mecabrc                                                              # 辞書の参照先にインストール先のディレクトリを追加
!echo `mecab-config --dicdir`"/mecab-ipadic-neologd" 

!pip install fastapi uvicorn nest-asyncio pyngrok                                                       # 追記
!pip install jinja2

# アプリとして実装

今回習った内容ををwebアプリとして実装します。ただ、全てを解説することはできないので以下の部分のみを紹介します。  

- webアプリについて
- アプリの基幹部分をクラスとして実装
- webフレームワークでの使い方  

申し訳ないですが以下の部分は質問でのみ解説します。  

- webアプリの基礎
- httpsについて
- ログの取り方

なんとなくアプリには校風なのが必要なんだなと感じてもらえれば幸いです。  

## WEBアプリについて

簡単にwebアプリについて紹介します。  
まずwebアプリが何なのかというと、ユーザーの入力を受け付けるwebサイトです。  
見るだけではなく、見る内容を変更したり、何かを購入したりできるものです。  

<br>

通常のサイトを例にした構成を以下に示します。

![web1.0](https://pub-dd9160b14dab4fd08df96674dc1b9692.r2.dev/web1.png)

この場合は指定されたデータ（urlで指定）をwebサーバが探してユーザーに返しているだけです。  

<br>

一方webアプリの場合は  

![web2.0](https://pub-dd9160b14dab4fd08df96674dc1b9692.r2.dev/web2.png)  

ユーザーのリクエスト(urlで指定)をもとに処理を行い、結果を返す仕組みを備えたwebサイトです。  

今回はこの処理の部分は「ユーザーの検索クエリを基に一番合っていそうな授業を探す」といった計算になります。  

In [None]:
"""
下準備
"""
# ドライブのマウント
from google.colab import drive
drive.mount("/content/drive")

# アプリで配信するhtmlの配置
!mkdir templates
!curl -v -o templates/index.html https://admiralhonda-share-tech.on.drv.tw/python_ml_intro/app/class_app_index.html

In [None]:
import numpy as np
import json
from gensim.models import KeyedVectors
from sklearn.metrics.pairwise import cosine_similarity
import MeCab
import logging

class ClassAppSelect():

  def __init__(self) -> None:
    logger = logging.getLogger("uvicorn")
    logger.info("initialize start.")

    self.tokenizer = MeCab.Tagger("-d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd -Owakati")
    with open("/content/drive/MyDrive/python_ml_intro/content_info_dict.json","r") as f:
      self.content = json.load(f)
    
    self.wv = KeyedVectors.load_word2vec_format("/content/drive/MyDrive/python_ml_intro/wiki_test_vec.pt",binary=True)
    self.content_vec = np.load("/content/drive/MyDrive/python_ml_intro/content_vec.npy")
    
    logger.info("initialize done.")


  def generate_query(self,query: str) -> np.ndarray:
    sum = np.zeros(300)                                    # 授業の文章ベクトルを格納する、すべての要素を0とした要素数300のベクトルを初期化。
    words = self.tokenizer.parse(query)[:-1].split(" ")    # 集約した文章を単語のリストに分割。mecabで分割した際には単語間にスペースが入った文字列として出力。最後の改行は邪魔なので考慮していない。
    recg_word_num = 0                                      # 文章内で認識できた単語の数を数える

    for word in words:
      try:
        sum += self.wv[word]
        recg_word_num += 1
      except KeyError:                                     # 学習していない単語の場合は考慮しない
        pass
      
    if recg_word_num == 0:                                 # もし学習済みの単語がない場合はランダムなベクトルを割り当てる
      return np.random(300)
    else:                                                  # 合計したベクトルを認識した単語の数で割って平均をとる
      return sum / recg_word_num


  def culculate_sim(self,query :np.ndarray) -> int:
    input_query = self.generate_query(query)
    sim_rate = cosine_similarity([input_query],self.content_vec)
    return self.content[np.argmax(sim_rate)]

In [None]:
test = ClassAppSelect()

In [None]:
print(test.culculate_sim("キャリアプラン"))

In [None]:
from fastapi import FastAPI,Request
from fastapi.middleware.cors import CORSMiddleware
from fastapi.templating import Jinja2Templates

app = FastAPI()
class_select_app = ClassAppSelect()
templates = Jinja2Templates(directory='templates')

app.add_middleware(
    CORSMiddleware,
    allow_origins=['*'],
    allow_credentials=True,
    allow_methods=['*'],
    allow_headers=['*'],
)

@app.get('/')
async def root(request: Request):
    return templates.TemplateResponse("index.html",{"request":request})

@app.get("/app")
async def user_input(user_req: str) -> dict:
  return class_select_app.culculate_sim(user_req)

## 

In [None]:
import nest_asyncio
from pyngrok import ngrok,conf
import uvicorn

# 認証トークンの設定。htmlファイルを配信するために必要です。
conf.get_default().auth_token = "1d2GMN6jsGz90I1W8dNizJJUnWy_CqQHkfxVG8zypGbHnsQL"

ngrok_tunnel = ngrok.connect(8000)
print('Public URL:', ngrok_tunnel.public_url)
nest_asyncio.apply()
uvicorn.run(app, port=8000)



INFO:     Started server process [74]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://127.0.0.1:8000 (Press CTRL+C to quit)


Public URL: http://6b42-34-125-93-121.ngrok.io
INFO:     133.43.7.144:0 - "GET / HTTP/1.1" 200 OK
INFO:     133.43.7.144:0 - "GET /favicon.ico HTTP/1.1" 404 Not Found
INFO:     210.139.253.39:0 - "GET / HTTP/1.1" 200 OK
INFO:     133.43.7.144:0 - "GET /app?user_req=%E3%82%AD%E3%83%A3%E3%83%AA%E3%82%A2%E3%83%97%E3%83%A9%E3%83%B3 HTTP/1.1" 200 OK
