## [Running Flask and FastAPI on Google Colab](https://medium.datadriveninvestor.com/flask-on-colab-825d2099d9d8)

In [1]:
!pip install fastapi nest-asyncio pyngrok uvicorn

Collecting fastapi
[?25l  Downloading https://files.pythonhosted.org/packages/4e/b9/a91a699f5c201413b3f61405dbccc29ebe5ad25945230e9cec98fdb2434c/fastapi-0.65.1-py3-none-any.whl (50kB)
[K     |██████▍                         | 10kB 8.8MB/s eta 0:00:01[K     |████████████▉                   | 20kB 12.2MB/s eta 0:00:01[K     |███████████████████▎            | 30kB 15.4MB/s eta 0:00:01[K     |█████████████████████████▊      | 40kB 17.8MB/s eta 0:00:01[K     |████████████████████████████████| 51kB 5.4MB/s 
Collecting pyngrok
[?25l  Downloading https://files.pythonhosted.org/packages/6b/4e/a2fe095bbe17cf26424c4abcd22a0490e22d01cc628f25af5e220ddbf6f0/pyngrok-5.0.5.tar.gz (745kB)
[K     |████████████████████████████████| 747kB 19.0MB/s 
[?25hCollecting uvicorn
[?25l  Downloading https://files.pythonhosted.org/packages/c8/de/953f0289508b1b92debdf0a6822d9b88ffb0c6ad471d709cf639a2c8a176/uvicorn-0.13.4-py3-none-any.whl (46kB)
[K     |████████████████████████████████| 51kB 6.4MB/s 


In [3]:
from fastapi import FastAPI
import nest_asyncio
from pyngrok import ngrok
import uvicorn

app = FastAPI()

@app.get('/index')
async def home():
  return "Hello World"

ngrok_tunnel = ngrok.connect(8000)
print('Public URL:', ngrok_tunnel.public_url)
print('Public docs URL:', ngrok_tunnel.public_url + "/docs")
nest_asyncio.apply()
uvicorn.run(app, port=8000)


INFO:     Started server process [58]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://127.0.0.1:8000 (Press CTRL+C to quit)


Public URL: http://838876fd6123.ngrok.io
Public docs URL: http://838876fd6123.ngrok.io/docs
INFO:     124.32.186.1:0 - "GET /docs HTTP/1.1" 200 OK
INFO:     124.32.186.1:0 - "GET /openapi.json HTTP/1.1" 200 OK


INFO:     Shutting down
INFO:     Waiting for application shutdown.
INFO:     Application shutdown complete.
INFO:     Finished server process [58]


## [Deploying Transformer Models](https://chatbotslife.com/deploying-transformer-models-1350876016f)


In [4]:
!pip install -qq transformers

[K     |████████████████████████████████| 2.3MB 10.8MB/s 
[K     |████████████████████████████████| 3.3MB 37.3MB/s 
[K     |████████████████████████████████| 901kB 34.8MB/s 
[?25h

In [5]:
from google.colab import drive 
drive.mount('/content/drive')

Mounted at /content/drive


In [6]:
%cd '/content/drive/My Drive/work/'

/content/drive/My Drive/work


In [7]:
#!pip install datasets
#!pip install rouge_score
!pip install sentencepiece

Collecting sentencepiece
[?25l  Downloading https://files.pythonhosted.org/packages/f5/99/e0808cb947ba10f575839c43e8fafc9cc44e4a7a2c8f79c60db48220a577/sentencepiece-0.1.95-cp37-cp37m-manylinux2014_x86_64.whl (1.2MB)
[K     |▎                               | 10kB 18.0MB/s eta 0:00:01[K     |▌                               | 20kB 22.2MB/s eta 0:00:01[K     |▉                               | 30kB 25.8MB/s eta 0:00:01[K     |█                               | 40kB 22.3MB/s eta 0:00:01[K     |█▍                              | 51kB 13.0MB/s eta 0:00:01[K     |█▋                              | 61kB 10.9MB/s eta 0:00:01[K     |██                              | 71kB 12.1MB/s eta 0:00:01[K     |██▏                             | 81kB 12.6MB/s eta 0:00:01[K     |██▌                             | 92kB 13.0MB/s eta 0:00:01[K     |██▊                             | 102kB 10.0MB/s eta 0:00:01[K     |███                             | 112kB 10.0MB/s eta 0:00:01[K     |███▎        

In [8]:
import torch
from transformers import (
    pipeline,
    AutoTokenizer,
    AutoModelForSeq2SeqLM
)

class NLP:
    def __init__(self):
        self.gen_model = AutoModelForSeq2SeqLM.from_pretrained('output/')
        self.gen_tokenizer = AutoTokenizer.from_pretrained('sonoisa/t5-base-japanese')
        self.gen_model.eval()
         
    def summarize(self, prompt="The epistemelogical limit"):
        inputs = self.gen_tokenizer.encode(prompt, return_tensors="pt", max_length=512, truncation=True)
        with torch.no_grad():
            summary_ids = self.gen_model.generate(inputs) #, max_length=512, min_length=5, length_penalty=5., num_beams=2)
            summary = self.gen_tokenizer.decode(summary_ids[0], skip_special_tokens=True, clean_up_tokenization_spaces=True)
            return summary

In [9]:
# from nlp import NLP
nlp = NLP()

text = r"""
地球の人里離れた山奥に住む尻尾の生えた少年・孫悟空はある日、西の都からやって来た少女ブルマと出会う。そこで、7つ集めると神龍が現れ、どんな願いでも一つだけ叶えてくれるというドラゴンボールの存在を、さらに育ての親である孫悟飯の形見として大切に持っていた球がその1つ「四星球」であることを知り、ブルマと共に残りのドラゴンボールを探す旅に出る。人さらいのウーロンや盗賊のヤムチャなどを巻き込んだボール探しの末、世界征服を企むピラフ一味にボールを奪われ神龍を呼び出されるが、ウーロンがとっさに言い放った下らない願いを叶えてもらうことで一味の野望を阻止する。
"""

print(nlp.summarize(text))


HBox(children=(FloatProgress(value=0.0, description='Downloading', max=710.0, style=ProgressStyle(description_…




HBox(children=(FloatProgress(value=0.0, description='Downloading', max=804231.0, style=ProgressStyle(descripti…




HBox(children=(FloatProgress(value=0.0, description='Downloading', max=1786.0, style=ProgressStyle(description…




HBox(children=(FloatProgress(value=0.0, description='Downloading', max=1955.0, style=ProgressStyle(description…


ドラゴンボールを探す旅に出た孫悟空は、7つ集めると神龍が現れるというドラゴンボールを探す旅に出る。


In [None]:
from fastapi import FastAPI
from fastapi.middleware.cors import CORSMiddleware
from pydantic import BaseModel
#from app.nlp import NLP

class Message(BaseModel):
    input: str
    output: str = None

app = FastAPI()
nlp = NLP()

origins = [
    "http://localhost",
    "http://localhost:3000",
    "http://127.0.0.1:3000"
]

app.add_middleware(
    CORSMiddleware,
    allow_origins=origins,
    allow_credentials=True,
    allow_methods=["POST"],
    allow_headers=["*"],
)

@app.post("/summarize/")
async def  generate(message: Message):
    message.output  = nlp.summarize(prompt=message.input)
    return {"output" : message.output}

ngrok_tunnel = ngrok.connect(8000)
print('Public URL:', ngrok_tunnel.public_url)
print('Public docs URL:', ngrok_tunnel.public_url + "/docs")
nest_asyncio.apply()
uvicorn.run(app, port=8000)

Public URL: http://4b100cdd3e6e.ngrok.io
Public docs URL: http://4b100cdd3e6e.ngrok.io/docs


INFO:     Started server process [57]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://127.0.0.1:8000 (Press CTRL+C to quit)


INFO:     124.32.186.1:0 - "GET /docs HTTP/1.1" 200 OK
INFO:     124.32.186.1:0 - "GET /openapi.json HTTP/1.1" 200 OK
INFO:     124.32.186.1:0 - "POST /summarize/ HTTP/1.1" 200 OK
INFO:     124.32.186.1:0 - "POST /summarize/ HTTP/1.1" 200 OK
INFO:     124.32.186.1:0 - "POST /summarize/ HTTP/1.1" 200 OK


INFO:     Shutting down
INFO:     Waiting for application shutdown.
INFO:     Application shutdown complete.
INFO:     Finished server process [57]


```
% curl -X 'POST' \
  'http://4b100cdd3e6e.ngrok.io/summarize/' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '{
  "input": "地球の人里離れた山奥に住む尻尾の生えた少年・孫悟空はある日、西の都からやって来た少女ブルマと出会う。そこで、7つ集めると神龍が現れ、どんな願いでも一つだけ叶えてくれるというドラゴンボールの存在を、さらに育ての親である孫悟飯の形見として大切に持っていた球がその1つ「四星球」であることを知り、ブルマと共に残りのドラゴンボールを探す旅に出る。人さらいのウーロンや盗賊のヤムチャなどを巻き込んだボール探しの末、世界征服を企むピラフ一味にボールを奪われ神龍を呼び出されるが、ウーロンがとっさに言い放った下らない願いを叶えてもらうことで一味の野望を阻止する。"
}'

{"output":"願いを一つだけ叶えてくれる「四星球」を探す旅に出る。"}
```