# Serializando os estimadores do Scikit-Learn

Com o modelo treinado com a tecnica out-of-core learning e serializado, podemos partir para a criaçãod e arquivos complementares para a aplicação.

O trecho abaxio refere-se a um arquivo.py para a limpeza dos dados e fará a tokenização com HashingVectorizer. O arquivo encontra-se no diretório _moviesclassifier_

In [1]:
# from sklearn.feature_extraction.text import HashingVectorizer
# import re
# import os
# import pickle

# cur_dir = os.path.dirname(__file__)
# stop = pickle.load(open(
#                         os.path.join(cur_dir, 'pickle_objects', 'stopwords.pkl'), 'rb'))

# def tokenizer(text):
#     text = re.sub('<[^>]*>', '', text)
#     emoticons = re.findall('(?::|;|=)(?:-)?(?:\)|\(|D|P)', text.lower())
#     text = re.sub('[\W]+', ' ', text.lower()) + ' '.join(emoticons).replace('-', '')
#     tokenized = [w for w in text.split() if w not in stop]
#     return tokenized

# vect = HashingVectorizer(decode_error='ignore', 
#                          n_features=2**21, 
#                          preprocessor=None, 
#                          tokenizer=tokenizer)

## Testando a serialização

Uma vez feita a serialização podemos testar a desserialização:

In [4]:
import pickle
import re
import os

#Load vectorizer.py
from vectorizer import vect

#Unpickled Classifier
clf = pickle.load(open(os.path.join(
                                    'pkl_objects', 'classifier.pkl'), 'rb'))

Podemos agora usar o objeto (modelo) carregado e processar um documento simples para fazer uma previsão sobre o  sentimento

In [9]:
import numpy as np

#Como o modelo retorna o sentimento como inteiros, através de um dict mapeamos o output para uma string
label = {0:'Negative', 1:'Positive'}

example_1 = ['I love this movie']
example_2 = ['This movies is garbage']

#Transformando o documento em um vetor de palavras com HashingVectorizer
X = vect.transform(example_1)

#Printamos as previsões do modelo, tanto para a label quanto para a probabilidade de estar certo
# Uma vez que o metodo predict_proba retorna um vetor com probabilidades para cada label, temos que o maior valor
# deste vetor corresponde a label mais provável e que confere com o resultado do metodo predict, por isso faz-se
# uso do np_max
print('Prediction: %s\nProbability: %.2f%%' % (label[clf.predict(X)[0]], 
                                               np.max(clf.predict_proba(X)*100)))

Prediction: Positive
Probability: 82.26%


# Configurando um Banco de Dados SQLite para armazenar os dados

Iremos agora configurar um banco de dados [SQLite](http://www.sqlite.org) simples para coletar feedback opcional dos usuários sobre as previsões do aplicativo Web. Podemos usar esse feedback para atualiz nosso modelo de classificação. SQLite é um mecanismo de banco de dados SQL, de código aberto, que não requer um servidor separado para operar, o que o torna ideal para projetos menores e aplicativos da web simples. Essencialmente, um banco de dados SQLite pode ser entendido como um arquivo de banco de dados, único e independente que nos permite acessar diretamente arquivos de armazenamento.

Felizmente o python, em sua biblioteca, ja fornece uma API para lidar com SQLite, que se chama [__sqlite3__](https://docs.python.org/3.6/library/sqlite3.html) que nos permite trabalhar com banco de dados SQLite.
<br>
<br>
Criaremos agora um novo banco de dados SQLite dentro do diretório movieclassifier e armazenar dois examples de reviews de filmes:

In [10]:
import sqlite3
import os

In [22]:
#Se ja houver o diretório que queremos criar excluiremos 
if os.path.exists('review.sqlite'):
    os.remove('review.sqlite')

#Criando a conexão com banco de dados SQLite, que cria um novo banco de dados - ('review.sqlite') no diretório
#movieclassifier se ele ja não existir
conn = sqlite3.connect('review.sqlite')

#Cursor que será responsável por fazer as chamadas para o banco com a sintaxe do SQLite
c = conn.cursor()

#Criando uma tabela com 3 colunas
c.execute('CREATE TABLE review_db'\
                             '(review TEXT, sentiment INTEGER, date TEXT)')

#Inserindo exemplos
"""
O comando DATETIME('now') insere automaticamente date e timestamp nas entradas fornecidas
Usando os argumentos "?, ?" passamos os exemplos criados assim como sua classe correspondente (label)
"""
example1 = 'I love this movie'
c.execute("INSERT INTO review_db"\
            "(review, sentiment, date) VALUES"\
              "(?, ?, DATETIME('now'))", (example1, 1))

example2 = 'I dislike this movie'
c.execute("INSERT INTO review_db"\
            "(review, sentiment, date) VALUES"\
              "(?, ?, DATETIME('now'))", (example2, 0))      
          
#Commit salva as alterações feitas no database
conn.commit()

#Fecha a conexão
conn.close()

Verificando se as entradas, tabelas e colunas foram armazenadas corretamente

In [23]:
#Reabrindo a conexão
conn = sqlite3.connect('review.sqlite')
c = conn.cursor()

#Selecionando tudo que foi add no banco do começo de 2020 até agora (22/02/2020)
c.execute("SELECT * FROM review_db WHERE date"\
             " BETWEEN '2020-01-01 00:00:00' AND DATETIME('now')")

#Recuperando o resultado da query
result = c.fetchall()

conn.close()

In [26]:
result

[('I love this movie', 1, '2020-02-22 16:41:15'),
 ('I dislike this movie', 0, '2020-02-22 16:41:15')]

# Developing a web application with Flask

Utilizaremos o framework [__FLASK__](http://flask.pocoo.org/docs/0.12/) para escrever a aplicação web. É um modelo muito popular criado em 2010, escrito em Python o que facilita muito a vida dos programadores. Diversas empresas famosas usaram ou ainda usam Flask, como por exemplo LinkedIn e Pinterest.

## Primeira aplicação web em Flask

Para se familiarizar e aprender a utilizar o __Flask API__ , desenvolveremos primeiro uma aplicação bem simples consistindo uma uma unica pagina web, com uma campo de formulario que permite inserir um nome.

Inicialmente criamos os seguintes diretórios com os seguintes arquivos:

In [27]:
"""
1st_flask_app_1/
    app.py
    templates/
        first_app.html
"""

'\n1st_flask_app_1/\n    app.py\n    templates/\n        first_app.html\n'

__app.py:__ Conterá o código principal que será executado pelo interpretador Python para executar a aplicação web
<br>
__templates:__ É o diretório em que o flask irá buscar pelos arquivos HTML para renderizar a pagina web

In [31]:
#Código do arquivo app.py
# from flask import Flask, render_template

# app = Flask(__name__)

# @app.route('/')
# def index():
#     return render_template('first_app.html')

# if __name__ == '__main__':
#     app.run()

* Executamos nossa aplicação como um módulo unico, assim nós inicializamos uma nova instancia do Flask com o argumento \__name__ para deixar o Flask saber que ele pode encontrar a pasta com templates HTML, no mesmo diretório em que esta localizada.
<br>

* Utilizamos um decorador de rotas(route) - (@app.route('/')) - para especificar a URL que deve acionar a execução da função índice.
<br>

* A função index apenas renderiza o arquivo HTML ('first.app.html') que esta localizado na pasta templates
<br>

* Por último a função __run__ que apenas executa a aplicação no servidor quando o script é executado diretamente de um interpretador Python, isto é garantido pelo __if__ com \__name__ == '\__main__'

In [35]:
#Código HTML do arquivo first_app.html
# <!doctype html>
# <html>
#     <head>
#         <tile>First App</title>
#     </head>
#     <body>
#         <div>Minha primeira web app com Flask!</div>
#     </body>
# </html>

No arquivo acima, simplesmente iniciamos um documento html em branco, com um elemento de bloco (< div >) que contém uma frase de apresentação. <br>
Convenientemente, Flask permite rodar a aplicação localmente, into é útil pra o desenvolvimento da aplicação e para testa-la antes de fazer o deploy. <br>
Para testar nossa aplicação basta no terminal, dentro do diretório da aplicação, executar: __python app.py__

## Formulario de validação e renderização

Iremos agora aprimorar a web app com elementos de formularios do HTML, para poder coletar dados dos usuários, usando a lib [WTForms](https://wtforms.readthedocs.io/en/latest/)

A idéia agora é que na primeira pagina o usuario insira o nome no campo destinado, e pressione o botão de _submit_ , em seguida uma nova pagina é exibida com o nome inserido e uma saudação.

In [1]:
# Inicialmente criaremos um novo diretório 
"""
1st_flask_app_2/
    app.py
    static/
        style.css
    templates/
        _formhelpers.html
        first_app.html
        hello.html
"""

'\n1st_flask_app_2/\n    app.py\n    static/\n        style.css\n    templates/\n        _formhelpers.html\n        first_app.html\n        hello.html\n'

__Algumas modificações precisarão ser feitas no app.py__

In [5]:
#Código da arquivo app.py
"""
from flask import Flask, render_template, request
from wtforms import Form, TextAreaField, validators

#Usando wtforms nós extendemos a função index, criando um campo de texto que será incluido na pagina através da classe TextAreaField
#que automaticamente ja checa quando o usuario insere um input valido ou não.

app = Flask(__name__)

class HelloForm(Form):
    sayhello = TextAreaField('', [validators.DataRequired()])

@app.route('/')
def index():
    form = HelloForm(request.form)
    return render_template('first_app.html', form=form)

#O metodo 'POST' é usado para transportar os dados do formulario para o servidor
@app.rout('/hello', methods=['POST'])

#Definindo uma nova função (hello) que será responsável por renderizar a  pagina HTML hello.html após a validação do formulario
def hello():
    form = HelloForm(request.form)
    if request.method == 'POST' and form.validate():
        name = request.method == 'POST' and form.validate():
        return render_template('first_app.html', form=form)
    return render_template('first_app.html', form=form)


#O argumento debug=True ativa o depurador do FLASK, o que será útil futuramente.
if __name__ == '__main__':
    app.run(debug=True)

"""

"\nfrom flask import Flask, render_template, request\nfrom wtforms import Form, TextAreaField, validators\n\n#Usando wtforms nós extendemos a função index, criando um campo de texto que será incluido na pagina através da classe TextAreaField\n#que automaticamente ja checa quando o usuario insere um input valido ou não.\n\napp = Flask(__name__)\n\nclass HelloForm(Form):\n    sayhello = TextAreaField('', [validators.DataRequired()])\n\n@app.route('/')\ndef index():\n    form = HelloForm(request.form)\n    return render_template('first_app.html', form=form)\n\n#O metodo 'POST' é usado para transportar os dados do formulario para o servidor\n@app.rout('/hello', methods=['POST'])\n\n#Definindo uma nova função (hello) que será responsável por renderizar a  pagina HTML hello.html após a validação do formulario\ndef hello():\n    form = HelloForm(request.form)\n    if request.method == 'POST' and form.validate():\n        name = request.method == 'POST' and form.validate():\n        return ren

## Macro

Implementaremos uma macro utilizando o motor template do [Jinja2](http://jinja.pocoo.org) no arquivo _formhelpers.html_ que depois será importado pela _first_app.html_

In [None]:
"""
{% macro render_field(field) %}
    <dt>{{ field.label }}
    <dd>{{ field.(**kwargs)|safe }}
    {% if field.errors %}
        <ul class=errors>
        {% for error in field.errors %}
            <li>{{ error }}</li>
        {% endfor %}
        </ul>
    {% endif %}
    </dd>
    </dt>
{% endmacro %}

"""

# Criando um app para review de filmes

Agora que estamos familiarizados com alguns conceitos de desenvolvimento de web app, iremos atribuir isso ao nosso classificador de reviews de filmes