# Classify Intent

In [1]:
import re
import spacy
import pprint
import pendulum
import numpy as np
import unicodedata
import pandas as pd
from src.ner import NER
from datetime import date
from spacy import displacy
from string import Template
from string import punctuation
from pymongo import MongoClient
from nltk.stem import RSLPStemmer
from nltk.corpus import stopwords
from bson.objectid import ObjectId
from spacy.lang.pt import Portuguese
from spacy.pipeline import EntityRuler
from nltk.tokenize import word_tokenize
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import TfidfVectorizer

pp = pprint.PrettyPrinter(indent=4)

In [2]:
df = pd.DataFrame([
     # sales
     ['vendas do último mês', 'sales'],
     ['quanto vendi esse mês', 'sales'],
     ['quanto vendi no mês de agosto', 'sales'],
     ['quais são os 10 produtos que mais vendi esse ano', 'sales'],
     ['quais são os 10 produtos que mais vendi esse mês', 'sales'],
     ['quais são os 10 produtos que mais vendi hoje', 'sales'],
     ['qual produto eu mais vendi hoje', 'sales'],
     # products
     ['quantos produtos eu tenho na minha base', 'products'],
     ['quantos produtos eu tenho na minha base de dados', 'products'],
     ['quantos produtos eu tenho na minha loja', 'products'],
     ['quantos refrigerantes eu vendo na minha loja', 'products'],
     ['quanto é o preço da coca-cola', 'products'],
     ['qual é o preço da coca-cola', 'products'],
     ['quantos refrigerantes tenho no estoque', 'products']
 ], columns=['message', 'label'])

In [3]:
expected = [
    { 'label': 'sales', 'entities': [('hoje', 'DATE')] },
    { 'label': 'sales', 'entities': [('ontem', 'DATE')] },
    { 'label': 'sales', 'entities': [('março', 'DATE')] },
    { 'label': 'sales', 'entities': [('março', 'DATE'), ('junho', 'DATE')] },
    { 'label': 'sales', 'entities': [('fev', 'DATE'), ('jun', 'DATE')] },
    { 'label': 'sales', 'entities': [('01/02/2020', 'DATE'), ('01/06/2020', 'DATE')] },
    { 'label': 'products', 'entities': [('heinekens', 'PRODUCT')] }
]

responses = []

def report(expected, responses):
    right_labels = 0
    wrong_labels = 0
    missing_entities = []

    total = len(responses)
    for i in range(total):
        if expected[i]['label'] == responses[i]['prediction']['label']:
            right_labels += 1
        else:
            wrong_labels += 1
        
        if len(expected[i]['entities']) != len(responses[i]['entities']):
            missing_entities.append({ 'message': messages[i], 'expected': expected[i]['entities'], 'actual': responses[i]['entities'] })
    
    print('--- CLASSIFICATION ---')
    print('')
    print('RIGHT_LABELS:', right_labels)
    print('WRONG_LABELS:', wrong_labels)
    print('')
    print('--- ENTITIES ---')
    print('')
    if len(missing_entities) == 0:
        print('ALL ENTITIES MATCH ✅')
    else:
        pp.pprint(missing_entities)
        

In [4]:
from src.chatbot import ChatBot

messages = [
    #'qual produto eu mais vendi hoje',
    'como foram minhas vendas hoje ?',
    'como foram minhas vendas ontem ?',
    'como foram minhas vendas no mês de março ?',
    'como foram minhas vendas entre março e junho ?',
    'como foram minhas vendas entre fev e jun ?',
    'como foram minhas vendas entre 01/02/2020 e 01/06/2020',
    'quantas heinekens tenho no meu estoque ?'
]

chatbot = ChatBot(df)

for message in messages:
    reply = chatbot.reply(message)
    print('REPLY:', reply)
    resp = chatbot.understand(message)
    print(resp)
    print('')
    responses.append(resp)

print('--- REPORT ---')
print('')
report(expected, responses)

MESSAGE:  como foram minhas vendas hoje ?
HEREEE
REPLY: Você vendeu R$ 1,274.10 no dia de hoje
HEREEE
{'prediction': {'label': 'sales', 'probability': 0.6879274479949774}, 'entities': [('hoje', 'DATE')]}

MESSAGE:  como foram minhas vendas ontem ?
HEREEE
REPLY: Você vendeu R$ 1,053.19 no dia de ontem
HEREEE
{'prediction': {'label': 'sales', 'probability': 0.6102076152319388}, 'entities': [('ontem', 'DATE')]}

MESSAGE:  como foram minhas vendas no mês de março ?
HEREEE
REPLY: Você vendeu R$ 1,136.50 no mês de março
HEREEE
{'prediction': {'label': 'sales', 'probability': 0.6102076152319388}, 'entities': [('março', 'DATE')]}

MESSAGE:  como foram minhas vendas entre março e junho ?
HEREEE
REPLY: Você vendeu R$ 82,912.79 entre os meses de março e junho
HEREEE
{'prediction': {'label': 'sales', 'probability': 0.6102076152319388}, 'entities': [('março', 'DATE'), ('junho', 'DATE')]}

MESSAGE:  como foram minhas vendas entre fev e jun ?
HEREEE
REPLY: Você vendeu R$ 83,056.19 entre os meses de f