# Análise das Intents

Este jupyter-notebook vai auxiliar na análise de detecção de intenções de seu chatbot.

### Configurando e Imports

In [2]:
import rasa
print("rasa: {}".format(rasa.__version__))

rasa: 1.2.0


### Treinando o modelo do Rasa NLU

* Para avaliar o bot o primeiro passo é treiner o seu chatbot. Mas não é necessário treinar a parte de conversão completa (rasa_core) apenas a parte de interpretação de mensagens (rasa_nlu).

* O comando `train-nlu` do Makefile executa o treinamento apenas do `rasa_nlu`

In [5]:
!make train-nlu -C $BOT_DIR_PATH

make: Entering directory '/work/bot'
rasa train nlu --fixed-model-name nlu
  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])
[94mTraining NLU model...[0m
2019-08-13 18:40:48 [1;30mINFO    [0m [34mrasa.nlu.training_data.training_data[0m  - Training data stats: 
	- intent examples: 314 (15 distinct intents)
	- Found intents: 'inform_preferences', 'deny', 'ask_how_doing', 'elogios', 'what_know_about', 'i_wanna_sell', 'i_wanna_rent', 'explain', 'bye', 'affirm', 'greet', 'lead_data', 'greet+ask_how_doing', 'i_wanna_buy', 'out_of_scope'
	- entity examples: 73 (3 distinct entities)
	- found entities: 'name', 'trading_type', 'property_type'

2019-08-13 18:40:48 [1;30mINFO    [0m [34mrasa.nlu.model[0m  - Starting to train componen

### Métodos de avaliação do chatbot

* O Rasa fornece vários métodos de avaliação e validação das `intents`, para verificar como utiliza-los, cada método fornece um log, imagem, gráfico ou arquivo com dados relevantes para interpretação do chatbot.

* O comando `rasa test` é a base para a avaliação do chatbot.

* Na célula abaixo a flag `-h` foi utilizada para mostrar as funções e a forma de uso de cada uma delas, mude seus valores e flags para ter as informações desejadas na sua análise.

* Atualmente o Rasa possui 2 modos, `evaluation` e `crossvalidation` que tem seções decicadas a eles neste jupyter notebook.

In [4]:
!rasa test nlu --help

usage: rasa test nlu [-h] [-v] [-vv] [--quiet] [-m MODEL] [-u NLU]
                     [--report [REPORT]] [--successes [SUCCESSES]]
                     [--errors ERRORS] [--histogram HISTOGRAM]
                     [--confmat CONFMAT] [-c CONFIG [CONFIG ...]]
                     [--cross-validation] [-f FOLDS] [-r RUNS]
                     [-p PERCENTAGES [PERCENTAGES ...]]

optional arguments:
  -h, --help            show this help message and exit
  -m MODEL, --model MODEL
                        Path to a trained Rasa model. If a directory is
                        specified, it will use the latest model in this
                        directory. (default: models)
  -u NLU, --nlu NLU     File or folder containing your NLU data. (default:
                        data)
  --report [REPORT]     Output path to save the intent/entity metrics report.
                        (default: None)
  --successes [SUCCESSES]
                        Output path to save success

### Evaluation

* O comando abaixo gera informações relevates para a validação das `intents` são elas:
    * Matriz de confuzão
    * Histograma
    * Erros de intents

In [6]:
!rasa test nlu -m $BOT_MODELS_PATH_NLU -u $BOT_INTENTS_PATH

  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])
2019-08-13 18:41:14 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - Running model for predictions:
100%|████████████████████████████████████████| 314/314 [00:00<00:00, 635.06it/s]
2019-08-13 18:41:14 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - Intent evaluation results:
2019-08-13 18:41:14 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - Intent Evaluation: Only considering those 314 examples that have a defined intent out of 314 examples
2019-08-13 18:41:14 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - F1-Score:  0.9968053976059585
2019-08-13 18:41:14 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - Precision: 0.9968731905037637
2019-08-13 18:41:14 [1;30mINFO    [0m [34mrasa.nlu.test[

#### Matriz de Confuzão
* A matriz de confuzão mostra a correlação entre as intents.
* A diagonal principal tem forte correlação pois mostra a relação de uma intent **com ela mesma**
* O ideal é que não haja **nenhum valor** diferente de **0 fora da diagonal principal**.

In [7]:
from IPython.display import IFrame
IFrame(src='./confmat.png', width=900, height=700)

#### Erros
* O arquivo `erros.json` mostra os erros encontrados. Este arquivo lista os mesmos erros mostrados na **matriz de confuzão**, então caso ela fique muito grande, não se preocupe, pois você pode apenas procurar os erros no arquivo gerado.
* Os erros mostrados são textos repetidos nos exemplos de diferrentes `intents`.
* Caso o arquivo não seja gerado significa que não foram encontrados erros.

In [8]:
%cat errors.json

[
  {
    "text": "R$ 600000",
    "intent": "inform_preferences",
    "intent_prediction": {
      "name": "lead_data",
      "confidence": 0.852974534034729
    }
  }
]

#### Histograma

* O histograma contém a distribuição da predições das `intents`

In [9]:
IFrame(src='./hist.png', width=900, height=700)

### Cross Validation

In [11]:
!rasa test nlu -m $BOT_MODELS_PATH_NLU -u $BOT_INTENTS_PATH -c $BOT_CONFIG_PATH --cross-validation --folds 2 --report

  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])
2019-08-13 18:50:07 [1;30mINFO    [0m [34mrasa.cli.test[0m  - Test model using cross validation.
2019-08-13 18:50:07 [1;30mINFO    [0m [34mrasa.nlu.model[0m  - Starting to train component WhitespaceTokenizer
2019-08-13 18:50:07 [1;30mINFO    [0m [34mrasa.nlu.model[0m  - Finished training component.
2019-08-13 18:50:07 [1;30mINFO    [0m [34mrasa.nlu.model[0m  - Starting to train component RegexFeaturizer
2019-08-13 18:50:07 [1;30mINFO    [0m [34mrasa.nlu.model[0m  - Finished training component.
2019-08-13 18:50:07 [1;30mINFO    [0m [34mrasa.nlu.model[0m  - Starting to train component CRFEntityExtractor
2019-08-13 18:50:07 [1;30mINFO    [0m [34mrasa.nlu.mode

Figure(2000x2000)
Figure(1000x1000)
2019-08-13 18:50:25 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - Accumulated test folds entity evaluation results:
2019-08-13 18:50:25 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - Evaluation for entity extractor: CRFEntityExtractor 
2019-08-13 18:50:25 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - Classification report for 'CRFEntityExtractor' saved to 'reports/CRFEntityExtractor_report.json'.
2019-08-13 18:50:25 [1;30mINFO    [0m [34mrasa.test[0m  - CV evaluation (n=2)
2019-08-13 18:50:25 [1;30mINFO    [0m [34mrasa.test[0m  - Intent evaluation results
2019-08-13 18:50:25 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - train Accuracy: 0.997 (0.003)
2019-08-13 18:50:25 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - train F1-score: 0.997 (0.003)
2019-08-13 18:50:25 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - train Precision: 0.997 (0.003)
2019-08-13 18:50:25 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - test Accuracy: 0.586 (0.006)
2019-08-13 

#### Matriz de Confusão Cross Validation

In [12]:
from IPython.display import IFrame
IFrame(src='./confmat.png', width=900, height=700)

#### Erros Cross Validation

In [13]:
%cat errors.json

[
  {
    "text": "Você fala sobre o meio ambiente?",
    "intent": "out_of_scope",
    "intent_prediction": {
      "name": "what_know_about",
      "confidence": 0.7624970078468323
    }
  },
  {
    "text": "Vc gosta de carnaval?",
    "intent": "out_of_scope",
    "intent_prediction": {
      "name": "bye",
      "confidence": 0.5487684011459351
    }
  },
  {
    "text": "batatinha quando nasce",
    "intent": "out_of_scope",
    "intent_prediction": {
      "name": "",
      "confidence": 0.0
    }
  },
  {
    "text": "bom dia",
    "intent": "greet",
    "intent_prediction": {
      "name": "affirm",
      "confidence": 0.528580367565155
    }
  },
  {
    "text": "oie",
    "intent": "greet",
    "intent_prediction": {
      "name": "",
      "confidence": 0.0
    }
  },
  {
    "text": "oiee",
    "intent": "greet",
    "intent_prediction": {
      "name": "",
      "confidence": 0.0
    }
  },
  {
    "text": "saudações",
  

#### Histograma

* O histograma contém a distribuição da predições das `intents`

## Referências:

O Rasa está em constante evolução, alguns links úteis para a construção deste jupyter-notebook e para a análise das `intents` são:

* [Evaluation](https://rasa.com/docs/nlu/evaluation/)