# Análise das Intents

Este jupyter-notebook vai auxiliar na análise de detecção de intenções de seu chatbot.

### Configurando e Imports

In [1]:
from IPython.display import IFrame

import rasa
print("rasa: {}".format(rasa.__version__))

rasa: 1.2.2


### Treinando o modelo do Rasa NLU

* Para avaliar o bot o primeiro passo é treiner o seu chatbot. Mas não é necessário treinar a parte de conversão completa (rasa_core) apenas a parte de interpretação de mensagens (rasa_nlu).

* O comando `train-nlu` do Makefile executa o treinamento apenas do `rasa_nlu`

In [12]:
!ls ../../coach/data

intents  stories


In [13]:
!rasa train nlu --config ../../coach/nlu_config.yml --nlu ../../coach/data/intents/

  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])
[94mTraining NLU model...[0m
2019-09-27 11:35:44 [1;30mINFO    [0m [34mrasa.nlu.training_data.training_data[0m  - Training data stats: 
	- intent examples: 589 (37 distinct intents)
	- Found intents: 'o_que_sei_falar', 'out_of_scope', 'cumprimentar', 'religiao', 'time', 'botao', 'diga_mais', 'onde_voce_mora', 'negar', 'hobby', 'negar_despedir', 'signo', 'afirmacao_botao', 'elogios', 'playlist', 'filhos', 'star_wars', 'relationship', 'license', 'me', 'tudo_bem', 'comida', 'negacao_botao', 'linguagens', 'bff', 'risada', 'como_estou', 'cor', 'action_test', 'de_onde_voce_eh', 'despedir', 'historia', 'genero', 'piada', 'filme', 'triste', 'esporte'
	- entity examples: 173 (22 distin

### Métodos de avaliação do chatbot

* O Rasa fornece vários métodos de avaliação e validação das `intents`, para verificar como utiliza-los, cada método fornece um log, imagem, gráfico ou arquivo com dados relevantes para interpretação do chatbot.

* O comando `!python -m rasa_nlu.test` é a base para a avaliação do chatbot.

* Na célula abaixo a flag `-h` foi utilizada para mostrar as funções e a forma de uso de cada uma delas, mude seus valores e flags para ter as informações desejadas na sua análise.

* Atualmente o Rasa possui 2 modos, `evaluation` e `crossvalidation` que tem seções decicadas a eles neste jupyter notebook.

In [20]:
!rasa test nlu -h

usage: rasa test nlu [-h] [-v] [-vv] [--quiet] [-m MODEL] [-u NLU]
                     [--report [REPORT]] [--successes [SUCCESSES]]
                     [--errors ERRORS] [--histogram HISTOGRAM]
                     [--confmat CONFMAT] [-c CONFIG [CONFIG ...]]
                     [--cross-validation] [-f FOLDS] [-r RUNS]
                     [-p PERCENTAGES [PERCENTAGES ...]]

optional arguments:
  -h, --help            show this help message and exit
  -m MODEL, --model MODEL
                        Path to a trained Rasa model. If a directory is
                        specified, it will use the latest model in this
                        directory. (default: models)
  -u NLU, --nlu NLU     File or folder containing your NLU data. (default:
                        data)
  --report [REPORT]     Output path to save the intent/entity metrics report.
                        (default: None)
  --successes [SUCCESSES]
                        Output path to save success

### Evaluation

* O comando abaixo gera informações relevates para a validação das `intents` são elas:
    * Matriz de confusão
    * Histograma
    * Erros de intents

In [23]:
!ls

confmat.png  errors.json  hist.png  intents-analysis.ipynb  models


In [22]:
!rm erros.json
# !python -m rasa_nlu.test -d $COACH_INTENTS_PATH -m $COACH_MODELS_NLU_PATH --mode evaluation
!rasa test nlu --nlu ../../coach/data/intents/ --model ./models/

rm: cannot remove 'erros.json': No such file or directory
  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])
2019-09-27 11:41:23 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - Running model for predictions:
100%|████████████████████████████████████████| 589/589 [00:00<00:00, 917.16it/s]
2019-09-27 11:41:23 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - Intent evaluation results:
2019-09-27 11:41:23 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - Intent Evaluation: Only considering those 589 examples that have a defined intent out of 589 examples
  'recall', 'true', average, warn_for)
  'recall', 'true', average, warn_for)
2019-09-27 11:41:23 [1;30mINFO    [0m [34mrasa.nlu.test[0m  - F1-Score:  0.9991303987742763
2019-09-27 11:41:23 

#### Matriz de Confusão
* A matriz de confusão mostra a correlação entre as intents.
* A diagonal principal tem forte correlação pois mostra a relação de uma intent **com ela mesma**
* O ideal é que não haja **nenhum valor** diferente de **0 fora da diagonal principal**.

`Execute este notebook no Firefox para visualizar o PDF da matriz de confusão`

In [24]:
IFrame(src='./confmat.png', width=900, height=700)

#### Erros
* O arquivo `erros,json` mostra os erros encontrados. Este arquivo lista os mesmos erros mostrados na **matriz de confusão**, então caso ela fique muito grande, não se preocupe, pois você pode apenas procurar os erros no arquivo gerado.
* Os erros mostrados são textos repetidos nos exemplos de diferrentes `intents`.
* Caso o arquivo não seja gerado significa que não foram encontrados erros.

In [25]:
%cat errors.json

[
  {
    "text": "e o c#",
    "intent": "linguagens",
    "intent_prediction": {
      "name": "",
      "confidence": 0.0
    }
  }
]

#### Histograma

* O histograma contém a distribuição da predições das `intents`

In [26]:
IFrame(src='./hist.png', width=900, height=700)

## Referências:

O Rasa está em constante evolução, alguns links úteis para a construção deste jupyter-notebook e para a análise das `intents` são:

* [Evaluation](https://rasa.com/docs/nlu/evaluation/)