# Análise das Intents

Este jupyter-notebook vai auxiliar na análise de detecção de intenções de seu chatbot.

### Configurando e Imports

In [1]:
from IPython.display import IFrame

import rasa_nlu
print("rasa_nlu: {}".format(rasa_nlu.__version__))

rasa_nlu: 0.15.0


### Treinando o modelo do Rasa NLU

* Para avaliar o bot o primeiro passo é treiner o seu chatbot. Mas não é necessário treinar a parte de conversão completa (rasa_core) apenas a parte de interpretação de mensagens (rasa_nlu).

* O comando `train-nlu` do Makefile executa o treinamento apenas do `rasa_nlu`

In [2]:
!make train-nlu -C $COACH_DIR_PATH

make: Entering directory '/work/coach'
python3 -m rasa_nlu.train -c nlu_config.yml --fixed_model_name current \
--data data/intents/ -o /src_models --project nlu --verbose
2019-09-24 18:45:18 [1;30mINFO    [0m [34mrasa_nlu.training_data.loading[0m  - Training data format of data/intents/aleatorio.md is md
2019-09-24 18:45:18 [1;30mINFO    [0m [34mrasa_nlu.training_data.training_data[0m  - Training data stats: 
	- intent examples: 411 (24 distinct intents)
	- Found intents: 'como_estou', 'risada', 'star_wars', 'me', 'religiao', 'hobby', 'playlist', 'filhos', 'relationship', 'time', 'cor', 'bff', 'historia', 'genero', 'triste', 'esporte', 'signo', 'piada', 'filme', 'comida', 'onde_voce_mora', 'linguagens', 'de_onde_voce_eh', 'license'
	- entity examples: 173 (22 distinct entities)
	- found entities: 'me', 'filhos', 'cor', 'starwars', 'genero', 'piada', 'filme', 'linguagens', 'playlist', 'live', 'religiao', 'hobby', 'how', 'relationship', 'bff', 'historia', 'triste', 'where', 'esp

### Métodos de avaliação do chatbot

* O Rasa fornece vários métodos de avaliação e validação das `intents`, para verificar como utiliza-los, cada método fornece um log, imagem, gráfico ou arquivo com dados relevantes para interpretação do chatbot.

* O comando `!python -m rasa_nlu.test` é a base para a avaliação do chatbot.

* Na célula abaixo a flag `-h` foi utilizada para mostrar as funções e a forma de uso de cada uma delas, mude seus valores e flags para ter as informações desejadas na sua análise.

* Atualmente o Rasa possui 2 modos, `evaluation` e `crossvalidation` que tem seções decicadas a eles neste jupyter notebook.

In [3]:
!python -m rasa_nlu.test -h

usage: test.py [-h] [--debug] [-v] -d DATA [--mode MODE] [-c CONFIG]
               [-m MODEL] [-f FOLDS] [--report [REPORT]]
               [--successes [SUCCESSES]] [--errors ERRORS]
               [--histogram HISTOGRAM] [--confmat CONFMAT]

evaluate a Rasa NLU pipeline with cross validation or on external data

optional arguments:
  -h, --help            show this help message and exit
  --debug               Print lots of debugging statements. Sets logging level
                        to DEBUG
  -v, --verbose         Be verbose. Sets logging level to INFO
  -d DATA, --data DATA  file containing training/evaluation data
  --mode MODE           evaluation|crossvalidation (evaluate pretrained model
                        or train model by crossvalidation)
  -c CONFIG, --config CONFIG
                        model configuration file (crossvalidation only)
  -m MODEL, --model MODEL
                        path to model (evaluation only)
  -f FOLDS, --folds FOLDS
 

### Evaluation

* O comando abaixo gera informações relevates para a validação das `intents` são elas:
    * Matriz de confusão
    * Histograma
    * Erros de intents

In [4]:
!rm erros.json
!python -m rasa_nlu.test -d $COACH_INTENTS_PATH -m $COACH_MODELS_NLU_PATH --mode evaluation

rm: cannot remove 'erros.json': No such file or directory
2019-09-24 18:45:44.587671: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA
2019-09-24 18:45:44.591468: I tensorflow/core/platform/profile_utils/cpu_utils.cc:94] CPU Frequency: 2400000000 Hz
2019-09-24 18:45:44.591691: I tensorflow/compiler/xla/service/service.cc:150] XLA service 0x55de38793bb0 executing computations on platform Host. Devices:
2019-09-24 18:45:44.591722: I tensorflow/compiler/xla/service/service.cc:158]   StreamExecutor device (0): <undefined>, <undefined>
Instructions for updating:
Use standard file APIs to check for files with this prefix.[0m
2019-09-24 18:45:44 [1;30mINFO    [0m [34mtensorflow[0m  - Restoring parameters from /models/nlu/current/component_4_EmbeddingIntentClassifier.ckpt
2019-09-24 18:45:44 [1;30mINFO    [0m [34mrasa_nlu.training_data.loading[0m  - Training data format of ../../coach/data

#### Matriz de Confusão
* A matriz de confusão mostra a correlação entre as intents.
* A diagonal principal tem forte correlação pois mostra a relação de uma intent **com ela mesma**
* O ideal é que não haja **nenhum valor** diferente de **0 fora da diagonal principal**.

`Execute este notebook no Firefox para visualizar o PDF da matriz de confusão`

In [5]:
IFrame(src='./confmat.png', width=900, height=700)

#### Erros
* O arquivo `erros,json` mostra os erros encontrados. Este arquivo lista os mesmos erros mostrados na **matriz de confusão**, então caso ela fique muito grande, não se preocupe, pois você pode apenas procurar os erros no arquivo gerado.
* Os erros mostrados são textos repetidos nos exemplos de diferrentes `intents`.
* Caso o arquivo não seja gerado significa que não foram encontrados erros.

In [6]:
%cat errors.json

[
    {
        "text": "e o c#",
        "intent": "linguagens",
        "intent_prediction": {
            "name": "",
            "confidence": 0.0
        }
    }
]

#### Histograma

* O histograma contém a distribuição da predições das `intents`

In [7]:
IFrame(src='./hist.png', width=900, height=700)

## Referências:

O Rasa está em constante evolução, alguns links úteis para a construção deste jupyter-notebook e para a análise das `intents` são:

* [Evaluation](https://rasa.com/docs/nlu/evaluation/)