# TinyML - Ávore de Decisão

In [None]:
#!pip install micromlgen

## 1. Import as bibliotecsa

In [None]:
from micromlgen import port
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn import metrics

## 2. Carrego o Dataset

O conjunto de dados Iris é um conjunto clássico na área de aprendizado de máquina e estatísticas. Ele foi introduzido por Sir Ronald A. Fisher em 1936 como um exemplo de análise discriminante. O conjunto de dados é frequentemente utilizado para fins educacionais e é um ponto de partida comum para a prática de classificação de padrões.


Atributos:

- Comprimento da sépala (em centímetros)

- Largura da sépala (em centímetros)

- Comprimento da pétala (em centímetros)

- Largura da pétala (em centímetros)

Espécies:

- 0 - Setosa

- 1 - Versicolor

- 2 - Virginica

In [None]:
X, y = load_iris(return_X_y=True)

In [None]:
print('Shape da entrada: ', X.shape)
print('Shape da variável alvo: ', y.shape)

In [None]:
print(X[:10])

In [None]:
print(y[:10])

## 3. Separo em dados de treinamento e teste

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3)

## 4. Crio o modelo de classificação

In [None]:
modelo = DecisionTreeClassifier(criterion = "entropy", splitter="best")

## 5. Treino o modelo

In [None]:
modelo.fit(X_train, y_train)

## 6. Vizualizo o modelo

In [None]:
from sklearn.tree import export_graphviz
from six import StringIO
from IPython.display import Image  
import pydotplus

feature_cols = ["Comprimento da sépala", "Largura da sépala", "Comprimento da pétala", "Largura da pétala"]
dot_data = StringIO()
export_graphviz(modelo, out_file=dot_data,  
                filled=True, rounded=True,
                special_characters=True,feature_names = feature_cols,class_names=['0','1','2'])
graph = pydotplus.graph_from_dot_data(dot_data.getvalue())  
graph.write_png('arvore_decisao.png')
Image(graph.create_png())


## 7. Avaliação do modelo com os dados de treinamento

In [None]:
training_predict = modelo.predict(X_train)

In [None]:
print(metrics.classification_report(y_train, training_predict, digits = 3))

In [None]:
print(metrics.confusion_matrix(y_train, training_predict))

## 8. Avaliação do modelo com os dados de teste

In [None]:
test_predict = modelo.predict(X_test)

In [None]:
print(metrics.classification_report(y_test, test_predict, digits = 3))

In [None]:
print(metrics.confusion_matrix(y_test, test_predict))

## 9. Obtenção do modelo para ser implantando no microcontrolador

In [None]:
print(port(modelo))

## 10. Salvo o modelo em um arquivo .h

In [None]:
with open('random_forest_classifier.h', 'w') as file:
    file.write(port(modelo))