# **Aprendizagem de máquina**

## Objetivos

*   Conhecer uma intuição sobre Redes Neurais Artificiais RNA
*   Praticar os algoritmos Perceptron e multilayer Perceptron (MLP)

## Redes Neurais Artificiais
As redes neurais são modelos computacionais inspirados pelo sistema nervoso de um animal capazes de realizar o aprendizado de máquina bem como o reconhecimento de padrões.

Tais modelos são muitas vezes utilizados para a tarefa de classificação de padrões, podendo gerar classificadores com características variadas.

As redes neurais artificiais possuem em comum o fato de serem constituídas por neurônios que se conectam entre si através de através de sinapses. A rede neural mais conhecida são as baseadas em Perceptron multicamada (MLP) embora existam outras redes como rede de Kohonem, as redes de base radial e a rede de Hopfield.

## Os principais componentes dos neurônios são:

*   Os dendritos, que têm por função receber os estímulos transmitidos pelos outros neurônios;

*   O corpo de neurônio, também chamado de soma, que é responsável por coletar e combinar informações vindas de outros neurônios;

*  O axônio, que é constituído de uma fibra tubular que pode alcançar até alguns metros, e é responsável por transmitir os estímulos para outras células.

## A Rede Perceptron

A rede Perceptron possui um algoritmo de aprendizado supervisionado que consegue definir um classificador que encontra a superfície de separação entre quaisquer duas classes linearmente separáveis.

Vamos aplicar essa rede ao dataset **Iris**, que já conhecemos de longa data, e verificar seu comportamento:

In [10]:
import pandas as pd
# Vamos usar o mesmo dataset da iris da UCI que já vinhamos usando
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"

# Como o dataset não tem o cabeçalho, vamos implementa-lo
header = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'species']
df = pd.read_csv(url, header=None, names=header)

df

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
0,5.1,3.5,1.4,0.2,Iris-setosa
1,4.9,3.0,1.4,0.2,Iris-setosa
2,4.7,3.2,1.3,0.2,Iris-setosa
3,4.6,3.1,1.5,0.2,Iris-setosa
4,5.0,3.6,1.4,0.2,Iris-setosa
...,...,...,...,...,...
145,6.7,3.0,5.2,2.3,Iris-virginica
146,6.3,2.5,5.0,1.9,Iris-virginica
147,6.5,3.0,5.2,2.0,Iris-virginica
148,6.2,3.4,5.4,2.3,Iris-virginica


Como já trabalhamos com esse dataset antes, sabemos exatamente qual a correlação dos atributos com a classificação de flor, por isso, vamos pular a etapa de exploração dos dados e separar nosso dataset em entradas e classes:

* Entradas: São os atributos utilizados pelo modelo para realizar o treinamento e teste;

* Classes: São as classificações das iris de acordo com os atributos. Utilizado para treinar e testar o modelo.

In [None]:

# Selecionando um sub-dataframe com os campos petal_length e petal_width, 
# e outro com a variável de classes
entradas = df[['petal_length', 'petal_width']]
classes = df['species']
print(f"Formato das tabelas de dados {entradas.shape} e classes {classes.shape}")

Formato das tabelas de dados (150, 2) e classes (150,)


### Agora vamos separar esses dois datasets em Treino e Teste:

In [11]:
# Separamos 20 % para o teste
from sklearn.model_selection import train_test_split
entradas_treino, entradas_teste, classes_treino, classes_teste = train_test_split(entradas, classes, test_size=0.2,random_state=42)
print(f"Formato das tabelas de dados de treino {entradas_treino.shape} e teste {entradas_teste.shape}")

Formato das tabelas de dados de treino (120, 2) e teste (30, 2)


### Aqui começa a implementação da nossa Rede Neural. Vamos utlizar a mais simples que existe por enquato a Perceptron.

Para detalhes sobre o uso dela no sklearn, leia a documentação: 

https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Perceptron.html

In [None]:
from sklearn.linear_model import Perceptron

modelo = Perceptron(tol=1.7)
modelo.fit(entradas_treino, classes_treino)

### Agora que temos o nosso modelo treinado, vamos realizar o teste:

In [None]:
classes_encontradas = modelo.predict(entradas_teste)
print(classes_encontradas)

['Iris-virginica' 'Iris-virginica' 'Iris-setosa' 'Iris-virginica'
 'Iris-setosa' 'Iris-virginica' 'Iris-virginica' 'Iris-virginica'
 'Iris-virginica' 'Iris-virginica' 'Iris-setosa' 'Iris-virginica'
 'Iris-setosa' 'Iris-virginica' 'Iris-virginica' 'Iris-virginica'
 'Iris-virginica' 'Iris-virginica' 'Iris-virginica' 'Iris-virginica'
 'Iris-setosa' 'Iris-virginica' 'Iris-virginica' 'Iris-setosa'
 'Iris-virginica' 'Iris-virginica' 'Iris-virginica' 'Iris-virginica'
 'Iris-virginica' 'Iris-setosa']


### E por fim, verificar o quão bom foi o nosso modelo:

In [None]:
from sklearn.metrics import accuracy_score

classes_encontradas_train = modelo.predict(entradas_treino)
print("Acerto médio de classificação treino: ",accuracy_score(classes_encontradas_train, classes_treino))

classes_encontradas = modelo.predict(entradas_teste)
print("Acerto médio de classificação teste: ",accuracy_score(classes_encontradas, classes_teste))

Acerto médio de classificação treino:  0.6833333333333333
Acerto médio de classificação teste:  0.6


In [None]:
from sklearn.metrics import classification_report

print(classification_report(classes_encontradas, classes_teste))

                 precision    recall  f1-score   support

    Iris-setosa       1.00      1.00      1.00         7
Iris-versicolor       0.00      0.00      0.00         0
 Iris-virginica       1.00      0.48      0.65        23

       accuracy                           0.60        30
      macro avg       0.67      0.49      0.55        30
   weighted avg       1.00      0.60      0.73        30



  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
