<h1 style='font-size:40px'> Introduction to Artificial Neural Networks With Keras</h1>

<h2 style='font-size:30px'> The Perceptron</h2>

<h3 style='font-size:30px;font-style:italic'> TLU</h3>
<div> 
    <ul style='font-size:20px'> 
        <li> 
            Uma Threshold Logic Unit (TLU) é uma estrututa que simula um neurônio. Ela recebe uma série de features e computa a soma ponderada delas (assim como um algoritmo de regressão simples). Mas após o cálculo, a equação é utilizada como argumento de uma função conhecida como step function.
        </li>
        <li> 
            Pode ser utilizada para tarefas de classificação binária. Assim como na Regressão Logística, caso o resultado obtido esteja acima de um threshold, a instância é designada à classe positiva; senão, à classe negativa.
        </li>
    </ul>
</div>
<center> 
    <h1> Estrutura de uma TLU</h1>
    <img src='tlu1.png'>
</center>

<center> 
    <h1> As step functions mais comuns da TLU</h1>
    <img src='tlu2.png'>
</center>

<h3 style='font-size:30px;font-style:italic'> Perceptron</h3>
<div> 
    <ul style='font-size:20px'> 
        <li> 
            Um Perceptron consiste em uma camada de várias TLU's. Caso os neurônios sejam conectados com todos os inputs provenientes do nível anterior, dizemos que a camada em questão é uma <em>fully connected layer.</em>
        </li>
    </ul>
</div>
<center> 
    <h1> Um Perceptron de 3 TLU's</h1>
    <img src='perceptron1.png'>
</center>

<div> 
    <ul style='font-size:20px'> 
        <li> 
            O Perceptron acima pode realizar 3 classificações binárias distintas, tornando-o um modelo multioutput.
        </li>
        <li> 
            Observe que, além das features, um termo bias (nesse caso, 1) também pode ser inserido como input.
        </li>
    </ul>
</div>
<center> 
    <img src='perceptron2.png'>
</center>
<div> 
    <ul style='font-size:20px'> 
        <li> 
            Note como a função de previsão para uma fully conneted layer é muito similar à função afim. A letra $\phi$ é a função de ativação - no contexto do TLU's, ela é chamada de step function.
        </li>
    </ul>
</div>

<div> 
    <ul style='font-size:20px'> 
        <li> 
            Durante a fase de treino, os neurônios de input que melhor contribuírem para previsões corretas recebem um maior peso ao alimentarem o TLU de output.
        </li>
    </ul>
</div>

In [28]:
# As fronteiras de decisão do objeto Perceptron são lineares. Portanto, não espere grandes resultados em datasets complexos!
from sklearn.linear_model import Perceptron
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import numpy as np

X,y = load_iris(return_X_y=True)
X, y = X[:, [2,3]], (y==0).astype(int)
X_train, X_test, y_train, y_test = train_test_split(X,y, random_state=42)

In [29]:
# O objeto 'Perceptron' admite Early Stopping!
from sklearn.metrics import roc_auc_score
per_clf = Perceptron(early_stopping=True, n_iter_no_change=8).fit(X_train, y_train)
roc_auc_score(y_test, per_clf.predict(X_test))

1.0

<h2 style='font-size:30px'> Multi-Layer Perceptron and Backpropagation</h2>
<div> 
    <ul style='font-size:20px'> 
        <li> 
            Considerando o desempenho limitado dos Perceptrons, foram criados os Multi-Layer Perceptrons. Eles possuem uma ou mais camadas de TLU's, conhecidas como hidden layers responsáveis por abastecerem a output layer - que possui o(s) TLU(s) que farão as previsões finais.
        </li>
        <li> 
            Todas as camadas dos MLP's são fully connected layers e, com exceção do nível de output, contam com um neurônio de bias.
        </li>
        <li> 
            Como os valores são transmitidos das camadas inferiores às superiores (e não vice-versa), a arquitetura de um MLP é classificada como uma Feedforward Neural Network (FNN).
        </li>
    </ul>
</div>

<h3 style='font-size:30px;font-style:italic'> Treinando um MLP</h3>
<div> 
    <ul style='font-size:20px'> 
        <li> 
            O fitting de um Multi-Layer Perceptron ocorre de maneira iterativa com mini-batches do set de treino.
        </li>
        <li> 
            Cada instância do subconjunto alimenta as hidden layers até que o TLU de output faça uma previsão. O valor lançado é comparado com o verdadeiro rótulo/número, sendo o nível de erro avaliado por uma loss function.
        </li>
        <li> 
            Em seguida, é analisado o impacto de cada neurônio nas hidden layers para o erro. Com isso, os pesos de cada conexão são atualizados para a próxima instância.
        </li>
        <li> 
            É importante ressaltar que os pesos de cada conexão sejam inicializados de maneira aleatória, sem isso, o processo de treinamento pode não convergir a uma solução aleatória.
        </li>
    </ul>
</div>

<h2 style='font-size:30px'> Regression MLP's</h2>
<div> 
    <ul style='font-size:20px'> 
        <li> 
            O autor oferece aqui algumas dicas de montagem de MLP's em regressões.
        </li>
        <li>
            Colocar uma função de ativação nos neurônios de output não é algo comum, mas caso queira que os valores previstos sejam sempre positivos, podemos recorrer ao uso da ReLU ou softplus. Se desejar que os outputs caiam dentro de um certo intervalo numérico, use a Logistic Function ou Hyperbolic Tangent Function (não se esqueça de atualizar os valores-alvo dentro do intervalo requerido [0-1] para logística e [-1,1] para hiperbólica).
        </li>
        <li> 
            Com relação à loss function, busque usar o Mean Absolute Error caso o dataset tenha outliers. Além disso, a Hubber Loss pode ser uma opção intermediária entre o MAE e o MSE, tendo menor sensibilidade a outliers, uma alta taxa de precisão e de convergência.
        </li>
    </ul>
</div>

<h2 style='font-size:30px'> Classification MLP's</h2>
<div> 
    <ul style='font-size:20px'> 
        <li> 
            Com relação a classificações, os neurônios de output recebem uma Regressão Logística ou uma softmax para computar as probabilidades de classe.
        </li>
        <li> 
            Em classificações binárias, um neurônio de output para cada condição deve existir; para as multi-classe, um neurônio terá que existir para cada classe.
        </li>
    </ul>
</div>

In [41]:
pip install tensorflow

Collecting tensorflow
  Downloading tensorflow-2.9.1-cp38-cp38-macosx_10_14_x86_64.whl (228.5 MB)
[K     |████████████████████████████████| 228.5 MB 878 bytes/s  0:00:016  |▊                               | 5.5 MB 6.2 MB/s eta 0:00:36     |█▏                              | 8.3 MB 3.2 MB/s eta 0:01:10     |███▌                            | 25.1 MB 7.3 MB/s eta 0:00:28     |██████▉                         | 49.1 MB 6.5 MB/s eta 0:00:28     |██████████▊                     | 76.7 MB 10.2 MB/s eta 0:00:15     |████████████████▍               | 117.0 MB 9.3 MB/s eta 0:00:12     |██████████████████▉             | 134.2 MB 9.3 MB/s eta 0:00:11     |████████████████████▍           | 145.6 MB 9.8 MB/s eta 0:00:09
[?25hCollecting google-pasta>=0.1.1
  Downloading google_pasta-0.2.0-py3-none-any.whl (57 kB)
[K     |████████████████████████████████| 57 kB 8.8 MB/s  eta 0:00:01
[?25hCollecting keras<2.10.0,>=2.9.0rc0
  Downloading keras-2.9.0-py2.py3-none-any.whl (1.6 MB)
[K     |█████████████

In [40]:
# Finalmente instalando o Tensor Flow!
pip install tensorflow

SyntaxError: invalid syntax (<ipython-input-40-9090218d8889>, line 2)

In [4]:
! mv /Users/felipeveiga/Desktop/Screen\ Shot\ 2022-07-26\ at\ 08.44.52.png ./perceptron2.png

<p style='color:red'> Escrever sobre o trecho grifado (p.290).</p>