In [17]:
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import numpy as np 

In [18]:
df = sns.load_dataset('penguins')
df = df.dropna()
df

Unnamed: 0,species,island,bill_length_mm,bill_depth_mm,flipper_length_mm,body_mass_g,sex
0,Adelie,Torgersen,39.1,18.7,181.0,3750.0,Male
1,Adelie,Torgersen,39.5,17.4,186.0,3800.0,Female
2,Adelie,Torgersen,40.3,18.0,195.0,3250.0,Female
4,Adelie,Torgersen,36.7,19.3,193.0,3450.0,Female
5,Adelie,Torgersen,39.3,20.6,190.0,3650.0,Male
...,...,...,...,...,...,...,...
338,Gentoo,Biscoe,47.2,13.7,214.0,4925.0,Female
340,Gentoo,Biscoe,46.8,14.3,215.0,4850.0,Female
341,Gentoo,Biscoe,50.4,15.7,222.0,5750.0,Male
342,Gentoo,Biscoe,45.2,14.8,212.0,5200.0,Female


In [19]:
X = df[['bill_length_mm', 'bill_depth_mm', 'flipper_length_mm']].values
y = df['body_mass_g'].values.reshape(-1,1)
y

array([[3750.],
       [3800.],
       [3250.],
       [3450.],
       [3650.],
       [3625.],
       [4675.],
       [3200.],
       [3800.],
       [4400.],
       [3700.],
       [3450.],
       [4500.],
       [3325.],
       [4200.],
       [3400.],
       [3600.],
       [3800.],
       [3950.],
       [3800.],
       [3800.],
       [3550.],
       [3200.],
       [3150.],
       [3950.],
       [3250.],
       [3900.],
       [3300.],
       [3900.],
       [3325.],
       [4150.],
       [3950.],
       [3550.],
       [3300.],
       [4650.],
       [3150.],
       [3900.],
       [3100.],
       [4400.],
       [3000.],
       [4600.],
       [3425.],
       [3450.],
       [4150.],
       [3500.],
       [4300.],
       [3450.],
       [4050.],
       [2900.],
       [3700.],
       [3550.],
       [3800.],
       [2850.],
       [3750.],
       [3150.],
       [4400.],
       [3600.],
       [4050.],
       [2850.],
       [3950.],
       [3350.],
       [4100.],
       [

In [20]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [21]:
scaler_X = StandardScaler()
scaler_y = StandardScaler()

X_train = scaler_X.fit_transform(X_train)
X_test = scaler_X.transform(X_test)

y_train = scaler_y.fit_transform(y_train)
y_test = scaler_y.transform(y_test)

In [22]:
X_train

array([[-5.93727064e-01, -1.75093934e+00,  9.35942804e-01],
       [-1.26104283e+00,  3.23106978e-01, -7.19956003e-01],
       [ 1.09309891e+00, -6.38036440e-01,  1.65589881e+00],
       [-1.52055452e+00,  1.03131792e+00, -8.63947203e-01],
       [-6.67873261e-01,  8.79558430e-01, -1.51190761e+00],
       [ 5.50521573e-02,  7.01744996e-02,  1.29592081e+00],
       [ 3.88710043e-01, -1.54859336e+00,  1.15192960e+00],
       [-2.22996080e-01, -2.05445832e+00,  1.00793840e+00],
       [ 1.87163398e+00,  1.84070185e+00,  0.00000000e+00],
       [-1.07567734e+00,  1.03131792e+00, -8.63947203e-01],
       [-1.26104283e+00,  1.68894236e+00, -1.43991201e-01],
       [-1.16836009e+00,  4.74866465e-01, -5.75964802e-01],
       [ 6.85294829e-01, -1.09331490e+00,  1.00793840e+00],
       [-7.23482908e-01, -8.15849874e-02, -1.79989001e+00],
       [-9.08848400e-01,  7.27798943e-01, -7.91951603e-01],
       [-5.93727064e-01, -2.83930970e-01, -1.00793840e+00],
       [-1.11275044e+00,  7.27798943e-01

In [23]:
import math

class Valor:
    def __init__(self, data, progenitor=(), operador_mae="", rotulo=""):
        self.data = data
        self.progenitor = progenitor
        self.operador_mae = operador_mae
        self.rotulo = rotulo
        self.grad = 0

    def __repr__(self):
        return f"Valor(data={self.data})"
    
    def __add__(self, outro_valor):
        """Realiza a operação: self + outro_valor."""
        
        if not isinstance(outro_valor, Valor):
            outro_valor = Valor(outro_valor)
            
        progenitor = (self, outro_valor)
        data = self.data + outro_valor.data
        operador_mae = "+"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_adicao():
            self.grad += resultado.grad
            outro_valor.grad += resultado.grad
            
        resultado.propagar = propagar_adicao
        
        return resultado
    
    def __mul__(self, outro_valor):
        """Realiza a operação: self * outro_valor."""
        
        if not isinstance(outro_valor, Valor):
            outro_valor = Valor(outro_valor)
            
        progenitor = (self, outro_valor)
        data = self.data * outro_valor.data
        operador_mae = "*"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_multiplicacao():
            self.grad += resultado.grad * outro_valor.data # grad_filho * derivada filho em relação a mãe
            outro_valor.grad += resultado.grad * self.data
            
        resultado.propagar = propagar_multiplicacao
        
        return resultado
    
    def exp(self):
        """Realiza a operação: exp(self)"""
        progenitor = (self, )
        data = np.exp(self.data)
        operador_mae = "exp"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_exp():
            self.grad += resultado.grad * data 
        
        resultado.propagar = propagar_exp
        
        return resultado
    
    def __pow__(self, expoente):
        """Realiza a operação: self ** expoente"""
        assert isinstance(expoente, (int, float))
        progenitor = (self, )
        data = self.data ** expoente
        operador_mae = f"**{expoente}"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_pow():
            self.grad += resultado.grad * (expoente * self.data ** (expoente - 1))
        
        resultado.propagar = propagar_pow
        
        return resultado
    
    def __truediv__(self, outro_valor):
        """Realiza a operação: self / outro_valor"""
        return self * outro_valor ** (-1)
    
    def __neg__(self):
        """Realiza a operação: -self"""
        return self * -1
    
    def __sub__(self, outro_valor):
        """Realiza a operação: self - outro_valor"""
        return self + (-outro_valor)
    
    def __radd__(self, outro_valor):
        """Realiza a operação: outro_valor + self"""
        return self + outro_valor
    
    def __rmul__(self, outro_valor):
        """Realiza a operação: outro_valor * self"""
        return self * outro_valor
    
    def sig(self):
        """Realiza a operação: exp(self) / (exp(self) + 1)"""
        return self.exp() / (self.exp() + 1)
    
    def propagar(self):
        pass
    
    def propagar_tudo(self):
        
        self.grad = 1
        
        ordem_topologica = []
        
        visitados = set()

        def constroi_ordem_topologica(v):
            if v not in visitados:
                visitados.add(v)
                for progenitor in v.progenitor:
                    constroi_ordem_topologica(progenitor)
                ordem_topologica.append(v)

        constroi_ordem_topologica(self)
        
        for vertice in reversed(ordem_topologica):
            vertice.propagar()

In [24]:
import random

class Neuronio:
    def __init__(self, num_dados_entrada):
        self.vies = Valor(random.uniform(-1, 1))
        
        self.pesos = []
        for i in range(num_dados_entrada):
            self.pesos.append(Valor(random.uniform(-1, 1)))
            
    def __call__(self, x, dropout):
        
        assert len(x) == len(self.pesos)
        
        prob_desl = random.uniform(0,1)
        soma = 0
        for info_entrada, peso_interno in zip(x, self.pesos):
            soma += info_entrada * peso_interno
            
        soma += self.vies  
        
        if prob_desl < dropout:
            dado_de_saida = Valor(0)
        else:
            dado_de_saida = soma.sig()
        
        return dado_de_saida       
    
    def parametros(self):
        return self.pesos + [self.vies]

In [25]:
class Camada:
    def __init__(self, num_neuronios, num_dados_entrada):
        neuronios = []
        
        for _ in range(num_neuronios):
            neuronio = Neuronio(num_dados_entrada)
            neuronios.append(neuronio)
            
        self.neuronios = neuronios     
        
    def __call__(self, x, dropout):
        dados_de_saida = []
        
        for neuronio in self.neuronios:
            informacao = neuronio(x,dropout)
            dados_de_saida.append(informacao)
            
        if len(dados_de_saida) == 1:
            return dados_de_saida[0]
        else:        
            return dados_de_saida  
    
    def parametros(self):
        params = []
        
        for neuronio in self.neuronios:
            params_neuronio = neuronio.parametros()
            params.extend(params_neuronio)
        
        return params

In [26]:
class MLP:
    def __init__(self, num_dados_entrada, num_neuronios_por_camada):
        
        percurso = [num_dados_entrada] + num_neuronios_por_camada
        
        camadas = []
        
        for i in range(len(num_neuronios_por_camada)):
            camada = Camada(num_neuronios_por_camada[i], percurso[i])
            camadas.append(camada)
            
        self.camadas = camadas
        
    def __call__(self, x, dropout):
        for camada in self.camadas[:-1]:
            x = camada(x, dropout)

        x = self.camadas[-1](x, 0)
        return x
    
    def parametros(self):
        params = []
        
        for camada in self.camadas:
            parametros_camada = camada.parametros()
            params.extend(parametros_camada)
            
        return params

In [27]:
NUM_DADOS_DE_ENTRADA = 3
NUM_DADOS_DE_SAIDA = 1    
CAMADAS_OCULTAS = [4, 5, 3] 

arquitetura_da_rede = CAMADAS_OCULTAS + [NUM_DADOS_DE_SAIDA]

minha_mlp = MLP(NUM_DADOS_DE_ENTRADA, arquitetura_da_rede)

In [28]:
X_train[0].shape

(3,)

In [30]:
NUM_EPOCAS = 200
TAXA_DE_APRENDIZADO = 0.5
dropout = 0.5

for epoca in range(NUM_EPOCAS):
    # forward pass
    y_pred = []
    for exemplo in X_train:
        previsao = minha_mlp(exemplo, dropout)
        y_pred.append(previsao)

    # loss
    erros = []
    for yt, yp in zip(y_train, y_pred):
        residuo = yp - yt
        erro_quadratico = residuo ** 2
        erros.append(erro_quadratico)        
    loss = sum(erros)

    # zero grad
    for p in minha_mlp.parametros():
        p.grad = 0

    # backpropagation
    loss.propagar_tudo()

    # atualiza parâmetros
    for p in minha_mlp.parametros():
        p.data = p.data - p.grad * TAXA_DE_APRENDIZADO

    # mostra resultado (opcional)
    print(epoca, loss.data)

0 [358.14993286]
1 [266.]
2 [266.]
3 [266.]
4 [266.]
5 [266.]
6 [266.]
7 [266.]
8 [266.]
9 [266.]
10 [266.]
11 [266.]
12 [266.]
13 [266.]
14 [266.]
15 [266.]
16 [266.]
17 [266.]
18 [266.]
19 [266.]
20 [266.]
21 [266.]
22 [266.]
23 [266.]
24 [266.]
25 [266.]


KeyboardInterrupt: 

In [27]:
print(y_pred)

[Valor(data=0.4383371082106723), Valor(data=0.4503454219559002), Valor(data=0.3995427858278129), Valor(data=0.4343216266500729)]


In [None]:
x = [
  [2.0, 3.0, -1.0],
  [3.0, -1.0, 0.5],
  [0.5, 1.0, 1.0],
  [1.0, 1.0, -1.0],
]
x = np.array(x)
y_true = [1, 0, 0.2, 0.5]

NUM_DADOS_DE_ENTRADA = 3  
NUM_DADOS_DE_SAIDA = 1    
CAMADAS_OCULTAS = [3, 2]  

arquitetura_da_rede = CAMADAS_OCULTAS + [NUM_DADOS_DE_SAIDA]

minha_mlp = MLP(NUM_DADOS_DE_ENTRADA, arquitetura_da_rede)

In [35]:
NUM_EPOCAS = 200
TAXA_DE_APRENDIZADO = 0.5
dropout = 0.5

for epoca in range(NUM_EPOCAS):
    # forward pass
    y_pred = []
    for exemplo in x:
        previsao = minha_mlp(exemplo, dropout)
        y_pred.append(previsao)

    # loss
    erros = []
    for yt, yp in zip(y_true, y_pred):
        residuo = yp - yt
        erro_quadratico = residuo ** 2
        erros.append(erro_quadratico)        
    loss = sum(erros)

    # zero grad
    for p in minha_mlp.parametros():
        p.grad = 0

    # backpropagation
    loss.propagar_tudo()

    # atualiza parâmetros
    for p in minha_mlp.parametros():
        p.data = p.data - p.grad * TAXA_DE_APRENDIZADO

    # mostra resultado (opcional)
    print(epoca, loss.data)

0 0.48025729359909486
1 0.5914276729229032
2 0.5693813073084526
3 0.531101076982782
4 0.5080703516105981
5 0.8049055690043879
6 0.695729061154634
7 0.5272528579347077
8 0.6287616708001225
9 0.5797259103361118
10 0.5251530545904265
11 0.4995621965338248
12 0.5255895575800739
13 0.7327676668868834
14 0.6608630545313373
15 0.5965682133619603
16 0.6361023350904885
17 0.5777862690219234
18 0.572100157980708
19 0.6090443306827743
20 0.5584652843437571
21 0.567876015373977
22 0.5321079077460408
23 0.5399040020742034
24 0.5850927011958087
25 0.5548503031273042
26 0.5947409335163183
27 0.6142805657441581
28 0.5782250969838594
29 0.5681354365634633
30 0.569282010968283
31 0.6134442207762426
32 0.5797330597833089
33 0.5678359514282751
34 0.5584574608083135
35 0.5739987872849365
36 0.5549691015166553
37 0.596874445948977
38 0.5673662872454396
39 0.5725180152719055
40 0.5440606189178444
41 0.5118250476044149
42 0.578607007946504
43 0.5609386296399609
44 0.5615605346805528
45 0.609316024421684
46 0.