In [116]:
import math

class Valor:
    def __init__(self, data, progenitor=(), operador_mae="", rotulo=""):
        self.data = data
        self.progenitor = progenitor
        self.operador_mae = operador_mae
        self.rotulo = rotulo
        self.grad = 0

    def __repr__(self):
        return f"Valor(data={self.data})"
    
    def __add__(self, outro_valor):
        """Realiza a operação: self + outro_valor."""
        
        if not isinstance(outro_valor, Valor):
            outro_valor = Valor(outro_valor)
            
        progenitor = (self, outro_valor)
        data = self.data + outro_valor.data
        operador_mae = "+"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_adicao():
            self.grad += resultado.grad
            outro_valor.grad += resultado.grad
            
        resultado.propagar = propagar_adicao
        
        return resultado
    
    def __mul__(self, outro_valor):
        """Realiza a operação: self * outro_valor."""
        
        if not isinstance(outro_valor, Valor):
            outro_valor = Valor(outro_valor)
            
        progenitor = (self, outro_valor)
        data = self.data * outro_valor.data
        operador_mae = "*"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_multiplicacao():
            self.grad += resultado.grad * outro_valor.data # grad_filho * derivada filho em relação a mãe
            outro_valor.grad += resultado.grad * self.data
            
        resultado.propagar = propagar_multiplicacao
        
        return resultado
    
    def exp(self):
        """Realiza a operação: exp(self)"""
        progenitor = (self, )
        data = math.exp(self.data)
        operador_mae = "exp"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_exp():
            self.grad += resultado.grad * data 
        
        resultado.propagar = propagar_exp
        
        return resultado
    
    def __pow__(self, expoente):
        """Realiza a operação: self ** expoente"""
        assert isinstance(expoente, (int, float))
        progenitor = (self, )
        data = self.data ** expoente
        operador_mae = f"**{expoente}"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_pow():
            self.grad += resultado.grad * (expoente * self.data ** (expoente - 1))
        
        resultado.propagar = propagar_pow
        
        return resultado
    
    def relu(self):
        """Função de ativação ReLU: retorna x se x > 0, senão retorna 0"""
        progenitor = (self,)
        data = self.data if self.data > 0 else 0
        resultado = Valor(data, progenitor, "ReLU")

        def propagar_relu():
            self.grad += resultado.grad * (1 if self.data > 0 else 0)

        resultado.propagar = propagar_relu
        return resultado
    
    def prelu(self, a= 0.1):
        """Função de ativação paramétrica ReLU: retorna x se x > 0, senão a*x"""
        if not isinstance(a, Valor):
            a = Valor(a)

        progenitor = (self, )
        if self.data > 0:
            resultado = Valor(self.data, progenitor, "prelu")

            def propagar_prelu():
                self.grad += resultado.grad  
      

        else:
            resultado = Valor(a.data * self.data, progenitor, "prelu")

            def propagar_prelu():
                self.grad += resultado.grad * a.data  # derivada da multiplicação: a
               

        resultado.propagar = propagar_prelu
        return resultado

    def __truediv__(self, outro_valor):
        """Realiza a operação: self / outro_valor"""
        return self * outro_valor ** (-1)
    
    def __neg__(self):
        """Realiza a operação: -self"""
        return self * -1
    
    def __sub__(self, outro_valor):
        """Realiza a operação: self - outro_valor"""
        return self + (-outro_valor)
    
    def __radd__(self, outro_valor):
        """Realiza a operação: outro_valor + self"""
        return self + outro_valor
    
    def __rmul__(self, outro_valor):
        """Realiza a operação: outro_valor * self"""
        return self * outro_valor
    
    def sig(self):
        """Realiza a operação: exp(self) / (exp(self) + 1)"""
        return self.exp() / (self.exp() + 1)
    
    def tanh(self):
        exp_pos = self.exp()
        exp_neg = (-self).exp()
        return (exp_pos - exp_neg) / (exp_pos + exp_neg)

    def propagar(self):
        pass
    
    def propagar_tudo(self):
        
        self.grad = 1
        
        ordem_topologica = []
        
        visitados = set()

        def constroi_ordem_topologica(v):
            if v not in visitados:
                visitados.add(v)
                for progenitor in v.progenitor:
                    constroi_ordem_topologica(progenitor)
                ordem_topologica.append(v)

        constroi_ordem_topologica(self)
        
        for vertice in reversed(ordem_topologica):
            vertice.propagar()
            


In [113]:
import random

class Neuronio1:
    def __init__(self, num_dados_entrada):
        self.vies = Valor(random.uniform(-1, 1))
        
        self.pesos = []
        for i in range(num_dados_entrada):
            self.pesos.append(Valor(random.uniform(-1, 1)))
            
    def __call__(self, x):
        
        assert len(x) == len(self.pesos)
        
        soma = 0
        for info_entrada, peso_interno in zip(x, self.pesos):
            soma += info_entrada * peso_interno
            
        soma += self.vies  
        dado_de_saida = soma.tanh()
        
        return dado_de_saida       
    
    def parametros(self):
        return self.pesos + [self.vies]

class Camada1:
    def __init__(self, num_neuronios, num_dados_entrada):
        neuronios = []
        
        for _ in range(num_neuronios):
            neuronio = Neuronio1(num_dados_entrada)
            neuronios.append(neuronio)
            
        self.neuronios = neuronios     
        
    def __call__(self, x):
        dados_de_saida = []
        
        for neuronio in self.neuronios:
            informacao = neuronio(x)
            dados_de_saida.append(informacao)
            
        if len(dados_de_saida) == 1:
            return dados_de_saida[0]
        else:        
            return dados_de_saida  
    
    def parametros(self):
        params = []
        
        for neuronio in self.neuronios:
            params_neuronio = neuronio.parametros()
            params.extend(params_neuronio)
        
        return params
    
class MLP:
    def __init__(self, num_dados_entrada, num_neuronios_por_camada):
        
        percurso = [num_dados_entrada] + num_neuronios_por_camada
        
        camadas = []
        
        for i in range(len(num_neuronios_por_camada)):
            camada = Camada(num_neuronios_por_camada[i], percurso[i])
            camadas.append(camada)
            
        self.camadas = camadas
        
    def __call__(self, x):
        for camada in self.camadas:
            x = camada(x)
        return x
    
    def parametros(self):
        params = []
        
        for camada in self.camadas:
            parametros_camada = camada.parametros()
            params.extend(parametros_camada)
            
        return params

In [114]:
x = [
  [2.0, 3.0, -1.0],
  [3.0, -1.0, 0.5],
  [0.5, 1.0, 1.0],
  [1.0, 1.0, -1.0],
]

y_true = [1, 0, 0.2, 0.5]

NUM_DADOS_DE_ENTRADA = 3  
NUM_DADOS_DE_SAIDA = 1    
CAMADAS_OCULTAS = [3, 2]  

arquitetura_da_rede = CAMADAS_OCULTAS + [NUM_DADOS_DE_SAIDA]


minha_mlp = MLP(NUM_DADOS_DE_ENTRADA, arquitetura_da_rede)

In [115]:
NUM_EPOCAS = 200
TAXA_DE_APRENDIZADO = 0.1

for epoca in range(NUM_EPOCAS):
    # forward pass
    y_pred = []
    for exemplo in x:
        previsao = minha_mlp(exemplo)
        y_pred.append(previsao)

    # loss
    erros = []
    for yt, yp in zip(y_true, y_pred):
        residuo = yp - yt
        erro_quadratico = residuo ** 2
        erros.append(erro_quadratico)        
    loss = sum(erros)

    # zero grad
    for p in minha_mlp.parametros():
        p.grad = 0

    # backpropagation
    loss.propagar_tudo()

    # atualiza parâmetros
    for p in minha_mlp.parametros():
        p.data = p.data - p.grad * TAXA_DE_APRENDIZADO

    # mostra resultado (opcional)
    print(epoca, loss.data)

0 2.040083160349753
1 0.6241715802208019
2 0.4940101997185723
3 0.39314024345373433
4 0.30655260999403056
5 0.2345246261537816
6 0.18052311176928543
7 0.14421273434074036
8 0.12151673239023862
9 0.10769133245188654
10 0.09914232883338953
11 0.0936127390840459
12 0.08979371874896983
13 0.08694511572163259
14 0.08464830560287433
15 0.08266426855297995
16 0.08085518548336508
17 0.07914123526132547
18 0.07747647589605032
19 0.07583511152722171
20 0.0742034942944501
21 0.07257535335923496
22 0.07094887873595082
23 0.06932489669145411
24 0.06770570552425285
25 0.06609432414618743
26 0.06449400834193879
27 0.06290794691045383
28 0.06133908197057281
29 0.0597900158057804
30 0.058262977203855114
31 0.056759826983310536
32 0.05528208725200619
33 0.05383098284662598
34 0.052407486706860296
35 0.05101236371900695
36 0.049646209804680055
37 0.0483094847245373
38 0.047002538250486586
39 0.04572563010833101
40 0.04447894450246995
41 0.04326260020242581
42 0.04207665718225704
43 0.04092112072424914
44

In [104]:
import random

class Neuronio2:
    def __init__(self, num_dados_entrada):
        self.vies = Valor(random.uniform(-1, 1))
        
        self.pesos = []
        for i in range(num_dados_entrada):
            self.pesos.append(Valor(random.uniform(-1, 1)))
            
    def __call__(self, x):
        
        assert len(x) == len(self.pesos)
        
        soma = 0
        for info_entrada, peso_interno in zip(x, self.pesos):
            soma += info_entrada * peso_interno
            
        soma += self.vies  
        dado_de_saida = soma.relu()
        
        return dado_de_saida       
    
    def parametros(self):
        return self.pesos + [self.vies]

class Camada:
    def __init__(self, num_neuronios, num_dados_entrada):
        neuronios = []
        
        for _ in range(num_neuronios):
            neuronio = Neuronio2(num_dados_entrada)
            neuronios.append(neuronio)
            
        self.neuronios = neuronios     
        
    def __call__(self, x):
        dados_de_saida = []
        
        for neuronio in self.neuronios:
            informacao = neuronio(x)
            dados_de_saida.append(informacao)
            
        if len(dados_de_saida) == 1:
            return dados_de_saida[0]
        else:        
            return dados_de_saida  
    
    def parametros(self):
        params = []
        
        for neuronio in self.neuronios:
            params_neuronio = neuronio.parametros()
            params.extend(params_neuronio)
        
        return params
    
class MLP:
    def __init__(self, num_dados_entrada, num_neuronios_por_camada):
        
        percurso = [num_dados_entrada] + num_neuronios_por_camada
        
        camadas = []
        
        for i in range(len(num_neuronios_por_camada)):
            camada = Camada(num_neuronios_por_camada[i], percurso[i])
            camadas.append(camada)
            
        self.camadas = camadas
        
    def __call__(self, x):
        for camada in self.camadas:
            x = camada(x)
        return x
    
    def parametros(self):
        params = []
        
        for camada in self.camadas:
            parametros_camada = camada.parametros()
            params.extend(parametros_camada)
            
        return params

In [122]:
x = [
  [2.0, 3.0, -1.0],
  [3.0, -1.0, 0.5],
  [0.5, 1.0, 1.0],
  [1.0, 1.0, -1.0],
]

y_true = [1, 0, 0.2, 0.5]

NUM_DADOS_DE_ENTRADA = 3  
NUM_DADOS_DE_SAIDA = 1    
CAMADAS_OCULTAS = [3, 2]  

arquitetura_da_rede = CAMADAS_OCULTAS + [NUM_DADOS_DE_SAIDA]


minha_mlp = MLP(NUM_DADOS_DE_ENTRADA, arquitetura_da_rede)

In [123]:
NUM_EPOCAS = 1000
TAXA_DE_APRENDIZADO = 0.05

for epoca in range(NUM_EPOCAS):
    # forward pass
    y_pred = []
    for exemplo in x:
        previsao = minha_mlp(exemplo)
        y_pred.append(previsao)

    # loss
    erros = []
    for yt, yp in zip(y_true, y_pred):
        residuo = yp - yt
        erro_quadratico = residuo ** 2
        erros.append(erro_quadratico)        
    loss = sum(erros)

    # zero grad
    for p in minha_mlp.parametros():
        p.grad = 0

    # backpropagation
    loss.propagar_tudo()

    # atualiza parâmetros
    for p in minha_mlp.parametros():
        p.data = p.data - p.grad * TAXA_DE_APRENDIZADO

    # mostra resultado (opcional)
    print(epoca, loss.data)

0 2.1419202257964405
1 0.37977426808660614
2 0.280808220201924
3 0.2508302944880596
4 0.2277699148628131
5 0.21018695436224039
6 0.1967556894230826
7 0.18623314199822866
8 0.17769366940509906
9 0.17051870988441328
10 0.16431815210230083
11 0.15885376479180283
12 0.15398182089149146
13 0.14961444136733418
14 0.14569507590380212
15 0.14218366714589
16 0.13904811744099974
17 0.13625970820478586
18 0.13379090653489017
19 0.13161454532343825
20 0.12970373772600033
21 0.12803213572283081
22 0.12657430457559965
23 0.12530608821092976
24 0.12420490460222555
25 0.12324994861892281
26 0.12242230171630379
27 0.12170495931352218
28 0.12108279171779944
29 0.12054245557578797
30 0.1200722717420534
31 0.11966208323458481
32 0.11930310429376237
33 0.1189877689056844
34 0.11870958474186405
35 0.11846299642775014
36 0.11824326042039576
37 0.11804633253567631
38 0.11786876827250936
39 0.11770763547690725
40 0.11756043851158329
41 0.11742505289087504
42 0.11729966925759064
43 0.11718274557881055
44 0.1170

416 0.047514723001836554
417 0.040250833543936416
418 0.04432035525996314
419 0.03788783659310797
420 0.04150219728836897
421 0.03577966450097744
422 0.03901123598225203
423 0.033897183913030114
424 0.03680661434047404
425 0.03221546120475371
426 0.0348535851703568
427 0.03071276525512067
428 0.03312220309494744
429 0.029369940258700256
430 0.03158644643213239
431 0.028169990884632984
432 0.030223589944129492
433 0.02709778721045923
434 0.029013726874796558
435 0.026139837082541112
436 0.027939383716323908
437 0.025284097457729623
438 0.0269851966292855
439 0.02451980995385878
440 0.026137632476931752
441 0.023837353341696677
442 0.025384744958016875
443 0.023228109632516394
444 0.02471596024746591
445 0.022684342334423745
446 0.024121888554516673
447 0.02219908629957163
448 0.023594159015815304
449 0.021766048893216376
450 0.02312527585771103
451 0.021379522272276658
452 0.022708494045688626
453 0.021034306513413183
454 0.022337712814146028
455 0.02072564324800913
456 0.02200738559112

785 0.004928413150348215
786 0.00503337905438413
787 0.0048979820530641455
788 0.005001814720699185
789 0.004867833665935422
790 0.004970548165114679
791 0.004837964109561217
792 0.004939575302108041
793 0.004808369693448851
794 0.004908892244718003
795 0.004779046906738955
796 0.0048784952944151
797 0.004749992408869051
798 0.004848380930946557
799 0.0047212030202193195
800 0.004818545802201085
801 0.004692675712781208
802 0.004788986714133388
803 0.004664407600885718
804 0.004759700620787559
805 0.004636395932026805
806 0.004730684614453643
807 0.004608638077812379
808 0.0047019359159920365
809 0.004581131525074506
810 0.004673451865354927
811 0.004553873867163742
812 0.004645229912331493
813 0.00452686279545552
814 0.004617267607543578
815 0.004500096091089164
816 0.004589562593711349
817 0.004473571616960253
818 0.004562112597210343
819 0.004447287309984431
820 0.004534915419936244
821 0.004421241173647739
822 0.004507968931491478
823 0.004395431270857218
824 0.004481271061706927
8

In [117]:
import random

class Neuronio3:
    def __init__(self, num_dados_entrada):
        self.vies = Valor(random.uniform(-1, 1))
        
        self.pesos = []
        for i in range(num_dados_entrada):
            self.pesos.append(Valor(random.uniform(-1, 1)))
            
    def __call__(self, x):
        
        assert len(x) == len(self.pesos)
        
        soma = 0
        for info_entrada, peso_interno in zip(x, self.pesos):
            soma += info_entrada * peso_interno
            
        soma += self.vies  
        dado_de_saida = soma.prelu()
        
        return dado_de_saida       
    
    def parametros(self):
        return self.pesos + [self.vies]

class Camada:
    def __init__(self, num_neuronios, num_dados_entrada):
        neuronios = []
        
        for _ in range(num_neuronios):
            neuronio = Neuronio3(num_dados_entrada)
            neuronios.append(neuronio)
            
        self.neuronios = neuronios     
        
    def __call__(self, x):
        dados_de_saida = []
        
        for neuronio in self.neuronios:
            informacao = neuronio(x)
            dados_de_saida.append(informacao)
            
        if len(dados_de_saida) == 1:
            return dados_de_saida[0]
        else:        
            return dados_de_saida  
    
    def parametros(self):
        params = []
        
        for neuronio in self.neuronios:
            params_neuronio = neuronio.parametros()
            params.extend(params_neuronio)
        
        return params
    
class MLP:
    def __init__(self, num_dados_entrada, num_neuronios_por_camada):
        
        percurso = [num_dados_entrada] + num_neuronios_por_camada
        
        camadas = []
        
        for i in range(len(num_neuronios_por_camada)):
            camada = Camada(num_neuronios_por_camada[i], percurso[i])
            camadas.append(camada)
            
        self.camadas = camadas
        
    def __call__(self, x):
        for camada in self.camadas:
            x = camada(x)
        return x
    
    def parametros(self):
        params = []
        
        for camada in self.camadas:
            parametros_camada = camada.parametros()
            params.extend(parametros_camada)
            
        return params

Colocar as funções matemáticas de ativação na introdução
guiar leitor 
introd e conclusão

Posso colocar mais de uma função na rede ?

tanh()	Melhor que sigmoid para camadas ocultas, pois é centrada em 0 e tem gradientes mais fortes

relu()	Mais simples e rápida, mas pode "morrer" com dados negativos

prelu()	Funciona bem como relu, mas com parte negativa controlada — pode ser interessante

In [125]:
x = [
  [2.0, 3.0, -1.0],
  [3.0, -1.0, 0.5],
  [0.5, 1.0, 1.0],
  [1.0, 1.0, -1.0],
]

y_true = [1, 0, 0.2, 0.5]

NUM_DADOS_DE_ENTRADA = 3  
NUM_DADOS_DE_SAIDA = 1    
CAMADAS_OCULTAS = [3, 2]  

arquitetura_da_rede = CAMADAS_OCULTAS + [NUM_DADOS_DE_SAIDA]


minha_mlp = MLP(NUM_DADOS_DE_ENTRADA, arquitetura_da_rede)

In [126]:
NUM_EPOCAS = 1000
TAXA_DE_APRENDIZADO = 0.05

for epoca in range(NUM_EPOCAS):
    # forward pass
    y_pred = []
    for exemplo in x:
        previsao = minha_mlp(exemplo)
        y_pred.append(previsao)

    # loss
    erros = []
    for yt, yp in zip(y_true, y_pred):
        residuo = yp - yt
        erro_quadratico = residuo ** 2
        erros.append(erro_quadratico)        
    loss = sum(erros)

    # zero grad
    for p in minha_mlp.parametros():
        p.grad = 0

    # backpropagation
    loss.propagar_tudo()

    # atualiza parâmetros
    for p in minha_mlp.parametros():
        p.data = p.data - p.grad * TAXA_DE_APRENDIZADO

    # mostra resultado (opcional)
    print(epoca, loss.data)

0 3.7738772181770233
1 0.935711424061035
2 0.2902736878281288
3 0.22993121547205636
4 0.1904291232493527
5 0.16088929915544073
6 0.1378546419331775
7 0.11949777357503734
8 0.1046954681790144
9 0.09267842870531623
10 0.08287618305529193
11 0.07484430782821522
12 0.06822787655219331
13 0.06274101224006767
14 0.05815362181612625
15 0.05428146558164188
16 0.05097801190992245
17 0.048127507968894555
18 0.04563906676553105
19 0.043441678637627996
20 0.0414800677493663
21 0.03971130293342245
22 0.038102063239420905
23 0.036626457714848806
24 0.035264304985090436
25 0.03399978823046872
26 0.032820412710311324
27 0.03171620445677753
28 0.030679099307299368
29 0.029702480721157297
30 0.028780832775656674
31 0.027909481440318757
32 0.027084402814274166
33 0.026302081622449246
34 0.02555940703213026
35 0.024853595892963126
36 0.02418213592860269
37 0.02354274331497263
38 0.02293333055685438
39 0.022351981700361883
40 0.02179693276340117
41 0.021266555889413348
42 0.02075934618204238
43 0.020273910

590 0.0012011284067739633
591 0.001198896567636439
592 0.0011966726524314832
593 0.0011944566197744468
594 0.0011922484285657549
595 0.001190048037988406
596 0.0011878554075055415
597 0.0011856704968581273
598 0.0011834932660624953
599 0.0011813236754080973
600 0.0011791616854551238
601 0.0011770072570322615
602 0.0011748603512344196
603 0.0011727209294203902
604 0.0011705889532108112
605 0.0011684643844858034
606 0.0011663471853828452
607 0.0011642373182946329
608 0.001162134745866946
609 0.0011600394309964936
610 0.0011579513368288755
611 0.001155870426756505
612 0.0011537966644164744
613 0.0011517300136886454
614 0.0011496704386935587
615 0.0011476179037904757
616 0.0011455723735754116
617 0.0011435338128791637
618 0.001141502186765343
619 0.0011394774605285765
620 0.0011374595996924972
621 0.0011354485700079413
622 0.001133444337451026
623 0.0011314468682213754
624 0.001129456128740276
625 0.0011274720856488249
626 0.0011254947058062278
627 0.0011235239562879596
628 0.0011215598043