## Construindo um grafo computacional automaticamente

In [1]:
from graphviz import Digraph


def _tracar(folha):
    """Função modificada da criada por Andrej Karpathy para construção de grafo.

    Referência: https://github.com/karpathy/micrograd

    """
    vertices = set()
    arestas = set()

    def construir(v):
        """Função recursiva para traçar o grafo."""
        if v not in vertices:
            vertices.add(v)
            for progenitor in v.progenitor:
                arestas.add((progenitor, v))
                construir(progenitor)

    construir(folha)

    return vertices, arestas


def plota_grafo(folha):
    """Função modificada da criada por Andrej Karpathy para construção de grafo.

    Referência: https://github.com/karpathy/micrograd

    """
    grafo = Digraph(format="svg", graph_attr={"rankdir": "LR"})
    vertices, arestas = _tracar(folha)

    for v in vertices:
        id_vertice = str(id(v))

        if hasattr(v, "rotulo") and (hasattr(v, "grad")):
            texto = "{ " + f"{v.rotulo} | data {v.data:.3f} | grad {v.grad:.3f}" + " }"

        elif hasattr(v, "rotulo"):
            texto = "{ " + f"{v.rotulo} | data {v.data:.3f}" + " }"

        else:
            texto = "{ " + f"data {v.data:.3f}" + " }"

        grafo.node(name=id_vertice, label=texto, shape="record")

        if v.operador_mae:
            grafo.node(name=id_vertice + v.operador_mae, label=v.operador_mae)
            grafo.edge(id_vertice + v.operador_mae, id_vertice)

    for vertice1, vertice2 in arestas:
        grafo.edge(str(id(vertice1)), str(id(vertice2)) + vertice2.operador_mae)

    return grafo

In [2]:
import math

class Valor:
    def __init__(self, data, progenitor=(), operador_mae="", rotulo=""):
        self.data = data
        self.progenitor = progenitor
        self.operador_mae = operador_mae
        self.rotulo = rotulo
        self.grad = 0

    def __repr__(self):
        return f"Valor(data={self.data})"
    
    def __add__(self, outro_valor):
        """Realiza a operação: self + outro_valor."""
        
        if not isinstance(outro_valor, Valor):
            outro_valor = Valor(outro_valor)
            
        progenitor = (self, outro_valor)
        data = self.data + outro_valor.data
        operador_mae = "+"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_adicao():
            self.grad += resultado.grad
            outro_valor.grad += resultado.grad
            
        resultado.propagar = propagar_adicao
        
        return resultado
    
    def __mul__(self, outro_valor):
        """Realiza a operação: self * outro_valor."""
        
        if not isinstance(outro_valor, Valor):
            outro_valor = Valor(outro_valor)
            
        progenitor = (self, outro_valor)
        data = self.data * outro_valor.data
        operador_mae = "*"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_multiplicacao():
            self.grad += resultado.grad * outro_valor.data # grad_filho * derivada filho em relação a mãe
            outro_valor.grad += resultado.grad * self.data
            
        resultado.propagar = propagar_multiplicacao
        
        return resultado
    
    def exp(self):
        """Realiza a operação: exp(self)"""
        progenitor = (self, )
        data = math.exp(self.data)
        operador_mae = "exp"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_exp():
            self.grad += resultado.grad * data 
        
        resultado.propagar = propagar_exp
        
        return resultado
    
    def __pow__(self, expoente):
        """Realiza a operação: self ** expoente"""
        assert isinstance(expoente, (int, float))
        progenitor = (self, )
        data = self.data ** expoente
        operador_mae = f"**{expoente}"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_pow():
            self.grad += resultado.grad * (expoente * self.data ** (expoente - 1))
        
        resultado.propagar = propagar_pow
        
        return resultado
    
    def __truediv__(self, outro_valor):
        """Realiza a operação: self / outro_valor"""
        return self * outro_valor ** (-1)
    
    def __neg__(self):
        """Realiza a operação: -self"""
        return self * -1
    
    def __sub__(self, outro_valor):
        """Realiza a operação: self - outro_valor"""
        return self + (-outro_valor)
    
    def __radd__(self, outro_valor):
        """Realiza a operação: outro_valor + self"""
        return self + outro_valor
    
    def __rmul__(self, outro_valor):
        """Realiza a operação: outro_valor * self"""
        return self * outro_valor
    
    def sig(self):
        """Realiza a operação: exp(self) / (exp(self) + 1)"""
        return self.exp() / (self.exp() + 1)
    
    def propagar(self):
        pass
    
    def propagar_tudo(self):
        
        self.grad = 1
        
        ordem_topologica = []
        
        visitados = set()

        def constroi_ordem_topologica(v):
            if v not in visitados:
                visitados.add(v)
                for progenitor in v.progenitor:
                    constroi_ordem_topologica(progenitor)
                ordem_topologica.append(v)

        constroi_ordem_topologica(self)
        
        for vertice in reversed(ordem_topologica):
            vertice.propagar()

In [3]:
import random

class Neuronio:
    def __init__(self, num_dados_entrada):
        self.vies = Valor(random.uniform(-1, 1))
        
        self.pesos = []
        for i in range(num_dados_entrada):
            self.pesos.append(Valor(random.uniform(-1, 1)))
            
    def __call__(self, x):
        
        assert len(x) == len(self.pesos)
        
        soma = 0
        for info_entrada, peso_interno in zip(x, self.pesos):
            soma += info_entrada * peso_interno
            
        soma += self.vies  
        dado_de_saida = soma.sig()
        
        return dado_de_saida       
    
    def parametros(self):
        return self.pesos + [self.vies]

In [4]:
class Camada:
    def __init__(self, num_neuronios, num_dados_entrada):
        neuronios = []
        
        for _ in range(num_neuronios):
            neuronio = Neuronio(num_dados_entrada)
            neuronios.append(neuronio)
            
        self.neuronios = neuronios     
        
    def __call__(self, x):
        dados_de_saida = []
        
        for neuronio in self.neuronios:
            informacao = neuronio(x)
            dados_de_saida.append(informacao)
            
        if len(dados_de_saida) == 1:
            return dados_de_saida[0]
        else:        
            return dados_de_saida  
    
    def parametros(self):
        params = []
        
        for neuronio in self.neuronios:
            params_neuronio = neuronio.parametros()
            params.extend(params_neuronio)
        
        return params

In [5]:
class MLP:
    def __init__(self, num_dados_entrada, num_neuronios_por_camada):
        
        percurso = [num_dados_entrada] + num_neuronios_por_camada
        
        camadas = []
        
        for i in range(len(num_neuronios_por_camada)):
            camada = Camada(num_neuronios_por_camada[i], percurso[i])
            camadas.append(camada)
            
        self.camadas = camadas
        
    def __call__(self, x):
        for camada in self.camadas:
            x = camada(x)
        return x
    
    def parametros(self):
        params = []
        
        for camada in self.camadas:
            parametros_camada = camada.parametros()
            params.extend(parametros_camada)
            
        return params

In [6]:
x = [
  [2.0, 3.0, -1.0],
  [3.0, -1.0, 0.5],
  [0.5, 1.0, 1.0],
  [1.0, 1.0, -1.0],
]

y_true = [1, 0, 0.2, 0.5]

In [7]:
NUM_DADOS_DE_ENTRADA = 3  
NUM_DADOS_DE_SAIDA = 1    
CAMADAS_OCULTAS = [3, 2]  

arquitetura_da_rede = CAMADAS_OCULTAS + [NUM_DADOS_DE_SAIDA]

minha_mlp = MLP(NUM_DADOS_DE_ENTRADA, arquitetura_da_rede)

In [8]:
y_pred = []

for exemplo in x:
    previsao = minha_mlp(exemplo)
    y_pred.append(previsao)
    
print(y_pred)

[Valor(data=0.42914285195662705), Valor(data=0.41966900105951116), Valor(data=0.42697161508134784), Valor(data=0.42375669401729793)]


In [9]:
erros = []

for yt, yp in zip(y_true, y_pred):
    residuo = yp - yt
    erro_quadratico = residuo ** 2
    erros.append(erro_quadratico)
    
loss = sum(erros)
print(loss)

Valor(data=0.5593291096823089)


In [10]:
loss.propagar_tudo()
grafo = plota_grafo(loss)

# para salvar o grafo
grafo.render("rede_neural_perda", format="png")

'rede_neural_perda.png'

In [11]:
parametros = minha_mlp.parametros()

print(len(parametros))
print()
parametros

23



[Valor(data=-0.7058413900217828),
 Valor(data=-0.3586962790333996),
 Valor(data=-0.016742671536366105),
 Valor(data=-0.14756510159888325),
 Valor(data=-0.2399191631493396),
 Valor(data=-0.7633014303972205),
 Valor(data=-0.33110076094655483),
 Valor(data=0.3535311834248258),
 Valor(data=-0.12206752782657948),
 Valor(data=0.3213277247847721),
 Valor(data=0.2542084824015316),
 Valor(data=0.6629944061809252),
 Valor(data=-0.34881003888533857),
 Valor(data=0.24678129814215843),
 Valor(data=-0.07778884498444372),
 Valor(data=-0.304282906256238),
 Valor(data=-0.10002077804140042),
 Valor(data=-0.2776662171899704),
 Valor(data=-0.22369437741341192),
 Valor(data=0.7872118210212933),
 Valor(data=-0.8594628170585381),
 Valor(data=0.8903808955898043),
 Valor(data=-0.502973452235352)]

In [12]:
TAXA_DE_APRENDIZADO = 0.01

loss.propagar_tudo()

for p in parametros:
    #print(p.grad)
    p.data = p.data - p.grad * TAXA_DE_APRENDIZADO

In [13]:
y_pred = []

for exemplo in x:
    previsao = minha_mlp(exemplo)
    y_pred.append(previsao)
    
print(y_pred)

[Valor(data=0.4305448012912124), Valor(data=0.4208031181355155), Valor(data=0.42826675833869304), Valor(data=0.42502200033758747)]


In [14]:
erros = []

for yt, yp in zip(y_true, y_pred):
    residuo = yp - yt
    erro_quadratico = residuo ** 2
    erros.append(erro_quadratico)
    
loss = sum(erros)
print(loss)

Valor(data=0.5590819009648694)


In [15]:
x = [
  [2.0, 3.0, -1.0],
  [3.0, -1.0, 0.5],
  [0.5, 1.0, 1.0],
  [1.0, 1.0, -1.0],
]

y_true = [1, 0, 0.2, 0.5]

NUM_DADOS_DE_ENTRADA = 3  
NUM_DADOS_DE_SAIDA = 1    
CAMADAS_OCULTAS = [3, 2]  

arquitetura_da_rede = CAMADAS_OCULTAS + [NUM_DADOS_DE_SAIDA]

minha_mlp = MLP(NUM_DADOS_DE_ENTRADA, arquitetura_da_rede)

In [16]:
NUM_EPOCAS = 200
TAXA_DE_APRENDIZADO = 0.5

for epoca in range(NUM_EPOCAS):
    # forward pass
    y_pred = []
    for exemplo in x:
        previsao = minha_mlp(exemplo)
        y_pred.append(previsao)

    # loss
    erros = []
    for yt, yp in zip(y_true, y_pred):
        residuo = yp - yt
        erro_quadratico = residuo ** 2
        erros.append(erro_quadratico)        
    loss = sum(erros)

    # zero grad
    for p in minha_mlp.parametros():
        p.grad = 0

    # backpropagation
    loss.propagar_tudo()

    # atualiza parâmetros
    for p in minha_mlp.parametros():
        p.data = p.data - p.grad * TAXA_DE_APRENDIZADO

    # mostra resultado (opcional)
    print(epoca, loss.data)

0 0.6875930747960726
1 0.6269576254870891
2 0.5951112385288666
3 0.5796430484460285
4 0.5722285975950037
5 0.5685316613105986
6 0.5665070032935927
7 0.5652197080329364
8 0.5642431334089948
9 0.5633797089988125
10 0.5625348140703653
11 0.5616598984415564
12 0.5607266373731042
13 0.5597150422390944
14 0.5586078915994328
15 0.5573880554459545
16 0.556037179577029
17 0.5545350666347642
18 0.5528595049488564
19 0.5509865082461611
20 0.5488910463937738
21 0.5465484055985513
22 0.5439363092172284
23 0.5410378237266646
24 0.5378448303874379
25 0.5343614661963932
26 0.5306065414876612
27 0.5266137806055871
28 0.5224290994870817
29 0.518105093049519
30 0.513694058469843
31 0.5092415256598531
32 0.5047819599424452
33 0.5003372765016072
34 0.4959177452129667
35 0.49152430326063934
36 0.4871512979990379
37 0.4827890009615451
38 0.47842559139709423
39 0.47404856174751664
40 0.46964562739122034
41 0.46520526387522604
42 0.46071698854051824
43 0.45617147930735324
44 0.4515605970914914
45 0.44687735623

In [17]:
y_true

[1, 0, 0.2, 0.5]

In [18]:
y_pred

[Valor(data=0.8334289279327886),
 Valor(data=0.0914476259895743),
 Valor(data=0.1969240303301453),
 Valor(data=0.5346961667960267)]

Muitos sabiam muito pouco sobre o bruxo Robert Caçador, mas segundo as lendas contadas no reino de Lumi, em sua juventude, ele era conhecido pelo psudônimo "Caçador de Moscas". Após derrotar o demônio Belzebu - o rei das moscas, o jovem Flyhunter aposentou seu punhos e dedicou-se ao aprendizado de feitições de predição de materiais. A imagem abaixo é um autorretrato feito por ele em sua juventude. 

<img src="https://images-wixmp-ed30a86b8c4ca887773594c2.wixmp.com/f/d21fddda-2c2f-4b93-a919-c1a06d4eff71/d2vtzm-dfa9dc97-4534-4d9d-af01-47e9f1710641.jpg/v1/fit/w_750,h_1248,q_70,strp/warrior_blod_by_flyhunter_d2vtzm-375w-2x.jpg?token=eyJ0eXAiOiJKV1QiLCJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJ1cm46YXBwOjdlMGQxODg5ODIyNjQzNzNhNWYwZDQxNWVhMGQyNmUwIiwiaXNzIjoidXJuOmFwcDo3ZTBkMTg4OTgyMjY0MzczYTVmMGQ0MTVlYTBkMjZlMCIsIm9iaiI6W1t7ImhlaWdodCI6Ijw9MjAzOCIsInBhdGgiOiJcL2ZcL2QyMWZkZGRhLTJjMmYtNGI5My1hOTE5LWMxYTA2ZDRlZmY3MVwvZDJ2dHptLWRmYTlkYzk3LTQ1MzQtNGQ5ZC1hZjAxLTQ3ZTlmMTcxMDY0MS5qcGciLCJ3aWR0aCI6Ijw9MTIyNSJ9XV0sImF1ZCI6WyJ1cm46c2VydmljZTppbWFnZS5vcGVyYXRpb25zIl19.KLhZ2oteH8EqANhP3sSjdrASPb8ckYClYK30XTdHwEQ" alt="alttext" width="200">

