# 3 - Monstrinhos

## 3.5 Forma, função e ativação

### Introdução:

O objetivo desta atividade é implementar 3 novas funções de ativação da rede neural feita em Python
puro nos vídeos da disciplina, descrevendo brevemente sobre estas funções de ativação e suas diferenças com relação à função de ativação sigmoidal. Além disso, mostrou-se alguns exemplos de que o código funciona rodando alguns testes simples.

#### Função ReLU (Unidade Linear Retificada):

#### Função Tanh (Tangente Hiperbólica):

#### Função Softmax:

### Desenvolvimento:

Importando as bibliotecas necessárias:

In [5]:
import math
import random

Definindo as classes principais da rede neural, contendo cada neurônio e camada. Essas classes foram baseadas no material de aula do Daniel Cassar [] e do vídeo do Andrej Karpathy [], adaptando para as funções de ativação escolhidas. Definindo as 3 funções na classe Valor:

In [1]:
class Valor:
    def __init__(self, data, progenitor=(), operador_mae="", rotulo=""):
        self.data = data
        self.progenitor = progenitor
        self.operador_mae = operador_mae
        self.rotulo = rotulo
        self.grad = 0

    def __repr__(self):
        return f"Valor(data={self.data})"
    
    def __add__(self, outro_valor):
        """Realiza a operação: self + outro_valor."""
        
        if not isinstance(outro_valor, Valor):
            outro_valor = Valor(outro_valor)
            
        progenitor = (self, outro_valor)
        data = self.data + outro_valor.data
        operador_mae = "+"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_adicao():
            self.grad += resultado.grad
            outro_valor.grad += resultado.grad
            
        resultado.propagar = propagar_adicao
        
        return resultado
    
    def __mul__(self, outro_valor):
        """Realiza a operação: self * outro_valor."""
        
        if not isinstance(outro_valor, Valor):
            outro_valor = Valor(outro_valor)
            
        progenitor = (self, outro_valor)
        data = self.data * outro_valor.data
        operador_mae = "*"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_multiplicacao():
            self.grad += resultado.grad * outro_valor.data # grad_filho * derivada filho em relação a mãe
            outro_valor.grad += resultado.grad * self.data
            
        resultado.propagar = propagar_multiplicacao
        
        return resultado
    
    def exp(self):
        """Realiza a operação: exp(self)"""
        progenitor = (self, )
        data = math.exp(self.data)
        operador_mae = "exp"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_exp():
            self.grad += resultado.grad * data 
        
        resultado.propagar = propagar_exp
        
        return resultado
    
    def __pow__(self, expoente):
        """Realiza a operação: self ** expoente"""
        assert isinstance(expoente, (int, float))
        progenitor = (self, )
        data = self.data ** expoente
        operador_mae = f"**{expoente}"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_pow():
            self.grad += resultado.grad * (expoente * self.data ** (expoente - 1))
        
        resultado.propagar = propagar_pow
        
        return resultado
    
    def __truediv__(self, outro_valor):
        """Realiza a operação: self / outro_valor"""
        return self * outro_valor ** (-1)
    
    def __neg__(self):
        """Realiza a operação: -self"""
        return self * -1
    
    def __sub__(self, outro_valor):
        """Realiza a operação: self - outro_valor"""
        return self + (-outro_valor)
    
    def __radd__(self, outro_valor):
        """Realiza a operação: outro_valor + self"""
        return self + outro_valor
    
    def __rmul__(self, outro_valor):
        """Realiza a operação: outro_valor * self"""
        return self * outro_valor
    
    # Funções de ativação
    def sig(self):
        """Função Sigmoide. Realiza a operação: exp(self) / (exp(self) + 1)"""
        return self.exp() / (self.exp() + 1)

    def relu(self):
        """Função ReLU. Realiza a operação: max(0, self), """

        progenitor = (self, )
        data = 0 if self.data < 0 else self.data
        operador_mae = "ReLU"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_relu():
            self.grad += (resultado.data > 0) * resultado.grad 
        
        resultado.propagar = propagar_relu
        
        return resultado

    def tanh(self):
        """Função tangente hiperbólica. Realiza a operação: exp(self) - exp(-self) / exp(self) + exp(-self)"""

        progenitor = (self, )
        data = 
        operador_mae = "Tanh"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_tanh():
            self.grad += (resultado.data > 0) * resultado.grad 
        
        resultado.propagar = propagar_tanh
        
        return resultado

    def tanh(self):
        x = self.data
        t = (math.exp(2*x) - 1)/(math.exp(2*x) + 1)
        out = Value(t, (self, ), 'tanh')
    
        def _backward():
            self.grad += (1 - t**2) * out.grad
        out._backward = _backward
        
        return out

    #def softmax(self):
        #"""Função Softmax. Realiza a operação: exp(self) / (exp(self) + 1)"""
        #return self.exp() / (self.exp() + 1)

    
    def propagar(self):
        pass
    
    def propagar_tudo(self):
        
        self.grad = 1
        
        ordem_topologica = []
        
        visitados = set()

        def constroi_ordem_topologica(v):
            if v not in visitados:
                visitados.add(v)
                for progenitor in v.progenitor:
                    constroi_ordem_topologica(progenitor)
                ordem_topologica.append(v)

        constroi_ordem_topologica(self)
        
        for vertice in reversed(ordem_topologica):
            vertice.propagar()

In [8]:
# Softmax
# Calculate exp(x) for each element
    #exp_x = np.exp(shifted_x)
    
    # Calculate the sum of exp(x) for normalization
    #sum_exp_x = np.sum(exp_x, axis=-1, keepdims=True)
    
    # Normalize to get probabilities
    #probabilities = exp_x / sum_exp_x
    
    #return probabilities

Tanh: f(x) = (e^x - e^-x) / (e^x + e^-x)

Relu: f(x) = max(0, x)

Soft: f(xi) = e^xi / Σj e^xj

Na classe Neuronio é possível escolher a função de ativação desejada como argumento para criar um neurônio, aplicando ao dado de saída:

In [7]:
class Neuronio:
    def __init__(self, num_dados_entrada, fc = 'Sigmoide'):
        """Modo de representar cada neurônio da rede neural
        
        Args:
            num_dados_entrada: inteiro, indica o número de dados de entrada do neurônio
            fc: string, indica a função de ativação aplicada ao neurônio, podendo ser:
                - Sigmoide (padrão)
                - ReLU
                - Tanh
                - Softmax

        Return
            Ao ser chamada retorna o valor de saída do neurônio (tipo Valor) após transformar 
            os dados de entrada com o peso, viés e função de ativação
        """
        
        self.vies = Valor(random.uniform(-1, 1))
        
        self.pesos = []
        for i in range(num_dados_entrada):
            self.pesos.append(Valor(random.uniform(-1, 1)))

        self.funcao = fc
                    
    def __call__(self, x):
        
        assert len(x) == len(self.pesos)
        
        soma = 0
        for info_entrada, peso_interno in zip(x, self.pesos):
            soma += info_entrada * peso_interno
            
        soma += self.vies  

        if self.funcao == "Sigmoide":
            dado_de_saida = soma.sig() 
        elif self.funcao == "ReLU":
            dado_de_saida = soma.relu() 
        elif self.funcao == "Tanh":
            dado_de_saida = soma.tanh() 
        elif self.funcao == "Softmax":
            # usar um if pra certificar que é a camada de saída (aplicar só 1 vez)
            dado_de_saida = soma.softmax()  

        return dado_de_saida       
    
    def parametros(self):
        return self.pesos + [self.vies]

As outras classes mantém-se constantes:

In [3]:
class Camada:
    def __init__(self, num_neuronios, num_dados_entrada):
        neuronios = []
        
        for _ in range(num_neuronios):
            neuronio = Neuronio(num_dados_entrada)
            neuronios.append(neuronio)
            
        self.neuronios = neuronios     
        
    def __call__(self, x):
        dados_de_saida = []
        
        for neuronio in self.neuronios:
            informacao = neuronio(x)
            dados_de_saida.append(informacao)
            
        if len(dados_de_saida) == 1:
            return dados_de_saida[0]
        else:        
            return dados_de_saida  
    
    def parametros(self):
        params = []
        
        for neuronio in self.neuronios:
            params_neuronio = neuronio.parametros()
            params.extend(params_neuronio)
        
        return params

In [4]:
class MLP:
    def __init__(self, num_dados_entrada, num_neuronios_por_camada):
        
        percurso = [num_dados_entrada] + num_neuronios_por_camada
        
        camadas = []
        
        for i in range(len(num_neuronios_por_camada)):
            camada = Camada(num_neuronios_por_camada[i], percurso[i])
            camadas.append(camada)
            
        self.camadas = camadas
        
    def __call__(self, x):
        for camada in self.camadas:
            x = camada(x)
        return x
    
    def parametros(self):
        params = []
        
        for camada in self.camadas:
            parametros_camada = camada.parametros()
            params.extend(parametros_camada)
            
        return params

### Conclusão:

### Referências:

[1] 

[2] 