# üëπ Fera Formid√°vel 4.1

> Atividade realizada em dupla: Caio Ruas (24010) e Thalles Cansi (24006)

Um novo n√≠vel de monstro aparece nas florestas m√°gicas de LUMI. Esta √© a primeira apari√ß√£o de um monstro do tipo **Fera Formid√°vel**. Para derrotar esta fera, precisaremos utilizar nossos conhecimentos de Redes Neurais para resolver um problema de
classifica√ß√£o. Vamos treinar uma rede neural com dados da planta √çris [1] que √© um conjunto de dados cl√°ssico em tarefas de classifica√ß√£o, possui 150 amostras com 4 atributos (comprimento e largura das s√©palas e p√©talas) e 3 classes correspondentes √†s esp√©cies de √≠ris.

![Flores de √çris](Imagens/Flores√çris.png)

<center>
Legenda 1: Diferen√ßas entre flores de √çris [2].
</center>

Estaremos utilizando o mesmo c√≥digo da aula, provido pelo professor, para construir e treinar a rede neural.

## üî¢ Valor

Esta √© a classe Valor, que representa um valor num√©rico com suporte a diferencia√ß√£o autom√°tica. Ela possui m√©todos para opera√ß√µes matem√°ticas, como adi√ß√£o, subtra√ß√£o, multiplica√ß√£o e exponencia√ß√£o, al√©m de m√©todos para calcular a fun√ß√£o sigmoide e backpropagation. √â not√≥rio lembrar que realizasse os c√°lculos mesmo com ordem invertida, onde o objeto Valor pode ser o primeiro ou segundo operando.

In [9]:
import math

class Valor:
    """
    Classe que representa um valor num√©rico com suporte a diferencia√ß√£o autom√°tica.
    
    Cada inst√¢ncia armazena:
      - data: o valor num√©rico.
      - progenitor: tupla com os valores dos quais este foi derivado.
      - operador_mae: string representando a opera√ß√£o que gerou o valor.
      - grad: gradiente (inicialmente zero) usado no backpropagation.
    """
    def __init__(self, data, progenitor=(), operador_mae="", rotulo=""):
        """
        Inicializa uma inst√¢ncia de Valor.
        
        Args:
            data (float): o valor num√©rico.
            progenitor (tuple): valores anteriores que contribu√≠ram para este.
            operador_mae (str): opera√ß√£o que gerou o valor.
            rotulo (str): r√≥tulo opcional para identifica√ß√£o.
        """
        self.data = data
        self.progenitor = progenitor
        self.operador_mae = operador_mae
        self.rotulo = rotulo
        self.grad = 0

    def __repr__(self):
        """Retorna uma representa√ß√£o string simplificada do objeto."""
        return f"Valor(data={self.data})"

    def __add__(self, outro_valor):
        """
        Sobrecarga do operador de adi√ß√£o.
        
        Realiza a opera√ß√£o: self + outro_valor.
        
        Args:
            outro_valor (Valor ou n√∫mero): valor a ser somado.
        
        Returns:
            Valor: novo objeto representando a soma.
        """
        if not isinstance(outro_valor, Valor):
            outro_valor = Valor(outro_valor)
            
        progenitor = (self, outro_valor)
        data = self.data + outro_valor.data
        operador_mae = "+"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_adicao():
            self.grad += resultado.grad
            outro_valor.grad += resultado.grad
            
        resultado.propagar = propagar_adicao
        
        return resultado

    def __mul__(self, outro_valor):
        """
        Sobrecarga do operador de multiplica√ß√£o.
        
        Realiza a opera√ß√£o: self * outro_valor.
        
        Args:
            outro_valor (Valor ou n√∫mero): valor a ser multiplicado.
        
        Returns:
            Valor: novo objeto representando o produto.
        """
        if not isinstance(outro_valor, Valor):
            outro_valor = Valor(outro_valor)
            
        progenitor = (self, outro_valor)
        data = self.data * outro_valor.data
        operador_mae = "*"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_multiplicacao():
            self.grad += resultado.grad * outro_valor.data
            outro_valor.grad += resultado.grad * self.data
            
        resultado.propagar = propagar_multiplicacao
        
        return resultado

    def exp(self):
        """
        Calcula a exponencial do valor.
        
        Realiza a opera√ß√£o: exp(self).
        
        Returns:
            Valor: novo objeto representando a exponencial.
        """
        progenitor = (self, )
        data = math.exp(self.data)
        operador_mae = "exp"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_exp():
            self.grad += resultado.grad * data 
        
        resultado.propagar = propagar_exp
        
        return resultado

    def __pow__(self, expoente):
        """
        Sobrecarga do operador de exponencia√ß√£o.
        
        Realiza a opera√ß√£o: self ** expoente.
        
        Args:
            expoente (int ou float): expoente da opera√ß√£o.
        
        Returns:
            Valor: novo objeto representando a exponencia√ß√£o.
        """
        assert isinstance(expoente, (int, float)), "Expoente deve ser um n√∫mero."
        progenitor = (self, )
        data = self.data ** expoente
        operador_mae = f"**{expoente}"
        resultado = Valor(data, progenitor, operador_mae)
        
        def propagar_pow():
            self.grad += resultado.grad * (expoente * self.data ** (expoente - 1))
        
        resultado.propagar = propagar_pow
        
        return resultado

    def __truediv__(self, outro_valor):
        """
        Sobrecarga do operador de divis√£o.
        
        Realiza a opera√ß√£o: self / outro_valor.
        
        Args:
            outro_valor (Valor ou n√∫mero): divisor.
        
        Returns:
            Valor: novo objeto representando a divis√£o.
        """
        return self * outro_valor ** (-1)

    def __neg__(self):
        """
        Sobrecarga do operador de nega√ß√£o.
        
        Realiza a opera√ß√£o: -self.
        
        Returns:
            Valor: novo objeto representando o valor negativo.
        """
        return self * -1

    def __sub__(self, outro_valor):
        """
        Sobrecarga do operador de subtra√ß√£o.
        
        Realiza a opera√ß√£o: self - outro_valor.
        
        Args:
            outro_valor (Valor ou n√∫mero): valor a ser subtra√≠do.
        
        Returns:
            Valor: novo objeto representando a subtra√ß√£o.
        """
        return self + (-outro_valor)

    def __radd__(self, outro_valor):
        """
        Sobrecarga do operador de adi√ß√£o reversa.
        
        Permite opera√ß√µes onde Valor est√° √† direita: outro_valor + self.
        
        Args:
            outro_valor (Valor ou n√∫mero): valor a ser somado.
        
        Returns:
            Valor: resultado da adi√ß√£o.
        """
        return self + outro_valor

    def __rmul__(self, outro_valor):
        """
        Sobrecarga do operador de multiplica√ß√£o reversa.
        
        Permite opera√ß√µes onde Valor est√° √† direita: outro_valor * self.
        
        Args:
            outro_valor (Valor ou n√∫mero): valor a ser multiplicado.
        
        Returns:
            Valor: resultado da multiplica√ß√£o.
        """
        return self * outro_valor

    def sig(self):
        """
        Calcula a fun√ß√£o sigmoide.
        
        Realiza a opera√ß√£o: exp(self) / (exp(self) + 1).
        
        Returns:
            Valor: novo objeto representando o resultado da sigmoide.
        """
        return self.exp() / (self.exp() + 1)

    def propagar(self):
        """
        Fun√ß√£o de propaga√ß√£o (backpropagation) do gradiente.
        
        Este m√©todo deve ser sobrescrito pelas opera√ß√µes espec√≠ficas.
        """
        pass

    def propagar_tudo(self):
        """
        Executa o backpropagation atrav√©s de todos os n√≥s (valores) conectados.
        
        Atribui gradiente 1 ao v√©rtice folha e propaga recursivamente utilizando uma ordem topol√≥gica dos n√≥s.
        """
        self.grad = 1
        ordem_topologica = []
        visitados = set()

        def constroi_ordem_topologica(v):
            if v not in visitados:
                visitados.add(v)
                for progenitor in v.progenitor:
                    constroi_ordem_topologica(progenitor)
                ordem_topologica.append(v)

        constroi_ordem_topologica(self)

        for vertice in reversed(ordem_topologica):
            vertice.propagar()


Para termos o dataset e poder realizar as avalia√ß√µes da nossa rede neural, bem como realizar alguns c√°lculos matem√°ticos, vamos importar as bibliotecas necess√°rias e carregar o dataset. 

In [10]:
import seaborn as sns
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder

O dataset Iris cont√©m informa√ß√µes sobre tr√™s esp√©cies de flores: setosa, versicolor e virginica. Cada amostra possui quatro atributos: comprimento e largura das s√©palas e p√©talas.

In [11]:
iris = sns.load_dataset('iris')
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
0,5.1,3.5,1.4,0.2,setosa
1,4.9,3.0,1.4,0.2,setosa
2,4.7,3.2,1.3,0.2,setosa
3,4.6,3.1,1.5,0.2,setosa
4,5.0,3.6,1.4,0.2,setosa


Vamos transformar as classes em valores num√©ricos e dividir os dados em conjuntos de treino e teste.

In [12]:
le = LabelEncoder()
iris['species'] = le.fit_transform(iris['species'])

X = iris.drop('species', axis=1).values
y = iris['species'].values

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

Vamos usar a implementa√ß√£o de MLP j√° existente no notebook para criar e treinar a rede neural.

In [13]:
NUM_DADOS_DE_ENTRADA = 4
NUM_DADOS_DE_SAIDA = 3
CAMADAS_OCULTAS = [5, 5]

arquitetura_da_rede = CAMADAS_OCULTAS + [NUM_DADOS_DE_SAIDA]

minha_mlp = MLP(NUM_DADOS_DE_ENTRADA, arquitetura_da_rede)

NameError: name 'MLP' is not defined

Vamos treinar a rede neural usando o conjunto de treino e calcular a perda em cada √©poca.

In [None]:
NUM_EPOCAS = 200
TAXA_DE_APRENDIZADO = 0.01

for epoca in range(NUM_EPOCAS):
    y_pred = []
    for exemplo in X_train:
        previsao = minha_mlp(exemplo)
        y_pred.append(previsao)

    erros = []
    for yt, yp in zip(y_train, y_pred):
        residuo = yp - yt
        erro_quadratico = residuo**2
        erros.append(erro_quadratico)
    loss = sum(erros)

    for p in minha_mlp.parametros():
        p.grad = 0

    loss.propagar_tudo()

    for p in minha_mlp.parametros():
        p.data = p.data - p.grad * TAXA_DE_APRENDIZADO

    if epoca % 10 == 0:
        print(f"√âpoca {epoca}, Perda: {loss.data}")

## Avalia√ß√£o da Rede Neural

Vamos avaliar o desempenho da rede neural no conjunto de teste.

## ü§ì Neur√¥nio

A classe Neur√¥nio representa um neur√¥nio em uma rede neural. Ela possui pesos e um vi√©s, que s√£o inicializados aleatoriamente. O neur√¥nio calcula a sa√≠da usando a fun√ß√£o sigmoide e realiza o backpropagation para atualizar os pesos e o vi√©s com base no erro da previs√£o.

In [None]:
import random


class Neuronio:
    """
    Representa um neur√¥nio simples com pesos e vi√©s para uso em uma rede neural.

    Este neur√¥nio utiliza a classe Valor para armazenar seus par√¢metros e realizar a
    diferencia√ß√£o autom√°tica durante o treinamento.
    """

    def __init__(self, num_dados_entrada):
        """
        Inicializa um neur√¥nio com um n√∫mero especificado de entradas.

        Args:
            num_dados_entrada (int): n√∫mero de entradas para o neur√¥nio.
        """
        self.vies = Valor(random.uniform(-1, 1))

        self.pesos = []
        for i in range(num_dados_entrada):
            self.pesos.append(Valor(random.uniform(-1, 1)))

    def __call__(self, x):
        """
        Realiza a passagem forward do neur√¥nio.

        Calcula a soma ponderada das entradas e aplica a fun√ß√£o sigmoide para
        determinar a sa√≠da do neur√¥nio.

        Args:
            x (list[Valor]): lista de objetos Valor representando as entradas.

        Returns:
            Valor: objeto Valor representando a sa√≠da do neur√¥nio.
        """
        assert len(x) == len(
            self.pesos
        ), "O n√∫mero de entradas deve ser igual ao n√∫mero de pesos."

        soma = 0
        for info_entrada, peso_interno in zip(x, self.pesos):
            soma += info_entrada * peso_interno

        soma += self.vies

        dado_de_saida = soma.sig()

        return dado_de_saida

    def parametros(self):
        """
        Retorna uma lista com os par√¢metros do neur√¥nio (pesos e vi√©s).

        Returns:
            list[Valor]: lista contendo os pesos e o vi√©s.
        """
        return self.pesos + [self.vies]

## üéÇ Camada

A classe Camada representa uma camada de neur√¥nios em uma rede neural. Ela possui um n√∫mero espec√≠fico de neur√¥nios e √© respons√°vel por calcular a sa√≠da da camada com base nas entradas recebidas. Realiza o forward pass e agrega os parametros de cada neur√¥nio.

In [None]:
class Camada:
    """
    Representa uma camada em uma rede neural composta por m√∫ltiplos neur√¥nios.

    Cada camada gerencia um conjunto de neur√¥nios, realizando a passagem forward
    e agregando os par√¢metros (pesos e vi√©s) de cada neur√¥nio.
    """

    def __init__(self, num_neuronios, num_dados_entrada):
        """
        Inicializa a camada com um n√∫mero espec√≠fico de neur√¥nios, cada um com
        um determinado n√∫mero de entradas.

        Args:
            num_neuronios (int): n√∫mero de neur√¥nios na camada.
            num_dados_entrada (int): n√∫mero de entradas para cada neur√¥nio.
        """
        self.neuronios = []
        for _ in range(num_neuronios):
            neuronio = Neuronio(num_dados_entrada)
            self.neuronios.append(neuronio)

    def __call__(self, x):
        """
        Realiza a passagem forward na camada.

        Aplica cada neur√¥nio da camada √† mesma entrada e retorna os dados de sa√≠da.

        Args:
            x (list[Valor]): lista de objetos Valor representando as entradas da camada.

        Returns:
            Valor ou list[Valor]: sa√≠da de um √∫nico neur√¥nio se houver apenas um,
            ou lista com as sa√≠das de todos os neur√¥nios.
        """
        dados_de_saida = []
        for neuronio in self.neuronios:
            informacao = neuronio(x)
            dados_de_saida.append(informacao)

        if len(dados_de_saida) == 1:
            return dados_de_saida[0]
        else:
            return dados_de_saida

    def parametros(self):
        """
        Agrega e retorna todos os par√¢metros (pesos e vi√©s) de cada neur√¥nio da camada.

        Returns:
            list[Valor]: lista contendo todos os par√¢metros dos neur√¥nios da camada.
        """
        params = []
        for neuronio in self.neuronios:
            params_neuronio = neuronio.parametros()
            params.extend(params_neuronio)

        return params

## üß† MLP

Por fim, nossa √∫ltima classe da nossa rede neural √© a `MLP` (Multi-Layer Perceptron). Ela representa uma rede neural com m√∫ltiplas camadas. A `MLP` organiza as camadas da rede, permitindo a passagem forward dos dados e a agrega√ß√£o dos par√¢metros de todas as camadas.

In [None]:
class MLP:
    """
    Representa uma rede neural do tipo MLP (Multi-Layer Perceptron).

    Essa classe organiza as camadas da rede, permitindo a passagem forward dos dados e
    a agrega√ß√£o dos par√¢metros (pesos e vi√©s) de todas as camadas.
    """

    def __init__(self, num_dados_entrada, num_neuronios_por_camada):
        """
        Inicializa a MLP com um n√∫mero definido de entradas e uma lista que especifica
        o n√∫mero de neur√¥nios em cada camada.

        Args:
            num_dados_entrada (int): n√∫mero de entradas da rede.
            num_neuronios_por_camada (list[int]): lista com o n√∫mero de neur√¥nios para cada camada.
        """
        percurso = [num_dados_entrada] + num_neuronios_por_camada

        camadas = []
        for i in range(len(num_neuronios_por_camada)):
            camada = Camada(num_neuronios_por_camada[i], percurso[i])
            camadas.append(camada)

        self.camadas = camadas

    def __call__(self, x):
        """
        Realiza a passagem forward pela rede.

        Cada camada processa a entrada e o resultado √© passado para a pr√≥xima camada.

        Args:
            x (list[Valor] ou Valor): dados de entrada para a rede.

        Returns:
            Valor ou list[Valor]: sa√≠da final da rede ap√≥s a passagem por todas as camadas.
        """
        for camada in self.camadas:
            x = camada(x)
        return x

    def parametros(self):
        """
        Agrega e retorna todos os par√¢metros (pesos e vi√©s) de todas as camadas da rede.

        Returns:
            list[Valor]: lista contendo os par√¢metros de cada camada.
        """
        params = []
        for camada in self.camadas:
            parametros_camada = camada.parametros()
            params.extend(parametros_camada)

        return params

In [None]:
# Avalia√ß√£o
y_pred_test = []
for exemplo in X_test:
    previsao = minha_mlp(exemplo)
    y_pred_test.append(np.argmax(previsao))

# Calculando acur√°cia
acuracia = np.mean(y_pred_test == y_test)
print(f'Acur√°cia no conjunto de teste: {acuracia * 100:.2f}%')

# üìñ Refer√™ncias

[1] Conjunto de dados Iris. UCI Machine Learning Repository. Dispon√≠vel em: https://archive.ics.uci.edu/dataset/53/iris. Acesso em: 05 de Abril de 2025.

[2] Conjunto de dados Iris. Wikipedia. Dispon√≠vel em: https://pt.wikipedia.org/wiki/Conjunto_de_dados_flor_Iris. Acesso em: 05 de Abril de 2025.