# Inteligência Artificial - Trabalho
- Universidade Federal de Santa Catarina
- Departamento de Automação e Sistemas
- Prof. Eric Aislan Antonelo

### Grupo
-

### Opção: 1

#### 1. Implementação:
- Crie as estruturas de dados para guardar os pesos que definem uma arquitetura
de rede neural multi-camadas. Inicialize a rede neural aleatoriamente.
- Implemente o algoritmo da retropropagação para o cálculo do gradiente, a
derivada parcial da função de custo com relação aos pesos da rede.
- Valide o algoritmo do cálculo do gradiente, realizando uma aproximação numérica
do mesmo. Verifique se os cálculos batem um com o outro.
- Dado o gradiente já calculado, implemente o método do descenso do gradiente
para o treinamento da rede neural, ou seja, o processo de ajuste dos pesos.

#### 2. Aplicação:
- Use o código implementado para treinar uma rede neural para realizar a classificação de um padrão de duas dimensões de entrada. Os dados para treinamento
estão disponíveis no arquivo
classification2.txt.
Para plotar a fronteira de decisão da rede treinada, poderá usar o código
disponível no link
https://colab.research.google.com/drive/1XTtZGgpAefbiWejTrEjsnWzS_
XXYdzff?usp=sharing.
- Relate resultados variando pelo menos duas vezes cada um dos hiperparâmetros: o número de camadas; o número de neurônios por camada; taxa de aprendizagem. Use métricas como taxa de classificação (porcentagem de predições
corretas) no conjunto de validação (exemplos não usados no treinamento).
- (opcional) Treine uma rede neural para classificar dígitos a partir de imagens
como entrada para a rede. Use o arquivo
classification3.mat.

#### 3. Entregas:
No relatório a ser entregue, descreva os experimentos e os resultados obtidos.
Grave um video de até 3 minutos, onde você deve explicar o código implementado
de uma forma geral, as dificuldades encontradas, e em especial:
- a parte do código referente ao cálculo do gradiente
- a parte do código referente ao gradient descent
- o gráfico da fronteira de decisão
Entregue o código, PDF do relatório e o arquivo de video pelo Moodle (zipado com
ZIP ou tar.gz).

In [1]:
import pandas as pd
import numpy as np

### Data source

In [2]:
df = pd.read_csv('classification2.txt', header=None)
df.columns = ['column1', 'column2', 'label']
df.info()
print(f'\nLabel Value counts: \n{df.label.value_counts()}')
df.head()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 118 entries, 0 to 117
Data columns (total 3 columns):
 #   Column   Non-Null Count  Dtype  
---  ------   --------------  -----  
 0   column1  118 non-null    float64
 1   column2  118 non-null    float64
 2   label    118 non-null    int64  
dtypes: float64(2), int64(1)
memory usage: 2.9 KB

Label Value counts: 
0    60
1    58
Name: label, dtype: int64


Unnamed: 0,column1,column2,label
0,0.051267,0.69956,1
1,-0.092742,0.68494,1
2,-0.21371,0.69225,1
3,-0.375,0.50219,1
4,-0.51325,0.46564,1


In [63]:
X = df.iloc[:, :-1]
n_samples = X.shape[0]
n_features = X.shape[1]
y = df.iloc[:, -1]

# TODO: Scale data

### Neural net data structure

In [73]:
class Neuron():
    def __init__(self, input_length):
        self.bias = 1
        self.weights = self.create_random_weights(input_length)
        
    def create_random_weights(self, input_length):
        return np.random.randn(input_length)
        
    def __repr__(self):
        return f'Neuron {self.weights}'
    
class Layer():
    def __init__(self, input_length, n_neurons):
        self.input_length = input_length
        self.n_neurons = n_neurons
        self.create_neurons()
    
    def create_neurons(self):
        """Creates neurons of layer
        """
        self.neurons = list()
        for i in range(self.n_neurons):
            self.neurons.append(
                Neuron(self.input_length)
            )
            
    def as_weight_matrix(self):
        """Represents layer's weights as a matrix, where each column is a neuron.
        """
        return np.array([n.weights for n in self.neurons]).T
    
    def as_bias_matrix(self):
        """Represents layer's biases as a matrix, where each column is a neuron.
        """
        return [n.bias for n in self.neurons]
            
    def transform(self, input_data):
        """Calculates layer output based on input data
        """
        return np.dot(input_data, self.as_weight_matrix()) + self.as_bias_matrix()
    
def relu(data):
    return np.maximum(0, data)
  
def sigmoid(data):
    return 1 / (1 + np.exp(-data)) 

class NeuralNet():
    def __init__(self, *layers, activation=None):
        self.layers = layers
        self.activation = activation
    
    def transform(self, X):
        X_transformed = X.copy()
        for layer in self.layers:
            X_transformed = self.activation(
                layer.transform(X_transformed)
            )
        
        return X_transformed
    
    def cost(self, X, y):
        hx = np.array(nn.transform(X).flat)
        log1_hx = np.log(hx)
        log2_hx = np.log(1 - hx)
        return -np.sum(
            np.multiply(log1_hx, y) + np.multiply((1 - y), log2_hx)
        ) / n_samples

In [74]:
layer1 = Layer(input_length=n_features, n_neurons=3)
layer2 = Layer(input_length=3, n_neurons=1)

nn = NeuralNet(layer1, layer2, activation=sigmoid)
nn.cost(X, y)

0.7187831362632758