<a href="https://colab.research.google.com/github/MoroFernando/perceptron/blob/main/Perceptron.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

A ideia deste notebook é construir uma rede neural básica a fim de entender seu funcionamento. Começaremos construindo primeiro um Perceptron simples, e posteriormente agrupalos em uma rede multilayer (MLP)

In [229]:
# Definimos alguns imports necessários
import random # Importa número aleatórios

# Perceptron: a estrutura básica

In [230]:
class Perceptron:
  def __init__(self, num_weights):
    self.weights = [random.uniform(-1, 1) for _ in range(num_weights)] # Inicia o Perceptron criando atributos de peso com valores aleatórios entre -1 e 1. Ex: [-0.87, -0.02, 0.56]
    self.bias = random.uniform(-1, 1) # Cria um número alea'torio para o bias também

  # Derfine um funcão step (degrau). Esta função será usada como funcão de ativaçao do nosso Perceptron
  def step(self, input):
    if input > 0:
      return 1
    else:
      return 0

  # Método usado para prever o resultado com base nos dados de entrada
  def predict(self, value):
    input = 0
    # Soma todos os valores de entrada multiplicados pelos respectivos pesos
    for idx, weight in enumerate(self.weights):
      input += value[idx] * weight
    # Adiciona o valor do bias
    input += self.bias
    return self.step(input)

In [231]:
# Cria um Perceptron com 3 parametros
perceptron = Perceptron(3)

Para exemplificar o uso do nosso Perceptron, vamos modelar um problema simples do dia a dia:

### **"Devo levar um guarda-chuva hoje?"**

Para tomar essa decisão, podemos considerar alguns fatores importantes que servirão como entradas para o nosso Perceptron:

*   **x1 = Está chovendo agora?** (0 para Não, 1 para Sim)
*   **x2 = Há previsão de chuva para hoje?** (0 para Não, 1 para Sim)
*   **x3 = O céu está nublado ou escuro?** (0 para Não, 1 para Sim)

Com base na combinação dessas três informações, nosso Perceptron de 3 parâmetros deverá nos ajudar a decidir se devemos ou não levar o guarda-chuva. Por meio de uma resposta binária: (0 para Não levar, 1 para Levar).

O Perceptron em sí não tem capacidade de interpetrar as informações (x1, x2, x3) da forma que nós humanos fazemos. Porém ele poderá atribuir um significado númerico por meio dos seus parâmetros de modo a atribuir a cada informação (x) um parâmetro (peso) específico. Assim conseguindo fazer com que parâmetros com pesos maiores, impactem mais no resultado final. Da mesma forma que se "estiver chovendo", as demais informaçoes de "previsão de chuva" ou "céu escuro" não importarem tanto, pois já irei levar o guarda chuva de qualquer forma.

In [232]:
# Dados de entrada (X) e saída esperada (y) para o problema do guarda-chuva.
# As entradas são: [Está chovendo agora (x1), Há previsão de chuva (x2), O céu está nublado (x3)]
# A saída esperada (y) é: 1 para "Levar guarda-chuva", 0 para "Não levar guarda-chuva"


# Por ser um problema pequeno de apenas 3 variáveis, podemos ilustrar todas as combinações possíveis na lista abaixo:
X = [
  [0, 0, 0], # Não chove, sem previsão, céu claro
  [0, 0, 1], # Não chove, sem previsão, céu escuro
  [0, 1, 0], # Não chove, com previsão, céu claro
  [0, 1, 1], # Não chove, com previsão, céu escuro
  [1, 0, 0], # Chovendo, sem previsão, céu claro
  [1, 0, 1], # Chovendo, sem previsão, céu escuro
  [1, 1, 0], # Chovendo, com previsão, céu claro
  [1, 1, 1],  # Chovendo, com previsão, céu escuro
]

y = [
    0, # Não chove, não tem previsão, céu claro -> Não leva
    0, # Não chove, não tem previsão, céu escuro -> Não leva
    0, # Não chove, tem previsão, céu claro -> Não leva
    1, # Não chove, tem previsão, céu escuro -> Leva
    1, # Chove, não tem previsão, céu claro -> Leva
    1, # Chove, não tem previsão, céu escuro -> Leva
    1, # Chove, tem previsão, céu claro -> Leva
    1, # Chove, tem previsão, céu escuro -> Leva
]


# Comumente representamos os dados pela letra "X" e os resultados esperados pela letra "y", de modo que ambas as listas terão o mesmo tamanho.
# Assim para saber qual seria a resposta esperada para o Problema X[índice], basta acessar a resposta ou label em y[índice]

Quando criamos nosso percetron, os valores dos seus parâmetros foram criados de forma aleatória. Ou seja, é como se ele não "soubesse" qual das informacões tem maior impacto na decisão final de levar ou não o guarda chuva

Se pedirmos a ele para prever se devmos levar o guarda chuva ou não, passando as 3 informações necessárias, ele irá computar o resultado com base nese valores de parâmetros inicias.

Vamos pedir para nos dizer se devemos ou não levar o guarda chuva se estiver chovendo, com previsão de chuva e o céu estando escuro.

In [233]:
# Definimos qual o índice dos dados "X" contém esse exemplo que queremos trabalhar, que no caso é o índice = 7
idx = 7

# Agora podemos chamar o método de prever uma reposta com base em uma entrada do perceptron
resposta = perceptron.predict(X[idx])

print(resposta)

0


Pelo fato de os parâmetros serem definidos de forma aletória na hora de criar o Perceptron, não temos como prever qual resposta ele nos dará de início, podendo tanto responder algo aparentemente correto para o nosso problema do Guarda Chuva, como por exemplo não leva-lo em um dia ensolarado sem chuva, mas também responder para não leva-lo em um dia chuvoso.

Para tronar o nosso Perceptron mais "inteligente", vamos treiná-lo para que possa responder com mais precisão ao nosso problema do Guarda Chuva

---

# Treinamento do Perceptron

O processo de treinamento de um Perceptron acontece pelo ato de passarmos uma grande quantidade de dados por várias vezes em sequência, de modo que em cada iteração, o Perceptron poderá "comparar" o resultado que ele deu, com o resultado que esperávamos e categorizamos como certo. Para essa abordagem de treinamento damos o nome de

####**Treinamento supervisionado**.

Supervisionado por que nós que dizemos de antemão qual é a resposta certa para determinado conjundo de informações iniciais. É como se falassemos: "Se não estiver chovendo **(x1 = 0)**, sem previsão de chuva **(x2 = 0)**, e com o céu claro **(x3 = 0)**. Não precisamos levar o guarda chuva **(y = 0)**"

Fazemos essa iteração para todos os dados do nosso conjunto, no nosso caso, o "X". E fazemos essa iteração sobres todos os dados mais de uma vez, como se fosse dar voltas em uma pista de corrida, cada "volta" chamamos de **época**.

Toda vez que o Perceptron responder errado durante o treinamento, ele deve ajustar os seus parâmetros a fim de tentar minimizar o erro. Esse ajuste segue uma fórmula matemática que não entrarei em detalhes aqui, porém para saber o "quanto" deve ser ajustado para cada erro, o Perceptron precisa ter alguma informação que diga o nível de ajuste a ser feito. Para isso damos o nome de **Taxa de aprendizado**.

In [239]:
# Aqui vamos reutilizar a classe Percetron construída anteriormente, porém com a adição de novos atributos e metódos necessários para o treinamento ocorrer.
class Perceptron:
  def __init__(self, num_weights):
    self.weights = [random.uniform(-1, 1) for _ in range(num_weights)]
    self.bias = random.uniform(-1, 1)

  def step(self, input):
    if input > 0:
      return 1
    else:
      return 0

  def predict(self, value):
    input = 0
    for idx, weight in enumerate(self.weights):
      input += value[idx] * weight
    input += self.bias
    return self.step(input)

  # Definimos um metodo de treinamento que recebe as series de informaçoes (data) e gabarito das repostas (labels) além de também a informação de quantas épocas queremos utilizar e qual a taxa de aprendizado
  def fit(self, data, labels, epochs = 10, learning_rate = 0.1):
    # Percorre cada epoca que definimos
    for epoch in range(epochs):
      # Para cada época, percorremos todos os dados
      for idx, value in enumerate(data):
        label = labels[idx]
        # Faz a predicao
        predict = self.predict(value)
        # Calcula o erro em relacao ao label
        error = label - predict

        # Ajuste os parametros em caso de erro
        if error != 0:
          # Percorre cada parametro do Perceptron para realizar o ajuste
          for i in range(len(self.weights)):
            self.weights[i] = self.adjust_weight(self.weights[i], error, value[i], learning_rate)
          # Ajusta o bias
          self.bias = self.adjust_weight(self.bias, error, 1, learning_rate)

  # Função de ajuste do parâmetro
  def adjust_weight(self, weight, error, value, learning_rate):
    return weight + (learning_rate * error * value)


In [235]:
# Instanciamos novamente o perceptron agora contendo o método de treinamento
perceptron = Perceptron(3)

# Chamamos o método de treinamento. Não passaremos o valor para épocas e taxa de aprendizado, assim o Perceptron usará os valores padrão
perceptron.fit(X, y)

Agora que realizamos o treinamento, vamos tentar fazer uma nova previsão com o Perceptron. Vamos utilizar as mesmas informações de antes.

In [236]:
idx = 7
resposta = perceptron.predict(X[idx])
print(resposta)

1


Agora o Perceptron conseguiu prever corretamente. Porém ainda não sabemos extamente se foi ao acaso, ou treinamento de fato foi bom o suficiente para ele acertar outros resultados. Para isso vamos pdeir para que ele preveja as repostas para todos os nossos dados "X", e na sequência comparamos todas as repostas com o gabarito "y" que temos, assim conseguimos dizer quantos porcento o Perceptron foi capaz de responder corretamente.

In [237]:
# Iniciamos definindo uma llista onde será armazenado as previsões feitas pelo Perceptron
predictions = []

# Agora percorremos cada dado no nosso conjunto de dados X e fazemos a predicão
for i in range(len(X)):
  predictions.append(perceptron.predict(X[i]))

# Contamos o número de acerto comparando as predicões do Perceptron com nosso gabarito "y"
correct_predictions = 0
for i in range(len(y)):
  if predictions[i] == y[i]:
    correct_predictions += 1

# Calculamos a porcentagem de acerto
accuracy = correct_predictions / len(y)

print(f'Número de acertos: {correct_predictions}')
print(f'Número de testes: {len(y)}')
print(f'Porcentagem de acertos: {accuracy}')

Número de acertos: 8
Número de testes: 8
Porcentagem de acertos: 1.0
