# Atividade de Redes Neurais de Emanuel Lopes Silva

Este notebook foi desenvolvido como um guia teórico e prático introdutório sobre Redes Neurais Artificiais (RNAs), com o objetivo de apresentar os conceitos fundamentais e exemplos de implementação em Python de forma clara e acessível.

As Redes Neurais Artificiais são sistemas computacionais inspirados na estrutura e no funcionamento do cérebro humano. Elas utilizam unidades chamadas neurônios artificiais, organizadas em camadas e interconectadas por pesos sinápticos, os quais são ajustados automaticamente durante o aprendizado. Com isso, as RNAs são capazes de identificar padrões, realizar classificações e fazer previsões com base em dados, sendo amplamente utilizadas em diversas aplicações da inteligência artificial.


#1. Introdução ao modelo de Perceptron



##1.1. O que é o Perceptron?

###1.1.1 Definição e propósito

O Perceptron é considerado o primeiro modelo computacional de rede neural com capacidade de aprendizado supervisionado, sendo formulado por Frank Rosenblatt, em 1958. Seu objetivo era simular o processo de reconhecimento de padrões por organismos biológicos, estabelecendo uma ligação entre a estrutura neural e o comportamento adaptativo. Segundo Rosenblatt, o Perceptron é um "modelo probabilístico de organização e armazenamento de informação no cérebro", cuja função central é aprender a associar padrões de entrada a respostas esperadas com base em exemplos fornecidos previamente (ROSENBLATT, 1958).

Seu propósito pode ser simplificado nos seguintes pontos:
- Simular o processo de **aprendizado supervisionado** inspirado no cérebro humano.
- Estabelecer um **modelo matemático** capaz de reconhecer padrões a partir de exemplos.
- Demonstrar que é possível implementar **funções de decisão lineares** com neurônios artificiais simples.
- Investigar como a **informação é armazenada e organizada** em redes de conexões sinápticas.
- Propor um sistema que aprende ajustando **pesos sinápticos** com base no erro da resposta.
- Oferecer uma base teórica para a construção de redes neurais mais complexas no futuro.
- Explorar o potencial de redes com **unidades simples interconectadas** para gerar comportamento inteligente.

###1.1.2 Origem Histórica

A origem do modelo de Perceptron remonta à tentativa de compreender os mecanismos de aprendizagem e reconhecimento presentes nos sistemas nervosos biológicos. O trabalho seminal de McCulloch e Pitts (1943) já propunha uma estrutura lógica para descrever a atividade neural por meio de funções booleanas, estabelecendo os fundamentos do que viria a ser conhecido como redes neurais artificiais. Eles demonstraram que "a atividade de qualquer neurônio pode ser representada como uma proposição" e que redes neurais poderiam, em princípio, implementar qualquer função lógica computável com base em conexões sinápticas e limiares de ativação​.

Décadas depois, Frank Rosenblatt, em seu artigo de 1958, formalizou o modelo do Perceptron como uma máquina probabilística capaz de realizar tarefas de classificação por meio da aprendizagem dos pesos sinápticos. Segundo Rosenblatt, o Perceptron representa um "sistema nervoso hipotético" que armazena informação por meio de conexões modificáveis, sendo capaz de generalizar e reconhecer padrões com base em estímulos sensoriais​
. Esse modelo é considerado a primeira implementação prática de uma rede neural com capacidade de aprendizado supervisionado.

O entusiasmo inicial com o Perceptron, no entanto, foi confrontado com críticas importantes. O livro Perceptrons de Minsky e Papert (1969) demonstrou limitações fundamentais do modelo, especialmente sua incapacidade de resolver problemas não linearmente separáveis, como o XOR. Essa crítica desacelerou o avanço das redes neurais por quase duas décadas.

Somente nos anos 1980, com o trabalho de Rumelhart, Hinton e McClelland, foi possível revitalizar o campo por meio do conceito de Parallel Distributed Processing (PDP). Esses pesquisadores defenderam que o processamento inteligente poderia emergir da interação paralela de unidades simples de processamento, reforçando o papel das redes distribuídas e do aprendizado supervisionado por propagação do erro como alternativa viável e biologicamente plausível para modelar a cognição humana​
.

###1.1.3 Importância na evolução das redes neurais
O modelo do Perceptron teve um papel fundamental na história da Inteligência Artificial, sendo considerado o ponto de partida das redes neurais artificiais com capacidade de aprendizado. Proposto por Frank Rosenblatt em 1958, o Perceptron foi o primeiro sistema computacional que demonstrou ser possível ensinar uma máquina a reconhecer padrões por meio de ajustes iterativos em seus parâmetros internos, simulando o processo de aprendizagem observado em sistemas biológicos (ROSENBLATT, 1958). Seu funcionamento baseado na atualização de pesos sinápticos a partir do erro da saída contribuiu para consolidar o paradigma conexionista como alternativa aos modelos simbólicos dominantes na época.

Ele foi essencial na evolução das redes neurais, pois:

- Foi o primeiro modelo de rede neural com capacidade de aprendizado supervisionado.
- Estabeleceu a ideia de ajuste de pesos sinápticos como mecanismo de aprendizagem.
- Inspirou o desenvolvimento de redes neurais multicamadas (MLPs) e o uso da retropropagação.
- Sua limitação com problemas como XOR motivou pesquisas sobre redes com maior capacidade expressiva.
- Fundamentou a transição de modelos simbólicos para modelos conexionistas na IA.
- Tornou-se referência obrigatória em estudos sobre o surgimento das redes neurais profundas.

##1.2. Inspiração Biológica
###1.2.1 Comparação entre neurônios biológicos e artificiais

###1.2.2 Elementos equivalentes: dendritos, corpo celular, axônio, sinapse

##1.3. Estrutura de um Perceptron
Entradas e pesos

Função de ativação (limiar)

Saída binária (0 ou 1)

Esquema visual do neurônio Perceptron

##1.4. Funcionamento Básico
Etapas do processo:

Soma ponderada

Aplicação da função de ativação

Geração da saída

##1.5. Fórmulas Matemáticas
Equação da saída do Perceptron:

𝑦
=
𝑓
(
∑
𝑖
=
1
𝑛
𝑤
𝑖
𝑥
𝑖
+
𝑏
)
y=f(
i=1
∑
n
​
 w
i
​
 x
i
​
 +b)
Explicação de cada termo:

𝑥
𝑖
x
i
​
 : entrada

𝑤
𝑖
w
i
​
 : peso

𝑏
b: viés (bias)

𝑓
f: função de ativação (degrau de Heaviside)

##1.6. Algoritmo de Aprendizado do Perceptron
Lógica do treinamento supervisionado

Atualização dos pesos:

𝑤
𝑖
←
𝑤
𝑖
+
𝜂
⋅
(
𝑦
real
−
𝑦
previsto
)
⋅
𝑥
𝑖
w
i
​
 ←w
i
​
 +η⋅(y
real
​
 −y
previsto
​
 )⋅x
i
​

Papel da taxa de aprendizado
𝜂
η

##1.7. Convergência e Limitações
Convergência garantida para problemas linearmente separáveis

Limitações do modelo simples (não resolve o XOR)

Introdução à motivação para redes multicamadas

##1.8. Visualizações e Intuições Geométricas
Fronteiras de decisão lineares

Separação de classes no plano cartesiano

##1.9. Variações e Extensões
Perceptron com múltiplos neurônios (camada de saída com mais classes)

Funções de ativação alternativas (ReLU, Sigmoid – apenas para contextualizar)



#2. Aplicação do Perceptron aos problemas lógicos OR e AND


2.1. Revisão dos Problemas Lógicos
Tabelas verdade dos operadores lógicos AND e OR

Representação como problemas de classificação binária

2.2. Construção Manual dos Datasets
Conjunto de dados com entrada binária (0 ou 1)

Preparação dos pares (entrada, saída esperada)

2.3. Implementação do Perceptron
Código Python manual, com comentários linha a linha

Inicialização de pesos e viés

Função de ativação (degrau)

Laço de treinamento com atualização dos pesos

2.4. Processo de Treinamento
Número de épocas

Cálculo do erro

Atualização iterativa dos pesos

2.5. Avaliação do Modelo
Previsão de saída para cada entrada

Comparação com a saída esperada

Impressão de resultados

2.6. Visualização dos Resultados
Gráficos de dispersão dos dados

Exibição da fronteira de decisão

Análise visual: separabilidade linear

2.7. Análise da Fronteira de Decisão
Interpretação geométrica dos pesos como coeficientes da reta

Como a reta se ajusta para classificar corretamente os dados

Demonstração com matplotlib (sem bibliotecas de IA)

2.8. Discussão dos Resultados
Por que o Perceptron funciona para OR e AND?

Influência da taxa de aprendizado e número de épocas

Limitações do modelo simples mesmo em problemas lineares (por ex., quando dados ruidosos são inseridos)

#3. Discussão do problema XOR e suas implicações para a evolução das Redes Neurais


3.1. Revisão do Problema Lógico XOR
Tabela verdade do operador XOR

Interpretação lógica: saída 1 quando os valores são diferentes

Representação gráfica: pontos no plano cartesiano

3.2. Construção do Dataset XOR
Criação manual das entradas e saídas

Representação binária e visualização em gráfico

3.3. Testando o Perceptron no XOR
Utilização da mesma implementação do Perceptron simples

Treinamento com os dados do XOR

Resultados obtidos: falhas na classificação correta

3.4. Visualização da Falha do Perceptron
Gráfico mostrando que os dados não são linearmente separáveis

Tentativas frustradas de ajustar uma reta que separe os dados

Ilustração clara da limitação do modelo linear

3.5. Entendendo a Limitação Teórica
Conceito de linear separability

Prova informal de que XOR não pode ser separado com uma única reta

Implicação direta: Perceptron simples não é suficiente

3.6. Implicações Históricas e Científicas
Impacto da crítica de Minsky & Papert (1969) sobre o Perceptron

Queda do interesse em redes neurais na década de 1970 (inverno da IA)

Redescoberta e evolução nos anos 1980 com o surgimento do Backpropagation

3.7. Solução: Redes Neurais Multicamadas (MLP)
Introdução ao conceito de camada oculta

Como uma MLP pode resolver o XOR

Antecipação do próximo passo na evolução das RNAs

3.8. Conclusão e Conexão com o Futuro
O problema XOR como marco histórico e ponto de virada

Importância da limitação para o avanço científico

Encaminhamento para estudos sobre redes multicamadas e deep learning



#Referências
MCCULLOCH, Warren S.; PITTS, Walter. A logical calculus of the ideas immanent in nervous activity. The Bulletin of Mathematical Biophysics, v. 5, p. 115–133, 1943. Reimpresso em: Bulletin of Mathematical Biology, v. 52, n. 1/2, p. 99–115, 1990.

ROSENBLATT, Frank. The perceptron: a probabilistic model for information storage and organization in the brain. Psychological Review, v. 65, n. 6, p. 386–408, 1958.

RUMELHART, David E.; HINTON, Geoffrey E.; MCCLELLAND, James L. Learning internal representations by error propagation. In: RUMELHART, D. E.; MCCLELLAND, J. L.; PDP Research Group (Ed.). Parallel Distributed Processing: Explorations in the Microstructure of Cognition. v. 1: Foundations. Cambridge, MA: MIT Press, 1986. p. 318–362.

Du, K.-L.; Leung, C.-S.; Mow, W.H.; Swamy, M.N.S. Perceptron: Learning, Generalization, Model Selection, Fault Tolerance, and Role in the Deep Learning Era. Mathematics 2022, 10, 4730. https://doi.org/10.3390/math10244730