## **Histórico das Arquiteturas de Redes Convolucionais (CNNs)**

As Redes Neurais Convolucionais (CNNs) vêm sendo utilizadas há décadas. Um exemplo clássico é a **LeNet-5**, aplicada para reconhecimento de dígitos em cheques no final da década de 1990. No entanto, foi somente com a popularização das **GPUs** que redes profundas se tornaram viáveis na prática. Desde então, as CNNs passaram a superar significativamente outras abordagens em tarefas de classificação de imagens. A seguir, revisitamos os principais marcos no desenvolvimento das arquiteturas baseadas em CNNs.

---

### **1. AlexNet (2012)**

A **AlexNet** marcou um ponto de virada na história do aprendizado profundo. Vencedora da competição **ImageNet 2012**, obteve uma taxa de erro top-5 de **15,3%**, superando amplamente o segundo colocado (26,2%).

#### **Inovações Introduzidas:**
- **ReLU** como função de ativação (ainda pouco conhecida na época).
- **MaxPooling** e **Dropout** para regularização.
- Treinamento eficiente em **GPUs** com múltiplas camadas.

Apesar de não ser mais considerada estado da arte, a AlexNet é um divisor de águas na história do deep learning.

---

### **2. Inception / GoogLeNet (2014)**

A arquitetura vencedora da ImageNet 2014 foi a **GoogLeNet**, introduzindo o revolucionário **módulo Inception**.

#### **Principais Características:**
- Combina convoluções de diferentes tamanhos (1×1, 3×3 e 5×5) em paralelo.
- Usa convoluções **1×1 como gargalo (bottleneck)** para reduzir a dimensionalidade antes de aplicar filtros maiores.
- Utiliza **9 módulos Inception empilhados**, formando uma rede profunda, mas eficiente.

**Desempenho:** erro top-5 de **6,67%**, com apenas 7 milhões de parâmetros (menos do que os 138 milhões da VGG).

---

### **3. VGG (2014)**

A arquitetura **VGG**, desenvolvida pelo **Visual Geometry Group (Universidade de Oxford)**, ficou em segundo lugar na competição de 2014.

#### **Características da VGG:**
- Arquitetura simples e sequencial com pilhas de camadas convolucionais 3×3.
- Utiliza duas grandes camadas totalmente conectadas (fully connected) antes da saída final.
- Configurações populares incluem a **VGG-16**, com 16 camadas.

**Desempenho:** erro top-5 de **8,8%**, mas com grande custo computacional (**138 milhões de parâmetros**).

#### **Popularidade:**
- Ainda amplamente utilizada por sua simplicidade.
- Comum em aplicações de **transferência de estilo**, como transformar fotos em pinturas no estilo Van Gogh.

---

### **4. ResNet (2015)**

A **ResNet (Residual Network)**, criada pela Microsoft, foi a vencedora da ImageNet 2015.

#### **Inovação Principal:**
- Introdução dos **blocos residuais**, que somam a entrada original do bloco à sua saída.
- Essa técnica combate o **desvanecimento do gradiente** em redes muito profundas.

#### **Impacto:**
- Permite o treinamento de redes com **mais de 100 camadas**.
- **ResNet-152** alcançou **erro top-5 de 4,49%**, e modelos em ensemble chegaram a **3,57%**, superando o desempenho humano.

---

### **5. Outras Arquiteturas Importantes**

#### **DenseNet (2016)**
- Expande a ideia da ResNet conectando **cada camada a todas as anteriores**.
- Permite construir redes **profundíssimas (mais de 1000 camadas)** com menos parâmetros.

#### **SqueezeNet e MobileNet**
- Focadas em **eficiência computacional**.
- Modelos pequenos, ideais para **dispositivos móveis** com recursos limitados.

#### **NASNet e PNAS (AutoML - Google)**
- Redes **projetadas automaticamente por outras redes** (Neural Architecture Search).
- A **NASNet** alcançou **erro top-5 de 3,8%**.
- Essa abordagem levou à suspensão das competições ImageNet, pois os modelos superaram o desempenho humano.

---

## **Conclusão**

A evolução das CNNs mostra como o avanço computacional, somado à inovação arquitetural, transformou a visão computacional. De redes simples como a LeNet-5 até modelos gerados automaticamente como a NASNet, a trajetória revela uma busca contínua por **eficiência, profundidade e generalização**. Hoje, esses modelos são amplamente utilizados em uma variedade de aplicações, como reconhecimento facial, diagnóstico médico e carros autônomos.