# Módulo 2: Processamento Digital de Imagem - Fundamentos

## 🎯 Objetivos de Aprendizagem

Ao final deste módulo, você será capaz de:

- ✅ Compreender os fundamentos matemáticos de imagens digitais
- ✅ Dominar operações básicas de processamento de imagem
- ✅ Aplicar filtros e transformações essenciais
- ✅ Implementar técnicas práticas com OpenCV

---

## 📚 2.1 Fundamentos de Gonzalez & Woods

### Referência Seminal

**Rafael C. Gonzalez** e **Richard E. Woods** são autores da obra seminal **"Digital Image Processing"** (4ª Edição), considerada a referência definitiva em processamento digital de imagem.

![Gonzalez & Woods](https://cdn.jsdelivr.net/gh/rfapo/visao-computacional@main/images/modulo2/gonzalez_woods.png)

### Importância da Obra

- **Referência padrão** em cursos universitários
- **Fundamentos matemáticos** sólidos
- **Algoritmos clássicos** bem documentados
- **Base teórica** para técnicas modernas

---

## 🔬 2.2 Fundamentos do Processamento Digital de Imagem

### Definição

**Processamento Digital de Imagem** é o conjunto de técnicas computacionais para manipular, analisar e interpretar imagens digitais.

![Fundamentos do Processamento](https://cdn.jsdelivr.net/gh/rfapo/visao-computacional@main/images/modulo2/fundamentos_processamento.png)

### Características Principais

| Aspecto | Descrição |
|---------|-----------|
| **Entrada** | Imagem digital (matriz de pixels) |
| **Processamento** | Algoritmos matemáticos |
| **Saída** | Imagem processada ou informação |
| **Objetivo** | Melhorar qualidade ou extrair informação |

### Áreas de Aplicação

- **Melhoria de qualidade**: Redução de ruído, correção de iluminação
- **Análise de conteúdo**: Detecção de bordas, segmentação
- **Compressão**: Redução de tamanho de arquivo
- **Restauração**: Recuperação de imagens degradadas

---

## 📐 2.3 Representação Matemática de Imagens

### Conceito Fundamental

Uma **imagem digital** é uma representação matemática de uma imagem real, onde cada pixel possui um valor numérico que representa sua intensidade luminosa.

![Representação Matemática de Imagens](https://cdn.jsdelivr.net/gh/rfapo/visao-computacional@main/images/modulo2/representacao_matematica_imagens.png)

### Características Fundamentais

#### **1. Matrizes de Pixels**
- Imagens são representadas como **matrizes bidimensionais**
- Cada elemento da matriz representa um pixel
- Coordenadas: (linha, coluna) ou (y, x)

#### **2. Profundidade de Bits**
- Determina quantos valores diferentes um pixel pode assumir
- **8-bit**: 256 valores (0-255)
- **16-bit**: 65.536 valores (0-65535)
- **24-bit**: 16.777.216 valores (RGB)

#### **3. Resolução Espacial**
- Número de pixels por unidade de comprimento
- Medida em DPI (dots per inch) ou PPI (pixels per inch)
- Afeta a qualidade e tamanho da imagem

#### **4. Resolução de Intensidade**
- Número de níveis de cinza distintos
- Relacionada à profundidade de bits
- Determina a suavidade das transições

### Representação Matemática

```
I(x,y) = f(x,y)
```

Onde:
- **I(x,y)**: Intensidade do pixel na posição (x,y)
- **f(x,y)**: Função que mapeia coordenadas para intensidade

---

## 🎨 2.4 Tipos de Imagens Digitais

### Classificação por Canais

![Tipos de Imagens Digitais](https://cdn.jsdelivr.net/gh/rfapo/visao-computacional@main/images/modulo2/tipos_imagens_digitais.png)

#### **1. Imagens em Escala de Cinza**

**Características:**
- Cada pixel representa apenas a **intensidade luminosa**
- Valores típicos: **0 (preto)** a **255 (branco)** para imagens 8-bit
- Representação: **Matriz 2D**

**Aplicações:**
- Análise médica (raios-X)
- Processamento de documentos
- Visão computacional clássica

#### **2. Imagens Coloridas**

**Características:**
- Cada pixel possui **múltiplos canais**
- **RGB**: Vermelho, Verde, Azul
- **HSV**: Matiz, Saturação, Valor
- Representação: **Matriz 3D** (altura × largura × canais)

**Modelos de Cor:**
| Modelo | Componentes | Uso Principal |
|--------|-------------|---------------|
| **RGB** | Red, Green, Blue | Monitores, câmeras |
| **HSV** | Hue, Saturation, Value | Análise de cor |
| **LAB** | Luminance, A, B | Processamento científico |

#### **3. Imagens Binárias**

**Características:**
- Apenas **dois valores**: 0 (preto) e 1 ou 255 (branco)
- Usadas para **segmentação** e análise de formas
- Representação: **Matriz 2D** com valores binários

**Aplicações:**
- Detecção de objetos
- Análise morfológica
- Processamento de documentos

---

## 🔧 2.5 Demonstração Prática: Visualização de Tipos de Imagens

Vamos carregar a imagem do fotógrafo e visualizar diferentes tipos de representação:

In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
import seaborn as sns
import os

def load_sample_image():
    """Carrega a imagem de exemplo"""
    
    # Caminho para a imagem do fotógrafo
    image_path = "images/modulo1/fotografo.png"
    
    if os.path.exists(image_path):
        # Carregar imagem
        image = cv2.imread(image_path)
        
        # Converter para RGB
        image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        
        # Converter para escala de cinza
        image_gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
        
        print(f"Imagem carregada: {image_rgb.shape}")
        return image_rgb, image_gray
    else:
        print(f"Imagem não encontrada em: {image_path}")
        print("Criando imagem sintética para demonstração...")
        
        # Criar imagem sintética
        image_rgb = np.zeros((300, 400, 3), dtype=np.uint8)
        
        # Adicionar formas
        cv2.circle(image_rgb, (150, 100), 50, (255, 0, 0), -1)
        cv2.rectangle(image_rgb, (200, 150), (300, 250), (0, 255, 0), -1)
        cv2.rectangle(image_rgb, (50, 200), (150, 300), (0, 0, 255), -1)
        
        # Adicionar texto
        cv2.putText(image_rgb, 'Sample Image', (100, 50), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), 2)
        
        # Converter para escala de cinza
        image_gray = cv2.cvtColor(image_rgb, cv2.COLOR_RGB2GRAY)
        
        return image_rgb, image_gray

def visualize_image_types(image_rgb, image_gray):
    """Visualiza diferentes tipos de representação de imagem"""
    
    fig, axes = plt.subplots(2, 3, figsize=(18, 12))
    
    # Imagem RGB original
    axes[0, 0].imshow(image_rgb)
    axes[0, 0].set_title('Imagem RGB Original')
    axes[0, 0].axis('off')
    
    # Imagem em escala de cinza
    axes[0, 1].imshow(image_gray, cmap='gray')
    axes[0, 1].set_title('Escala de Cinza')
    axes[0, 1].axis('off')
    
    # Canais RGB separados
    axes[0, 2].imshow(image_rgb[:, :, 0], cmap='Reds')
    axes[0, 2].set_title('Canal Vermelho (R)')
    axes[0, 2].axis('off')
    
    axes[1, 0].imshow(image_rgb[:, :, 1], cmap='Greens')
    axes[1, 0].set_title('Canal Verde (G)')
    axes[1, 0].axis('off')
    
    axes[1, 1].imshow(image_rgb[:, :, 2], cmap='Blues')
    axes[1, 1].set_title('Canal Azul (B)')
    axes[1, 1].axis('off')
    
    # Histograma
    axes[1, 2].hist(image_gray.ravel(), bins=256, range=[0, 256], color='gray', alpha=0.7)
    axes[1, 2].set_title('Histograma - Escala de Cinza')
    axes[1, 2].set_xlabel('Intensidade')
    axes[1, 2].set_ylabel('Frequência')
    
    plt.tight_layout()
    plt.show()

def analyze_image_properties(image_rgb, image_gray):
    """Analisa propriedades da imagem"""
    
    print("=== ANÁLISE DE PROPRIEDADES DA IMAGEM ===")
    
    # Propriedades básicas
    height, width, channels = image_rgb.shape
    print(f"\nPropriedades Básicas:")
    print(f"  - Dimensões: {width} x {height} pixels")
    print(f"  - Canais: {channels}")
    print(f"  - Total de pixels: {width * height:,}")
    print(f"  - Profundidade de bits: 8-bit por canal")
    
    # Estatísticas RGB
    print(f"\nEstatísticas RGB:")
    for i, color in enumerate(['Red', 'Green', 'Blue']):
        channel = image_rgb[:, :, i]
        print(f"  - {color}: Min={np.min(channel)}, Max={np.max(channel)}, Mean={np.mean(channel):.1f}")
    
    # Estatísticas escala de cinza
    print(f"\nEstatísticas Escala de Cinza:")
    print(f"  - Min: {np.min(image_gray)}")
    print(f"  - Max: {np.max(image_gray)}")
    print(f"  - Mean: {np.mean(image_gray):.1f}")
    print(f"  - Std: {np.std(image_gray):.1f}")
    
    # Análise de histograma
    hist, bins = np.histogram(image_gray, bins=256, range=[0, 256])
    print(f"\nAnálise de Histograma:")
    print(f"  - Pixels escuros (0-85): {np.sum(hist[0:86]):,} ({np.sum(hist[0:86])/hist.sum()*100:.1f}%)")
    print(f"  - Pixels médios (86-170): {np.sum(hist[86:171]):,} ({np.sum(hist[86:171])/hist.sum()*100:.1f}%)")
    print(f"  - Pixels claros (171-255): {np.sum(hist[171:256]):,} ({np.sum(hist[171:256])/hist.sum()*100:.1f}%)")

# Executar demonstração
print("=== DEMONSTRAÇÃO: TIPOS DE IMAGENS DIGITAIS ===")

# Carregar imagem
image_rgb, image_gray = load_sample_image()

# Visualizar tipos de imagem
visualize_image_types(image_rgb, image_gray)

# Analisar propriedades
analyze_image_properties(image_rgb, image_gray)

print("\n=== DEMONSTRAÇÃO CONCLUÍDA ===")

---

## ⚙️ 2.6 Operações Básicas de Processamento

### Classificação das Operações

![Operações Básicas](https://cdn.jsdelivr.net/gh/rfapo/visao-computacional@main/images/modulo2/operacoes_aritmeticas.png)

#### **1. Operações Aritméticas**
- **Adição**: Combinação de imagens
- **Subtração**: Detecção de mudanças
- **Multiplicação**: Aplicação de máscaras
- **Divisão**: Normalização

#### **2. Operações Lógicas**
- **AND**: Interseção de regiões
- **OR**: União de regiões
- **NOT**: Inversão de valores
- **XOR**: Diferença exclusiva

#### **3. Operações Geométricas**
![Operações Geométricas](https://cdn.jsdelivr.net/gh/rfapo/visao-computacional@main/images/modulo2/operacoes_geometricas.png)

- **Translação**: Movimento
- **Rotação**: Transformação angular
- **Escala**: Redimensionamento
- **Reflexão**: Espelhamento

---

## 🔧 2.7 Demonstração Prática: Operações Básicas

Vamos implementar e visualizar diferentes operações básicas:

In [None]:
def arithmetic_operations(image_gray):
    """Implementa operações aritméticas básicas"""
    
    # Adição
    noise = np.random.normal(0, 25, image_gray.shape).astype(np.int16)
    added = np.clip(image_gray.astype(np.int16) + noise, 0, 255).astype(np.uint8)
    
    # Subtração
    subtracted = np.clip(image_gray.astype(np.int16) - 50, 0, 255).astype(np.uint8)
    
    # Multiplicação
    multiplied = np.clip(image_gray.astype(np.float32) * 1.5, 0, 255).astype(np.uint8)
    
    # Divisão
    divided = np.clip(image_gray.astype(np.float32) / 1.5, 0, 255).astype(np.uint8)
    
    return {
        'original': image_gray,
        'added': added,
        'subtracted': subtracted,
        'multiplied': multiplied,
        'divided': divided
    }

def logical_operations(image_gray):
    """Implementa operações lógicas básicas"""
    
    # Criar máscara binária
    threshold = 128
    mask1 = (image_gray > threshold).astype(np.uint8) * 255
    
    # Criar segunda máscara (invertida)
    mask2 = (image_gray < threshold).astype(np.uint8) * 255
    
    # Operações lógicas
    and_result = cv2.bitwise_and(mask1, mask2)
    or_result = cv2.bitwise_or(mask1, mask2)
    not_result = cv2.bitwise_not(mask1)
    xor_result = cv2.bitwise_xor(mask1, mask2)
    
    return {
        'mask1': mask1,
        'mask2': mask2,
        'and': and_result,
        'or': or_result,
        'not': not_result,
        'xor': xor_result
    }

def geometric_operations(image_rgb):
    """Implementa operações geométricas básicas"""
    
    height, width = image_rgb.shape[:2]
    
    # Translação
    M_translation = np.float32([[1, 0, 50], [0, 1, 30]])
    translated = cv2.warpAffine(image_rgb, M_translation, (width, height))
    
    # Rotação
    center = (width // 2, height // 2)
    M_rotation = cv2.getRotationMatrix2D(center, 30, 1.0)
    rotated = cv2.warpAffine(image_rgb, M_rotation, (width, height))
    
    # Escala
    scaled = cv2.resize(image_rgb, None, fx=0.8, fy=0.8)
    
    # Reflexão horizontal
    flipped_h = cv2.flip(image_rgb, 1)
    
    # Reflexão vertical
    flipped_v = cv2.flip(image_rgb, 0)
    
    return {
        'original': image_rgb,
        'translated': translated,
        'rotated': rotated,
        'scaled': scaled,
        'flipped_h': flipped_h,
        'flipped_v': flipped_v
    }

def visualize_arithmetic_operations(results):
    """Visualiza operações aritméticas"""
    
    fig, axes = plt.subplots(2, 3, figsize=(18, 12))
    
    operations = [
        ('original', 'Original'),
        ('added', 'Adição (+ Ruído)'),
        ('subtracted', 'Subtração (-50)'),
        ('multiplied', 'Multiplicação (×1.5)'),
        ('divided', 'Divisão (÷1.5)')
    ]
    
    for i, (key, title) in enumerate(operations):
        row = i // 3
        col = i % 3
        
        axes[row, col].imshow(results[key], cmap='gray')
        axes[row, col].set_title(title)
        axes[row, col].axis('off')
    
    # Histograma comparativo
    axes[1, 2].hist(results['original'].ravel(), bins=50, alpha=0.7, label='Original', color='blue')
    axes[1, 2].hist(results['added'].ravel(), bins=50, alpha=0.7, label='Adição', color='red')
    axes[1, 2].set_title('Histograma Comparativo')
    axes[1, 2].set_xlabel('Intensidade')
    axes[1, 2].set_ylabel('Frequência')
    axes[1, 2].legend()
    
    plt.tight_layout()
    plt.show()

def visualize_logical_operations(results):
    """Visualiza operações lógicas"""
    
    fig, axes = plt.subplots(2, 3, figsize=(18, 12))
    
    operations = [
        ('mask1', 'Máscara 1 (>128)'),
        ('mask2', 'Máscara 2 (<128)'),
        ('and', 'AND Lógico'),
        ('or', 'OR Lógico'),
        ('not', 'NOT Lógico'),
        ('xor', 'XOR Lógico')
    ]
    
    for i, (key, title) in enumerate(operations):
        row = i // 3
        col = i % 3
        
        axes[row, col].imshow(results[key], cmap='gray')
        axes[row, col].set_title(title)
        axes[row, col].axis('off')
    
    plt.tight_layout()
    plt.show()

def visualize_geometric_operations(results):
    """Visualiza operações geométricas"""
    
    fig, axes = plt.subplots(2, 3, figsize=(18, 12))
    
    operations = [
        ('original', 'Original'),
        ('translated', 'Translação'),
        ('rotated', 'Rotação (30°)'),
        ('scaled', 'Escala (0.8x)'),
        ('flipped_h', 'Reflexão Horizontal'),
        ('flipped_v', 'Reflexão Vertical')
    ]
    
    for i, (key, title) in enumerate(operations):
        row = i // 3
        col = i % 3
        
        axes[row, col].imshow(results[key])
        axes[row, col].set_title(title)
        axes[row, col].axis('off')
    
    plt.tight_layout()
    plt.show()

def analyze_operations_performance(arithmetic_results, logical_results):
    """Analisa performance das operações"""
    
    print("=== ANÁLISE DE PERFORMANCE DAS OPERAÇÕES ===")
    
    # Análise aritmética
    print("\nOperações Aritméticas:")
    for op in ['added', 'subtracted', 'multiplied', 'divided']:
        img = arithmetic_results[op]
        mean_val = np.mean(img)
        std_val = np.std(img)
        print(f"  - {op.capitalize()}: Mean={mean_val:.1f}, Std={std_val:.1f}")
    
    # Análise lógica
    print("\nOperações Lógicas:")
    for op in ['and', 'or', 'not', 'xor']:
        img = logical_results[op]
        white_pixels = np.sum(img > 0)
        total_pixels = img.size
        percentage = (white_pixels / total_pixels) * 100
        print(f"  - {op.upper()}: {white_pixels:,} pixels brancos ({percentage:.1f}%)")

# Executar demonstração
print("=== DEMONSTRAÇÃO: OPERAÇÕES BÁSICAS ===")

# Carregar imagem
image_rgb, image_gray = load_sample_image()

# Operações aritméticas
print("\nAplicando operações aritméticas...")
arithmetic_results = arithmetic_operations(image_gray)
print("✓ Operações aritméticas aplicadas")

# Operações lógicas
print("\nAplicando operações lógicas...")
logical_results = logical_operations(image_gray)
print("✓ Operações lógicas aplicadas")

# Operações geométricas
print("\nAplicando operações geométricas...")
geometric_results = geometric_operations(image_rgb)
print("✓ Operações geométricas aplicadas")

# Visualizar resultados
print("\nVisualizando operações aritméticas...")
visualize_arithmetic_operations(arithmetic_results)

print("\nVisualizando operações lógicas...")
visualize_logical_operations(logical_results)

print("\nVisualizando operações geométricas...")
visualize_geometric_operations(geometric_results)

# Analisar performance
analyze_operations_performance(arithmetic_results, logical_results)

print("\n=== DEMONSTRAÇÃO CONCLUÍDA ===")

---

## 🔄 2.8 Transformações de Intensidade

### Conceito

**Transformações de Intensidade** modificam os valores de pixel de uma imagem para melhorar sua qualidade visual ou facilitar análise posterior.

![Transformações de Intensidade](https://cdn.jsdelivr.net/gh/rfapo/visao-computacional@main/images/modulo2/transformacoes_intensidade.png)

### Tipos de Transformações

#### **1. Transformações Lineares**
- **Contraste**: s = a × r + b
- **Brilho**: s = r + b
- **Inversão**: s = 255 - r

#### **2. Transformações Não-Lineares**
- **Logarítmica**: s = c × log(1 + r)
- **Potência**: s = c × r^γ
- **Sigmóide**: s = 255 / (1 + e^(-k(r-128)))

#### **3. Equalização de Histograma**
- **Objetivo**: Distribuir uniformemente os níveis de cinza
- **Método**: Transformação cumulativa
- **Resultado**: Melhor contraste

---

## 🔧 2.9 Demonstração Prática: Transformações de Intensidade

Vamos implementar e visualizar diferentes transformações:

In [None]:
def linear_transformations(image_gray):
    """Implementa transformações lineares"""
    
    # Contraste e brilho
    contrast_bright = np.clip(image_gray.astype(np.float32) * 1.5 + 30, 0, 255).astype(np.uint8)
    
    # Inversão
    inverted = 255 - image_gray
    
    # Contraste alto
    high_contrast = np.clip(image_gray.astype(np.float32) * 2.0, 0, 255).astype(np.uint8)
    
    # Contraste baixo
    low_contrast = np.clip(image_gray.astype(np.float32) * 0.5 + 128, 0, 255).astype(np.uint8)
    
    return {
        'original': image_gray,
        'contrast_bright': contrast_bright,
        'inverted': inverted,
        'high_contrast': high_contrast,
        'low_contrast': low_contrast
    }

def nonlinear_transformations(image_gray):
    """Implementa transformações não-lineares"""
    
    # Transformação logarítmica
    c = 255 / np.log(1 + np.max(image_gray))
    log_transformed = np.clip(c * np.log(1 + image_gray.astype(np.float32)), 0, 255).astype(np.uint8)
    
    # Transformação de potência (gamma)
    gamma = 2.0
    power_transformed = np.clip(255 * np.power(image_gray.astype(np.float32) / 255, gamma), 0, 255).astype(np.uint8)
    
    # Transformação sigmóide
    k = 0.1
    sigmoid_transformed = np.clip(255 / (1 + np.exp(-k * (image_gray.astype(np.float32) - 128))), 0, 255).astype(np.uint8)
    
    return {
        'original': image_gray,
        'logarithmic': log_transformed,
        'power': power_transformed,
        'sigmoid': sigmoid_transformed
    }

def histogram_equalization(image_gray):
    """Implementa equalização de histograma"""
    
    # Equalização global
    equalized_global = cv2.equalizeHist(image_gray)
    
    # Equalização adaptativa (CLAHE)
    clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(8, 8))
    equalized_adaptive = clahe.apply(image_gray)
    
    return {
        'original': image_gray,
        'equalized_global': equalized_global,
        'equalized_adaptive': equalized_adaptive
    }

def visualize_intensity_transformations(linear_results, nonlinear_results, equalization_results):
    """Visualiza transformações de intensidade"""
    
    fig, axes = plt.subplots(4, 4, figsize=(20, 16))
    
    # Transformações lineares
    linear_ops = [
        ('original', 'Original'),
        ('contrast_bright', 'Contraste + Brilho'),
        ('inverted', 'Inversão'),
        ('high_contrast', 'Alto Contraste')
    ]
    
    for i, (key, title) in enumerate(linear_ops):
        axes[0, i].imshow(linear_results[key], cmap='gray')
        axes[0, i].set_title(title)
        axes[0, i].axis('off')
    
    # Transformações não-lineares
    nonlinear_ops = [
        ('original', 'Original'),
        ('logarithmic', 'Logarítmica'),
        ('power', 'Potência (γ=2.0)'),
        ('sigmoid', 'Sigmóide')
    ]
    
    for i, (key, title) in enumerate(nonlinear_ops):
        axes[1, i].imshow(nonlinear_results[key], cmap='gray')
        axes[1, i].set_title(title)
        axes[1, i].axis('off')
    
    # Equalização de histograma
    equalization_ops = [
        ('original', 'Original'),
        ('equalized_global', 'Equalização Global'),
        ('equalized_adaptive', 'Equalização Adaptativa'),
        ('original', 'Comparação')
    ]
    
    for i, (key, title) in enumerate(equalization_ops):
        if key == 'original' and i == 3:
            # Histograma comparativo
            axes[2, i].hist(equalization_results['original'].ravel(), bins=50, alpha=0.7, label='Original', color='blue')
            axes[2, i].hist(equalization_results['equalized_global'].ravel(), bins=50, alpha=0.7, label='Global', color='red')
            axes[2, i].hist(equalization_results['equalized_adaptive'].ravel(), bins=50, alpha=0.7, label='Adaptativa', color='green')
            axes[2, i].set_title('Histogramas Comparativos')
            axes[2, i].set_xlabel('Intensidade')
            axes[2, i].set_ylabel('Frequência')
            axes[2, i].legend()
        else:
            axes[2, i].imshow(equalization_results[key], cmap='gray')
            axes[2, i].set_title(title)
            axes[2, i].axis('off')
    
    # Histogramas individuais
    for i in range(4):
        if i < len(linear_ops):
            key = linear_ops[i][0]
            axes[3, i].hist(linear_results[key].ravel(), bins=50, color='blue', alpha=0.7)
            axes[3, i].set_title(f'Histograma - {linear_ops[i][1]}')
            axes[3, i].set_xlabel('Intensidade')
            axes[3, i].set_ylabel('Frequência')
    
    plt.tight_layout()
    plt.show()

def analyze_transformations_performance(linear_results, nonlinear_results, equalization_results):
    """Analisa performance das transformações"""
    
    print("=== ANÁLISE DE PERFORMANCE DAS TRANSFORMAÇÕES ===")
    
    # Análise linear
    print("\nTransformações Lineares:")
    for key, title in [('original', 'Original'), ('contrast_bright', 'Contraste+Brilho'), ('inverted', 'Inversão')]:
        img = linear_results[key]
        mean_val = np.mean(img)
        std_val = np.std(img)
        print(f"  - {title}: Mean={mean_val:.1f}, Std={std_val:.1f}")
    
    # Análise não-linear
    print("\nTransformações Não-Lineares:")
    for key, title in [('logarithmic', 'Logarítmica'), ('power', 'Potência'), ('sigmoid', 'Sigmóide')]:
        img = nonlinear_results[key]
        mean_val = np.mean(img)
        std_val = np.std(img)
        print(f"  - {title}: Mean={mean_val:.1f}, Std={std_val:.1f}")
    
    # Análise equalização
    print("\nEqualização de Histograma:")
    for key, title in [('original', 'Original'), ('equalized_global', 'Global'), ('equalized_adaptive', 'Adaptativa')]:
        img = equalization_results[key]
        mean_val = np.mean(img)
        std_val = np.std(img)
        print(f"  - {title}: Mean={mean_val:.1f}, Std={std_val:.1f}")

# Executar demonstração
print("=== DEMONSTRAÇÃO: TRANSFORMAÇÕES DE INTENSIDADE ===")

# Carregar imagem
image_rgb, image_gray = load_sample_image()

# Transformações lineares
print("\nAplicando transformações lineares...")
linear_results = linear_transformations(image_gray)
print("✓ Transformações lineares aplicadas")

# Transformações não-lineares
print("\nAplicando transformações não-lineares...")
nonlinear_results = nonlinear_transformations(image_gray)
print("✓ Transformações não-lineares aplicadas")

# Equalização de histograma
print("\nAplicando equalização de histograma...")
equalization_results = histogram_equalization(image_gray)
print("✓ Equalização de histograma aplicada")

# Visualizar resultados
print("\nVisualizando transformações...")
visualize_intensity_transformations(linear_results, nonlinear_results, equalization_results)

# Analisar performance
analyze_transformations_performance(linear_results, nonlinear_results, equalization_results)

print("\n=== DEMONSTRAÇÃO CONCLUÍDA ===")

---

## 🔍 2.10 Filtros Espaciais

### Conceito

**Filtros Espaciais** são operações que modificam os valores de pixel de uma imagem baseando-se nos valores dos pixels vizinhos.

![Filtros Espaciais](https://cdn.jsdelivr.net/gh/rfapo/visao-computacional@main/images/modulo2/filtros_espaciais.png)

### Tipos de Filtros

#### **1. Filtros de Suavização (Smoothing)**

**Objetivo**: Reduzir ruído e suavizar a imagem

**Tipos:**
- **Média**: Média aritmética dos pixels vizinhos
- **Gaussiano**: Peso baseado em distribuição gaussiana
- **Mediana**: Valor mediano dos pixels vizinhos

**Kernel de Média 3×3:**
```
[1/9  1/9  1/9]
[1/9  1/9  1/9]
[1/9  1/9  1/9]
```

#### **2. Filtros de Nitidez (Sharpening)**

**Objetivo**: Realçar bordas e detalhes

**Kernel Laplaciano:**
```
[ 0  -1   0]
[-1   4  -1]
[ 0  -1   0]
```

#### **3. Filtros de Detecção de Bordas**

**Sobel (Gradiente):**
```
Gx = [-1  0  1]    Gy = [-1 -2 -1]
     [-2  0  2]         [ 0  0  0]
     [-1  0  1]         [ 1  2  1]
```

**Magnitude do Gradiente:**
```
|G| = √(Gx² + Gy²)
```

### Aplicações

| Tipo de Filtro | Aplicação | Efeito |
|----------------|-----------|--------|
| **Suavização** | Redução de ruído | Imagem mais suave |
| **Nitidez** | Realce de detalhes | Bordas mais definidas |
| **Detecção de Bordas** | Análise de formas | Contornos destacados |

---

## 🔧 2.11 Demonstração Prática: Filtros Espaciais

Vamos implementar e visualizar diferentes filtros espaciais:

In [None]:
def smoothing_filters(image_gray):
    """Implementa filtros de suavização"""
    
    # Filtro de média
    kernel_size = 5
    mean_filtered = cv2.blur(image_gray, (kernel_size, kernel_size))
    
    # Filtro Gaussiano
    gaussian_filtered = cv2.GaussianBlur(image_gray, (kernel_size, kernel_size), 0)
    
    # Filtro de mediana
    median_filtered = cv2.medianBlur(image_gray, kernel_size)
    
    # Filtro bilateral
    bilateral_filtered = cv2.bilateralFilter(image_gray, 9, 75, 75)
    
    return {
        'original': image_gray,
        'mean': mean_filtered,
        'gaussian': gaussian_filtered,
        'median': median_filtered,
        'bilateral': bilateral_filtered
    }

def sharpening_filters(image_gray):
    """Implementa filtros de nitidez"""
    
    # Kernel Laplaciano
    laplacian_kernel = np.array([[0, -1, 0], [-1, 4, -1], [0, -1, 0]])
    laplacian_filtered = cv2.filter2D(image_gray, -1, laplacian_kernel)
    
    # Kernel Laplaciano alternativo
    laplacian_kernel_alt = np.array([[-1, -1, -1], [-1, 8, -1], [-1, -1, -1]])
    laplacian_alt_filtered = cv2.filter2D(image_gray, -1, laplacian_kernel_alt)
    
    # Unsharp masking
    gaussian_blur = cv2.GaussianBlur(image_gray, (5, 5), 0)
    unsharp_mask = cv2.addWeighted(image_gray, 1.5, gaussian_blur, -0.5, 0)
    
    # High-pass filter
    high_pass_kernel = np.array([[-1, -1, -1], [-1, 9, -1], [-1, -1, -1]])
    high_pass_filtered = cv2.filter2D(image_gray, -1, high_pass_kernel)
    
    return {
        'original': image_gray,
        'laplacian': laplacian_filtered,
        'laplacian_alt': laplacian_alt_filtered,
        'unsharp_mask': unsharp_mask,
        'high_pass': high_pass_filtered
    }

def edge_detection_filters(image_gray):
    """Implementa filtros de detecção de bordas"""
    
    # Sobel
    sobel_x = cv2.Sobel(image_gray, cv2.CV_64F, 1, 0, ksize=3)
    sobel_y = cv2.Sobel(image_gray, cv2.CV_64F, 0, 1, ksize=3)
    sobel_magnitude = np.sqrt(sobel_x**2 + sobel_y**2)
    sobel_magnitude = np.uint8(sobel_magnitude)
    
    # Prewitt
    prewitt_x = np.array([[-1, 0, 1], [-1, 0, 1], [-1, 0, 1]])
    prewitt_y = np.array([[-1, -1, -1], [0, 0, 0], [1, 1, 1]])
    prewitt_x_filtered = cv2.filter2D(image_gray, -1, prewitt_x)
    prewitt_y_filtered = cv2.filter2D(image_gray, -1, prewitt_y)
    prewitt_magnitude = np.sqrt(prewitt_x_filtered**2 + prewitt_y_filtered**2)
    prewitt_magnitude = np.uint8(prewitt_magnitude)
    
    # Roberts
    roberts_x = np.array([[1, 0], [0, -1]])
    roberts_y = np.array([[0, 1], [-1, 0]])
    roberts_x_filtered = cv2.filter2D(image_gray, -1, roberts_x)
    roberts_y_filtered = cv2.filter2D(image_gray, -1, roberts_y)
    roberts_magnitude = np.sqrt(roberts_x_filtered**2 + roberts_y_filtered**2)
    roberts_magnitude = np.uint8(roberts_magnitude)
    
    # Canny
    canny_edges = cv2.Canny(image_gray, 50, 150)
    
    return {
        'original': image_gray,
        'sobel': sobel_magnitude,
        'prewitt': prewitt_magnitude,
        'roberts': roberts_magnitude,
        'canny': canny_edges
    }

def visualize_smoothing_filters(results):
    """Visualiza filtros de suavização"""
    
    fig, axes = plt.subplots(2, 3, figsize=(18, 12))
    
    filters = [
        ('original', 'Original'),
        ('mean', 'Filtro de Média'),
        ('gaussian', 'Filtro Gaussiano'),
        ('median', 'Filtro de Mediana'),
        ('bilateral', 'Filtro Bilateral')
    ]
    
    for i, (key, title) in enumerate(filters):
        row = i // 3
        col = i % 3
        
        axes[row, col].imshow(results[key], cmap='gray')
        axes[row, col].set_title(title)
        axes[row, col].axis('off')
    
    # Histograma comparativo
    axes[1, 2].hist(results['original'].ravel(), bins=50, alpha=0.7, label='Original', color='blue')
    axes[1, 2].hist(results['gaussian'].ravel(), bins=50, alpha=0.7, label='Gaussiano', color='red')
    axes[1, 2].hist(results['median'].ravel(), bins=50, alpha=0.7, label='Mediana', color='green')
    axes[1, 2].set_title('Histogramas Comparativos')
    axes[1, 2].set_xlabel('Intensidade')
    axes[1, 2].set_ylabel('Frequência')
    axes[1, 2].legend()
    
    plt.tight_layout()
    plt.show()

def visualize_sharpening_filters(results):
    """Visualiza filtros de nitidez"""
    
    fig, axes = plt.subplots(2, 3, figsize=(18, 12))
    
    filters = [
        ('original', 'Original'),
        ('laplacian', 'Laplaciano'),
        ('laplacian_alt', 'Laplaciano Alt'),
        ('unsharp_mask', 'Unsharp Masking'),
        ('high_pass', 'High-Pass')
    ]
    
    for i, (key, title) in enumerate(filters):
        row = i // 3
        col = i % 3
        
        axes[row, col].imshow(results[key], cmap='gray')
        axes[row, col].set_title(title)
        axes[row, col].axis('off')
    
    # Histograma comparativo
    axes[1, 2].hist(results['original'].ravel(), bins=50, alpha=0.7, label='Original', color='blue')
    axes[1, 2].hist(results['laplacian'].ravel(), bins=50, alpha=0.7, label='Laplaciano', color='red')
    axes[1, 2].hist(results['unsharp_mask'].ravel(), bins=50, alpha=0.7, label='Unsharp', color='green')
    axes[1, 2].set_title('Histogramas Comparativos')
    axes[1, 2].set_xlabel('Intensidade')
    axes[1, 2].set_ylabel('Frequência')
    axes[1, 2].legend()
    
    plt.tight_layout()
    plt.show()

def visualize_edge_detection_filters(results):
    """Visualiza filtros de detecção de bordas"""
    
    fig, axes = plt.subplots(2, 3, figsize=(18, 12))
    
    filters = [
        ('original', 'Original'),
        ('sobel', 'Sobel'),
        ('prewitt', 'Prewitt'),
        ('roberts', 'Roberts'),
        ('canny', 'Canny')
    ]
    
    for i, (key, title) in enumerate(filters):
        row = i // 3
        col = i % 3
        
        axes[row, col].imshow(results[key], cmap='gray')
        axes[row, col].set_title(title)
        axes[row, col].axis('off')
    
    # Histograma comparativo
    axes[1, 2].hist(results['sobel'].ravel(), bins=50, alpha=0.7, label='Sobel', color='blue')
    axes[1, 2].hist(results['prewitt'].ravel(), bins=50, alpha=0.7, label='Prewitt', color='red')
    axes[1, 2].hist(results['canny'].ravel(), bins=50, alpha=0.7, label='Canny', color='green')
    axes[1, 2].set_title('Histogramas Comparativos')
    axes[1, 2].set_xlabel('Intensidade')
    axes[1, 2].set_ylabel('Frequência')
    axes[1, 2].legend()
    
    plt.tight_layout()
    plt.show()

def analyze_filters_performance(smoothing_results, sharpening_results, edge_results):
    """Analisa performance dos filtros"""
    
    print("=== ANÁLISE DE PERFORMANCE DOS FILTROS ===")
    
    # Análise suavização
    print("\nFiltros de Suavização:")
    for key, title in [('original', 'Original'), ('mean', 'Média'), ('gaussian', 'Gaussiano'), ('median', 'Mediana')]:
        img = smoothing_results[key]
        mean_val = np.mean(img)
        std_val = np.std(img)
        print(f"  - {title}: Mean={mean_val:.1f}, Std={std_val:.1f}")
    
    # Análise nitidez
    print("\nFiltros de Nitidez:")
    for key, title in [('laplacian', 'Laplaciano'), ('unsharp_mask', 'Unsharp Masking'), ('high_pass', 'High-Pass')]:
        img = sharpening_results[key]
        mean_val = np.mean(img)
        std_val = np.std(img)
        print(f"  - {title}: Mean={mean_val:.1f}, Std={std_val:.1f}")
    
    # Análise detecção de bordas
    print("\nFiltros de Detecção de Bordas:")
    for key, title in [('sobel', 'Sobel'), ('prewitt', 'Prewitt'), ('roberts', 'Roberts'), ('canny', 'Canny')]:
        img = edge_results[key]
        mean_val = np.mean(img)
        std_val = np.std(img)
        edge_pixels = np.sum(img > 128)
        total_pixels = img.size
        edge_percentage = (edge_pixels / total_pixels) * 100
        print(f"  - {title}: Mean={mean_val:.1f}, Std={std_val:.1f}, Edges={edge_percentage:.1f}%")

# Executar demonstração
print("=== DEMONSTRAÇÃO: FILTROS ESPACIAIS ===")

# Carregar imagem
image_rgb, image_gray = load_sample_image()

# Filtros de suavização
print("\nAplicando filtros de suavização...")
smoothing_results = smoothing_filters(image_gray)
print("✓ Filtros de suavização aplicados")

# Filtros de nitidez
print("\nAplicando filtros de nitidez...")
sharpening_results = sharpening_filters(image_gray)
print("✓ Filtros de nitidez aplicados")

# Filtros de detecção de bordas
print("\nAplicando filtros de detecção de bordas...")
edge_results = edge_detection_filters(image_gray)
print("✓ Filtros de detecção de bordas aplicados")

# Visualizar resultados
print("\nVisualizando filtros de suavização...")
visualize_smoothing_filters(smoothing_results)

print("\nVisualizando filtros de nitidez...")
visualize_sharpening_filters(sharpening_results)

print("\nVisualizando filtros de detecção de bordas...")
visualize_edge_detection_filters(edge_results)

# Analisar performance
analyze_filters_performance(smoothing_results, sharpening_results, edge_results)

print("\n=== DEMONSTRAÇÃO CONCLUÍDA ===")

### Análise dos Resultados

**Observações Importantes:**

1. **Filtros de Suavização**:
   - **Média**: Reduz ruído mas borra detalhes
   - **Gaussiano**: Suavização natural e simétrica
   - **Mediana**: Eficaz contra ruído impulsivo
   - **Bilateral**: Preserva bordas enquanto suaviza

2. **Filtros de Nitidez**:
   - **Laplaciano**: Realça bordas e detalhes
   - **Unsharp Masking**: Nitidez controlada
   - **High-Pass**: Enfatiza frequências altas
   - **Aplicação**: Melhoria de qualidade visual

3. **Filtros de Detecção de Bordas**:
   - **Sobel**: Gradiente robusto e eficiente
   - **Prewitt**: Similar ao Sobel, menos suavizado
   - **Roberts**: Detecção de bordas diagonais
   - **Canny**: Bordas finas e bem definidas

---

## 📝 Resumo do Módulo 2

### Principais Conceitos Abordados

1. **Fundamentos**: Base teórica de Gonzalez & Woods
2. **Representação**: Matemática de imagens digitais
3. **Tipos**: Escala de cinza, coloridas e binárias
4. **Operações**: Aritméticas, geométricas e lógicas
5. **Transformações**: Intensidade e histograma
6. **Filtros**: Espaciais e suas aplicações

### Demonstrações Práticas

**1. Tipos de Imagens:**
   - Visualização de diferentes formatos
   - Análise de histogramas
   - Características estatísticas

**2. Operações Básicas:**
   - Aritméticas (adição, subtração)
   - Lógicas (AND, OR)
   - Geométricas (rotação, escala)

**3. Transformações:**
   - Lineares (contraste, brilho)
   - Não-lineares (log, potência)
   - Equalização de histograma

**4. Filtros Espaciais:**
   - Suavização (média, gaussiano, mediana)
   - Nitidez (laplaciano, unsharp masking)
   - Detecção de bordas (sobel, prewitt, canny)

### Próximos Passos

No **Módulo 3**, aplicaremos esses fundamentos para construir **Redes Neurais Convolucionais (CNNs)**, que são a base do deep learning para visão computacional.

### Referências Principais

- [Digital Image Processing - Gonzalez & Woods](https://www.pearson.com/us/higher-education/program/Gonzalez-Digital-Image-Processing-4th-Edition/PGM110167.html)
- [Computer Vision: Algorithms and Applications - Szeliski](https://szeliski.org/Book/)

---

**Próximo Módulo**: Deep Learning para Visão Computacional

## 🎯 Conexão com o Próximo Módulo

Agora que dominamos os **fundamentos do processamento digital de imagem** e implementamos **filtros espaciais**, estamos preparados para aplicar esses conceitos em **Redes Neurais Convolucionais**.

No **Módulo 3**, veremos como:

### 🔗 **Conexões Diretas:**

1. **Filtros Espaciais** → **Camadas Convolucionais**
   - Os kernels que estudamos se tornam **filtros aprendíveis**
   - Operação de convolução aplicada em toda a imagem

2. **Operações Básicas** → **Funções de Ativação**
   - Transformações de intensidade
   - Funções não-lineares (ReLU, sigmoid)

3. **Representação Matemática** → **Tensores**
   - Matrizes de pixels
   - Estruturas de dados multidimensionais

4. **Técnicas Clássicas** → **Deep Learning**
   - Processamento manual
   - Aprendizado automático de características

### 🚀 **Evolução Natural:**

- **Processamento Manual** → **Aprendizado Automático**
- **Filtros Fixos** → **Filtros Adaptativos**
- **Técnicas Clássicas** → **Redes Neurais**
- **Fundamentos** → **Aplicações Avançadas**

Esta transição marca o início da **era do deep learning** em visão computacional!

## 🖼️ Imagens de Referência - Módulo 2

![Operações Aritméticas](https://cdn.jsdelivr.net/gh/rfapo/visao-computacional@main/images/modulo2/operacoes_aritmeticas.png)

![Operações Geométricas](https://cdn.jsdelivr.net/gh/rfapo/visao-computacional@main/images/modulo2/operacoes_geometricas.png)

