# Módulo 2: Processamento Digital de Imagem - Fundamentos## Objetivos de Aprendizagem- Compreender os fundamentos matemáticos de imagens digitais- Dominar operações básicas de processamento de imagem- Aplicar filtros e transformações essenciais- Implementar técnicas práticas com OpenCV---## 2.1 Fundamentos de Gonzalez & Woods**Rafael C. Gonzalez** e **Richard E. Woods** são autores da obra seminal **"Digital Image Processing"** (4ª Edição), considerada a referência definitiva em processamento digital de imagem.![Gonzalez & Woods](https://raw.githubusercontent.com/rfapo/visao-computacional/main/images/modulo2/gonzalez_woods.png)### Fundamentos do Processamento Digital de Imagem**Processamento Digital de Imagem** é o conjunto de técnicas computacionais para manipular, analisar e interpretar imagens digitais. Baseado nos fundamentos estabelecidos por Gonzalez & Woods.![Fundamentos do Processamento](https://raw.githubusercontent.com/rfapo/visao-computacional/main/images/modulo2/fundamentos_processamento.png)### Representação de Imagens DigitaisUma imagem digital é uma representação matemática de uma imagem real, onde cada pixel possui um valor numérico que representa sua intensidade luminosa.![Representação Matemática de Imagens](https://raw.githubusercontent.com/rfapo/visao-computacional/main/images/modulo2/representacao_matematica_imagens.png)**Características Fundamentais:**- **Matrizes de pixels**: Imagens são representadas como matrizes bidimensionais- **Profundidade de bits**: Determina quantos valores diferentes um pixel pode assumir- **Resolução espacial**: Número de pixels por unidade de comprimento- **Resolução de intensidade**: Número de níveis de cinza distintos### Tipos de Imagens Digitais**1. Imagens em Escala de Cinza:**- Cada pixel representa apenas a intensidade luminosa- Valores típicos: 0 (preto) a 255 (branco) para imagens 8-bit- Representação: Matriz 2D**2. Imagens Coloridas:**- Cada pixel possui múltiplos canais (RGB, HSV, etc.)- RGB: Vermelho, Verde, Azul- Representação: Matriz 3D (altura × largura × canais)**3. Imagens Binárias:**- Apenas dois valores: 0 (preto) e 1 ou 255 (branco)- Usadas para segmentação e análise de formas- Representação: Matriz 2D com valores binários![Tipos de Imagens Digitais](https://raw.githubusercontent.com/rfapo/visao-computacional/main/images/modulo2/tipos_imagens_digitais.png)**Referências:**- [Digital Image Processing - Gonzalez & Woods](https://www.pearson.com/us/higher-education/program/Gonzalez-Digital-Image-Processing-4th-Edition/PGM110167.html)- [Computer Vision: Algorithms and Applications - Szeliski](https://szeliski.org/Book/)

## 2.2 Demonstração Prática: Visualização de Tipos de Imagens

Vamos criar e visualizar diferentes tipos de imagens digitais para entender suas características:


In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt
from PIL import Image
import seaborn as sns

def create_sample_images():
    """Cria imagens de exemplo para demonstração"""
    
    # 1. Imagem em escala de cinza
    gray_image = np.zeros((200, 200), dtype=np.uint8)
    
    # Criar gradiente
    for i in range(200):
        gray_image[:, i] = int(255 * i / 199)
    
    # Adicionar formas
    cv2.circle(gray_image, (100, 100), 50, 128, -1)
    cv2.rectangle(gray_image, (50, 50), (150, 150), 200, 2)
    
    # 2. Imagem colorida RGB
    color_image = np.zeros((200, 200, 3), dtype=np.uint8)
    
    # Criar padrão colorido
    for i in range(200):
        for j in range(200):
            color_image[i, j, 0] = int(255 * i / 199)  # Red
            color_image[i, j, 1] = int(255 * j / 199)  # Green
            color_image[i, j, 2] = int(255 * (i + j) / 398)  # Blue
    
    # Adicionar formas coloridas
    cv2.circle(color_image, (100, 100), 50, (255, 255, 255), -1)
    cv2.rectangle(color_image, (50, 50), (150, 150), (0, 0, 0), 2)
    
    # 3. Imagem binária
    binary_image = np.zeros((200, 200), dtype=np.uint8)
    
    # Criar padrão binário
    for i in range(0, 200, 20):
        for j in range(0, 200, 20):
            if (i // 20 + j // 20) % 2 == 0:
                binary_image[i:i+20, j:j+20] = 255
    
    # Adicionar formas
    cv2.circle(binary_image, (100, 100), 50, 255, -1)
    cv2.rectangle(binary_image, (50, 50), (150, 150), 0, 2)
    
    return gray_image, color_image, binary_image

def visualize_image_types():
    """Visualiza diferentes tipos de imagens digitais"""
    
    # Criar imagens de exemplo
    gray_img, color_img, binary_img = create_sample_images()
    
    # Configurar visualização
    fig, axes = plt.subplots(2, 3, figsize=(15, 10))
    
    # Imagem em escala de cinza
    axes[0, 0].imshow(gray_img, cmap='gray')
    axes[0, 0].set_title('Imagem em Escala de Cinza\n(200×200, 8-bit)')
    axes[0, 0].axis('off')
    
    # Histograma da imagem em escala de cinza
    axes[1, 0].hist(gray_img.flatten(), bins=50, color='gray', alpha=0.7)
    axes[1, 0].set_title('Histograma de Intensidades')
    axes[1, 0].set_xlabel('Intensidade')
    axes[1, 0].set_ylabel('Frequência')
    
    # Imagem colorida
    axes[0, 1].imshow(cv2.cvtColor(color_img, cv2.COLOR_BGR2RGB))
    axes[0, 1].set_title('Imagem Colorida RGB\n(200×200×3, 8-bit por canal)')
    axes[0, 1].axis('off')
    
    # Histogramas dos canais RGB
    colors = ['red', 'green', 'blue']
    for i, color in enumerate(colors):
        axes[1, 1].hist(color_img[:, :, i].flatten(), bins=50, 
                        color=color, alpha=0.5, label=f'Canal {color.upper()}')
    axes[1, 1].set_title('Histogramas dos Canais RGB')
    axes[1, 1].set_xlabel('Intensidade')
    axes[1, 1].set_ylabel('Frequência')
    axes[1, 1].legend()
    
    # Imagem binária
    axes[0, 2].imshow(binary_img, cmap='gray')
    axes[0, 2].set_title('Imagem Binária\n(200×200, 1-bit)')
    axes[0, 2].axis('off')
    
    # Histograma da imagem binária
    axes[1, 2].hist(binary_img.flatten(), bins=2, color='black', alpha=0.7)
    axes[1, 2].set_title('Histograma Binário')
    axes[1, 2].set_xlabel('Valor (0 ou 255)')
    axes[1, 2].set_ylabel('Frequência')
    axes[1, 2].set_xticks([0, 255])
    
    plt.suptitle('Tipos de Imagens Digitais e suas Características', fontsize=16)
    plt.tight_layout()
    plt.show()
    
    return gray_img, color_img, binary_img

# Executar demonstração
sample_images = visualize_image_types()

### Análise dos Resultados

**Características Observadas:**

1. **Imagem em Escala de Cinza:**
   - **Formato**: Matriz 2D (200×200)
   - **Valores**: 0-255 (8 bits)
   - **Histograma**: Distribuição contínua de intensidades

2. **Imagem Colorida RGB:**
   - **Formato**: Matriz 3D (200×200×3)
   - **Canais**: Vermelho, Verde, Azul
   - **Histogramas**: Um para cada canal

3. **Imagem Binária:**
   - **Formato**: Matriz 2D (200×200)
   - **Valores**: Apenas 0 e 255
   - **Histograma**: Distribuição bimodal

**Insights Importantes:**
- **Complexidade**: Escala de cinza < Binária < Colorida
- **Armazenamento**: Binária < Escala de cinza < Colorida
- **Aplicações**: Cada tipo tem usos específicos

**Referências:**
- [Digital Image Processing - Gonzalez & Woods](https://www.pearson.com/us/higher-education/program/Gonzalez-Digital-Image-Processing-4th-Edition/PGM110167.html)


## 2.3 Operações Básicas de Processamento### Operações Aritméticas**Adição de Imagens:**- **Propósito**: Combinar informações de múltiplas imagens- **Aplicações**: Redução de ruído, composição- **Fórmula**: C(x,y) = A(x,y) + B(x,y)**Subtração de Imagens:**- **Propósito**: Detectar diferenças entre imagens- **Aplicações**: Detecção de movimento, análise de mudanças- **Fórmula**: C(x,y) = |A(x,y) - B(x,y)|**Multiplicação por Escalar:**- **Propósito**: Ajustar brilho e contraste- **Aplicações**: Melhoria de qualidade visual- **Fórmula**: C(x,y) = α × A(x,y)![Operações Aritméticas](https://raw.githubusercontent.com/rfapo/visao-computacional/main/images/modulo2/operacoes_aritmeticas.png)### Operações Lógicas**AND, OR, NOT:**- **Propósito**: Manipulação de imagens binárias- **Aplicações**: Morfologia matemática, segmentação- **Uso**: Operações pixel a pixel### Operações Geométricas**Translação:**- **Propósito**: Mover imagem no plano- **Aplicações**: Registro de imagens**Rotação:**- **Propósito**: Girar imagem em torno de um ponto- **Aplicações**: Correção de orientação**Escala:**- **Propósito**: Redimensionar imagem- **Aplicações**: Normalização, zoom![Operações Geométricas](https://raw.githubusercontent.com/rfapo/visao-computacional/main/images/modulo2/operacoes_geometricas.png)**Referências:**- [Digital Image Processing - Gonzalez & Woods](https://www.pearson.com/us/higher-education/program/Gonzalez-Digital-Image-Processing-4th-Edition/PGM110167.html)

## 2.4 Demonstração Prática: Operações Básicas

Vamos implementar e visualizar as operações básicas de processamento de imagem:


In [None]:
def demonstrate_basic_operations():
    """Demonstra operações básicas de processamento de imagem"""
    
    # Criar imagens de exemplo
    img1 = np.zeros((150, 150), dtype=np.uint8)
    img2 = np.zeros((150, 150), dtype=np.uint8)
    
    # Imagem 1: Círculo
    cv2.circle(img1, (75, 75), 50, 255, -1)
    
    # Imagem 2: Retângulo
    cv2.rectangle(img2, (50, 50), (100, 100), 255, -1)
    
    # Operações aritméticas
    addition = cv2.add(img1, img2)
    subtraction = cv2.subtract(img1, img2)
    multiplication = cv2.multiply(img1, 0.5)
    
    # Operações lógicas
    logical_and = cv2.bitwise_and(img1, img2)
    logical_or = cv2.bitwise_or(img1, img2)
    logical_not = cv2.bitwise_not(img1)
    
    # Operações geométricas
    # Translação
    M_translation = np.float32([[1, 0, 30], [0, 1, 30]])
    translated = cv2.warpAffine(img1, M_translation, (150, 150))
    
    # Rotação
    M_rotation = cv2.getRotationMatrix2D((75, 75), 45, 1)
    rotated = cv2.warpAffine(img1, M_rotation, (150, 150))
    
    # Escala
    scaled = cv2.resize(img1, (100, 100))
    scaled = cv2.resize(scaled, (150, 150))
    
    # Visualização
    fig, axes = plt.subplots(4, 3, figsize=(15, 20))
    
    # Imagens originais
    axes[0, 0].imshow(img1, cmap='gray')
    axes[0, 0].set_title('Imagem 1 (Círculo)')
    axes[0, 0].axis('off')
    
    axes[0, 1].imshow(img2, cmap='gray')
    axes[0, 1].set_title('Imagem 2 (Retângulo)')
    axes[0, 1].axis('off')
    
    axes[0, 2].text(0.5, 0.5, 'Operações\nBásicas', ha='center', va='center', 
                    fontsize=14, bbox=dict(boxstyle='round', facecolor='lightblue'))
    axes[0, 2].axis('off')
    
    # Operações aritméticas
    axes[1, 0].imshow(addition, cmap='gray')
    axes[1, 0].set_title('Adição (A + B)')
    axes[1, 0].axis('off')
    
    axes[1, 1].imshow(subtraction, cmap='gray')
    axes[1, 1].set_title('Subtração (A - B)')
    axes[1, 1].axis('off')
    
    axes[1, 2].imshow(multiplication, cmap='gray')
    axes[1, 2].set_title('Multiplicação (A × 0.5)')
    axes[1, 2].axis('off')
    
    # Operações lógicas
    axes[2, 0].imshow(logical_and, cmap='gray')
    axes[2, 0].set_title('AND Lógico')
    axes[2, 0].axis('off')
    
    axes[2, 1].imshow(logical_or, cmap='gray')
    axes[2, 1].set_title('OR Lógico')
    axes[2, 1].axis('off')
    
    axes[2, 2].imshow(logical_not, cmap='gray')
    axes[2, 2].set_title('NOT Lógico')
    axes[2, 2].axis('off')
    
    # Operações geométricas
    axes[3, 0].imshow(translated, cmap='gray')
    axes[3, 0].set_title('Translação (+30, +30)')
    axes[3, 0].axis('off')
    
    axes[3, 1].imshow(rotated, cmap='gray')
    axes[3, 1].set_title('Rotação (45°)')
    axes[3, 1].axis('off')
    
    axes[3, 2].imshow(scaled, cmap='gray')
    axes[3, 2].set_title('Escala (0.67x)')
    axes[3, 2].axis('off')
    
    plt.suptitle('Operações Básicas de Processamento de Imagem', fontsize=16)
    plt.tight_layout()
    plt.show()
    
    return {
        'original1': img1,
        'original2': img2,
        'addition': addition,
        'subtraction': subtraction,
        'multiplication': multiplication,
        'logical_and': logical_and,
        'logical_or': logical_or,
        'logical_not': logical_not,
        'translated': translated,
        'rotated': rotated,
        'scaled': scaled
    }

# Executar demonstração
operations_results = demonstrate_basic_operations()

### Análise das Operações

**Operações Aritméticas:**
- **Adição**: Combina informações, pode causar saturação
- **Subtração**: Detecta diferenças, útil para detecção de movimento
- **Multiplicação**: Ajusta brilho, valores menores escurecem a imagem

**Operações Lógicas:**
- **AND**: Interseção de regiões
- **OR**: União de regiões
- **NOT**: Inversão de valores

**Operações Geométricas:**
- **Translação**: Move sem distorção
- **Rotação**: Preserva forma, pode cortar bordas
- **Escala**: Redimensiona, pode causar perda de qualidade

**Referências:**
- [Digital Image Processing - Gonzalez & Woods](https://www.pearson.com/us/higher-education/program/Gonzalez-Digital-Image-Processing-4th-Edition/PGM110167.html)


## 2.5 Filtros e Transformações### Filtros Espaciais**Filtros de Suavização:**- **Média**: Reduz ruído, suaviza bordas- **Gaussiano**: Suavização mais natural- **Mediana**: Remove ruído impulsivo**Filtros de Realce:**- **Sobel**: Detecção de bordas- **Laplaciano**: Realce de bordas- **Unsharp Masking**: Realce de detalhes![Filtros Espaciais](https://raw.githubusercontent.com/rfapo/visao-computacional/main/images/modulo2/filtros_espaciais.png)### Transformações de Intensidade**Transformações Lineares:**- **Ajuste de Brilho**: s = r + c- **Ajuste de Contraste**: s = α × r- **Transformação Linear**: s = α × r + β**Transformações Não-Lineares:**- **Logarítmica**: s = c × log(1 + r)- **Potência (Gamma)**: s = c × r^γ- **Thresholding**: s = 255 se r > T, senão 0![Transformações de Intensidade](https://raw.githubusercontent.com/rfapo/visao-computacional/main/images/modulo2/transformacoes_intensidade.png)### Transformações Geométricas**Transformações Afins:**- **Translação**: x' = x + tx, y' = y + ty- **Rotação**: x' = x×cos(θ) - y×sin(θ), y' = x×sin(θ) + y×cos(θ)- **Escala**: x' = sx×x, y' = sy×y**Transformações Perspectivas:**- **Homografia**: Transformação projetiva- **Aplicações**: Correção de perspectiva, panorama**Referências:**- [Digital Image Processing - Gonzalez & Woods](https://www.pearson.com/us/higher-education/program/Gonzalez-Digital-Image-Processing-4th-Edition/PGM110167.html)

## 2.6 Demonstração Prática: Filtros e Transformações

Vamos implementar e visualizar diferentes filtros e transformações:


In [None]:
def demonstrate_filters_and_transformations():
    """Demonstra filtros e transformações de imagem"""
    
    # Criar imagem de exemplo com ruído
    original = np.zeros((200, 200), dtype=np.uint8)
    
    # Adicionar formas
    cv2.circle(original, (100, 100), 80, 255, -1)
    cv2.rectangle(original, (50, 50), (150, 150), 128, 2)
    
    # Adicionar ruído
    noise = np.random.normal(0, 20, original.shape).astype(np.int16)
    noisy_image = np.clip(original.astype(np.int16) + noise, 0, 255).astype(np.uint8)
    
    # Filtros de suavização
    mean_filter = cv2.blur(noisy_image, (5, 5))
    gaussian_filter = cv2.GaussianBlur(noisy_image, (5, 5), 0)
    median_filter = cv2.medianBlur(noisy_image, 5)
    
    # Filtros de realce
    sobel_x = cv2.Sobel(original, cv2.CV_64F, 1, 0, ksize=3)
    sobel_y = cv2.Sobel(original, cv2.CV_64F, 0, 1, ksize=3)
    sobel_magnitude = np.sqrt(sobel_x**2 + sobel_y**2)
    
    laplacian = cv2.Laplacian(original, cv2.CV_64F)
    
    # Transformações de intensidade
    # Brilho
    brightness = cv2.add(original, 50)
    
    # Contraste
    contrast = cv2.multiply(original, 1.5)
    
    # Gamma correction
    gamma = 2.0
    gamma_corrected = np.power(original / 255.0, gamma) * 255.0
    gamma_corrected = gamma_corrected.astype(np.uint8)
    
    # Thresholding
    _, threshold = cv2.threshold(original, 127, 255, cv2.THRESH_BINARY)
    
    # Visualização
    fig, axes = plt.subplots(4, 4, figsize=(20, 20))
    
    # Imagens originais
    axes[0, 0].imshow(original, cmap='gray')
    axes[0, 0].set_title('Imagem Original')
    axes[0, 0].axis('off')
    
    axes[0, 1].imshow(noisy_image, cmap='gray')
    axes[0, 1].set_title('Imagem com Ruído')
    axes[0, 1].axis('off')
    
    axes[0, 2].text(0.5, 0.5, 'Filtros de\nSuavização', ha='center', va='center', 
                    fontsize=12, bbox=dict(boxstyle='round', facecolor='lightgreen'))
    axes[0, 2].axis('off')
    
    axes[0, 3].text(0.5, 0.5, 'Filtros de\nRealce', ha='center', va='center', 
                    fontsize=12, bbox=dict(boxstyle='round', facecolor='lightcoral'))
    axes[0, 3].axis('off')
    
    # Filtros de suavização
    axes[1, 0].imshow(mean_filter, cmap='gray')
    axes[1, 0].set_title('Filtro de Média')
    axes[1, 0].axis('off')
    
    axes[1, 1].imshow(gaussian_filter, cmap='gray')
    axes[1, 1].set_title('Filtro Gaussiano')
    axes[1, 1].axis('off')
    
    axes[1, 2].imshow(median_filter, cmap='gray')
    axes[1, 2].set_title('Filtro Mediana')
    axes[1, 2].axis('off')
    
    axes[1, 3].text(0.5, 0.5, 'Transformações\nde Intensidade', ha='center', va='center', 
                    fontsize=12, bbox=dict(boxstyle='round', facecolor='lightyellow'))
    axes[1, 3].axis('off')
    
    # Filtros de realce
    axes[2, 0].imshow(np.abs(sobel_magnitude), cmap='gray')
    axes[2, 0].set_title('Sobel (Magnitude)')
    axes[2, 0].axis('off')
    
    axes[2, 1].imshow(np.abs(laplacian), cmap='gray')
    axes[2, 1].set_title('Laplaciano')
    axes[2, 1].axis('off')
    
    axes[2, 2].text(0.5, 0.5, 'Outros\nFiltros', ha='center', va='center', 
                    fontsize=12, bbox=dict(boxstyle='round', facecolor='lightblue'))
    axes[2, 2].axis('off')
    
    axes[2, 3].text(0.5, 0.5, 'Thresholding\ne Binarização', ha='center', va='center', 
                    fontsize=12, bbox=dict(boxstyle='round', facecolor='lightpink'))
    axes[2, 3].axis('off')
    
    # Transformações de intensidade
    axes[3, 0].imshow(brightness, cmap='gray')
    axes[3, 0].set_title('Ajuste de Brilho (+50)')
    axes[3, 0].axis('off')
    
    axes[3, 1].imshow(contrast, cmap='gray')
    axes[3, 1].set_title('Ajuste de Contraste (×1.5)')
    axes[3, 1].axis('off')
    
    axes[3, 2].imshow(gamma_corrected, cmap='gray')
    axes[3, 2].set_title('Correção Gamma (γ=2.0)')
    axes[3, 2].axis('off')
    
    axes[3, 3].imshow(threshold, cmap='gray')
    axes[3, 3].set_title('Thresholding (T=127)')
    axes[3, 3].axis('off')
    
    plt.suptitle('Filtros e Transformações de Imagem', fontsize=16)
    plt.tight_layout()
    plt.show()
    
    return {
        'original': original,
        'noisy': noisy_image,
        'mean_filter': mean_filter,
        'gaussian_filter': gaussian_filter,
        'median_filter': median_filter,
        'sobel': sobel_magnitude,
        'laplacian': laplacian,
        'brightness': brightness,
        'contrast': contrast,
        'gamma': gamma_corrected,
        'threshold': threshold
    }

# Executar demonstração
filters_results = demonstrate_filters_and_transformations()

### Análise dos Filtros e Transformações

**Filtros de Suavização:**
- **Média**: Reduz ruído mas suaviza bordas
- **Gaussiano**: Suavização mais natural, preserva melhor as bordas
- **Mediana**: Excelente para ruído impulsivo, preserva bordas

**Filtros de Realce:**
- **Sobel**: Detecta bordas em direções específicas
- **Laplaciano**: Realça todas as bordas, sensível ao ruído

**Transformações de Intensidade:**
- **Brilho**: Adiciona/subtrai valor constante
- **Contraste**: Multiplica por fator, pode causar saturação
- **Gamma**: Transformação não-linear, ajusta curva de resposta
- **Thresholding**: Converte para imagem binária

**Referências:**
- [Digital Image Processing - Gonzalez & Woods](https://www.pearson.com/us/higher-education/program/Gonzalez-Digital-Image-Processing-4th-Edition/PGM110167.html)


## Resumo do Módulo 2

### Principais Conceitos Abordados

1. **Fundamentos de Gonzalez & Woods**
   - Representação matemática de imagens
   - Tipos de imagens digitais
   - Características fundamentais

2. **Operações Básicas**
   - Operações aritméticas (adição, subtração, multiplicação)
   - Operações lógicas (AND, OR, NOT)
   - Operações geométricas (translação, rotação, escala)

3. **Filtros e Transformações**
   - Filtros espaciais (suavização, realce)
   - Transformações de intensidade
   - Transformações geométricas

### Demonstrações Práticas

**1. Visualização de Tipos de Imagens:**
- Imagens em escala de cinza
- Imagens coloridas RGB
- Imagens binárias
- Análise de histogramas

**2. Operações Básicas:**
- Operações aritméticas e lógicas
- Transformações geométricas
- Comparação visual de resultados

**3. Filtros e Transformações:**
- Filtros de suavização e realce
- Transformações de intensidade
- Análise de efeitos visuais

### Próximos Passos

No próximo módulo, exploraremos **Deep Learning para Visão Computacional**, onde aprenderemos sobre CNNs e arquiteturas clássicas.

### Referências Principais

- [Digital Image Processing - Gonzalez & Woods](https://www.pearson.com/us/higher-education/program/Gonzalez-Digital-Image-Processing-4th-Edition/PGM110167.html)
- [Computer Vision: Algorithms and Applications - Szeliski](https://szeliski.org/Book/)

---

**Próximo Módulo**: Deep Learning para Visão Computacional
