# Módulo 1: Introdução e História da Visão Computacional

## 🎯 Objetivos de Aprendizagem

Ao final deste módulo, você será capaz de:

- ✅ Compreender o que é visão computacional e sua importância
- ✅ Conhecer a evolução histórica da área
- ✅ Entender as diferenças entre processamento de imagem e visão computacional
- ✅ Identificar aplicações cotidianas da visão computacional
- ✅ Implementar técnicas básicas de detecção de bordas

---

## 👁️ 1.1 O que é Visão Computacional?

### Definição

**Visão Computacional** é uma área da inteligência artificial que visa dar às máquinas a capacidade de "ver" e interpretar o mundo visual, extraindo informações significativas de imagens e vídeos.

![Definição Visão Computacional](https://github.com/rfapo/visao-computacional/blob/main/images/modulo1/definicao_visao_computacional.png?raw=true)

### Características Principais

| Aspecto | Descrição |
|---------|-----------|
| **Entrada** | Imagens digitais ou vídeos |
| **Processamento** | Algoritmos de análise visual |
| **Saída** | Informação estruturada sobre o conteúdo |
| **Objetivo** | Compreender e interpretar cenas visuais |

### Diferenças entre Processamento de Imagem e Visão Computacional

![Diferenças Processamento vs Visão](https://github.com/rfapo/visao-computacional/blob/main/images/modulo1/diferencas_processamento_visao.png?raw=true)

#### **Processamento de Imagem:**
- **Foco**: Melhorar a qualidade da imagem
- **Entrada**: Imagem
- **Saída**: Imagem processada
- **Exemplos**: Redução de ruído, correção de cores

#### **Visão Computacional:**
- **Foco**: Extrair informação semântica
- **Entrada**: Imagem
- **Saída**: Informação estruturada
- **Exemplos**: Reconhecimento de objetos, análise de cenas

---

## 📚 1.2 Evolução Histórica

### Marcos Importantes

![Evolução Histórica](https://github.com/rfapo/visao-computacional/blob/main/images/modulo1/evolucao_historica.png?raw=true)

#### **Década de 1960-1970: Fundamentos**
- **1963**: Primeiros algoritmos de detecção de bordas
- **1966**: Projeto MIT "Summer Vision Project"
- **1970**: Primeiros sistemas de reconhecimento de padrões

#### **Década de 1980-1990: Desenvolvimento**
- **1980**: Algoritmos de correspondência estéreo
- **1986**: Backpropagation para redes neurais
- **1990**: Primeiros sistemas comerciais de visão

#### **Década de 2000-2010: Revolução**
- **2001**: Viola-Jones para detecção facial
- **2006**: SIFT (Scale-Invariant Feature Transform)
- **2009**: ImageNet dataset

#### **Década de 2010-2020: Era do Deep Learning**
- **2012**: AlexNet revoluciona ImageNet
- **2015**: ResNet com skip connections
- **2017**: Attention mechanisms

#### **Década de 2020+: Foundation Models**
- **2020**: Vision Transformers (ViT)
- **2021**: CLIP para visão-linguagem
- **2022**: DALL-E e modelos generativos

### Referências Acadêmicas Importantes

#### **CS231n - Stanford**
O curso **CS231n: Convolutional Neural Networks for Visual Recognition** da Stanford University é uma referência fundamental para aprender visão computacional moderna.

![CS231n Stanford](https://github.com/rfapo/visao-computacional/blob/main/images/modulo1/cs231n_stanford.png?raw=true)

**Características:**
- **Conteúdo**: CNNs, RNNs, Detection, Segmentation
- **Implementação**: Código prático em PyTorch
- **Disponibilidade**: Gratuito online
- **Atualização**: Conteúdo atualizado regularmente

---

## 🌟 1.3 Importância da Visão Computacional na IA

### Por que é Importante?

![Importância Visão IA](https://github.com/rfapo/visao-computacional/blob/main/images/modulo1/importancia_visao_ia.png?raw=true)

#### **1. Dados Visuais Dominam**
- **80%** das informações que processamos são visuais
- **Bilhões** de imagens são compartilhadas diariamente
- **Crescimento exponencial** de conteúdo visual

#### **2. Aplicações Críticas**
- **Medicina**: Diagnóstico por imagem
- **Automação**: Carros autônomos
- **Segurança**: Reconhecimento facial
- **Entretenimento**: Realidade aumentada

#### **3. Base para Outras Áreas**
- **Robótica**: Navegação e manipulação
- **AR/VR**: Realidade aumentada e virtual
- **Multimodal**: Integração com linguagem natural

---

## 🏠 1.4 Aplicações Cotidianas da Visão Computacional

### Exemplos Práticos

![Aplicações Cotidianas](https://github.com/rfapo/visao-computacional/blob/main/images/modulo1/aplicacoes_cotidianas.png?raw=true)

#### **1. Smartphones**
- **Câmeras inteligentes**: Modo retrato, detecção de faces
- **Realidade aumentada**: Filtros e efeitos visuais
- **Organização**: Agrupamento automático de fotos

#### **2. Transporte**
- **Carros autônomos**: Detecção de pedestres e veículos
- **Estacionamento**: Detecção de vagas disponíveis
- **Tráfego**: Monitoramento de fluxo

#### **3. Redes Sociais**
- **Moderação**: Detecção de conteúdo inadequado
- **Filtros**: Efeitos visuais em tempo real
- **Recomendação**: Análise de conteúdo visual

#### **4. Saúde**
- **Diagnóstico**: Análise de exames médicos
- **Cirurgia**: Assistência robótica
- **Telemedicina**: Consultas remotas

---

## 🔍 1.5 Demonstração Prática: Técnicas de Detecção de Bordas

Vamos implementar e visualizar diferentes técnicas de detecção de bordas usando uma imagem real:

In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt
from scipy import ndimage
from skimage import filters
import os

def load_sample_image():
    """Carrega a imagem de exemplo"""
    
    # Caminho para a imagem do fotógrafo
    image_path = "images/modulo1/fotografo.png"
    
    if os.path.exists(image_path):
        # Carregar imagem
        image = cv2.imread(image_path)
        
        # Converter para RGB
        image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        
        # Converter para escala de cinza
        image_gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
        
        print(f"Imagem carregada: {image_rgb.shape}")
        return image_rgb, image_gray
    else:
        print(f"Imagem não encontrada em: {image_path}")
        print("Criando imagem sintética para demonstração...")
        
        # Criar imagem sintética
        image_rgb = np.zeros((300, 400, 3), dtype=np.uint8)
        
        # Adicionar formas
        cv2.circle(image_rgb, (150, 100), 50, (255, 0, 0), -1)
        cv2.rectangle(image_rgb, (200, 150), (300, 250), (0, 255, 0), -1)
        cv2.rectangle(image_rgb, (50, 200), (150, 300), (0, 0, 255), -1)
        
        # Adicionar texto
        cv2.putText(image_rgb, 'Sample Image', (100, 50), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 255, 255), 2)
        
        # Converter para escala de cinza
        image_gray = cv2.cvtColor(image_rgb, cv2.COLOR_RGB2GRAY)
        
        return image_rgb, image_gray

def sobel_edge_detection(image_gray):
    """Detecção de bordas usando Sobel"""
    
    # Gradientes Sobel
    sobel_x = cv2.Sobel(image_gray, cv2.CV_64F, 1, 0, ksize=3)
    sobel_y = cv2.Sobel(image_gray, cv2.CV_64F, 0, 1, ksize=3)
    
    # Magnitude do gradiente
    sobel_magnitude = np.sqrt(sobel_x**2 + sobel_y**2)
    
    # Direção do gradiente
    sobel_direction = np.arctan2(sobel_y, sobel_x)
    
    # Normalizar para visualização
    sobel_x_norm = np.uint8(np.absolute(sobel_x))
    sobel_y_norm = np.uint8(np.absolute(sobel_y))
    sobel_magnitude_norm = np.uint8(sobel_magnitude)
    
    return {
        'gradient_x': sobel_x_norm,
        'gradient_y': sobel_y_norm,
        'magnitude': sobel_magnitude_norm,
        'direction': sobel_direction
    }

def canny_edge_detection(image_gray, low_threshold=50, high_threshold=150):
    """Detecção de bordas usando Canny"""
    
    # Detecção de bordas Canny
    canny_edges = cv2.Canny(image_gray, low_threshold, high_threshold)
    
    return canny_edges

def laplacian_edge_detection(image_gray):
    """Detecção de bordas usando Laplaciano"""
    
    # Filtro Laplaciano
    laplacian = cv2.Laplacian(image_gray, cv2.CV_64F)
    
    # Normalizar para visualização
    laplacian_norm = np.uint8(np.absolute(laplacian))
    
    return laplacian_norm

def log_edge_detection(image_gray, sigma=1.0):
    """Detecção de bordas usando LoG (Laplacian of Gaussian)"""
    
    # Aplicar filtro Gaussiano
    gaussian = cv2.GaussianBlur(image_gray, (0, 0), sigma)
    
    # Aplicar Laplaciano
    log = cv2.Laplacian(gaussian, cv2.CV_64F)
    
    # Normalizar para visualização
    log_norm = np.uint8(np.absolute(log))
    
    return log_norm

def dog_edge_detection(image_gray, sigma1=1.0, sigma2=2.0):
    """Detecção de bordas usando DoG (Difference of Gaussians)"""
    
    # Aplicar dois filtros Gaussianos
    gaussian1 = cv2.GaussianBlur(image_gray, (0, 0), sigma1)
    gaussian2 = cv2.GaussianBlur(image_gray, (0, 0), sigma2)
    
    # Diferença dos Gaussianos
    dog = gaussian1.astype(np.float64) - gaussian2.astype(np.float64)
    
    # Normalizar para visualização
    dog_norm = np.uint8(np.absolute(dog))
    
    return dog_norm

def visualize_edge_detection_results(image_rgb, image_gray, results):
    """Visualiza resultados das técnicas de detecção de bordas"""
    
    fig, axes = plt.subplots(3, 3, figsize=(18, 15))
    
    # Imagem original
    axes[0, 0].imshow(image_rgb)
    axes[0, 0].set_title('Imagem Original')
    axes[0, 0].axis('off')
    
    # Imagem em escala de cinza
    axes[0, 1].imshow(image_gray, cmap='gray')
    axes[0, 1].set_title('Escala de Cinza')
    axes[0, 1].axis('off')
    
    # Sobel - Gradiente X
    axes[0, 2].imshow(results['sobel']['gradient_x'], cmap='gray')
    axes[0, 2].set_title('Sobel - Gradiente X')
    axes[0, 2].axis('off')
    
    # Sobel - Gradiente Y
    axes[1, 0].imshow(results['sobel']['gradient_y'], cmap='gray')
    axes[1, 0].set_title('Sobel - Gradiente Y')
    axes[1, 0].axis('off')
    
    # Sobel - Magnitude
    axes[1, 1].imshow(results['sobel']['magnitude'], cmap='gray')
    axes[1, 1].set_title('Sobel - Magnitude')
    axes[1, 1].axis('off')
    
    # Canny
    axes[1, 2].imshow(results['canny'], cmap='gray')
    axes[1, 2].set_title('Canny')
    axes[1, 2].axis('off')
    
    # Laplaciano
    axes[2, 0].imshow(results['laplacian'], cmap='gray')
    axes[2, 0].set_title('Laplaciano')
    axes[2, 0].axis('off')
    
    # LoG
    axes[2, 1].imshow(results['log'], cmap='gray')
    axes[2, 1].set_title('LoG (Laplacian of Gaussian)')
    axes[2, 1].axis('off')
    
    # DoG
    axes[2, 2].imshow(results['dog'], cmap='gray')
    axes[2, 2].set_title('DoG (Difference of Gaussians)')
    axes[2, 2].axis('off')
    
    plt.tight_layout()
    plt.show()

def analyze_edge_detection_performance(results):
    """Analisa performance das técnicas de detecção de bordas"""
    
    print("=== ANÁLISE DE PERFORMANCE DAS TÉCNICAS DE DETECÇÃO DE BORDAS ===")
    
    # Calcular estatísticas
    techniques = {
        'Sobel Magnitude': results['sobel']['magnitude'],
        'Canny': results['canny'],
        'Laplaciano': results['laplacian'],
        'LoG': results['log'],
        'DoG': results['dog']
    }
    
    print("\nEstatísticas por Técnica:")
    for name, image in techniques.items():
        # Calcular estatísticas
        mean_val = np.mean(image)
        std_val = np.std(image)
        max_val = np.max(image)
        min_val = np.min(image)
        
        # Contar pixels de borda (valores altos)
        edge_pixels = np.sum(image > 128)
        total_pixels = image.size
        edge_percentage = (edge_pixels / total_pixels) * 100
        
        print(f"\n{name}:")
        print(f"  - Valor médio: {mean_val:.2f}")
        print(f"  - Desvio padrão: {std_val:.2f}")
        print(f"  - Valor máximo: {max_val}")
        print(f"  - Valor mínimo: {min_val}")
        print(f"  - Pixels de borda (>128): {edge_pixels} ({edge_percentage:.1f}%)")
    
    # Comparação qualitativa
    print("\n=== COMPARAÇÃO QUALITATIVA ===")
    print("\nCaracterísticas das Técnicas:")
    print("\n1. Sobel:")
    print("   - Vantagens: Rápido, direção do gradiente")
    print("   - Desvantagens: Sensível ao ruído")
    print("   - Aplicação: Detecção de bordas em tempo real")
    
    print("\n2. Canny:")
    print("   - Vantagens: Bordas finas, boa precisão")
    print("   - Desvantagens: Parâmetros sensíveis")
    print("   - Aplicação: Detecção precisa de contornos")
    
    print("\n3. Laplaciano:")
    print("   - Vantagens: Simples, detecta mudanças bruscas")
    print("   - Desvantagens: Muito sensível ao ruído")
    print("   - Aplicação: Detecção de bordas em imagens suaves")
    
    print("\n4. LoG (Laplacian of Gaussian):")
    print("   - Vantagens: Reduz ruído, bordas suaves")
    print("   - Desvantagens: Computacionalmente caro")
    print("   - Aplicação: Detecção de bordas em imagens com ruído")
    
    print("\n5. DoG (Difference of Gaussians):")
    print("   - Vantagens: Detecta bordas em múltiplas escalas")
    print("   - Desvantagens: Parâmetros complexos")
    print("   - Aplicação: Detecção de bordas multiescala")

# Executar demonstração
print("=== DEMONSTRAÇÃO: TÉCNICAS DE DETECÇÃO DE BORDAS ===")

# Carregar imagem
image_rgb, image_gray = load_sample_image()

# Aplicar técnicas de detecção de bordas
print("\nAplicando técnicas de detecção de bordas...")

# Sobel
sobel_results = sobel_edge_detection(image_gray)
print("✓ Sobel aplicado")

# Canny
canny_result = canny_edge_detection(image_gray)
print("✓ Canny aplicado")

# Laplaciano
laplacian_result = laplacian_edge_detection(image_gray)
print("✓ Laplaciano aplicado")

# LoG
log_result = log_edge_detection(image_gray)
print("✓ LoG aplicado")

# DoG
dog_result = dog_edge_detection(image_gray)
print("✓ DoG aplicado")

# Organizar resultados
results = {
    'sobel': sobel_results,
    'canny': canny_result,
    'laplacian': laplacian_result,
    'log': log_result,
    'dog': dog_result
}

# Visualizar resultados
print("\nVisualizando resultados...")
visualize_edge_detection_results(image_rgb, image_gray, results)

# Analisar performance
analyze_edge_detection_performance(results)

print("\n=== DEMONSTRAÇÃO CONCLUÍDA ===")

### Análise dos Resultados

**Observações Importantes:**

1. **Sobel**:
   - **Gradiente X**: Detecta bordas verticais
   - **Gradiente Y**: Detecta bordas horizontais
   - **Magnitude**: Combina ambos os gradientes
   - **Aplicação**: Detecção de bordas em tempo real

2. **Canny**:
   - **Precisão**: Bordas finas e bem definidas
   - **Robustez**: Boa performance em diferentes condições
   - **Parâmetros**: Sensível aos thresholds
   - **Aplicação**: Detecção precisa de contornos

3. **Laplaciano**:
   - **Simplicidade**: Algoritmo direto
   - **Sensibilidade**: Detecta mudanças bruscas
   - **Ruído**: Muito sensível ao ruído
   - **Aplicação**: Detecção de bordas em imagens suaves

4. **LoG (Laplacian of Gaussian)**:
   - **Suavização**: Reduz ruído antes da detecção
   - **Qualidade**: Bordas mais suaves
   - **Custo**: Computacionalmente mais caro
   - **Aplicação**: Detecção de bordas em imagens com ruído

5. **DoG (Difference of Gaussians)**:
   - **Multiescala**: Detecta bordas em diferentes escalas
   - **Flexibilidade**: Adaptável a diferentes tamanhos
   - **Complexidade**: Parâmetros mais complexos
   - **Aplicação**: Detecção de bordas multiescala

---

## 📝 Resumo do Módulo 1

### Principais Conceitos Abordados

1. **Fundamentos**: Definição e importância da visão computacional
2. **História**: Evolução da área ao longo das décadas
3. **Diferenças**: Processamento de imagem vs visão computacional
4. **Aplicações**: Exemplos cotidianos e práticos
5. **Técnicas**: Detecção de bordas e implementação

### Demonstrações Práticas

**1. Técnicas de Detecção de Bordas:**
   - Implementação de Sobel, Canny, Laplaciano
   - LoG e DoG para detecção multiescala
   - Análise comparativa de performance
   - Visualização de resultados

### Próximos Passos

No **Módulo 2**, aprofundaremos os **Fundamentos do Processamento Digital de Imagem**, incluindo operações básicas, filtros e transformações.

### Referências Principais

- [CS231n: Convolutional Neural Networks for Visual Recognition - Stanford](http://cs231n.stanford.edu/)
- [Computer Vision: Algorithms and Applications - Szeliski](https://szeliski.org/Book/)

---

**Próximo Módulo**: Processamento Digital de Imagem - Fundamentos

## 🎯 Conexão com o Próximo Módulo

Agora que compreendemos os **fundamentos da visão computacional** e implementamos **técnicas de detecção de bordas**, estamos preparados para aprofundar os **fundamentos do processamento digital de imagem**.

No **Módulo 2**, veremos como:

### 🔗 **Conexões Diretas:**

1. **Detecção de Bordas** → **Filtros Espaciais**
   - Sobel, Canny, Laplaciano
   - Filtros de suavização e nitidez

2. **Processamento de Imagem** → **Operações Básicas**
   - Fundamentos teóricos
   - Implementação prática

3. **Representação Matemática** → **Manipulação de Pixels**
   - Matrizes de pixels
   - Operações aritméticas e lógicas

4. **Técnicas Básicas** → **Transformações Avançadas**
   - Operações geométricas
   - Transformações de intensidade

### 🚀 **Evolução Natural:**

- **Conceitos** → **Implementação**
- **Técnicas Básicas** → **Operações Avançadas**
- **Detecção** → **Processamento**
- **Fundamentos** → **Aplicações**

Esta transição marca o início da **base teórica sólida** para técnicas avançadas de visão computacional!