In [6]:
import warnings
import pandas as pd
import numpy as np
import cv2 as cv

In [7]:
warnings.filterwarnings("ignore")

<span style="font-size: 12px; font-family: 'Trebuchet MS', sans-serif;font-weight: 100; letter-spacing: 0.8px;">

# Visão Computacional:
A visão computacional é uma área da inteligência artificial que se concentra no desenvolvimento de algoritmos e técnicas para que computadores possam interpretar </br>
e entender o conteúdo visual de imagens e vídeos.

---
**Detecção de Faces**

A detecção de faces é uma técnica fundamental em visão computacional, utilizada em uma variedade de aplicações, como reconhecimento facial, </br>
análise de emoções e sistemas de segurança. Existem várias abordagens para a detecção de faces, incluindo métodos baseados em características e aprendizado profundo.</br>
Alguns dos algoritmos mais populares para detecção de faces incluem:

- **Viola-Jones**: Um dos primeiros e mais amplamente utilizados algoritmos para detecção de faces. Ele utiliza um classificador em cascata treinado com características de Haar.
- **Histogram of Oriented Gradients (HOG)**: Uma técnica que extrai características baseadas em gradientes de intensidade para representar faces em uma imagem.
- **Redes Neurais Convolucionais (CNNs)**: Abordagem mais recente e eficaz, que utiliza redes neurais convolucionais profundas para aprender características diretamente das imagens.

**Detecção de Objetos em Cascata**

O método de detecção de objetos em cascata é uma técnica clássica amplamente utilizada para detecção de objetos em imagens. Ele é especialmente popular na detecção de faces,</br> 
mas também pode ser aplicado a outros tipos de objetos. O método de detecção em cascata utiliza um classificador em cascata treinado com características específicas do </br>
objeto de interesse. Alguns dos exemplos mais comuns incluem:

- **Haar Cascades**: Uma abordagem popular para detecção de faces e outros objetos. O método utiliza um conjunto de características de Haar, que são padrões visuais simples, para treinar um classificador em cascata.
- **LBP (Local Binary Patterns) Cascades**: Uma extensão do método de detecção em cascata que utiliza padrões binários locais para treinar o classificador. É especialmente eficaz em aplicações onde a iluminação varia.

<img src="https://miro.medium.com/v2/resize:fit:1400/1*JhFCP1CjF7fRYt9pLldMsw.jpeg" width="400">


---
**Detecção de Objetos**

Além da detecção de faces, a visão computacional também é utilizada para detectar uma ampla variedade de objetos em imagens e vídeos.</br> 
Alguns dos algoritmos comuns para detecção de objetos incluem:

- **YOLO (You Only Look Once)**: Um dos algoritmos mais rápidos e eficientes para detecção de objetos em tempo real. Ele divide a imagem em uma grade e prevê caixas delimitadoras e classes diretamente.
- **Faster R-CNN**: Um método baseado em regiões que utiliza uma rede neural convolucional para extrair características e uma rede secundária para gerar propostas de regiões.
- **SSD (Single Shot Multibox Detector)**: Um método que combina a eficiência do YOLO com a precisão do Faster R-CNN.

---
**Reconhecimento Facial**

O reconhecimento facial é uma aplicação importante da visão computacional, com uma ampla gama de aplicações, desde sistemas de segurança </br>
até reconhecimento de emoções em sistemas de interação humano-computador. Alguns dos métodos comuns para reconhecimento facial incluem:

- **Eigenfaces**: Uma técnica clássica de análise de componentes principais (PCA) para representação e reconhecimento de faces.
- **Fisherfaces**: Uma extensão do Eigenfaces que leva em consideração informações de classe para melhorar o desempenho do reconhecimento facial.
- **Local Binary Patterns (LBP)**: Um método que extrai padrões locais de textura da imagem para representar e reconhecer faces.

<img src="https://static.javatpoint.com/tutorial/opencv/images/face-detection-and-face-recognition6.png" width="400">

- **Redes Neurais Convolucionais (CNNs)**: Abordagem mais recente e eficaz, que utiliza redes neurais convolucionais profundas para aprender características diretamente das imagens de faces.

---
**Rastreamento de Objetos**

O rastreamento de objetos é utilizado para seguir o movimento de objetos em sequências de vídeo. Ele é comumente utilizado em aplicações </br>
de vigilância, rastreamento de veículos e análise de movimento. Alguns dos métodos populares para rastreamento de objetos incluem:

- **Kalman Filter**: Um filtro estatístico que utiliza uma série de medições para prever a próxima posição de um objeto.
- **Particle Filter (PF)**: Um método de estimativa que utiliza uma amostra de partículas para representar a distribuição de probabilidade do estado do objeto.
- **Correlação de Template**: Uma técnica simples que compara uma região de interesse em cada frame do vídeo com um modelo de referência.

**CSRT**: </br>
O método CSRT (Discriminative Correlation Filter with Channel and Spatial Reliability) é um algoritmo popular para rastreamento de objetos em vídeos. Ele é baseado em filtros de correlação discriminativos e utiliza informações espaciais e de canal para melhorar a precisão do rastreamento. O CSRT é conhecido por sua capacidade de rastreamento robusto em condições desafiadoras, como mudanças de iluminação, oclusões parciais e deformações do objeto.
O CSRT opera em duas etapas principais: inicialização e atualização. Durante a inicialização, o algoritmo utiliza uma região de interesse (ROI) inicial para extrair características discriminativas do objeto a ser rastreado. Essas características são usadas para treinar um filtro de correlação discriminativo, que é então usado para localizar o objeto em frames subsequentes do vídeo. Durante a atualização, o filtro é adaptado dinamicamente para compensar mudanças no objeto, como rotação, escala e deformação.

<img src="https://user-images.githubusercontent.com/12802864/26883749-54b16eae-4b9e-11e7-8506-94c211331218.png" width="400">

O método CSRT demonstrou um desempenho robusto em uma variedade de cenários e é amplamente utilizado em aplicações de rastreamento de objetos em tempo real, como vigilância, monitoramento de tráfego e análise de vídeo forense.

</span>

In [8]:
img_test = cv.imread('./data/images/workplace.jpg')

In [9]:
cv.imshow('Workplace Image', img_test)
cv.waitKey(0)
cv.destroyAllWindows()

In [10]:
detector_face = cv.CascadeClassifier('./data/xml/frontalface.xml')

In [12]:
gray_img = cv.cvtColor(img_test, cv.COLOR_BGR2GRAY)
cv.imshow('Gray Scale', gray_img)
cv.waitKey(0)
cv.destroyAllWindows()

In [13]:
detections = detector_face.detectMultiScale(gray_img)

In [14]:
detections

array([[ 284,  263,  113,  113],
       [1148,  261,  129,  129],
       [  44,  919,   30,   30],
       [ 928,  488,  172,  172],
       [ 229,  509,  142,  142],
       [1639,  159,  141,  141],
       [ 103,  784,   56,   56]])

In [15]:
len(detections)

7

In [23]:
for(x, y, l, a) in detections:
    cv.rectangle(img_test, (x, y), (x + l, y + a), (0,255,0), 2)
cv.imshow('Workplace Image', img_test)
cv.waitKey(0)
cv.destroyAllWindows()