<a href="https://colab.research.google.com/github/rikdantas/Aprendizagem-de-Maquinas/blob/main/IMD1101/Pratica_01/Pratica01_HOG.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Prática 01 - Utilização de extrator para imagens e uso do k-NN
Nesse notebook serão desenvolvidos os códigos para preparar os CSVs usando o HOG assim como solicitado na prática 01.

Aluno: Paulo Ricardo Dantas

## Importando bibliotecas

In [2]:
# Importando bibliotecas
import os
import zipfile
from skimage.io import imread
from skimage.transform import resize
from skimage.feature import hog
import pandas as pd
import gdown

## Importando as imagens
Antes de realizar esse passo, eu já fiz o download do dataset que continham todas as fotos e separei apenas as imagens das raças que foram disponibilizados para mim de acordo com o sorteio. Apenas para relembrar, as raças sorteadas para mim foram: japanese_chin, miniature_pinscher, Ragdoll e Birman.

In [3]:
# Baixando as imagens
url = 'https://drive.google.com/uc?id=1EeKN5HVD_bk2XjfzbAGjQ6tZDIMNC5FY'
output = 'images.zip'
gdown.download(url, output, quiet=True)

# Descompacta o arquivo zip
zip_file_path = "images.zip"
output_dir = "images"

with zipfile.ZipFile(zip_file_path, 'r') as zip_ref:
    zip_ref.extractall(output_dir)

# Como eu vou ficar com uma pasta images dentro da pasta images, eu preciso atualizar o caminho
output_dir = "images/images"

## Função para criar rótulos
Como uma parte que acho importante é criar uma função que vai rotular as imagens com base no nome do arquivo para adicioná-las ao CSV final.

In [4]:
# Define classes de acordo com o nome do arquivo
def get_class_from_filename(filename):
    if "Birman" in filename or "Ragdoll" in filename:
        return "gato"
    elif "japanese_chin" in filename or "miniature_pinscher" in filename:
        return "cachorro"
    else:
        return None

## Aplicando o HOG em diferentes configurações

### HOG_128_16x16

In [5]:
# Lista para armazenar as características HOG e as classes
hog_features = []

# Processa as imagens e extrai as características HOG com a primeira configuração
for filename in os.listdir(output_dir):
    if filename.endswith(".jpg"):
        image_path = os.path.join(output_dir, filename)
        animal_class = get_class_from_filename(filename)

        if animal_class:
            try:
                # Carrega a imagem e redimensiona para 128x128
                image = imread(image_path)
                image_resized = resize(image, (128, 128))

                # Extrai as características HOG com a primeira configuração
                fd, hog_image = hog(image_resized,
                                    orientations=9,
                                    pixels_per_cell=(16, 16),
                                    cells_per_block=(2, 2),
                                    visualize=True,
                                    channel_axis=-1)

                # Adiciona as características HOG e a classe à lista
                hog_features.append(fd.tolist() + [animal_class])
            except ValueError as e:
                print(f"Erro ao processar {filename}: {e}")

# Salva as características em um arquivo CSV
columns = [f"feature_{i}" for i in range(len(hog_features[0]) - 1)] + ["class"]
df = pd.DataFrame(hog_features, columns=columns)
df.to_csv("HOG_128_16x16.csv", index=False)

### HOG_128_20x20

In [6]:
# Lista para armazenar as características HOG e as classes
hog_features = []

# Processa as imagens e extrai as características HOG com a primeira configuração
for filename in os.listdir(output_dir):
    if filename.endswith(".jpg"):
        image_path = os.path.join(output_dir, filename)
        animal_class = get_class_from_filename(filename)

        if animal_class:
            try:
                # Carrega a imagem e redimensiona para 128x128
                image = imread(image_path)
                image_resized = resize(image, (128, 128))

                # Extrai as características HOG com a primeira configuração
                fd, hog_image = hog(image_resized,
                                    orientations=9,
                                    pixels_per_cell=(20, 20),
                                    cells_per_block=(2, 2),
                                    visualize=True,
                                    channel_axis=-1)

                # Adiciona as características HOG e a classe à lista
                hog_features.append(fd.tolist() + [animal_class])
            except ValueError as e:
                print(f"Erro ao processar {filename}: {e}")

# Salva as características em um arquivo CSV
columns = [f"feature_{i}" for i in range(len(hog_features[0]) - 1)] + ["class"]
df = pd.DataFrame(hog_features, columns=columns)
df.to_csv("HOG_128_20x20.csv", index=False)

### HOG_256_16x16

In [8]:
# Lista para armazenar as características HOG e as classes
hog_features = []

# Processa as imagens e extrai as características HOG com a primeira configuração
for filename in os.listdir(output_dir):
    if filename.endswith(".jpg"):
        image_path = os.path.join(output_dir, filename)
        animal_class = get_class_from_filename(filename)

        if animal_class:
            try:
                # Carrega a imagem e redimensiona para 256x256
                image = imread(image_path)
                image_resized = resize(image, (256, 256))

                # Extrai as características HOG com a primeira configuração
                fd, hog_image = hog(image_resized,
                                    orientations=9,
                                    pixels_per_cell=(16, 16),
                                    cells_per_block=(2, 2),
                                    visualize=True,
                                    channel_axis=-1)

                # Adiciona as características HOG e a classe à lista
                hog_features.append(fd.tolist() + [animal_class])
            except ValueError as e:
                print(f"Erro ao processar {filename}: {e}")

# Salva as características em um arquivo CSV
columns = [f"feature_{i}" for i in range(len(hog_features[0]) - 1)] + ["class"]
df = pd.DataFrame(hog_features, columns=columns)
df.to_csv("HOG_256_16x16.csv", index=False)

### HOG_256_20x20

In [9]:
# Lista para armazenar as características HOG e as classes
hog_features = []

# Processa as imagens e extrai as características HOG com a primeira configuração
for filename in os.listdir(output_dir):
    if filename.endswith(".jpg"):
        image_path = os.path.join(output_dir, filename)
        animal_class = get_class_from_filename(filename)

        if animal_class:
            try:
                # Carrega a imagem e redimensiona para 256x256
                image = imread(image_path)
                image_resized = resize(image, (256, 256))

                # Extrai as características HOG com a primeira configuração
                fd, hog_image = hog(image_resized,
                                    orientations=9,
                                    pixels_per_cell=(20, 20),
                                    cells_per_block=(2, 2),
                                    visualize=True,
                                    channel_axis=-1)

                # Adiciona as características HOG e a classe à lista
                hog_features.append(fd.tolist() + [animal_class])
            except ValueError as e:
                print(f"Erro ao processar {filename}: {e}")

# Salva as características em um arquivo CSV
columns = [f"feature_{i}" for i in range(len(hog_features[0]) - 1)] + ["class"]
df = pd.DataFrame(hog_features, columns=columns)
df.to_csv("HOG_256_20x20.csv", index=False)