In [1]:
import numpy as np
from skimage.feature import hog
from skimage.color import rgb2gray
from sklearn.datasets import fetch_openml
from sklearn.model_selection import train_test_split

#### 1. Carregar o dataset CIFAR-10
#### A flag 'as_frame=False' garante que os dados vêm como arrays numpy

In [3]:
print("Baixando o dataset CIFAR-10...")
cifar = fetch_openml(name='CIFAR_10', version=1, as_frame=False, parser='auto')
print("Dataset baixado.")

Baixando o dataset CIFAR-10...
Dataset baixado.


In [10]:
# Os dados brutos vêm como uma matriz de pixels (32x32x3 para RGB)
X = cifar.data.reshape(-1, 32, 32, 3)
y = cifar.target
X.shape


(60000, 32, 32, 3)

In [7]:
# 2. Pré-processamento: converter para escala de cinza
# HOG é mais eficiente com imagens em tons de cinza
X_gray = np.array([rgb2gray(img) for img in X])

# 3. Dividir os dados em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X_gray, y, test_size=0.2, random_state=42)

print(f"Shape dos dados de treino (cinza): {X_train.shape}")
print(f"Shape dos rótulos de treino: {y_train.shape}")
print(f"Shape dos dados de teste (cinza): {X_test.shape}")
print(f"Shape dos rótulos de teste: {y_test.shape}")

Shape dos dados de treino (cinza): (48000, 32, 32)
Shape dos rótulos de treino: (48000,)
Shape dos dados de teste (cinza): (12000, 32, 32)
Shape dos rótulos de teste: (12000,)


### Visualizando o dataset

In [None]:

# Visualizar a estrutura dos dados
print("\n--- Visualização da Estrutura dos Dados ---")
print(f"Número total de imagens: {X.shape[0]}")
print(f"Dimensão de cada imagem: {X.shape[1]}x{X.shape[2]} pixels")
print(f"Número de canais de cor (RGB): {X.shape[3]}")
print(f"Classes de rótulos disponíveis: {np.unique(y)}")

# Pegar uma "view" parcial do dataset (as 5 primeiras imagens)
X_view = X[:5]
y_view = y[:5]

# Imprimir a forma e alguns valores dos pixels da primeira imagem
print("\n--- Dados da primeira imagem (antes da conversão para cinza) ---")
print(f"Shape da primeira imagem: {X_view[0].shape}")
print("Valores dos pixels (por exemplo, os 5 primeiros de cada canal):")
print(f"Canal Vermelho (R): {X_view[0, :, :, 0].flatten()[:5]}")
print(f"Canal Verde (G):  {X_view[0, :, :, 1].flatten()[:5]}")
print(f"Canal Azul (B):   {X_view[0, :, :, 2].flatten()[:5]}")
print(f"Rótulo da primeira imagem: {y_view[0]}")

# Imprimir a forma e alguns valores da primeira imagem em tons de cinza
print("\n--- Dados da primeira imagem em tons de cinza ---")
print(f"Shape da primeira imagem em tons de cinza: {X_gray[0].shape}")
print("Valores dos pixels (por exemplo, os 5 primeiros):")
print(f"Pixels: {X_gray[0].flatten()[:5]}")
print(f"Rótulo da primeira imagem: {y_view[0]}")


--- Visualização da Estrutura dos Dados ---
Número total de imagens: 60000
Dimensão de cada imagem: 32x32 pixels
Número de canais de cor (RGB): 3
Classes de rótulos disponíveis: ['0' '1' '2' '3' '4' '5' '6' '7' '8' '9']

--- Dados da primeira imagem (antes da conversão para cinza) ---
Shape da primeira imagem: (32, 32, 3)
Valores dos pixels (por exemplo, os 5 primeiros de cada canal):
Canal Vermelho (R): [26 13 14 10 18]
Canal Verde (G):  [17 13 15 13 11]
Canal Azul (B):   [13 14 14 26 10]
Rótulo da primeira imagem: 8

--- Dados da primeira imagem em tons de cinza ---
Shape da primeira imagem em tons de cinza: (32, 32)
Valores dos pixels (por exemplo, os 5 primeiros):
Pixels: [2.01922897e-18 1.41727992e-18 1.59544686e-18 1.44196721e-18
 1.34608037e-18]
Rótulo da primeira imagem: 8
