<a href="https://colab.research.google.com/github/BrunoBerval/dio_project2/blob/main/redu%C3%A7%C3%A3o_de_dimensionalidade_simples.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Redução de Dimensionalidade em Imagens em formato simples (.bmp) sem importação de bibliotecas

O processamento de imagens é uma etapa essencial em diversas aplicações de Machine Learning, como reconhecimento de padrões, visão computacional, e análise de dados visuais. No entanto, imagens coloridas possuem uma quantidade significativa de informações que nem sempre são relevantes para os modelos de aprendizado. Esse excesso de dimensionalidade pode aumentar o custo computacional e dificultar o aprendizado de padrões significativos pelos algoritmos.

Para lidar com isso, o código apresentado realiza uma redução de dimensionalidade nos dados de imagem, como não estamos importando bibliotecas que lidam especificamente com imagens, o formato BMP é ideal para este caso porque oferece simplicidade, dados diretos e precisão, permitindo manipulação fácil dos pixels, sem precisar lidar com decodificação ou perdas de informação. Isso torna o BMP uma escolha prática para tarefas como conversões e pré-processamento de imagens para Machine Learning. Assim veremos como o código converte uma imagem colorida em duas versões simplificadas:

Tons de cinza: Reduz os três canais de cor (RGB) para um único canal, mantendo a intensidade luminosa percebida pelo olho humano. Essa conversão é amplamente utilizada, pois a informação de cor raramente é crucial para a detecção de bordas, formas ou texturas, que são os principais aspectos extraídos em muitas tarefas de Machine Learning.

Imagem binária (preto e branco): Reduz ainda mais a complexidade ao representar cada pixel com apenas dois valores possíveis (preto ou branco). Essa transformação é útil em cenários onde o contraste entre objetos e o fundo é o principal fator de interesse, como na segmentação de imagens e reconhecimento óptico de caracteres (OCR).

Este código demonstra, de forma prática, como realizar essas transformações e salvar os resultados em arquivos BMP, facilitando a análise posterior e o uso em tarefas de aprendizado de máquina.



---
##Dimensionality Reduction in Images in simple format (.bmp) without importing libraries

Image processing is an essential step in various Machine Learning applications, such as pattern recognition, computer vision, and visual data analysis. However, color images contain a significant amount of information that is not always relevant to learning models. This excess dimensionality can increase computational costs and make it harder for algorithms to learn meaningful patterns.

To deal with this, the code presented performs a dimensionality reduction on the image data, as we are not importing libraries that deal specifically with images, the BMP format is ideal for this case because it offers simplicity, direct data and precision, allowing easy manipulation of pixels. , without having to deal with decoding or loss of information. This makes BMP a practical choice for tasks such as image conversions and preprocessing for Machine Learning. So we will see how the code converts a colored image into two simplified versions:

Grayscale: Reduces the three color channels (RGB) to a single channel, preserving the luminance intensity perceived by the human eye. This conversion is widely used because color information is rarely crucial for detecting edges, shapes, or textures, which are the primary features extracted in many Machine Learning tasks.

Binary image (black and white): Further reduces complexity by representing each pixel with only two possible values (black or white). This transformation is useful in scenarios where the contrast between objects and the background is the main focus, such as in image segmentation and optical character recognition (OCR).

This code demonstrates, in a practical way, how to perform these transformations and save the results as BMP files, facilitating subsequent analysis and use in machine learning tasks.


###Obter as informações principais de uma imagem BMP e os dados de seus pixels.

Abertura do arquivo: O arquivo BMP é aberto em modo binário ('rb').

Leitura do cabeçalho: Os primeiros 54 bytes do arquivo (cabeçalho BMP) são lidos, o que contém informações sobre o formato da imagem.

Extração da largura e altura: A largura e a altura da imagem são extraídas dos bytes específicos do cabeçalho (localizados nas posições 18-21 para a largura e 22-25 para a altura), usando a função int.from_bytes para converter de bytes para um número inteiro em formato little-endian.

Leitura dos dados dos pixels: Os dados dos pixels são lidos após o cabeçalho, armazenando todas as informações da imagem.

Retorno: A função retorna o cabeçalho, a largura, a altura e os dados dos pixels.



---
###Get the main information of a BMP image and its pixel data.

File opening: The BMP file is opened in binary mode ('rb').

Header reading: The first 54 bytes of the file (BMP header) are read, which contains information about the image format.

Width and Height Extraction: The width and height of the image are extracted from the header-specific bytes (located at positions 18-21 for the width and 22-25 for the height), using the int.from_bytes function to convert from bytes to an integer in little-endian format.

Reading pixel data: Pixel data is read after the title, storing all image information.

Return: The function returns the header, width, height and pixel data.








In [1]:
def read_bmp(file_path):
    with open(file_path, 'rb') as f:
        # Ler cabeçalho BMP (54 bytes)
        header = f.read(54)

        # Largura e altura da imagem (4 bytes cada, little-endian)
        width = int.from_bytes(header[18:22], 'little')
        height = int.from_bytes(header[22:26], 'little')

        # Ler os dados dos pixels
        data = f.read()
    return header, width, height, data

###RGB para Tons de cinza

A função rgb_to_grayscale converte uma imagem RGB para tons de cinza. Ela faz isso da seguinte forma:

Iteração pelos pixels: Percorre os dados da imagem, processando a cada 3 bytes (representando um pixel com canais R, G e B).
Cálculo do tom de cinza: Usa a fórmula de conversão para tons de cinza (pesos de 0.299 para R, 0.587 para G e 0.114 para B) para calcular o valor de cinza de cada pixel.
Criação da imagem em tons de cinza: Para cada pixel, o valor de cinza é usado para preencher os canais R, G e B, criando uma imagem monocromática.
Retorno: A função retorna os dados da imagem convertida para tons de cinza.

---
###RGB to Grayscale


The rgb_to_grayscale function converts an RGB image to grayscale. She does this as follows:

Iteration through pixels: Cycles through the image data, processing every 3 bytes (representing a pixel with R, G and B channels).
Grayscale calculation: Uses the grayscale conversion formula (weights of 0.299 for R, 0.587 for G, and 0.114 for B) to calculate the gray value of each pixel.
Grayscale image creation: For each pixel, the gray value is used to fill the R, G, and B channels, creating a monochromatic image.
Return: The function returns the image data converted to grayscale.

In [2]:
def rgb_to_grayscale(data):
    grayscale_data = bytearray()
    for i in range(0, len(data), 3):
        # Cada pixel tem 3 bytes: B, G, R
        b, g, r = data[i], data[i+1], data[i+2]
        # Fórmula para tons de cinza
        gray = int(0.299 * r + 0.587 * g + 0.114 * b)
        # Adicionar o mesmo valor para B, G e R (tons de cinza)
        grayscale_data.extend([gray, gray, gray])
    return grayscale_data

###Tons de cinza para binário

A função grayscale_to_binary converte uma imagem em tons de cinza para uma imagem binária (preto e branco).

Entrada de dados: A função recebe os dados de uma imagem em tons de cinza e um valor de limiar (threshold), com valor padrão 128.
Iteração pelos pixels: Ela percorre os dados a cada 3 bytes, verificando o valor de cinza de cada pixel.
Aplicação do limiar: Se o valor de cinza for maior que o limiar, o pixel é convertido para branco (255); caso contrário, para preto (0).
Construção da imagem binária: O valor de preto ou branco é atribuído aos três canais (R, G, B) de cada pixel.

Retorno: A função retorna os dados da imagem convertida para binário.
A imagem resultante terá apenas pixels pretos ou brancos, dependendo do limiar.

---
###Grayscale to binary

The grayscale_to_binary function converts a grayscale image to a binary (black and white) image.

Data input: The function receives data from an image in grayscale and a threshold value, with a default value of 128.
Iteration through pixels: It goes through the data every 3 bytes, checking the gray value of each pixel.
Threshold application: If the gray value is greater than the threshold, the pixel is converted to white (255); otherwise to black (0).
Construction of the binary image: The black or white value is assigned to the three channels (R, G, B) of each pixel.

Return: The function returns the image data converted to binary.
The resulting image will have only black or white pixels, depending on the threshold.

In [3]:
def grayscale_to_binary(data, threshold=128):
    binary_data = bytearray()
    for i in range(0, len(data), 3):
        # Apenas verificar um canal (R, G ou B, pois todos são iguais em tons de cinza)
        gray = data[i]
        # Limiar: preto ou branco
        value = 255 if gray > threshold else 0
        binary_data.extend([value, value, value])
    return binary_data

Função para salvar as imagens processadas.



---
Function to save processed images.


In [4]:
def save_bmp(file_path, header, data):
    with open(file_path, 'wb') as f:
        f.write(header)
        f.write(data)

A célula de código abaixo executa as funções.



---

The code cell below run the functions.

In [5]:
# Caminhos para os arquivos
input_path = 'AyrtonSenna.bmp'
output_grayscale_path = 'AyrtonSenna_grayscale.bmp'
output_binary_path = 'AyrtonSenna_binary.bmp'

# Ler a imagem BMP
header, width, height, data = read_bmp(input_path)

# Converter para tons de cinza
grayscale_data = rgb_to_grayscale(data)
save_bmp(output_grayscale_path, header, grayscale_data)

# Converter para binário (preto e branco)
binary_data = grayscale_to_binary(grayscale_data)
save_bmp(output_binary_path, header, binary_data)

print("Conversões concluídas!")

Conversões concluídas!
