# Palmas Machine Learning - Etapa de preprocessamento

Neste notebook estão as etapas de preprocessamento para as imagens de palmas dos tipos *miuda* e *orelha de elefante*.

Os processos foram feitos da seguinte maneira:

- Remoção de artefatos usando o Photoshop para todas as imagens;
- Normalização das imagens para o padrão RGB;
- Redimensionamento das imagens para 640x640;
- Normalização das imagens do para a escala de 0 a 1;
- Augmento de dados.


In [6]:
import Augmentor
import cv2
import matplotlib.pyplot as plt
import numpy as np
import os
import shutil

## Miuda


In [19]:
miuda_imagens = os.listdir('Miuda editada')
print(f'Número de imagens da miuda: {len(miuda_imagens)}')

Número de imagens da miuda: 38


In [20]:
datasets_dir = 'imagens_redimensionadas_normalizadas/Miuda'

if not os.path.exists(datasets_dir):
    os.makedirs(datasets_dir)
    print('Diretório foi criado!')

Diretório foi criado!


### Redimensionamento e normalização

Redimensiosamento para 640x640 e normalização das imagens para o padrão RGB e para a escala de 0 a 1.

In [21]:
for miuda_imagem in miuda_imagens:
    image = cv2.imread(f'Miuda editada/{miuda_imagem}')
    image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    # Resimensionamento da imagem
    image = cv2.resize(image, (640, 640))
    # Normalização para imagem para escala de 0 a 1
    image = image / 255.0
    # Salvar image
    plt.imsave(fname=f'{datasets_dir}/{miuda_imagem}', arr=image)

### Augmento de imagens

In [22]:
miuda_imagens = os.listdir('imagens_redimensionadas_normalizadas/Miuda')
print(f'Número de imagens da miuda: {len(miuda_imagens)}')

Número de imagens da miuda: 38


In [23]:
datasets_dir = 'imagens_augmentadas/Miuda'

if not os.path.exists(datasets_dir):
    os.makedirs(datasets_dir)
    print('Diretório foi criado!')

Diretório foi criado!


In [26]:
# Caminho para a pasta onde as imagens normalizadas estão localizadas
pasta_redimensionadas_normalizadas = 'imagens_redimensionadas_normalizadas/Miuda'
p = Augmentor.Pipeline(pasta_redimensionadas_normalizadas)


p.rotate(probability=0.7, max_left_rotation=10, max_right_rotation=10)
p.zoom_random(probability=0.7, percentage_area=0.8)
p.flip_left_right(probability=0.5)
p.flip_top_bottom(probability=0.5)
p.sample(100)


p.process()

print('Concluído')

Initialised with 38 image(s) found.
Output directory set to imagens_redimensionadas_normalizadas/Miuda/output.

Processing <PIL.Image.Image image mode=RGB size=640x640 at 0x7F8903DD3DC0>: 100%
Processing <PIL.Image.Image image mode=RGB size=640x640 at 0x7F8903DD22C0>: 100%

Concluído





In [27]:
miuda_imagens_aumentadas_path = 'imagens_redimensionadas_normalizadas/Miuda/output'
miuda_imagens_aumentadas = os.listdir(miuda_imagens_aumentadas_path)
for image in miuda_imagens_aumentadas:
    shutil.move(f'{miuda_imagens_aumentadas_path}/{image}', 'imagens_augmentadas/Miuda')

## Orelha de Elefante

In [53]:
elefante_imagens = os.listdir('Orelha de elefante editada')
print(f'Número de imagens de Orelha de Elefante: {len(elefante_imagens)}')

Número de imagens de Orelha de Elefante: 56


In [54]:
datasets_dir = 'imagens_redimensionadas_normalizadas/Orelha_elefante'

if not os.path.exists(datasets_dir):
    os.makedirs(datasets_dir)
    print('Diretório foi criado!')

### Redimensionamento e normalização

Redimensiosamento para 640x640 e normalização das imagens para o padrão RGB e para a escala de 0 a 1.

In [55]:
for elefante_imagem in elefante_imagens:
    image = cv2.imread(f'Orelha de elefante editada/{elefante_imagem}')
    image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    # Resimensionamento da imagem
    image = cv2.resize(image, (640, 640))
    # Normalização para imagem para escala de 0 a 1
    image = image / 255.0
    # Salvar image
    plt.imsave(fname=f'{datasets_dir}/{elefante_imagem}', arr=image)

### Augmento de imagens

In [15]:
elefante_imagens = os.listdir('imagens_redimensionadas_normalizadas/Orelha_elefante')
print(f'Número de imagens de Orelha de Elefante: {len(elefante_imagens)}')

Número de imagens de Orelha de Elefante: 56


In [16]:
datasets_dir = 'imagens_augmentadas/Orelha_elefante'

if not os.path.exists(datasets_dir):
    os.makedirs(datasets_dir)
    print('Diretório foi criado!')

Diretório foi criado!


In [17]:
# Caminho para a pasta onde as imagens normalizadas estão localizadas
pasta_redimensionadas_normalizadas = 'imagens_redimensionadas_normalizadas/Orelha_elefante'
p = Augmentor.Pipeline(pasta_redimensionadas_normalizadas)


p.rotate(probability=0.7, max_left_rotation=10, max_right_rotation=10)
p.zoom_random(probability=0.7, percentage_area=0.8)
p.flip_left_right(probability=0.5)
p.flip_top_bottom(probability=0.5)
p.sample(100)


p.process()

print('Concluído')

Initialised with 56 image(s) found.
Output directory set to imagens_redimensionadas_normalizadas/Orelha_elefante/output.

Processing <PIL.JpegImagePlugin.JpegImageFile image mode=RGB size=640x640 at 0x7
Processing <PIL.Image.Image image mode=RGB size=640x640 at 0x7F8903DD07C0>: 100%

Concluído





In [18]:
elefante_imagens_aumentadas_path = 'imagens_redimensionadas_normalizadas/Orelha_elefante/output'
elefante_imagens_aumentadas = os.listdir(elefante_imagens_aumentadas_path)
for image in elefante_imagens_aumentadas:
    shutil.move(f'{elefante_imagens_aumentadas_path}/{image}', 'imagens_augmentadas/Orelha_elefante')

## Renomeação do diretório

Renomeação do diretório com as imagens preprocessadas

In [28]:
os.rename('imagens_augmentadas', 'dataset')