In [1]:
import numpy as np
from PIL import Image
import os
import json
from collections import defaultdict

In [2]:
work_dir='/home/clemes/Monografia/'

In [3]:
with open(os.path.join(work_dir,'UFPR-ALPR dataset','dados.json'),'r') as f:
    dados=json.load(f)

In [4]:
def read_img(path,file):
    """ Função que abre o arquivo contendo a imagem e a transforma em um array numpy
        
        :param path: caminho onde se encontra o arquivo contendo a imagem
        :param file: nome do arquivo a ser aberto
        :return: retorna um array numpy a partir da conversão da imagem para grayscale
    
    """
    with Image.open(os.path.join(path,file)) as img:
        return np.asarray(img.convert('L'))

In [5]:
def read_label(file):
    """Função que procura pelo nome do arquivo com a imagem no dicionário gerado a partir do arquivo dados.json e retorna o label
       para aquele caractere
       
       :param file: nome do arquivo contendo a imagem
                    um exemplo de nome de arquivo é 'track0055[10]_char5.png'. O valor logo após 'char' indica a posição na placa
       :return: string com o label
    
    
    """
    text=file.rstrip('.png').split('_char') #No caso do exemplo do docstring, retornaria a lista ['track0055[10]','5'],
    return dados[text[0]]['plate'][int(text[1])-1]

In [6]:
"""
    Esta célula cria um defaultdict (igual ao dicionário, mas cria a key caso ela não exista) que vai armazenar
    6 keys: training_dados, training_label, testing_dados, testing_label, validation_dados e validation_label

"""

temp=defaultdict(list)

for dirpath, dirnames, filenames in os.walk(os.path.join(work_dir,'crops')):
    if not dirnames:
        for file in filenames:
            temp[os.path.split(dirpath)[1]+'_dados'].append(read_img(dirpath,file))
            temp[os.path.split(dirpath)[1]+'_label'].append(read_label(file))


In [7]:
'''
    Esta célula "empilha" as imagens num único ndarray
'''

training_img=np.stack(temp['training_dados'])
testing_img=np.stack(temp['testing_dados'])
validation_img=np.stack(temp['validation_dados'])

In [8]:
training_label=np.array(temp['training_label'])
testing_label=np.array(temp['testing_dados_label'])
validation_label=np.array(temp['validation_label'])

In [9]:
"""
    Esta célula salva os arrays com imagens e labels em arquivos binários para serem usados posteriormente
"""

np.save(os.path.join(work_dir,'Codigo','training_data.npy'),training_img)
np.save(os.path.join(work_dir,'Codigo','testing_data.npy'),testing_img)
np.save(os.path.join(work_dir,'Codigo','validation_data.npy'),validation_img)

np.save(os.path.join(work_dir,'Codigo','training_label.npy'),training_label)
np.save(os.path.join(work_dir,'Codigo','testing_label.npy'),testing_label)
np.save(os.path.join(work_dir,'Codigo','validation_label.npy'),validation_label)