**RNA para Reconhecimento de Placas Veiculares em imagens**

Nosso objetivo é modelar uma RNA (depois comparar com uma CNN) e usar os dados de identificação de placas veiculares. Para isso, precisamos conhecer os dados. Nesta atividade, os dados de entrada, X, são apresentados por uma matriz para cada imagem. O shape da matriz X completa é (1800, 1080, 1920, 3), que significa:
1. Há 1800 imagens na entrada na variável X;
2. Há 1080 linhas de pixels em cada imagem;
3. Cada linha da imagem contém 1920 colunas de pixels;
4. Há 3 números por pixels, que são as componentes Red, Green, Blue de cada pixel.
Esta estrutura da matriz de entrada não requer nenhuma transformação nas imagens, com possível redução de resolução. Como está, a entrada da RNA precisa ter 1080*1920 neurônios na entrada. Isso dá 2.073.600 (dois milhões, setenta e três mil e seiscentos neurônios.
A variável Y tem a saída para cada entrada. Os dados de saída, neste estágio inicial, são formados pelos cantos do retângulo que envolve a placa localizada na imagem. Isso consiste de 8 números, sendo 4 pares de coordenadas, um para cada canto.
Precisamos carregar essas matrizes, o que pode ser feito da seguinte forma:

In [5]:
import numpy as np

def carregarMatrizes(proposito: str) -> tuple[np.ndarray, np.ndarray]:
    X_data = np.load(f'./data/X_{proposito}.csv.npy', 'r')
    Y_data = np.load(f'./data/Y_{proposito}.csv.npy', 'r')
    return (X_data, Y_data)

def main():
    X_data, Y_data = carregarMatrizes('training') # ou 'validation' or 'testing'
    print(X_data.shape, Y_data.shape)

if __name__ == '__main__':
    main()


(1800, 1080, 1920, 3) (1800, 8)


O método carregarMatrizes é responsável por abrir o arquivo com as matrizes e carregá-lo para uma matriz em numpy. O método recebe como parâmetro o propósito do par de matrizes X e Y, que pode ser 'training', 'validation' ou 'testing'.

Em seguida, precisamos montar a RNA com o modelo desejado. Inicialmente, precisaremos de uma RNA com as seguintes camadas:
1. Camada de entrada com 2.073.600 neurônios, com ativação dada pela função ReLU;
2. Segunda camada, primeira oculta, 100.000 neurônios, completamente conectados à primeira camada, e também com ativação dada pela função ReLU;
3. Terceira camada, segunda oculta, também 100.000 neurônios completamente conectados à segunda camada, com ativação pela ReLU;
4. Quarta camada, de saída, com 8 neurônios completamente conectados à terceira camada.

Nosso objetivo é modelar uma RNA (depois comparar com uma CNN) e usar os dados de identificação de placas veiculares. Para isso, precisamos conhecer os dados. Nesta atividade, os dados de entrada, X, são apresentados por uma matriz para cada imagem. O shape da matriz X completa é (1800, 1080, 1920, 3), que significa:
1. Há 1800 imagens na entrada na variável X;
2. Há 1080 linhas de pixels em cada imagem;
3. Cada linha da imagem contém 1920 colunas de pixels;
4. Há 3 números por pixels, que são as componentes Red, Green, Blue de cada pixel.
Esta estrutura da matriz de entrada não requer nenhuma transformação nas imagens, com possível redução de resolução. Como está, a entrada da RNA precisa ter 1080*1920 neurônios na entrada. Isso dá 2.073.600 (dois milhões, setenta e três mil e seiscentos neurônios.
A variável Y tem a saída para cada entrada. Os dados de saída, neste estágio inicial, são formados pelos cantos do retângulo que envolve a placa localizada na imagem. Isso consiste de 8 números, sendo 4 pares de coordenadas, um para cada canto.
Precisamos carregar essas matrizes, o que pode ser feito da seguinte forma: