No aprendizado profundo, uma rede neural convolucional (CNN ou ConvNet) é uma classe de rede neural artificial, mais comumente aplicada para analisar imagens visuais tendo aplicações em reconhecimento de imagem e vídeo, sistemas  de recomendação. As CNNs são versões regularizadas de perceptrons multicamadas. Perceptrons multicamadas geralmente significam redes totalmente conectadas, ou seja, cada neurônio em uma camada está conectado a todos os neurônios na próxima camada. A "conectividade total" dessas redes as torna propensas ao overfitting de dados. Formas típicas de regularização, ou prevenção de overfitting, incluem: penalizar parâmetros durante o treinamento (como queda de peso) ou aparar conectividade (conexões ignoradas, desistências, etc.) As CNNs adotam uma abordagem diferente em relação à regularização: elas aproveitam o padrão hierárquico nos dados e montar padrões de complexidade crescente usando padrões menores e mais simples gravados em seus filtros. Portanto, em uma escala de conectividade e complexidade, as CNNs estão no extremo inferior.

Kim, Phil. Convolutional Neural Network. MATLAB Deep Learning. Apress, Berkeley, CA. https://doi.org/10.1007/978-1-4842-2845-6_6, 2017.

In [None]:
import numpy as np
from keras.models import Sequential
from keras.layers import Dropout, Dense, Flatten
from keras.optimizers import SGD
from keras.layers.convolutional import Conv2D, MaxPooling2D
from keras.utils import np_utils as u
from keras.datasets import cifar10

In [None]:
#Vamos começar carregando os dados do Cifar10
(X, y), (X_test, y_test) = cifar10.load_data()

In [None]:
#Lembre-se de que as imagens estão em RGB
#Para que possamos normalizar os dados mergulhando em 255
#Os dados estão em números inteiros, portanto, precisamos convertê-los para float primeiro
X, X_test = X.astype('float32')/255.0, X_test.astype('float32')/255.0

In [None]:
#Depois convertemos os valores de y em vetores one-hot
#O cifar10 tem apenas 10 classes, por isso especificamos um one-hot
#vetor de largura/classe 10
y, y_test = u.to_categorical(y, 10), u.to_categorical(y_test, 10)

In [None]:
#Agora podemos ir em frente e criar nosso modelo Convolution
model = Sequential()

In [None]:
#Queremos gerar 32 mapas de recursos. O tamanho do kernel será
#3x3 e especificamos nossa forma de entrada como 32x32 com 3 canais
#Padding=mesmo significa que queremos a mesma saída dimensional que a entrada
#activation especifica a função de ativação
model.add(Conv2D(32, (3, 3), input_shape=(32, 32, 3), padding='same', activation='relu'))

In [None]:
#20% dos nós são definidos como 0
model.add(Dropout(0.2))

In [None]:
#agora adicionamos outra camada de convolução, novamente com um kernel 3x3
#Desta vez nosso padding=valid significa que a dimensão de saída pode
#tomar qualquer forma
model.add(Conv2D(32, (3, 3), activation='relu', padding='valid'))

In [None]:
#maxpool com um kernet de 2x2
model.add(MaxPooling2D(pool_size=(2, 2)))

In [None]:
#Em um NN de convolução, precisamos nivelar nossos dados antes que possamos
#introduza na camada de saída/densidade
model.add(Flatten())

In [None]:
#Camada densa com 512 unidades ocultas
model.add(Dense(512, activation='relu'))

In [None]:
#desta vez, definimos 30% dos nós para 0 para minimizar o overfitting
model.add(Dropout(0.3))

In [None]:
#Finalmente a camada densa de saída com 10 unidades ocultas correspondentes a
#nossa aula 10
model.add(Dense(10, activation='softmax'))

In [None]:
#Poucas configurações simples
model.compile(loss='categorical_crossentropy', optimizer=SGD(momentum=0.5, decay=0.0004), metrics=['accuracy'])

In [None]:
#Execute o algoritmo!
model.fit(X, y, validation_data=(X_test, y_test), epochs=25, batch_size=512)

In [None]:
#Salve os pesos para usar depois
model.save_weights("cifar10.hdf5")

In [None]:
#Finalmente imprima a precisão do nosso modelo!
print("Accuracy: &2.f%%" %(model.evaluate(X_test, y_test)[1]*100))