# **Extração de características com ResNet50 pré-treinada, fusão de características, redução de dimensionalidade e classificação com SVM**

Antes de iniciar a execução do código faça a seguinte alteração:
Menu: **Ambiente de execução -> Alterar o tipo de ambiente de execução -> GPU**

In [1]:
import numpy as np
from PIL import Image

from keras.datasets import cifar10
from keras.models import Model
from keras.applications import resnet50

from sklearn.decomposition import PCA
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

A função **lowSampleDataset(X,Y)** apenas reduz a quantidade de exemplos para que a execução seja mais rápida em nosso exemplo!

In [2]:
def lowSampleDataset(X, Y):
    perm = np.random.permutation(X.shape[0])
    X = X[perm[0 : (int)(X.shape[0] * (5/100))]]
    Y = Y[perm[0 : (int)(Y.shape[0] * (5/100))]]
    return X, Y

**Pré-processamento:**

1.   Carregamos o dataset CIFAR10
2.   Reduzimos a quantidade de exemplos
1.   Alteramos a resolução dos exemplos

In [3]:
print("Loading CIFAR10 images ...")
(Xtrain, Ytrain), (Xtest, Ytest) = cifar10.load_data()

print('\tOriginal training set shape: ', Xtrain.shape)
print('\tOriginal testing set shape: ', Xtest.shape)

Xtrain, Ytrain = lowSampleDataset(Xtrain, Ytrain)
Xtest, Ytest = lowSampleDataset(Xtest, Ytest)

X = []
for i in range(0, Xtrain.shape[0]):
    X.append(np.array(Image.fromarray(Xtrain[i]).resize(size=(224,224))))
Xtrain = np.array(X)

X = []
for i in range(0, Xtest.shape[0]):
    X.append(np.array(Image.fromarray(Xtest[i]).resize(size=(224,224))))
Xtest = np.array(X)

print('\tTraining set shape: ', Xtrain.shape)
print('\tTesting set shape: ', Xtest.shape)

Loading CIFAR10 images ...
	Original training set shape:  (50000, 32, 32, 3)
	Original testing set shape:  (10000, 32, 32, 3)
	Training set shape:  (2500, 224, 224, 3)
	Testing set shape:  (500, 224, 224, 3)


**Extração de características:**

Carregamos a ResNet50 e extraímos características utilizando:


1.   Saída da camada **avg_pool** como descritor global (final da rede)
2.   Saída da camada **conv5_block3_out** como descritor local (início da rede)

Em seguida, realizamos a concatenação das características



In [4]:
print("Loading the ResNet50-ImageNet model ...")
model = resnet50.ResNet50(include_top=True, weights='imagenet', input_shape=(224, 224, 3), classes=1000)
#model.summary()

modelGlobal = Model(inputs=model.input, outputs=model.get_layer(name='avg_pool').output)
prediction = np.array(modelGlobal.predict(Xtrain))
XtrainGlobal = np.reshape(prediction, (prediction.shape[0], prediction.shape[1]))
prediction = np.array(modelGlobal.predict(Xtest))
XtestGlobal = np.reshape(prediction, (prediction.shape[0], prediction.shape[1]))

modelLocal = Model(inputs=model.input, outputs=model.get_layer(name='conv5_block3_out').output)
prediction = np.array(modelLocal.predict(Xtrain))
XtrainLocal = np.reshape(prediction, (prediction.shape[0], prediction.shape[1]*prediction.shape[2]*prediction.shape[3]))
prediction = np.array(modelLocal.predict(Xtest))
XtestLocal = np.reshape(prediction, (prediction.shape[0], prediction.shape[1]*prediction.shape[2]*prediction.shape[3]))

Xtrain = np.concatenate((XtrainGlobal, XtrainLocal), axis=1)
Xtest = np.concatenate((XtestGlobal, XtestLocal), axis=1)

print('\tFeatures fusion training shape: ', Xtrain.shape)
print('\tFeatures fusion testing shape: ', Xtest.shape)

Loading the ResNet50-ImageNet model ...
	Features fusion training shape:  (2500, 102400)
	Features fusion testing shape:  (500, 102400)


**Redução de dimensionalidade:**

As características extraídas possuem dimensão de 102400. Uma solução para agilizar o processo é a redução de dimensionalidade. PCA é uma técnica que avalia quais atributos possuem mais relevância e os seleciona.

In [5]:
print("Dimensionality reduction with PCA ...")
pca = PCA(n_components=256)
Xtrain = pca.fit_transform(Xtrain)
Xtest = pca.transform(Xtest)

print('\tFeatures training shape: ', Xtrain.shape)
print('\tFeatures testing shape: ', Xtest.shape)

Dimensionality reduction with PCA ...
	Features training shape:  (2500, 256)
	Features testing shape:  (500, 256)


**Classificação:**

Neste exemplo, temos o conjunto de treinamento e teste separados. Consequentemente, podemos aplicar um classificador sem a necessidade de Cross-Validation.

In [6]:
print("Classification with Linear SVM ...")
svm = SVC(kernel='linear')
svm.fit(Xtrain, np.ravel(Ytrain, order='C'))
result = svm.predict(Xtest)

acc = accuracy_score(result, np.ravel(Ytest, order='C'))
print("\tAccuracy Linear SVM: %0.4f" % acc)

Classification with Linear SVM ...
	Accuracy Linear SVM: 0.8320
