In [68]:
import skimage.feature, skimage.io
import numpy as np
import math
from sklearn.naive_bayes import GaussianNB
from sklearn import tree
from sklearn.neighbors import KNeighborsClassifier as KNNC
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler

#Pasta que contém o conjunto de dados já extraído.
#Esta pasta contém as pastas A-Z e os arquivos NIST_Train_Upper.txt, NIST_Test_Upper.txt e NIST_Valid_Upper.txt
NCharacter_dataset_folder = "./NCharacter_SD19_BMP/"

#Uma pasta onde as características extraídas são salvas.
features_folder = 'features'

#Classe que abstrai a divisão em zonas
class Zonas(object):
    def __init__(self):
        pass
    
    #Função geradora que retorna uma zona de cada vez.
    #Os argumentos são o número de linhas da imagem e o número de colunas da imagem.
    def get_zonas(self, n_linhas, n_colunas):
        raise NotImplementedError

#Classe que implementa a divisão em zonas retangulares.
class ZonasRetangulares(Zonas):
    
    #Construtor que configura o zoneamento a ser feito: zonas_x zonas horizontais e zonas_y zonas verticais.
    def __init__(self, zonas_x, zonas_y):
        super(ZonasRetangulares, self).__init__()
        self.zonas_x = zonas_x
        self.zonas_y = zonas_y
        
    #Implementa a função geradora de zonas retangulares.
    def get_zonas(self, n_linhas, n_colunas):
        cortes_x = np.floor(np.linspace(0, n_colunas, num=self.zonas_x+1)).astype(int)
        cortes_y = np.floor(np.linspace(0, n_linhas, num=self.zonas_y+1)).astype(int)
        #print (cortes_x)
        #print (cortes_y)
        for i in range(len(cortes_x)-1):
            for j in range(len(cortes_y)-1):
                yield(cortes_x[i], cortes_y[j], cortes_x[i+1], cortes_y[j+1],cortes_x[i] - cortes_x[i+1], cortes_y[i] - cortes_y[i+1] )


# Caraterísticas

In [79]:
#Variaveis que definem a quantidade de linhas e colunas vai ter a imagem, usada pra igualar imagens com diferentes tamanhos
HIST_LINHAS_GRUPOS = 3
HIST_COLS_GRUPOS = 3

def histograma_cor(imagem):
    #print('im', imagem.shape)
    vals, counts = np.unique(imagem, return_counts=True)
    o = vals.argsort()
    vals = vals[o]
    counts = counts[o]
#     print(o)
    if len(vals) < 2:
        #imagem com apenas branco ou apenas preto
        if vals[0] == 0:
            return [counts[0], 0]
        else:
            return [0, counts[0]]
        
    return counts

def histograma_horizontal(imagem, linha = HIST_LINHAS_GRUPOS):
    tm_imagem = (len(imagem), len(imagem[0]))
    total = []
    for i in range (0, tm_imagem[0]):
        vals, counts = np.unique(imagem[i], return_counts=True)
        o = vals.argsort()
        vals = vals[o]
        counts = counts[o]
        if len(vals) < 2:
            #imagem com apenas branco ou apenas preto
            if vals[0] == 0:
                total.append([counts[0], 0])
            else:
                total.append([0, counts[0]])
            
        else:
            total.append(counts)
    
    grupo_total = []
    linhas = int((tm_imagem[0])/linha)
    branco = 0
    preto = 0
    final = 0
    
    for i in range(linha):
        for j in range(linhas):
            branco = branco + total[final][0]
            preto = preto + total[final][1]
            final = final +1  
        grupo_total.append(branco)
        grupo_total.append(preto)
        branco = 0
        preto = 0
    
    branco = 0
    preto = 0
    for i in range(final, tm_imagem[0]):
        branco = branco + total[i][0]
        preto = preto + total[i][0]
    if (final != tm_imagem[0]):
        grupo_total[len(grupo_total)-2] += branco
        grupo_total[len(grupo_total)-1] += preto
                          
    return grupo_total
    
#chama a função anterior, mas passando a matriz transposta
def histograma_vertical(imagem):
    transposta = imagem.transpose()
    return histograma_horizontal(transposta, HIST_COLS_GRUPOS)

def hog(imagem):
    return skimage.feature.hog(imagem)
    

# Extração de Características

In [117]:
#Esta função apenas abre os arquivos com as listas de treino / teste e validação.
#Retorna os caminhos para os arquivos, os rótulos e o nome dos arquivos sem o caminho.
def parse_filelist(path, prefix=''):
    with open(path, 'r') as f:
        c = f.readlines()
    caminhos = list(map(str.strip, c))
    rotulos = [ i.split('/')[1].upper() for i in caminhos]
    arquivos = [i.split('/')[-1] for i in caminhos]
    p = zip(rotulos, arquivos)
    caminhos = [ prefix + '/' + i[0] + '/' + i[1] for i in p]
    
    return list(zip(caminhos,rotulos, arquivos))

#Esta é uma função que recebe o tipo de zoneamento a ser feito e as features que devem ser
#extraídas de cada zona. Veja que essa função é chamada no "for" abaixo, que faz a extração das características
#para cada uma das listas de imagens (treino, teste e validação)
def extract_features(filelist, dataset_folder, zonas, features=[histograma_cor]):
    instancias = parse_filelist(filelist, prefix=dataset_folder)
    #Note que o MAP abaixo mapeia cada instância (imagem) à função que extrai as 
    #características (feature_extraction) abaixo.
    features = list(map(feature_extraction, instancias, [zonas] * len(instancias), [features] * len(instancias)))
    
    return np.array(features)

#Essa função de extração das características de cada instância. zonas é uma instância de subclasse
#de Zonas. Features é uma lista de funções que extraem características. Cada função da lista recebe uma matriz
#que representa a imagem (que está na zona) e retorna o vetor de característica computado daquela característica. 
def feature_extraction(instancia, zonas, features):
    caminho = instancia[0]
    #print(instancia)
    imagem = skimage.io.imread(caminho)
    caracteristicas = np.array([])
    #print("imagem.shape",imagem.shape)
    
    res = []
    for f in features:
        for z in zonas.get_zonas(imagem.shape[1], imagem.shape[0]):
            #print ("%d:%d,%d:%d" % (z[0], z[2], z[1], z[3]))
            f_val = f(imagem[z[0]:z[2],z[1]:z[3]])
            res.extend(f_val)
    
    return np.array(res)

#Realiza a extração das características!
for i in [('NIST_Train_Upper.txt', 'train'), ('NIST_Test_Upper.txt', 'test'), ('NIST_Valid_Upper.txt', 'val')]:
    print('extraindo características de %s' % (i[0]))
    #note que esta linha extrai características de 4 zonas (2 imagens por linhas e 2 por coluna). 
    #Neste exemplo apenas a característica histograma_cor é computada.
    feats = extract_features(NCharacter_dataset_folder + i[0], NCharacter_dataset_folder, ZonasRetangulares(3,3), features=[histograma_vertical])
    feats2 = extract_features(NCharacter_dataset_folder + i[0], NCharacter_dataset_folder, ZonasRetangulares(3,3), features=[histograma_horizontal])
    
    #se tem 2 feats, é que rolou combinação de histograma e tem que usar o contatenate, se não só caga pro concat
    
    feats = np.concatenate((feats,feats2),axis=1)
    np.save(features_folder + ('/%s_feats.pkl' % (i[1])), feats)

print('Fim da extração de características!')



extraindo características de NIST_Train_Upper.txt
extraindo características de NIST_Test_Upper.txt
extraindo características de NIST_Valid_Upper.txt
Fim da extração de características!


# Treino e Teste com SVM e KNN (Sem validação)

In [118]:
train_features = np.load(features_folder + '/train_feats.pkl.npy')
train_rotulos = parse_filelist(NCharacter_dataset_folder + 'NIST_Train_Upper.txt')
train_rotulos = [i[1] for i in train_rotulos]
print (len(train_rotulos), train_features.shape)

test_features = np.load(features_folder + '/test_feats.pkl.npy')
test_rotulos = parse_filelist(NCharacter_dataset_folder + 'NIST_Test_Upper.txt')
test_rotulos = [i[1] for i in test_rotulos]
print (len(test_rotulos), test_features.shape)

SS = StandardScaler()
SS.fit(train_features)
train_features = SS.transform(train_features)
test_features = SS.transform(test_features)

print('Zona: 2x2, histograma horizontal, histograma de cor')


#Classificador KNN = 1
KNN = KNNC(n_neighbors=1)
KNN.fit(train_features, train_rotulos)
y_pred = KNN.predict(test_features)

print('KNN 1 score: ' , '{:.3f}'.format(accuracy_score(test_rotulos, y_pred)))
print(confusion_matrix(test_rotulos, y_pred))


#Classificador KNN = 3
KNN = KNNC(n_neighbors=3)
KNN.fit(train_features, train_rotulos)
y_pred = KNN.predict(test_features)

print('KNN 3 score: ' , '{:.3f}'.format(accuracy_score(test_rotulos, y_pred)))

print(confusion_matrix(test_rotulos, y_pred))


#Classificador KNN = 5
KNN = KNNC(n_neighbors=5)
KNN.fit(train_features, train_rotulos)
y_pred = KNN.predict(test_features)

print('KNN 5 score: ' , '{:.3f}'.format(accuracy_score(test_rotulos, y_pred)))
print(confusion_matrix(test_rotulos, y_pred))


#Classificados SVM
clf = SVC()
clf.fit(train_features, train_rotulos)
y_pred = clf.predict(test_features)

print('SVM score: ', '{:.3f}'.format(accuracy_score(test_rotulos, y_pred)))
print(confusion_matrix(test_rotulos, y_pred))
print(classification_report(test_rotulos, y_pred, digits=3))



#Classicador árvore de decisão
arvore = tree.DecisionTreeClassifier()
arvore.fit(train_features, train_rotulos)
y_pred = arvore.predict(test_features)

print('Tree score: ', '{:.3f}'.format(accuracy_score(test_rotulos, y_pred)))
print(confusion_matrix(test_rotulos, y_pred))



#Classificador Gaussiano
gaussiano = GaussianNB()
gaussiano.fit(train_features, train_rotulos)
y_pred = gaussiano.predict(test_features)

print('Gaussian score: ', '{:.3f}'.format(accuracy_score(test_rotulos, y_pred)))
print(confusion_matrix(test_rotulos, y_pred))


37440 (37440, 108)
11941 (11941, 108)
Zona: 2x2, histograma horizontal, histograma de cor




KNN 1 score:  0.830
[[402   3   0   2   0   5   4   8   1   1   2   4   4   4   0   5   4   6
    0   2   0   0   0   2   0   0]
 [  7 335   5  27   4   0  13   1   0   0   4   0   0   1   8   2   1  12
   10   0   0   1   1   1   0   2]
 [  0   1 480   0   0   6   4   0   0   0   0  22   0   0   1   1   1   0
    0   1   1   0   0   0   0   0]
 [  0   2   1 327   0   0   0   0   0   1   0   0   0   0  39   6   5   1
    1   0   8   4   0   0   0   1]
 [  0  18  16   4 268  19  12   0   1   0   2  12   0   0   1   2   0   2
    3   0   0   0   0   0   1   4]
 [  0   0   1   0   8 310   1   0   0   1   0   1   1   0   0  61   1   0
    2  25   0   0   0   0   5   2]
 [  4   3  18   2   7   1 305   0   0   0   0   1   1   1   8   1  16   1
    8   0   9   1   2   0   0   0]
 [  4   2   0   1   0   1   1 346   0   1   5   1   5  16   0   0   0   1
    0   0   9   2   2   0   5   0]
 [  0   0  11   1  12   2   0   0 643  54   0  11   0   0   0   0   0   0
   11  20   0   3   0   2   2  43]

SVM score:  0.879
[[423   2   0   2   0   4   1   2   1   0   5   0   4   1   0   0   1   3
    0   0   1   0   0   8   0   1]
 [ 11 370   2  13   3   2   6   0   0   0   0   0   6   0   5   0   2  10
    2   0   1   1   1   0   0   0]
 [  0   0 502   0   2   3   1   0   0   0   0   8   0   0   1   1   0   0
    0   0   0   0   0   0   0   0]
 [  2   1   3 357   0   0   0   0   0   1   0   0   0   1  20   4   2   0
    0   0   4   1   0   0   0   0]
 [  0   9   8   0 310  13   9   0   0   0   0   4   0   0   0   1   0   1
    2   0   0   0   0   0   1   7]
 [  0   0   1   0   0 383   0   0   0   0   1   0   1   0   0  16   1   0
    1  13   0   0   0   0   2   0]
 [  2   6   7   0   8   1 317   2   0   0   0   2   7   0   4   0   8   0
    0   0  13   1  11   0   0   0]
 [  4   1   0   0   0   2   1 357   0   0   2   0  11   6   2   0   0   1
    0   1   5   1   4   0   4   0]
 [  0   0   7   0  19   6   0   0 650  39   0   1   0   0   1   0   0   0
   15   8   0   1   0  12   3  53]
 