In [1]:
import cv2
import os
import random
import pandas as pd
import numpy as np
import seaborn as sns
from sklearn.model_selection import GridSearchCV
from skimage import feature
from sklearn.metrics import (f1_score, precision_score, recall_score, 
accuracy_score, confusion_matrix)
from sklearn.model_selection import StratifiedKFold
from sklearn.svm import SVC
from sklearn.neural_network import MLPClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.gaussian_process import GaussianProcessClassifier
from sklearn.gaussian_process.kernels import (RBF, Matern)
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier, AdaBoostClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.discriminant_analysis import QuadraticDiscriminantAnalysis
from xgboost import XGBClassifier

In [None]:
def criarListaImagens(listaCategorias, data_dir, img_size):
  lista = []
  for categoria in listaCategorias:
    path = os.path.join(data_dir, categoria)
    class_num = listaCategorias.index(categoria)
    for img in os.listdir(path):
      try:
        img_array = cv2.imread(os.path.join(path, img))
        new_array = cv2.resize(img_array, (img_size, img_size))
        lista.append([new_array, class_num])
      except Exception as e:
        print(e)
        pass
  return lista

#----------------------------------------------------------------------#

def criaListaTreinoTeste(lista):
  classes = []
  imagens = []
  for imagem in lista:
    imagens.append(imagem[0])
    classes.append(imagem[1])
  return imagens, classes

#----------------------------------------------------------------------#

def obtemCanaisCoresRGB(listaOrigem):
  listaDestino = []
  for imagem in listaOrigem:
    aux = cv2.split(imagem)
    aux.append(cv2.cvtColor(imagem, cv2.COLOR_BGR2GRAY))
    listaDestino.append(aux)

  return listaDestino

#----------------------------------------------------------------------#

def obterCanaisCores(listaOrigem, cvt):
  listaDestino = []
  for imagem in listaOrigem:    
    i = cv2.cvtColor(imagem, cvt)
    aux = cv2.split(i)
    aux = cv2.split(i)
    aux.append(cv2.cvtColor(i, cv2.COLOR_BGR2GRAY))
    listaDestino.append(aux)

  return listaDestino

#----------------------------------------------------------------------#

class LocalBinaryPatterns:
    def __init__(self, numPoints, radius):
        self.numPoints = numPoints
        self.radius = radius
    def describe(self, image, eps=1e-7):
        lbp = feature.local_binary_pattern(image, self.numPoints,
            self.radius, method="uniform")
        (hist, _) = np.histogram(lbp.ravel(),
            bins=np.arange(0, self.numPoints + 3),
            range=(0, self.numPoints + 2))
        hist = hist.astype("float")
        hist /= (hist.sum() + eps)
        return hist

#----------------------------------------------------------------------#

def obtemHistogramaCanais(listaImagens, lbp):
  canal_1 = []
  canal_2 = []
  canal_3 = []
  canal_cinza = []
  for imagem in listaImagens:
    canal_1.append(lbp.describe(imagem[0]))
    canal_2.append(lbp.describe(imagem[1]))
    canal_3.append(lbp.describe(imagem[2]))
    canal_cinza.append(lbp.describe(imagem[3]))
  return canal_1, canal_2, canal_3, canal_cinza

#----------------------------------------------------------------------#


In [2]:

names = ["Nearest Neighbors", "SVM Linear", "SVM RBF", "Gaussian Process",
         "Decision Tree", "Random Forest", "AdaBoost", "Naive Bayes"]

classifiers = [
    KNeighborsClassifier(3),
    SVC(C=1000, cache_size=200, class_weight=None, coef0=0.0,
        decision_function_shape='ovo', degree=3, gamma='scale', kernel='linear',
        max_iter=-1, probability=False, random_state=109, shrinking=True, tol=0.001,
        verbose=False),
    SVC(C=10000, cache_size=200, class_weight=None, coef0=0.0,
        decision_function_shape='ovo', degree=3, gamma=1, kernel='rbf', max_iter=-1,
        probability=False, random_state=109, shrinking=True, tol=0.001,verbose=False),
    GaussianProcessClassifier(1.0 * RBF(1.0)),
    DecisionTreeClassifier(class_weight=None, criterion='entropy',
        max_depth=3, max_features=None, max_leaf_nodes=None,
        min_impurity_decrease=0.0, min_impurity_split=None,
        min_samples_leaf=50, min_samples_split=2,
        min_weight_fraction_leaf=0.0,
        random_state=None, splitter='best'),
    RandomForestClassifier (bootstrap=False, class_weight=None,
        criterion='gini', max_depth=50, max_features='sqrt',
        max_leaf_nodes=None, min_impurity_decrease=0.0, min_impurity_split=None,
        min_samples_leaf=1, min_samples_split=2,
        min_weight_fraction_leaf=0.0, n_estimators=550,
        n_jobs=None, oob_score=False, random_state=None,
        verbose=0, warm_start=False),
    AdaBoostClassifier(),
    GaussianNB()
]

#----------------------------------------------------------------------#

def xgboost(listaTreino, listaTeste, classesTreino, classesTeste):
    m = XGBClassifier(colsample_bytree= 0.6, 
        gamma= 5, learning_rate= 0.15, max_depth= 5, 
        min_child_weight= 1, n_estimators= 100, subsample=0.8, eta= 0.3 ).fit(listaTreino, classesTreino)
    preds = m.predict(listaTeste)
    y_pred = m.predict(listaTeste)     
    acc = accuracy_score(classesTeste, y_pred)
    f1  = f1_score(classesTeste, y_pred, average='weighted')
    cm  = confusion_matrix(classesTeste, y_pred)
    return acc, f1, cm

#----------------------------------------------------------------------#

def utilizarClassificadores(listaTreino, classesTreino, listaTeste, classesTeste, namesClassifiers, classifiers):
    listaAccuracy = {}
    listaCM = {}
    listaF1Score = {}
    for i, c in enumerate(classifiers):
        m = c.fit(listaTreino, classesTreino)
        y_pred = m.predict(listaTeste)         
        listaAccuracy[namesClassifiers[i]] = accuracy_score(classesTeste, y_pred)
        listaF1Score[namesClassifiers[i]]  = f1_score(classesTeste, y_pred, average='weighted')
        listaCM[namesClassifiers[i]]       = confusion_matrix(classesTeste, y_pred)
    listaAccuracy["XGBoost"], listaF1Score["XGBoost"], listaCM["XGBoost"] = xgboost(np.asarray(listaTreino), np.asarray(listaTeste), np.asarray(classesTreino), np.asarray(classesTeste))
    return listaAccuracy , listaF1Score, listaCM



In [None]:
def classificarImagens(pontos, raio):
    _lbp = LocalBinaryPatterns(pontos, raio)

    lista_treino_rgb_b, lista_treino_rgb_g, lista_treino_rgb_r, lista_treino_rgb_gray = obtemHistogramaCanais(listaRgbTreino, _lbp)
    lista_treino_hsv_h, lista_treino_hsv_s, lista_treino_hsv_v, _ = obtemHistogramaCanais(listaHsvTreino, _lbp)
    lista_treino_lab_l, lista_treino_lab_a, lista_treino_lab_b, _ = obtemHistogramaCanais(listaLabTreino, _lbp)

    lista_teste_rgb_b, lista_teste_rgb_g, lista_teste_rgb_r, lista_teste_rgb_gray = obtemHistogramaCanais(listaRgbTeste, _lbp)
    lista_teste_hsv_h, lista_teste_hsv_s, lista_teste_hsv_v, _ = obtemHistogramaCanais(listaHsvTeste, _lbp)
    lista_teste_lab_l, lista_teste_lab_a, lista_teste_lab_b, _ = obtemHistogramaCanais(listaLabTeste, _lbp)

    linha = []
    listaF1Score = []
    listaCM = [] 
    conf_matrix = []

    #('------------------ RGB ----------------')
    l, f1, cm = pd.Series(utilizarClassificadores(lista_treino_rgb_gray, classes_treino, lista_teste_rgb_gray, classes_teste, names, classifiers))
    linha.append(l)
    listaF1Score.append(f1)
    listaCM.append(cm)
    #('------------------ RGB - R ------------')
    l, f1, cm = pd.Series(utilizarClassificadores(lista_treino_rgb_r, classes_treino, lista_teste_rgb_r, classes_teste, names, classifiers))
    linha.append(l)
    listaF1Score.append(f1)
    listaCM.append(cm)
    #('------------------ RGB - G ------------')
    l, f1, cm = pd.Series(utilizarClassificadores(lista_treino_rgb_g, classes_treino, lista_teste_rgb_g, classes_teste, names, classifiers))
    linha.append(l)
    listaF1Score.append(f1)
    listaCM.append(cm)
    #('------------------ RGB - B ------------')
    l, f1, cm = pd.Series(utilizarClassificadores(lista_treino_rgb_b, classes_treino, lista_teste_rgb_b, classes_teste, names, classifiers))
    linha.append(l)
    listaF1Score.append(f1)
    listaCM.append(cm)

    #('------------------ HSV - H ------------')
    l, f1, cm = pd.Series(utilizarClassificadores(lista_treino_hsv_h, classes_treino, lista_teste_hsv_h, classes_teste, names, classifiers))
    linha.append(l)
    listaF1Score.append(f1)
    listaCM.append(cm)
    #('------------------ HSV - S ------------')
    l, f1, cm = pd.Series(utilizarClassificadores(lista_treino_hsv_s, classes_treino, lista_teste_hsv_s, classes_teste, names, classifiers))
    linha.append(l)
    listaF1Score.append(f1)
    listaCM.append(cm)
    #('------------------ HSV - V ------------')
    l, f1, cm = pd.Series(utilizarClassificadores(lista_treino_hsv_v, classes_treino, lista_teste_hsv_v, classes_teste, names, classifiers))
    linha.append(l)
    listaF1Score.append(f1)
    listaCM.append(cm)

    #('------------------ LAB - L ------------')
    l, f1, cm = pd.Series(utilizarClassificadores(lista_treino_lab_l, classes_treino, lista_teste_lab_l, classes_teste, names, classifiers))
    linha.append(l)
    listaF1Score.append(f1)
    listaCM.append(cm)
    #('------------------ LAB - A ------------')
    l, f1, cm = pd.Series(utilizarClassificadores(lista_treino_lab_a, classes_treino, lista_teste_lab_a, classes_teste, names, classifiers))
    linha.append(l)
    listaF1Score.append(f1)
    listaCM.append(cm)
    #('------------------ LAB - B ------------')
    l, f1, cm = pd.Series(utilizarClassificadores(lista_treino_lab_b, classes_treino, lista_teste_lab_b, classes_teste, names, classifiers))
    linha.append(l)
    listaF1Score.append(f1)
    listaCM.append(cm)
    
    return linha, listaF1Score, listaCM

In [None]:
def obterResultados (pontos, raio):
    linhas, listaF1Score, listaCM, listaPS, listaRS = classificarImagens(pontos, raio)
    print('------ %s pontos - %s raio ------' % (pontos, raio))
    print('--- Acuracia ---')
    display(pd.DataFrame(linhas))
    print('--- F1 ---')
    display(pd.DataFrame(listaF1Score))
    print('--- Matriz confusao ---')
    display(pd.DataFrame(listaCM))
    print('---------------------------------')
    

In [4]:
data_dir = r"C:\Users\Rosana\Documents\Mestrado\DataSets\RIM_ONE_v2"
categorias = ["glaucoma","normal"]
img_size = 200
listaImagens = criarListaImagens(categorias, data_dir, img_size)
imagens, classes = criaListaTreinoTeste(listaImagens)

In [5]:
skf = StratifiedKFold(n_splits=3)
for id_train, id_test in skf.split(imagens, classes):

    listaRgbTreino = obtemCanaisCoresRGB(imagens_treino)
    listaHsvTreino = obterCanaisCores(imagens_treino, cv2.COLOR_BGR2HSV)
    listaLabTreino = obterCanaisCores(imagens_treino, cv2.COLOR_BGR2LAB)
    listaLuvTreino = obterCanaisCores(imagens_treino, cv2.COLOR_BGR2LUV)

    listaRgbTeste = obtemCanaisCoresRGB(imagens_teste)
    listaHsvTeste = obterCanaisCores(imagens_teste, cv2.COLOR_BGR2HSV)
    listaLabTeste = obterCanaisCores(imagens_teste, cv2.COLOR_BGR2LAB)
    listaLuvTeste = obterCanaisCores(imagens_teste, cv2.COLOR_BGR2LUV)
    
    obterResultados(8,1)
    obterResultados(16,3)
    obterResultados(24,3)
    obterResultados(24,8)