# Treinamento

## K-Nearest Neighbors (KNN)

### Local Bynary Patterns (LBP)

#### Train Test Split

In [2]:
import os
import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split, StratifiedKFold

In [4]:
diretorio_base = "./data/espectogramas/"

# Lista de arrays no formato [[key, nome], ...]
lista_arquivos = []

for pasta in os.listdir(diretorio_base):
    if os.path.isdir(os.path.join(diretorio_base, pasta)):
        diretorio_pasta = os.path.join(diretorio_base, pasta)
        for arquivo in os.listdir(diretorio_pasta):
            lista_arquivos.append([pasta, arquivo])


df_X = pd.DataFrame(lista_arquivos, columns=['key', 'nome_arquivo'])


# Remova o elemento em que só há uma ocorrência de determinada 'key'
df_X = df_X.groupby('key').filter(lambda x: len(x) > 1)

# transforma em lista
lista_arquivos = df_X.values.tolist()

# Separa a primeira coluna da lista na variavel nome_arquivo e key
key, nome_arquivo = zip(*lista_arquivos)

# Remove o .png do nome do arquivo
nome_arquivo = [nome[:-4] for nome in nome_arquivo]





In [5]:
arq_treino, arq_teste, y_treino, y_teste = train_test_split(nome_arquivo, key, test_size=0.2, stratify=key)


In [6]:
# Carregar o arquivo LBP.csv
df_lbp = pd.read_csv('./data/caracteristicas/LBP.csv')

# Filtrar as amostras com 'nome_arquivo' presente em arq_treino
df_train = df_lbp[df_lbp['nome_arquivo'].isin(arq_treino)]

# Filtrar as amostras com 'nome_arquivo' presente em arq_teste
df_test = df_lbp[df_lbp['nome_arquivo'].isin(arq_teste)]

# Salvar os arquivos
df_train.to_csv('./data/caracteristicas/LBP_treino.csv', index=False)
df_test.to_csv('./data/caracteristicas/LBP_teste.csv', index=False)

# Carrega o arquivo de treino
df_train = pd.read_csv('./data/caracteristicas/LBP_treino.csv')

# Carrega o arquivo de teste
df_test = pd.read_csv('./data/caracteristicas/LBP_teste.csv')

# Separa as colunas de entrada e saida
y_train = df_train['key']
X_train = df_train.drop(columns=['key', 'nome_arquivo'])

y_test = df_test['key']
X_test = df_test.drop(columns=['key', 'nome_arquivo'])

# normaliza os dados
scaler = StandardScaler()

# Ajusta os dados de treino
X_train = scaler.fit_transform(X_train)

# Ajusta os dados de teste
X_test = scaler.transform(X_test)

print(X_train)



[[-0.79217773  0.63269316 -0.76622217 ...  0.          0.
   0.        ]
 [ 1.95850214  0.65685718  1.48444989 ...  0.          0.
   0.        ]
 [ 0.42533631  0.28449112  1.04681921 ...  0.          0.
   0.        ]
 ...
 [-0.79217773 -2.70704465 -0.76622217 ...  0.          0.
   0.        ]
 [-0.79217773  0.35773362 -0.76622217 ...  0.          0.
   0.        ]
 [-0.79217773  0.30805479 -0.76622217 ...  0.          0.
   0.        ]]


In [7]:
# Cria o classificador
knn = KNeighborsClassifier(n_neighbors=9)

# Treina o classificador
knn.fit(X_train, y_train)

# Testa o classificador
y_pred = knn.predict(X_test)

# Calcula a acurácia
from sklearn.metrics import accuracy_score
acc = accuracy_score(y_test, y_pred)
print('Acurácia: ', acc)


Acurácia:  0.06646905595975927


In [8]:
print(classification_report(y_test, y_pred))

  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))


              precision    recall  f1-score   support

     abethr1       0.00      0.00      0.00        16
     abhori1       0.03      0.11      0.05       168
     abythr1       0.01      0.04      0.02        48
     afbfly1       0.00      0.00      0.00        20
     afdfly1       0.00      0.00      0.00        18
     afecuc1       0.02      0.05      0.02       110
     affeag1       0.00      0.00      0.00        22
     afgfly1       0.00      0.00      0.00         6
     afghor1       0.00      0.00      0.00        58
     afmdov1       0.00      0.00      0.00        29
     afpfly1       0.01      0.02      0.02       172
     afpwag1       0.00      0.00      0.00        97
     afrgos1       0.03      0.05      0.04       110
     afrgrp1       0.00      0.00      0.00        23
     afrjac1       0.00      0.00      0.00        22
     afrthr1       0.07      0.10      0.08       144
     amesun2       0.00      0.00      0.00        50
     augbuz1       0.00    

  _warn_prf(average, modifier, msg_start, len(result))
