# Classificação

Com a etapa de leitura de dados finalizada, podemos começar a nos preocupar em treinar um modelo bom o suficiente para obter bons resultados de classificação. Como sempre, vamos começar preparando o notebook:

In [1]:
import numpy as np

from utils import read_data, prepare_data

Em seguida, preparamos o conjunto de treino e de teste:

In [2]:
labels = {'Fall': 1, 'ADL': 2}

fall_train = read_data('Dataset/Fall/Train', labels['Fall'])
adl_train = read_data('Dataset/ADL/Train', labels['ADL'])

fall_test = read_data('Dataset/Fall/Test', labels['Fall'])
adl_test = read_data('Dataset/ADL/Test', labels['ADL'])

x_train, y_train = prepare_data(fall_train, adl_train)
x_test, y_test = prepare_data(fall_test, adl_test)

Por conveniência, vamos definir uma função para imprimir os valores de acurácia dos classificadores, bem como os parâmetros utilizados:

In [3]:
def print_acc(model, train, test):
    print('Acurácia:', model)
    print('Conjunto de treino: {:.4f}\t\tConjunto de teste: {:.4f}'.format(train, test))

Agora basta começar os experimentos e ajustar os parâmetros até chegarmos em um classificador com resultados satisfatórios em ambos os conjuntos:

In [4]:
from sklearn.linear_model import LogisticRegression

clf = LogisticRegression().fit(x_train, y_train)
print_acc(clf, clf.score(x_train, y_train), clf.score(x_test, y_test))

Acurácia: LogisticRegression()
Conjunto de treino: 0.9655		Conjunto de teste: 1.0000


In [5]:
from sklearn.svm import SVC

clf = SVC(kernel='linear').fit(x_train, y_train)
print_acc(clf, clf.score(x_train, y_train), clf.score(x_test, y_test))

Acurácia: SVC(kernel='linear')
Conjunto de treino: 0.9828		Conjunto de teste: 0.9167


In [6]:
clf = SVC(kernel='poly').fit(x_train, y_train)
print_acc(clf, clf.score(x_train, y_train), clf.score(x_test, y_test))

Acurácia: SVC(kernel='poly')
Conjunto de treino: 0.9483		Conjunto de teste: 0.9167


In [7]:
clf = SVC(kernel='rbf').fit(x_train, y_train)
print_acc(clf, clf.score(x_train, y_train), clf.score(x_test, y_test))

Acurácia: SVC()
Conjunto de treino: 0.9310		Conjunto de teste: 0.9167


In [8]:
from sklearn.ensemble import RandomForestClassifier

clf = RandomForestClassifier(max_depth=3, min_samples_leaf=5).fit(x_train, y_train)
print_acc(clf, clf.score(x_train, y_train), clf.score(x_test, y_test))

Acurácia: RandomForestClassifier(max_depth=3, min_samples_leaf=5)
Conjunto de treino: 0.9828		Conjunto de teste: 1.0000


E temos um vencedor:

In [9]:
from sklearn.neural_network import MLPClassifier

clf = MLPClassifier(hidden_layer_sizes=(32, 128, 24), max_iter=500, activation='relu', random_state=42).fit(x_train, y_train)
print_acc(clf, clf.score(x_train, y_train), clf.score(x_test, y_test))

Acurácia: MLPClassifier(hidden_layer_sizes=(32, 128, 24), max_iter=500, random_state=42)
Conjunto de treino: 1.0000		Conjunto de teste: 1.0000
