# IF648EC - Sistemas Inteligentes
Caderno para a disciplina IF648EC da Universidade Federal de Pernambuco.
Construído por Wilton Ramos da Silva

# 1. Introdução

Este projeto utiliza redes MLPs para tratar um conjunto de dados de Sintomas de Lombalgia. A dor lombar crônica é uma das principais causas de incapacidade em todo o mundo. Dados revelam que a prevalência dessa dor em adultos aumentou mais de 100% na última década e tende a aumentar nas populações mais velhas. Em geral, o diagnóstico de lombalgia é complexo e depende de vários fatores. Por tanto, temos como objetivo criar um sistema capaz de identificar pacientes que possam sofrer dessa doença a partir de determinadas características. 

# 2. Importar dados e bibliotecas
Inicialmente, importaremos as bibliotecas e os dados necessários.

In [None]:
import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, plot_confusion_matrix, confusion_matrix

In [None]:
data = pd.read_csv('../input/lower-back-pain-symptoms-dataset/Dataset_spine.csv')

Agora, iremos visualizar o que temos em data

In [None]:
data

Como vemos, o dado que estamos trabalhando é um tabela de 310 linhas e 14 colunas. Contudo, a última coluna ("Unnamed: 13") não possui nenhum dado útil. Por isso, iremos retirar essa coluna da tabela.

In [None]:
data = data.drop(['Unnamed: 13'], axis = 1)
data

Para poder treinar e testar nossa rede, inicialmente divideremos data em dois conjuntos distintos. Um conjunto y, que possuíra a coluna Class_att; um conjunto x, que possuíra o restante de data. Em seguida, repartiremos 20% para treino e 80% para teste do nosso modelo.

In [None]:
y = data['Class_att']
x = data.drop(['Class_att'], axis = 1)

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.2, random_state = 13)

# 3. Treino 1
Utilizaremos a biblioteca SKLearn para criar nossa rede MLP. Inicialmente, utilizaremos os seus parâmetros padrões.

In [None]:
MLP_classifier = MLPClassifier(random_state = 13, verbose = False)
MLP_classifier.get_params()

Iremos, então, treinar nosso modelo utilizando os conjuntos x_test e y_test

In [None]:
MLP_classifier.fit(x_train, y_train)

# 4. Resultados do treino 1
Observaremos os resultados do treino.

In [None]:
y_pred = MLP_classifier.predict(x_test)
MLP_classifier.score(x_test, y_test)

Com os parâmetros padrões, obtivemos um modelo com acurácia de 83%.

Agora, podemos analisar o relatório de classificação:

In [None]:
report = classification_report(y_test, y_pred)
print(report)

Em relação à precisão, para o nosso modelo tivemos 92% para abnormal e 71% para normal. Ou seja, a chance de algum paciente em condições normais ser diagnosticado com lombalgia é de 8%, enquanto que a chance de um paciente com a doença ser classificado erroneamente como saudável é de 29%.

Também vale comentar sobre a taxa de recall. Conseguimos extrair que 15% das pessoas saudáveis foram erroneamenge classificadas como doentes. Já aqueles que estão doentes, 17% foram classificados como saudáveis.

# 5. Treino 2
Vamos, agora, ver como o sistema se comporta ao modificar a função de ativação e aumentar o número de iterações

In [None]:
MLP_classifier_ID = MLPClassifier(activation = 'identity', max_iter = 500,random_state = 13, verbose = False)
MLP_classifier_LG = MLPClassifier(activation = 'logistic', max_iter = 500,random_state = 13, verbose = False)
MLP_classifier_TH = MLPClassifier(activation = 'tanh', max_iter = 500,random_state = 13, verbose = False)
MLP_classifier_ID.fit(x_train, y_train)
MLP_classifier_LG.fit(x_train, y_train)
MLP_classifier_TH.fit(x_train, y_train)

In [None]:
y_pred = MLP_classifier_ID.predict(x_test)
print(MLP_classifier_ID.score(x_test, y_test))
report = classification_report(y_test, y_pred)
print(report)

Para a função identity, em que f(x) = x, o modelo obteve uma acurácia de 85%. Em relação à precisão, percebemos 95% para abnormal e 72% para normal. Enquanto que na taxa de recall, nota-se 83% para abnormal e 90% para normal. Vale ressaltar que entre as funções testadas nesta seção, essa foi a única que conseguiu convergir.

In [None]:
y_pred = MLP_classifier_LG.predict(x_test)
print(MLP_classifier_LG.score(x_test, y_test))
report = classification_report(y_test, y_pred)
print(report)

Já para a função logistic, em que  f(x) = 1 / (1 + exp(-x)), o modelo atingiu o número limite de iterações sem convergir, mas ainda respondeu com uma acurácia de 85%. Em relação à precisão, percebemos 97% para abnormal e 70% para normal. Enquanto que na taxa de recall, nota-se 81% para abnormal e 95% para normal (a maior entre as funções disponíveis).

In [None]:
y_pred = MLP_classifier_TH.predict(x_test)
print(MLP_classifier_TH.score(x_test, y_test))
report = classification_report(y_test, y_pred)
print(report)

Por fim, a função tanh, em que  f(x) = tanh(x),também atingiu o número limite de iterações sem convergi e obteve uma acurácia de 82%. Em relação à precisão, percebemos 90% para abnormal e 70% para normal. Enquanto que na taxa de recall, nota-se 83% para abnormal e 80% para normal (a mais baixa entre as funções disponíveis).

# 6. Treino 3
Aqui, iremos utiliza três camadas de unidades de processamento intermediário e a função sigmoidal como função de ativação. Além disso, como no teste anterior a função sigmoidal atingiu o número limite de iterações, iremos aumentá-lo.

In [None]:
MLP_classifier_LG = MLPClassifier(hidden_layer_sizes = (100, 100, 100,),activation = 'logistic', max_iter = 1000,random_state = 13, verbose = False)
MLP_classifier_LG.fit(x_train, y_train)

In [None]:
y_pred = MLP_classifier_LG.predict(x_test)
print(MLP_classifier_LG.score(x_test, y_test))
report = classification_report(y_test, y_pred)
print(report)

Com os valores alterados, percebemos um baixa na acurácia do modelo e nos valores de precissão e de recall. Assim, temos que a implementação anterior com essa função apresenta melhores resultados.

# 7. Limpeza dos dados

Nesse momento, tentaremos descobrir quais são as melhroes variáveis para utilizar como dados da nossa MLP. Esperamos, assim, maximizar a precisão dos casos.

In [None]:
from sklearn.ensemble import ExtraTreesClassifier
import matplotlib.pyplot as plt
model = ExtraTreesClassifier()
model.fit(x,y)
feat_importances = pd.Series(model.feature_importances_, index=x.columns)
feat_importances.nlargest(12).plot(kind='barh')
plt.show()

Nesse gráfico conseguimos observar quais váriaveis impactam mais na classificação dos casos. Vemos que as colunas [7, 12] são as que menos impactam nessa classificação. Devemos, no entanto, focas nas demais variáveis, as que realmente podem causa mudança no resultado.

In [None]:
df = pd.read_csv('../input/lower-back-pain-symptoms-dataset/Dataset_spine.csv')
df = df.drop(['Unnamed: 13'], axis=1)
df = df.drop(['Col7','Col8','Col9','Col10','Col11','Col12'], axis=1)
df.head()


Agora, como vemos, temos as colunas [1,6] e o a coluna [Class_att]. A seguir iremos, dividir novamente esse conjunto em subconjunto de teste e treino.

In [None]:
y = df['Class_att']
x = df.drop(['Class_att'], axis=1)

x_train, x_test, y_train, y_test = train_test_split(x,y, test_size = 0.2, random_state = 13)

In [None]:
clf = MLPClassifier(hidden_layer_sizes = (100,100,100), random_state = 13, activation = 'logistic', verbose = False, validation_fraction = 0.2)                    
clf.fit(x_train, y_train)

In [None]:
y_pred = clf.predict(x_test)
clf.score(x_test, y_test)

In [None]:
report = classification_report(y_test, y_pred)
print(report)

Com essas modificações, acreditávamos que iríamos obter melhores resultados. No entanto, como é possível notar, o melhor resultado que obtivemos foi com a função 'logistic' sem limpeza do nosso conjunto de dados.