# Importação do dataset

In [None]:
import pandas as pd
import numpy as np

O dataset escolhido é um problema de classificação em que as características (features) clínicas foram observadas ou medidas em 64 pacientes com câncer de mama e 52 paciente controles saudáveis. O objetivo é classificar um indivíduo a partir de suas features como pacientre controle saudável ou como portador de câncer de mama.

In [None]:
df = pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/00451/dataR2.csv")

## Verificação de informações básicas sobre o dataset

In [None]:
df.head()

Unnamed: 0,Age,BMI,Glucose,Insulin,HOMA,Leptin,Adiponectin,Resistin,MCP.1,Classification
0,48,23.5,70,2.707,0.467409,8.8071,9.7024,7.99585,417.114,1
1,83,20.690495,92,3.115,0.706897,8.8438,5.429285,4.06405,468.786,1
2,82,23.12467,91,4.498,1.009651,17.9393,22.43204,9.27715,554.697,1
3,68,21.367521,77,3.226,0.612725,9.8827,7.16956,12.766,928.22,1
4,86,21.111111,92,3.549,0.805386,6.6994,4.81924,10.57635,773.92,1


In [None]:
df.shape

(116, 10)

In [None]:
# vamos verificar a proporção entre os dois rótulos existentes na coluna de label

valores_label = df['Classification'].value_counts() # valores da coluna label
total_valores = valores_label.iloc[0] + valores_label.iloc[1] # quantidade total dos valores

negativos = valores_label.iloc[0] # quantidade de valores negativos (-)
positivos = valores_label.iloc[1] # quantidade de valores positivos (+)

porc_negativa = negativos/total_valores # porcentagem dos rótulos negativos (-)
porc_positiva = positivos/total_valores # porcentagem dos rótulos positivos (+)

print(f"quantidade de negativos = {negativos}")
print(f"porcentagem de negativos = {round(porc_negativa*100,2)}%\n")
print(f"quantidade de positivos = {positivos}")
print(f"porcentagem de positivos = {round(porc_positiva*100,2)}%")

quantidade de negativos = 64
porcentagem de negativos = 55.17%

quantidade de positivos = 52
porcentagem de positivos = 44.83%


In [None]:
df.describe()

Unnamed: 0,Age,BMI,Glucose,Insulin,HOMA,Leptin,Adiponectin,Resistin,MCP.1,Classification
count,116.0,116.0,116.0,116.0,116.0,116.0,116.0,116.0,116.0,116.0
mean,57.301724,27.582111,97.793103,10.012086,2.694988,26.61508,10.180874,14.725966,534.647,1.551724
std,16.112766,5.020136,22.525162,10.067768,3.642043,19.183294,6.843341,12.390646,345.912663,0.499475
min,24.0,18.37,60.0,2.432,0.467409,4.311,1.65602,3.21,45.843,1.0
25%,45.0,22.973205,85.75,4.35925,0.917966,12.313675,5.474283,6.881763,269.97825,1.0
50%,56.0,27.662416,92.0,5.9245,1.380939,20.271,8.352692,10.82774,471.3225,2.0
75%,71.0,31.241442,102.0,11.18925,2.857787,37.3783,11.81597,17.755207,700.085,2.0
max,89.0,38.578759,201.0,58.46,25.050342,90.28,38.04,82.1,1698.44,2.0


In [None]:
df.dtypes

Age                 int64
BMI               float64
Glucose             int64
Insulin           float64
HOMA              float64
Leptin            float64
Adiponectin       float64
Resistin          float64
MCP.1             float64
Classification      int64
dtype: object

# Pré-processamento

## Tratamento de dados nulos



In [None]:
qnt_inicial_linhas = df.shape[0] # armazenamento de quantas linhas o dataset possui antes de eliminar os dados nulos
qnt_inicial_coluna = df.shape[1] # armazenamento de quantas colunas o dataset possui antes de eliminar os dados nulos

df  = df.replace('?', np.nan) # substituicao do caracter '?' para o tipo np.nan, pois np.nan é um tipo padrão de dado nulo
df  = df.dropna() # eliminação dos dados nulos

print("Total de linhas com dados nulos que foram eliminadas:", qnt_inicial_linhas - df.shape[0]) # calculo de quantas linhas com dados nulos foram eliminadas
print(f"Formato original do dataframe:  linhas = {qnt_inicial_linhas}, colunas = {qnt_inicial_coluna}")  # impressao do formato do dataframe original
print(f"Formato final do dataframe: linhas = {df.shape[0]}, colunas = {df.shape[1]}") # impressao do formato do dataframe

Total de linhas com dados nulos que foram eliminadas: 0
Formato original do dataframe:  linhas = 116, colunas = 10
Formato final do dataframe: linhas = 116, colunas = 10


## Divisão das variáveis

In [None]:
X = df
y = df[['Classification']] # divisão da label

#Normalização



In [None]:
# inicializacao
X_min_max_scaled = X.copy() # copia do dataframe original para outro dataframe

# loop para normalizar as variaveis dentro do intervalo (0,1), a partir da funcao x = x - x.min / x.max - x.min
for i in X:
  if X[i].name != "Classification":
    X[i] = (X[i] - X[i].min()) / (X[i].max() - X[i].min())

X.head() # verificacao do dataframe normalizado

Unnamed: 0,Age,BMI,Glucose,Insulin,HOMA,Leptin,Adiponectin,Resistin,MCP.1,Classification
0,0.369231,0.25385,0.070922,0.004908,0.0,0.052299,0.221152,0.060665,0.224659,1
1,0.907692,0.114826,0.22695,0.01219,0.009742,0.052726,0.103707,0.010826,0.255926,1
2,0.892308,0.235278,0.219858,0.036874,0.022058,0.158526,0.571021,0.076906,0.307912,1
3,0.676923,0.148328,0.120567,0.014171,0.005911,0.064811,0.151538,0.121131,0.533934,1
4,0.953846,0.13564,0.22695,0.019936,0.013748,0.027782,0.08694,0.093375,0.440565,1


In [None]:
# troca [1,2] por [0,1] na coluna label, para se adequar ao neuronio de saida
for i in range(X.shape[0]):
  if X['Classification'][i] == 1:
    X['Classification'][i] = 0
  else:
    X['Classification'][i] = 1

for i in range(y.shape[0]):
  if y['Classification'][i] == 1:
    y['Classification'][i] = 0
  else:
    y['Classification'][i] = 1

In [None]:
print(X['Classification'].unique())

[0 1]


# Divisão entre conjunto de treinamento e teste





In [None]:
from sklearn.model_selection import train_test_split

In [None]:
# criacao da divisao do dataframe em features para teste (X_train), features de teste (X_test), label para treino (y_label) e label para teste (y_test)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

In [None]:
print("Formato do conjunto de features para treinamento (X_train): linhas = " + str(X_train.shape[0]) + ", colunas = "+ str(X_train.shape[1]) + "")
print("Formato do conjunto de features para teste (X_test): linhas = " + str(X_test.shape[0]) + ", colunas = "+ str(X_test.shape[1]) + "")
print("Verificação da proporção de treino: o conjunto de treino representa aproximadamente " + str(round((X_train.shape[0]/df.shape[0])*100,2)) + "% do total do dataframe original (df)")

Formato do conjunto de features para treinamento (X_train): linhas = 81, colunas = 10
Formato do conjunto de features para teste (X_test): linhas = 35, colunas = 10
Verificação da proporção de treino: o conjunto de treino representa aproximadamente 69.83% do total do dataframe original (df)


# Multilayer Perceptron (MLP)



## Implementação (função Sigmoid)

In [None]:
from math import exp
from random import seed
from random import random

# Inicializa a rede neural
def initialize_network(n_inputs, n_hidden, n_outputs): # parâmetros: quantidade de neuronios na entrada, na hidden layer, e na saída

  network = list() # inicializa a rede com uma lista

  # sera feito o uso da funcao random() para inicializar os pesos, que vao assumir um valor aleatorio entre 0 e 1

  # a hidden layer é um dicionário do python com os pesos de cada entrada (n_inputs) somado com um espaco para armazenar o viés, ou seja,  n_inputs + 1
  hidden_layer = [{'weights':[random() for i in range(n_inputs + 1)]} for i in range(n_hidden)]

  network.append(hidden_layer) # adiciona a hidden layer

  # a camada de output é um dicionário em Python com os pesos de cada neuronio escondido (n_hidden) somado com um espaço para armazenar o viés, ou seja, n_hidden + 1
  output_layer = [{'weights':[random() for i in range(n_hidden + 1)]} for i in range(n_outputs)]

  network.append(output_layer) # adiciona a camada de saida

  # é importante comentar que o viés vai ocupar a ultima posição das listas dos pesos

  print('pesos iniciais:')
  for layer in network:
    print(layer)

  return network

# ----------------------- FORWARD PROPAGATE -----------------------

# Funcao de ativacao
def activate(weights, inputs): # recebe pesos e as entradas

  activation = weights[-1] # inicializa ativação com o viés (que ocupa a última posição dos pesos)

  # As entradas (inputs) pode ser uma linha do nosso conjunto de dados de treinamento, como no caso da hidden layer.
  # Também podem ser as saídas de cada neurônio da hidden layer, no caso da camada de saída.
  # Sendo assim, o loop a seguir pode iterar para cada uma dessas opções
  for i in range(len(weights)-1):
    activation += weights[i] * inputs[i]

  # no final teremos activation = somatório(wi * xi) + viés
  return activation


# Funcao de transferencia de neuronio
def transfer(activation): # recebe o resultado da ativação do neuronio
  return 1.0 / (1.0 + exp(-activation)) # dentre as funcoes de ativacao eh usada a sigmoide


# Forward propagate
def forward_propagate(network, row):
  inputs = row # inicializa com as entradas da camada de entrada

  for layer in network:

    new_inputs = [] # inicializa a lista de resultados da f(net)

    for neuron in layer:

      activation = activate(neuron['weights'], inputs) # calcula o net de cada neuronio

      neuron['output'] = transfer(activation) # calcula o resultado da funcao de ativacao

      # armazena o mesmo resulta em um array para ser usada como input
      # na proxima camada ou na camada de output
      new_inputs.append(neuron['output'])

    inputs = new_inputs

  return inputs

# ----------------------- BACK PROPAGATE ERROR -----------------------

# Calcula a derivada da saida de um neuronio
def transfer_derivative(output):
  return output * (1.0 - output) # derivada da funcao escolhida, Sigmoide


# Backpropagate error e armazenamento nos neuronios
def backward_propagate_error(network, expected):

  # esta funcao calcula para cada peso w: (erro na predicao) * (derivada da funcao de transferencia)
  # para propagar reversamento partindo da camada de saída para as hidden layers
  # e devolve um dicionario [output, weight, delta]

  # o sinal de erro calculado para cada neurônio é armazenado com o nome ‘delta’

  for i in reversed(range(len(network))): # loop em que é inicializado as listas onde serao armazenados os resultados

    layer = network[i] # neuronio de saida [i], apenas armazena para calculo

    errors = list() # lista com os erros, delta

    if i != len(network)-1:

      for j in range(len(layer)): # iteracao por posicao da camada
        error = 0.0

        for neuron in network[i + 1]: # loop atraves dos neuronios, em que será atualizado o erro
          error += (neuron['weights'][j] * neuron['delta']) # calcula todos os pesos ajustados com o delta de cada neuronio

        errors.append(error)

    else:
      for j in range(len(layer)): #iteracao por posicao da camada que vai calcular o erro da saida de acordo com a expectatica informada
        neuron = layer[j]
        errors.append(neuron['output'] - expected[j]) # calcula o erro individual

    for j in range(len(layer)): # calcula o delta
      neuron = layer[j]
      neuron['delta'] = errors[j] * transfer_derivative(neuron['output']) # para cada neuronio calcula-se o (erro) * (derivada da funcao de transferencia)

# ----------------------- TRAIN NETWORK -----------------------

# Atualiza os pesos com os erros
def update_weights(network, row, l_rate): # recebe a rede neural, inputs e a taxa de aprendizado

  for i in range(len(network)):

    inputs = row[:-1] # inicializa com o ultimo elemento

    if i != 0: # condicao para lista vazia
      inputs = [neuron['output'] for neuron in network[i - 1]] # arnazena a saida da proxima camada que sera a entrada desta, metodo reverso

    for neuron in network[i]: # loop de iteracao dos neuronios

      for j in range(len(inputs)):

        neuron['weights'][j] -= l_rate * neuron['delta'] * inputs[j] # atualiza o peso: w = w - l_rate * error * input

      neuron['weights'][-1] -= l_rate * neuron['delta'] # propaga para tras, w(t-1)


# Treinamento por n epocas
def train_network(network, train, l_rate, n_epoch, n_outputs):

  for epoch in range(n_epoch):# loop pelas n epocas

    sum_error = 0 # inicializa o erro

    for row in train: # loop pelo conjunto de treinamento

      outputs = forward_propagate(network, row) # armazena a saida da funcao de transferencia para ser usada como input na proxima

      expected = [0 for i in range(n_outputs)] # usada para armazenar o resultado de forma binaria (one hotted) para ser comparavel com a saida, marca todos os valores esperados como zero

      expected[row[-1]] = 1 # marca o ultimo input como 1

      sum_error += sum([(expected[i]-outputs[i])**2 for i in range(len(expected))]) # calcula o quadrado de delta, elimina valores negativos e ilustra a parabola

      backward_propagate_error(network, expected) # calcula o delta para cada neuronio

      update_weights(network, row, l_rate) # funcao para atualizar o peso com o delta e taxa de aprendizado

    print('>época=%d, lrate=%.3f, erro=%.3f' % (epoch, l_rate, sum_error)) # imprimi o reseultado de cada epoca

  print('pesos finais:')
  for layer in network:
    print(layer)

# ----------------------- PREDICT -----------------------

def predict(network, row): # retorna o indice com a maior probabilidade
 outputs = forward_propagate(network, row)
 return outputs.index(max(outputs))

## Aplicação

In [None]:
#converte para np.array, estrutura esperada pelo codigo
X_train = X_train.to_numpy(dtype=object)
X_test = X_test.to_numpy(dtype=object)

In [None]:
#declaracao de variaveis
n_inputs = len(X_train[0])-1
n_outputs = len(set([row[-1] for row in X_train]))
n_hidden = 4

In [None]:
#inicializa rede neural
network = initialize_network(n_inputs, n_hidden, n_outputs)

pesos iniciais:
[{'weights': [0.3341369682059847, 0.89085046581371, 0.004549496470945491, 0.2589045157479587, 0.8450716981534722, 0.987983661608356, 0.442635136535938, 0.903112148861891, 0.4740923155683723, 0.28336751454406495]}, {'weights': [0.6628159309276854, 0.11740086146518036, 0.5694378725444753, 0.5151151484894333, 0.9621610885090061, 0.1096605335875882, 0.9494650662320734, 0.47344907787228463, 0.9630453630165917, 0.7187215247002041]}, {'weights': [0.6556389611445161, 0.521111536963618, 0.31297193067346385, 0.6724358400071815, 0.7738717223047566, 0.5023842065761167, 0.06590054378182109, 0.44542140599359126, 0.679501495803593, 0.459241194335835]}, {'weights': [0.6527681474449718, 0.0768398571193104, 0.360270688828795, 0.23966349195235948, 0.1814621173877311, 0.6244131266743548, 0.44546322089678847, 0.8669009533584435, 0.4726307636086431, 0.39214740394597014]}]
[{'weights': [0.2969088998900602, 0.7548379744293308, 0.34797656926727205, 0.8246754288040894, 0.4331844272419897]}, {'we

In [None]:
#treinamento com 70% do dataset
#retorno binario, escolhemos 0.5 de taxa de aprendizado
train_network(network, X_train, 0.5, 2000, n_outputs)

>época=0, lrate=0.500, erro=49.384
>época=1, lrate=0.500, erro=42.076
>época=2, lrate=0.500, erro=42.002
>época=3, lrate=0.500, erro=41.934
>época=4, lrate=0.500, erro=41.857
>época=5, lrate=0.500, erro=41.770
>época=6, lrate=0.500, erro=41.669
>época=7, lrate=0.500, erro=41.553
>época=8, lrate=0.500, erro=41.417
>época=9, lrate=0.500, erro=41.257
>época=10, lrate=0.500, erro=41.072
>época=11, lrate=0.500, erro=40.859
>época=12, lrate=0.500, erro=40.617
>época=13, lrate=0.500, erro=40.348
>época=14, lrate=0.500, erro=40.057
>época=15, lrate=0.500, erro=39.746
>época=16, lrate=0.500, erro=39.420
>época=17, lrate=0.500, erro=39.082
>época=18, lrate=0.500, erro=38.736
>época=19, lrate=0.500, erro=38.385
>época=20, lrate=0.500, erro=38.032
>época=21, lrate=0.500, erro=37.679
>época=22, lrate=0.500, erro=37.327
>época=23, lrate=0.500, erro=36.978
>época=24, lrate=0.500, erro=36.633
>época=25, lrate=0.500, erro=36.293
>época=26, lrate=0.500, erro=35.960
>época=27, lrate=0.500, erro=35.634
>é

In [None]:
#iteracao por features com resultado da predicao
resp = []
i = 1
for row in X_test:
  prediction = predict(network, row)
  resp.append(prediction)

## Acurácia

In [None]:
from sklearn.metrics import accuracy_score

acc = accuracy_score(y_test, resp)
print(f'Acurácia = {round(acc, 2) * 100}%')

Acurácia = 69.0%


## MLP com Tangente Hiperbólica

In [None]:
# FUNCOES MODIFICADAS NO ALGORITMO INICIAL

# Funcao de transferencia de neuronio
def transfer(activation): # recebe o resultado da ativação do neuronio
  return (2.0 / (1.0 + exp(-2*activation))) - 1 # dentre as funcoes de ativacao eh usada a tangente hiperbolica


# Calcula a derivada da saida de um neuronio
def transfer_derivative(output):
  return (1.0 - output)**2 # derivada da funcao escolhida, tangente hiperbolica

### Aplicação

In [None]:
n_inputs = len(X_train[0])-1
n_outputs = len(set([row[-1] for row in X_train]))
n_hidden = 4

network = initialize_network(n_inputs, n_hidden, n_outputs)

pesos iniciais:
[{'weights': [0.2728255636495698, 0.5717647546359337, 0.9420739856599278, 0.5590674215316841, 0.22254932932318816, 0.9927666719194201, 0.3198647267305825, 0.7306105916800375, 0.5516942619291257, 0.765792530319723]}, {'weights': [0.7916173525560338, 0.8223239031836808, 0.9595221078064259, 0.5460301365625809, 0.1683171804773067, 0.0019982588860270045, 0.9443867491340363, 0.456019695063119, 0.6783737091262846, 0.10226526049356455]}, {'weights': [0.8986122350500461, 0.5216686458294926, 0.5731748568351228, 0.5723536085719757, 0.22642670690065658, 0.010739410483229794, 0.13998524089765318, 0.6181402639905851, 0.019283394453025737, 0.08900827967680935]}, {'weights': [0.048642827674491795, 0.559360701854969, 0.9618954710016492, 0.18243176306513742, 0.23850576437297466, 0.6710864721396733, 0.4202330716273822, 0.5156681357517154, 0.7776779889114981, 0.5147908370842929]}]
[{'weights': [0.4741965027753874, 0.6243271421029718, 0.2988756303020593, 0.6967426602082545, 0.55957277604591

In [None]:
train_network(network, X_train, 0.1, 2000, n_outputs)

resp = []
i = 1
for row in X_test:
  prediction = predict(network, row)
  resp.append(prediction)

>época=0, lrate=0.100, erro=79.073
>época=1, lrate=0.100, erro=79.060
>época=2, lrate=0.100, erro=79.048
>época=3, lrate=0.100, erro=79.035
>época=4, lrate=0.100, erro=79.021
>época=5, lrate=0.100, erro=79.008
>época=6, lrate=0.100, erro=78.994
>época=7, lrate=0.100, erro=78.980
>época=8, lrate=0.100, erro=78.965
>época=9, lrate=0.100, erro=78.950
>época=10, lrate=0.100, erro=78.935
>época=11, lrate=0.100, erro=78.919
>época=12, lrate=0.100, erro=78.903
>época=13, lrate=0.100, erro=78.887
>época=14, lrate=0.100, erro=78.869
>época=15, lrate=0.100, erro=78.852
>época=16, lrate=0.100, erro=78.834
>época=17, lrate=0.100, erro=78.815
>época=18, lrate=0.100, erro=78.796
>época=19, lrate=0.100, erro=78.776
>época=20, lrate=0.100, erro=78.755
>época=21, lrate=0.100, erro=78.734
>época=22, lrate=0.100, erro=78.712
>época=23, lrate=0.100, erro=78.690
>época=24, lrate=0.100, erro=78.666
>época=25, lrate=0.100, erro=78.642
>época=26, lrate=0.100, erro=78.616
>época=27, lrate=0.100, erro=78.590
>é

### Acurácia

In [None]:
from sklearn.metrics import accuracy_score

acc = accuracy_score(y_test, resp)
print(f'Acurácia = {round(acc, 2) * 100}%')

Acurácia = 74.0%
