# Red neuronal para predecir si una persona sufrirá de un derrame cerebral

## 1.Leer el archivo stroke.csv

In [6]:
#----------------------------------------------------------
# Se importan las librerias
#----------------------------------------------------------

import numpy as np
import pandas as pd
import sklearn
import warnings

In [11]:
#----------------------------------------------------------
# Url de los datos
#----------------------------------------------------------

url = ("https://raw.githubusercontent.com/Yurani1143/Informe_Inteligencia_Artificial/main/stroke.csv")

#----------------------------------------------------------
# Se cargan los datos
#----------------------------------------------------------
datos = pd.read_csv(url, sep=",")
datos.columns= ["sexo","edad","hipertension","enfermedades_cardiacas","casado","tipo_trabajo","tipo_residencia","nivel_glucosa_promedio","indice_masa_corporal","estado_tabaquismo","derrame_cerebral"]


In [12]:
#----------------------------------------------------------
# Información de los atributos
#----------------------------------------------------------

datos.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 700 entries, 0 to 699
Data columns (total 11 columns):
 #   Column                  Non-Null Count  Dtype  
---  ------                  --------------  -----  
 0   sexo                    700 non-null    object 
 1   edad                    700 non-null    float64
 2   hipertension            700 non-null    int64  
 3   enfermedades_cardiacas  700 non-null    int64  
 4   casado                  700 non-null    object 
 5   tipo_trabajo            700 non-null    object 
 6   tipo_residencia         700 non-null    object 
 7   nivel_glucosa_promedio  700 non-null    float64
 8   indice_masa_corporal    651 non-null    float64
 9   estado_tabaquismo       700 non-null    object 
 10  derrame_cerebral        700 non-null    int64  
dtypes: float64(3), int64(3), object(5)
memory usage: 60.3+ KB


In [13]:
#----------------------------------------------------------
# Variables categóricas (tipo object)
#----------------------------------------------------------
datos.select_dtypes(include=['object']).describe()


Unnamed: 0,sexo,casado,tipo_trabajo,tipo_residencia,estado_tabaquismo
count,700,700,700,700,700
unique,2,2,5,2,4
top,Female,Yes,Private,Urban,never smoked
freq,414,522,410,356,265


In [14]:
#----------------------------------------------------------
# Variables cuantitativas (tipo entero)
#----------------------------------------------------------

datos.select_dtypes(include=['int64']).describe()

Unnamed: 0,hipertension,enfermedades_cardiacas,derrame_cerebral
count,700.0,700.0,700.0
mean,0.151429,0.095714,0.355714
std,0.358722,0.294409,0.479072
min,0.0,0.0,0.0
25%,0.0,0.0,0.0
50%,0.0,0.0,0.0
75%,0.0,0.0,1.0
max,1.0,1.0,1.0


In [15]:
#----------------------------------------------------------
# Variables cuantitativas (tipo real)
#----------------------------------------------------------
datos.select_dtypes(include=['float64']).describe()

Unnamed: 0,edad,nivel_glucosa_promedio,indice_masa_corporal
count,700.0,700.0,651.0
mean,51.4852,116.647786,29.857143
std,22.401775,53.171734,8.008309
min,0.32,55.25,12.0
25%,36.0,78.7875,24.45
50%,55.0,96.925,28.5
75%,71.0,137.795,34.3
max,82.0,271.74,71.9


## 2.Seleccionar aleatoriamente el 80% del conjunto de datos para entrenar y el 20% restante para las pruebas

In [13]:
#----------------------------------------------------------
# Libreria sklearn
#----------------------------------------------------------
from sklearn.model_selection import train_test_split 

totalDatos=len(datos) # cantidad de datos
cTrain=int(totalDatos*0.8) # 80% para entrenar y 20% para probar
cTest=totalDatos-cTrain
print(totalDatos,cTrain,cTest)
train_data,test_data= sklearn.model_selection.train_test_split(datos, train_size=cTrain, test_size=cTest)


700 560 140


700 - Conjunto total de datos

560 - Corresponde al 80% del conjunto de entrenamiento 

140 - Corresponde al 20 % del conjunto de prueba

In [14]:
#----------------------------------------------------------
# Dimension del conjunto de entrenamiento
#----------------------------------------------------------
train_data.shape


(560, 11)

Los datos de entrenamiento son 560 y tiene 11 atributos 

In [15]:
#----------------------------------------------------------
# Muestra 5 datos de entrenamiento
#----------------------------------------------------------

train_data.head()

Unnamed: 0,sexo,edad,hipertension,enfermedades_cardiacas,casado,tipo_trabajo,tipo_residencia,nivel_glucosa_promedio,indice_masa_corporal,estado_tabaquismo,derrame_cerebral
248,Female,78.0,0,0,Yes,Private,Rural,78.81,19.6,Unknown,1
267,Female,44.0,0,0,Yes,Govt_job,Urban,57.33,24.6,smokes,0
628,Female,20.0,0,0,No,Govt_job,Rural,73.0,20.8,never smoked,0
222,Female,63.0,0,0,Yes,Govt_job,Rural,205.35,42.2,formerly smoked,1
579,Female,54.0,0,0,Yes,Private,Rural,118.51,40.6,never smoked,0


De los 560 datos de entrenamiento se muestra 5 datos aleatorios 

## 3. Utilizar una estrategia para normalizar los datos y llenar los datos faltantes

### Pipeline para los atributos categóricos

In [47]:
#----------------------------------------------------------
#Librerias sklearn
#----------------------------------------------------------
from sklearn.preprocessing import OneHotEncoder
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer

# 5 atributos categóricos
cat_attribs = ['sexo','casado','tipo_trabajo','tipo_residencia','estado_tabaquismo']

cat_pipeline = Pipeline([
        ("imputer", SimpleImputer(strategy="most_frequent")),
        ("cat_encoder", OneHotEncoder(sparse=False))
    ])

### Pipeline para los atributos númericos

In [48]:
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import MinMaxScaler

# 5 atributos numéricos
num_attribs = ['edad','hipertension','enfermedades_cardiacas','nivel_glucosa_promedio','indice_masa_corporal']

num_pipeline = Pipeline([
        ("imputer", SimpleImputer(strategy="median")),
        ("scaler", StandardScaler())

    ])

### Pipeline completo

In [49]:
#----------------------------------------------------------
#Libreria sklearn
#----------------------------------------------------------
from sklearn.compose import ColumnTransformer

full_pipeline = ColumnTransformer([
    ("num", num_pipeline, num_attribs),
    ("cat", cat_pipeline, cat_attribs),
])

In [51]:
#----------------------------------------------------------
# Se transforman los datos entrenados 
# Variables independientes
#----------------------------------------------------------
X_train = full_pipeline.fit_transform(train_data)
X_train.shape



(560, 20)

Los datos de entrenamiento son 560 y 20 por el OneHotEncoding (5 de los atributos numéricos + 15 de los atributoscategóricos)

In [53]:
#---------------------------------------------------------------
# Muestra los datos de entrenamiento después de la codificación
#---------------------------------------------------------------

X_train[0,:]

array([ 1.20401269, -0.42008403, -0.30268454, -0.73888594, -1.31972346,
        1.        ,  0.        ,  0.        ,  1.        ,  0.        ,
        0.        ,  1.        ,  0.        ,  0.        ,  1.        ,
        0.        ,  1.        ,  0.        ,  0.        ,  0.        ])

In [54]:
#----------------------------------------------------------
# Variable dependiente -> derrame_cerebral
#----------------------------------------------------------

y_train = train_data["derrame_cerebral"]
y_train

248    1
267    0
628    0
222    1
579    0
      ..
32     1
517    0
617    0
138    1
417    0
Name: derrame_cerebral, Length: 560, dtype: int64

In [67]:
#----------------------------------------------------------
# Se transforman los datos de prueba 
# Variables independientes
#--------------------------------------------------------
X_test = full_pipeline.transform(test_data) 
X_test

array([[ 0.7968947 ,  2.38047614,  3.30376961, ...,  0.        ,
         1.        ,  0.        ],
       [-0.15304729, -0.42008403, -0.30268454, ...,  0.        ,
         0.        ,  1.        ],
       [-0.96728327, -0.42008403, -0.30268454, ...,  0.        ,
         0.        ,  1.        ],
       ...,
       [ 0.7968947 ,  2.38047614, -0.30268454, ...,  0.        ,
         1.        ,  0.        ],
       [ 1.24924802, -0.42008403, -0.30268454, ...,  1.        ,
         0.        ,  0.        ],
       [ 0.29930604, -0.42008403, -0.30268454, ...,  1.        ,
         0.        ,  0.        ]])

In [68]:
#----------------------------------------------------------
# Variable dependiente -> derrame_cerebral
#----------------------------------------------------------
y_test = test_data["derrame_cerebral"]
y_test

143    1
349    0
308    0
572    0
135    1
      ..
551    0
468    0
132    1
198    1
47     1
Name: derrame_cerebral, Length: 140, dtype: int64

## 4. Construir 5 redes neuronales variando en la topología de la red la cantidad de capas ocultas y de neuronas por cada capa oculta. Puede también variar los hiperparámetros solver y la función de activación. En todas las pruebas debe usar un random_state=123. Incluya en el notebook una tabla a manera de resumen con el accuracy obtenido en cada caso y también las matrices de confusión

In [100]:
#----------------------------------------------------------
# Librerias
#----------------------------------------------------------
import pandas as pd
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score, confusion_matrix

# Se crea una lista para almacenar los resultados
resultados = []

# Define una lista de topologías a probar
topologias = [
    (10), # una capa oculta con 20 neuronas
    (10,10), # dos capas ocultas una con 20 y otra con 10 neuronas
    (20,), # una capa oculta con 30 neuronas
    (20, 20), # dos capas ocultas con 30 y otra con 20 neuronas 
    (30,), # una capa oculta con 40 neuronas
    ]

# Define una lista de funciones de activación a probar
func_activacion = ["relu", "logistic"] 

# Define una lista de solvers a probar
solvers = ["adam", "sgd"]

# Itera para cada topología
for topologia in topologias:
    # Itera para cada función de activación
    for activacion in func_activacion:
        # Itera para cada solver
        for solver in solvers:
            # Crea el modelo de red neuronal
            model = MLPClassifier(hidden_layer_sizes=topologia, activation=activacion, solver=solver, random_state=123)
            # Entrena el modelo
            model.fit(X_train, y_train)
            # Realiza las predicciones
            y_pred = model.predict(X_test)
            # Calcula el accuracy
            accuracy = round(accuracy_score(y_test, y_pred),4) # con 4 decimales
            # Calcula la matriz de confusión
            confusion = confusion_matrix(y_test, y_pred)
            # Almacena el resultado
            resultados.append({"Topología": topologia, "Función de activación": activacion, "Solver": solver, "Accuracy": accuracy, "Matriz de confusión": confusion})

# Imprime los resultados
#print(resultados)



In [94]:
#----------------------------------------------------------
#Libreria pandas
#----------------------------------------------------------
import pandas as pd

# Se imprime la tabla con los resultados
result = pd.DataFrame(resultados)
display(result)

Unnamed: 0,Topología,Función de activación,Solver,Accuracy,Matriz de confusión
0,"(10, 5)",relu,adam,0.7643,"[[74, 18], [15, 33]]"
1,"(10, 5)",relu,sgd,0.6857,"[[90, 2], [42, 6]]"
2,"(10, 5)",logistic,adam,0.7,"[[66, 26], [16, 32]]"
3,"(10, 5)",logistic,sgd,0.6571,"[[92, 0], [48, 0]]"
4,"(20, 10, 5)",relu,adam,0.7429,"[[71, 21], [15, 33]]"
5,"(20, 10, 5)",relu,sgd,0.7714,"[[76, 16], [16, 32]]"
6,"(20, 10, 5)",logistic,adam,0.7,"[[64, 28], [14, 34]]"
7,"(20, 10, 5)",logistic,sgd,0.6571,"[[92, 0], [48, 0]]"
8,"(30, 15)",relu,adam,0.7571,"[[69, 23], [11, 37]]"
9,"(30, 15)",relu,sgd,0.7929,"[[78, 14], [15, 33]]"


Con los resultados obtenidos se construyó la tabla anterior, en la cual se tiene la topología de la red, la función de activación, el hiperparámetro solver, el accuracy y la matriz de confusión.

## 5. Indique en el notebook usando una celda de tipo Markdown los hiperparámetros que por el momento le permiten obtener la red con mayor accuracy

In [101]:
# Encontrar la red neuronal con el mayor valor de Accuracy
max_accuracy = max(resultados, key=lambda x: x["Accuracy"])

# Imprime los hiperparámetros del mejor resultado
print("-------------------------------------------")
print("Mejores hiperparámetros:")
print("-------------------------------------------")
print("Topología:", max_accuracy["Topología"])
print("Función de activación:", max_accuracy["Función de activación"])
print("Solver:", max_accuracy["Solver"])
print("Accuracy:", max_accuracy["Accuracy"])
print("Matriz de confusión:", max_accuracy["Matriz de confusión"])

-------------------------------------------
Mejores hiperparámetros:
-------------------------------------------
Topología: (30,)
Función de activación: relu
Solver: adam
Accuracy: 0.7857
Matriz de confusión: [[73 19]
 [11 37]]


Se obtiene la red neuronal con el valor más alto en accuracy y se imprime los hiperparámetros.

## 6. Seleccione uno de los hiperparámetros disponibles en la documentación (https://scikitlearn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html) que sea diferente al solver, a la función de activación, y al random_state. Realice dos variaciones en el hiperparámetro seleccionado manteniendo los otros hiperparámetros del punto anterior. Indique el accuracy obtenido al modificar el hiperparámetro seleccionado y analice si la red mejora, empeora, o mantiene su exactitud.Incluya en el notebook dicho análisis

In [102]:
#-----------------------------------------------
# Librerias
#-----------------------------------------------
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score

# Se crea una lista para almacenar los resultados
resultados_p7 = []

# Define una lista de tasas de aprendizaje inicial para la prueba
learning_rate_inits = [0.01, 0.001]
activation = "identity" # función de activación ReLU
solver = "lbfgs" # solver Adam
# Itera para cada tasa de aprendizaje inicial
for learning_rate_init in learning_rate_inits:

    # Define la topología de la red
    hidden_layer_sizes = (10, 10) # dos capas ocultas con 10 neuronas cada una
    # Crea el modelo de red neuronal
    model = MLPClassifier(hidden_layer_sizes=hidden_layer_sizes, activation=activation, solver=solver, random_state=123, learning_rate_init=learning_rate_init)
    # Entrena el modelo
    model.fit(X_train, y_train) 
    # Realiza las predicciones
    y_pred = model.predict(X_test)
    # Calcula el accuracy
    accuracy = accuracy_score(y_test, y_pred)
    # Almacena el resultado
    resultados_p7.append({"learning_rate_init": learning_rate_init, "accuracy": accuracy})

# Imprime los resultados
print("---------------------------------")
print(resultados_p7)
print("---------------------------------")

---------------------------------
[{'learning_rate_init': 0.01, 'accuracy': 0.7928571428571428}, {'learning_rate_init': 0.001, 'accuracy': 0.7928571428571428}]
---------------------------------


In [103]:
#----------------------------------------------------------
#Libreria pandas
#----------------------------------------------------------
import pandas as pd

# Se imprime la tabla con los resultados
resultado_punto7 = pd.DataFrame(resultados_p7)
display(resultado_punto7)

Unnamed: 0,learning_rate_init,accuracy
0,0.01,0.792857
1,0.001,0.792857


In [104]:
#----------------------------------------------------------
# Comparación de los accuracy del punto 5 y punto 6
#----------------------------------------------------------

# Se imprime la red neuronal con el mayor valor de Accuracy del punto 5
print("Accuracy de la red neuronal del punto 5:", max_accuracy["Accuracy"])

# Encontrar la red neuronal con el mayor valor de Accuracy
max_accuracy_p7 = max(resultados_p7, key=lambda x: x["accuracy"])

# Se imprime la red neuronal con el mayor valor de Accuracy del punto 6
print("Accuracy de la red neuronal del punto 6:", max_accuracy_p7["accuracy"])
print("    ")

if max_accuracy["Accuracy"] > max_accuracy_p7["accuracy"]:
    print("La red neuronal empeoró la exactitud, por lo que la mejor red tiene un accuracy de", round(max_accuracy["Accuracy"],4),
          "que corresponde al punto 5.")
    print("-------------------------------------------")
    print("Mejores hiperparámetros:")
    print("-------------------------------------------")
    print("Topología:", max_accuracy["Topología"])
    print("Función de activación:", max_accuracy["Función de activación"])
    print("Solver:", max_accuracy["Solver"])
    print("Accuracy:", max_accuracy["Accuracy"])
    print("Matriz de confusión:", max_accuracy["Matriz de confusión"])
    
elif max_accuracy["Accuracy"] < max_accuracy_p7["accuracy"]:
    print("La red neuronal mejoró la exactitud, por lo que la mejor red tiene un accuracy de", round(max_accuracy_p7["accuracy"],4), 
          "que corresponde al punto 7.")
    print("-------------------------------------------")
    print("Mejores hiperparámetros:")
    print("-------------------------------------------")
    print("learning_rate_init:", max_accuracy_p7["learning_rate_init"])
    print("Función de activación:", activation)
    print("Solver:", solver)
else:
    print("La red neuronal mantuvo la exactitud, ya que los valores de accuracy dieron igual aunque se haya realizado variaciones en los hiperparámetros.")



Accuracy de la red neuronal del punto 5: 0.7857
Accuracy de la red neuronal del punto 6: 0.7928571428571428
    
La red neuronal mejoró la exactitud, por lo que la mejor red tiene un accuracy de 0.7929 que corresponde al punto 7.
-------------------------------------------
Mejores hiperparámetros:
-------------------------------------------
learning_rate_init: 0.01
Función de activación: identity
Solver: lbfgs
