# **Redes Neuronales**

Las redes neuronales son modelos computacionales inspirados en el funcionamiento del cerebro humano, diseñados para aprender a partir de datos y realizar tareas complejas como la clasificación, la regresión y el reconocimiento de patrones.

Una red neuronal, también conocida como red neuronal artificial (ANN), consiste en un conjunto de nodos interconectados, llamados neuronas, organizados en capas. Estas capas incluyen:



*   **Capa de entrada:**  Recibe los datos iniciales.
*   **Capas ocultas:** Procesan la información mediante conexiones entre nodos.
*   **Capa de salida:** Produce el resultado final de la red. Cada neurona realiza cálculos sobre las entradas que recibe y transmite los resultados a otras neuronas. Este proceso permite que la red aprenda y se adapte a diferentes tipos de entradas, mejorando su precisión con el tiempo



## Liberías para redes neuronales
# TensorFlow
 es una de las bibliotecas más populares para el desarrollo de modelos de aprendizaje automático y redes neuronales.

Se utiliza para construir, entrenar y desplegar modelos de aprendizaje profundo. Incluye herramientas para crear redes neuronales convolucionales (CNN), redes neuronales recurrentes (RNN), y más.

# Keras
Keras es una API de alto nivel para construir y entrenar modelos de aprendizaje profundo que se ejecuta sobre TensorFlow. Es conocida por su simplicidad y facilidad de uso.

Permite a los desarrolladores crear rápidamente modelos de redes neuronales con menos líneas de código. Ideal para prototipos rápidos y experimentación.

# Scikit-learn

Aunque Scikit-learn no está diseñado específicamente para redes neuronales profundas, proporciona implementaciones básicas de perceptrones multicapa (MLP) que son útiles para tareas más simples.

Es ideal para modelos menos complejos y tareas de preprocesamiento de datos.

In [None]:
#Ejecute las librerías
import numpy as np
import pandas as pd
import tensorflow as tf
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

In [1]:
#Abre una ventana de exploración para carga de documentos .sav
#from google.colab import files
# Subir archivos .sav
uploaded = files.upload()

KeyboardInterrupt: 

In [None]:
!pip install pyreadstat
import pyreadstat

# Cargar archivos .sav
a_2018, meta1 = pyreadstat.read_sav("2018.sav")
a_2019, meta2 = pyreadstat.read_sav("2019.sav")
a_2020, meta3 = pyreadstat.read_sav("2020.sav")
a_2021, meta4 = pyreadstat.read_sav("2021.sav")
a_2022, meta4 = pyreadstat.read_sav("2022.sav")

# Visualizar los primeros registros
print(a_2018.head())

      AÑO   MES  DIASESTANCIA  SEXO  PPERTENENCIA  EDAD  PERIODOEDA  \
0  2018.0   4.0           3.0   1.0           4.0  39.0         3.0   
1  2018.0  11.0           5.0   1.0           4.0  22.0         3.0   
2  2018.0   7.0           3.0   1.0           4.0  22.0         3.0   
3  2018.0   8.0           3.0   2.0           9.0  43.0         3.0   
4  2018.0   8.0           2.0   2.0           4.0  34.0         3.0   

   DEPTORESIDEN MUNIRESIDEN CAUFIN  CONDIEGRES  TRATARECIB  
0          23.0        2300   A010         1.0         1.0  
1          23.0        2300   A010         1.0         1.0  
2          20.0        2001   A010         1.0         1.0  
3          19.0        1901   A010         1.0         1.0  
4          18.0        1804   A010         1.0         1.0  


In [None]:
# Concatenar filas
d_total = pd.concat([a_2018,a_2019,a_2020,a_2021, a_2022], ignore_index=True)

# Verificar resultado
print(d_total.head())


      AÑO   MES  DIASESTANCIA  SEXO  PPERTENENCIA  EDAD  PERIODOEDA  \
0  2018.0   4.0           3.0   1.0           4.0  39.0         3.0   
1  2018.0  11.0           5.0   1.0           4.0  22.0         3.0   
2  2018.0   7.0           3.0   1.0           4.0  22.0         3.0   
3  2018.0   8.0           3.0   2.0           9.0  43.0         3.0   
4  2018.0   8.0           2.0   2.0           4.0  34.0         3.0   

   DEPTORESIDEN MUNIRESIDEN CAUFIN  CONDIEGRES  TRATARECIB  
0          23.0        2300   A010         1.0         1.0  
1          23.0        2300   A010         1.0         1.0  
2          20.0        2001   A010         1.0         1.0  
3          19.0        1901   A010         1.0         1.0  
4          18.0        1804   A010         1.0         1.0  


In [None]:
#Convirtiendo CAUFIN a factor
# Convertir con One-Hot Encoding
#dt_one_hot = pd.get_dummies(d_total, columns=['CAUFIN'])
d_total['Cat_caufin'] = d_total['CAUFIN'].astype('category')

# Ver el DataFrame con columnas One-Hot
print(d_total)

            AÑO   MES  DIASESTANCIA  SEXO  PPERTENENCIA  EDAD  PERIODOEDA  \
0        2018.0   4.0           3.0   1.0           4.0  39.0         3.0   
1        2018.0  11.0           5.0   1.0           4.0  22.0         3.0   
2        2018.0   7.0           3.0   1.0           4.0  22.0         3.0   
3        2018.0   8.0           3.0   2.0           9.0  43.0         3.0   
4        2018.0   8.0           2.0   2.0           4.0  34.0         3.0   
...         ...   ...           ...   ...           ...   ...         ...   
1208567  2022.0   1.0        9999.0   1.0           4.0  82.0         3.0   
1208568  2022.0   3.0        9999.0   1.0           9.0  84.0         3.0   
1208569  2022.0   1.0        9999.0   2.0           4.0  86.0         3.0   
1208570  2022.0  10.0        9999.0   2.0           4.0  87.0         3.0   
1208571  2022.0   1.0        9999.0   1.0           4.0  90.0         3.0   

         DEPTORESIDEN MUNIRESIDEN CAUFIN  CONDIEGRES  TRATARECIB Cat_caufin

In [None]:
#Ver la columna CAUFIN
print(d_total['CAUFIN'])

0          A010
1          A010
2          A010
3          A010
4          A010
           ... 
1208567    Z988
1208568    Z988
1208569    Z988
1208570    Z988
1208571    Z988
Name: CAUFIN, Length: 1208572, dtype: object


In [None]:
import pandas as pd
# Ver el número de filas
print("Número de filas:", len(d_total))

# Ver el número de columnas
print("Número de columnas:", len(d_total.columns))

# Método alternativo que muestra ambos a la vez
print("Forma del dataset (filas, columnas):", d_total.shape)

Número de filas: 1208572
Número de columnas: 13
Forma del dataset (filas, columnas): (1208572, 13)


In [None]:
#Aleatoriedad
d_total = d_total.sample(frac = 1, random_state = 42).reset_index(drop=True)

In [None]:
#Selección de la data
X = d_total[['SEXO','DIASESTANCIA','DEPTORESIDEN']]
y = d_total['Cat_caufin']

In [None]:
#Datos de entrenamiento
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder

X_train, X_test, y_train, y_test  = train_test_split(X, y, test_size = 0.2, random_state = 42)

X_train = X_train.replace(' ', np.nan).dropna().astype('float32')
# Inicializando LabelEncoder
label_encoder = LabelEncoder()
# Fit and transform y_train
#Fit on all unique values to avoid unseen labels during transform
all_unique_labels = pd.concat([y_train[X_train.index], y_test[X_test.index]]).unique()
label_encoder.fit(all_unique_labels)
y_train = label_encoder.transform(y_train[X_train.index]).astype('float32')

X_test = X_test.replace(' ', np.nan).dropna().astype('float32')
# Transform y_test using the same encoder
y_test = label_encoder.transform(y_test[X_test.index]).astype('float32')

In [None]:
#Densidad de las capas, relu: función de activación de la capa (cambia valores negativos a positivos), introduce no linealidades
#sigmoid salida que representa la probabilidad de pertenencia a una de las clases
model = Sequential()
model.add(Dense(3, input_dim = 3, activation = 'relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [None]:
model.compile(loss ='binary_crossentropy', optimizer ='adam', metrics =['accuracy'])

In [None]:
#Entrenamiento
model.fit(X_train, y_train, epochs = 50, batch_size = 200, validation_data=(X_test, y_test))


Epoch 1/50
[1m4835/4835[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 2ms/step - accuracy: 9.2783e-07 - loss: -13305356233973170176.0000 - val_accuracy: 4.1371e-06 - val_loss: -14117100379992752128.0000
Epoch 2/50
[1m4835/4835[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m23s[0m 3ms/step - accuracy: 4.4015e-06 - loss: -14240004889257181184.0000 - val_accuracy: 4.1371e-06 - val_loss: -15207310139397767168.0000
Epoch 3/50
[1m4835/4835[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m12s[0m 3ms/step - accuracy: 8.2034e-07 - loss: -15425521416069447680.0000 - val_accuracy: 4.1371e-06 - val_loss: -16361763263702106112.0000
Epoch 4/50
[1m4835/4835[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m20s[0m 2ms/step - accuracy: 8.1562e-07 - loss: -16640563128622383104.0000 - val_accuracy: 4.1371e-06 - val_loss: -17577326144766607360.0000
Epoch 5/50
[1m4835/4835[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m13s[0m 3ms/step - accuracy: 2.6260e-06 - loss: -17882691310125580288.0000 -

<keras.src.callbacks.history.History at 0x7ecae5d46290>

Probar el porcentaje de asertividad del modelo

In [None]:
loss, acc = model.evaluate(X_test, y_test)
print(acc*100)

[1m7554/7554[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 1ms/step - accuracy: 2.5849e-06 - loss: -13006228598078570496.0000
0.00041371035877091344
