# Redes neuronales artificiales utilizando Scikit-Learn

La clase MLPClassifier implementa un algoritmo de perceptrón multicapa (MLP) que se entrena utilizando Retropropagación (Backpropagation).

Los parámetros más interesantes a la hora de definir una red neuronal utilizando  [MLPClassifier](https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html) son:

* **Para la estructura de la red:**

    * hidden_layer_sizes: con este parámetro definimos la numero de capas y el número de nodos que queremos. Cada elemento en la tupla representa el numero de nodos en la iesima posición, donde el indice corresponde al de su posición en la tupla. Por ejemplo, el parámetro (5,2) define dos capas, la primera tendrá 5 nodos y la segunda 2 nodos. 

* **Funciones de activación:**
  * activation: define la función de activación para las capas ocultas. Los posibles valores son: {‘identity’ sin transformación (lineal), ‘logistic’ (función sigmoide), ‘tanh’ (tangente hiperbólica), ‘relu’ (rectified Linear Unit)}, default=’relu’

* **Algoritmo de optimización:**

  * solver: indica el algoritmo de optimización. Los posibles valores son: {‘lbfgs’, ‘sgd’, ‘adam’}, default=’adam’

* **Tasa de aprendizaje:**
  
  * learning_rate: Cómo se ajustan los pesos durante el entrenamiento.
    * 'constant': Fijo.
    * 'invscaling': Decrece con las iteraciones.
    * 'adaptive': Se ajusta según la validación.

In [34]:
from sklearn.neural_network import MLPClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
import numpy as np

X, y = make_classification(n_samples=400, random_state=42, n_classes=2) #genero el dataset con 400 muestras y 2 clases
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y,
                                                    random_state=1)


## Generación de redes neuronales para problemas de clasificación

### Definición de la estructura

In [14]:
clf = MLPClassifier(hidden_layer_sizes=(150,100,50),
                        activation = 'relu',
                        solver = 'adam',
                        learning_rate='adaptive')

### Entrenamiento

Posteriormente se puede entrenar el modelo utilizando la función `fit(x,y)` donde `x` corresponde a los datos de entrada e `y` corresponde al target value.  

In [15]:
clf.fit(X_train, y_train)

### Análisis de la red neuronal

Una vez entrenado el modelo podemos acceder a información por medio de diferentes atributos:

In [19]:
#posibles clases a las que puede pertenecer
print(clf.classes_)

#valor de la función de perdida
print(clf.loss_)

#lista con los coeficientes de los pesos de las capas
print(clf.coefs_)

#numero de capas
print(clf.n_layers_)

#numero de outputs
print(clf.n_outputs_)

#nombre de la función de activación de la última capa
print(clf.out_activation_)

[0 1]
0.001314218841592306
[array([[ 0.0582447 ,  0.05026171,  0.0859854 , ..., -0.07727536,
        -0.02710259, -0.07718382],
       [-0.09241211,  0.02688664, -0.05187178, ...,  0.04316804,
         0.07768852, -0.11101593],
       [ 0.1143678 , -0.07367388,  0.10816706, ..., -0.07867884,
         0.01295381,  0.18977639],
       ...,
       [ 0.12763847,  0.17215396,  0.1523791 , ...,  0.04050622,
         0.1898287 , -0.02534187],
       [-0.02899205,  0.05921173, -0.01601822, ..., -0.13166828,
         0.15584755,  0.02750063],
       [-0.21196018,  0.07444649, -0.04007293, ..., -0.10194837,
         0.12602327,  0.206509  ]]), array([[-0.08913741,  0.16813956, -0.03133981, ..., -0.12589116,
         0.07970647, -0.03291654],
       [-0.07342179,  0.08982486, -0.00748123, ...,  0.03703566,
         0.04034721,  0.09205264],
       [ 0.05435174,  0.13008776, -0.02489583, ...,  0.14996452,
        -0.05394787, -0.12487916],
       ...,
       [-0.03845712,  0.08773875,  0.11173468,

### Predicción

Después del ajuste (entrenamiento), el modelo puede predecir las etiquetas para nuevas muestras de diferentes formas. 

La primera forma es por medio del método `predict_proba`. El método `predict_proba` se utiliza para obtener las probabilidades de pertenencia a cada clase para las muestras proporcionadas. 

Al ejecutar `clf.predict_proba(X_test[:1])`, el modelo devuelve un array de probabilidades. 
Cada elemento del array representa la probabilidad de que la muestra pertenezca a una de las clases posibles. 
Por ejemplo, si el modelo es un clasificador binario, el array tendrá dos valores: 
la probabilidad de que la muestra pertenezca a la clase 0 y la probabilidad de que pertenezca a la clase 1.

In [4]:
clf.predict_proba(X_test[:2])

array([[2.55943126e-04, 9.99744057e-01],
       [9.99936736e-01, 6.32639783e-05]])

Sin embargo, la función `predict` devolverá la clase sobre la que tiene más probabilidad de pertenecer. 

In [5]:
print(clf.predict(X_test[:2]))

[1 0]


### Ejemplo completo dataset iris

In [23]:
from sklearn.neural_network import MLPClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Cargar datos
data = load_iris()
X, y = data.data, data.target

# Dividir datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear y entrenar el modelo
mlp = MLPClassifier(hidden_layer_sizes=(100,), activation='relu', solver='adam', max_iter=500, random_state=42)
mlp.fit(X_train, y_train)

# Predicciones
y_pred = mlp.predict(X_test)

# Evaluación
accuracy = accuracy_score(y_test, y_pred)
print(f"Precisión: {accuracy:.2f}")


Precisión: 1.00




## Generación de redes neuronales para problemas de regresión

Es posible entrenar un modelo de regresión utilizando la clase MLPRegressor

In [24]:
from sklearn.neural_network import MLPRegressor
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# Crear un conjunto de datos de regresión
X, y = make_regression(n_samples=200, n_features=5, noise=0.1, random_state=42)

# Dividir datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear y entrenar el modelo
mlp = MLPRegressor(hidden_layer_sizes=(50, 30), 
                   activation='relu', 
                   solver='adam', 
                   max_iter=500, 
                   random_state=42)
mlp.fit(X_train, y_train)

# Predicciones
y_pred = mlp.predict(X_test)

# Evaluación
mse = mean_squared_error(y_test, y_pred)
print(f"Error cuadrático medio: {mse:.2f}")


Error cuadrático medio: 55.86




## Inclusión del modelo dentro de un pipeline

In [30]:
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.neural_network import MLPClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.model_selection import GridSearchCV

# Cargar datos
data = load_iris()
X, y = data.data, data.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Crear el pipeline
pipeline = Pipeline([
    ('scaler', StandardScaler()),  # Escalador para normalizar los datos
    ('mlp', MLPClassifier(max_iter=10000, random_state=42))  # Modelo
])

# Entrenar el modelo con el pipeline
pipeline.fit(X_train, y_train)

# Evaluación
accuracy = pipeline.score(X_test, y_test)
print(f"Precisión: {accuracy:.2f}")


Precisión: 1.00


También se podría hacer para un modelo de regresión

In [29]:
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.neural_network import MLPRegressor
from sklearn.datasets import make_regression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# Crear un conjunto de datos de regresión
X, y = make_regression(n_samples=200, n_features=5, noise=0.1, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Crear el pipeline
pipeline = Pipeline([
    ('scaler', StandardScaler()),  # Escalador
    ('mlp', MLPRegressor(max_iter=10000, random_state=42))  # Modelo
])

# Entrenar el modelo
pipeline.fit(X_train, y_train)

# Predicción y evaluación
y_pred = pipeline.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
print(f"Error cuadrático medio: {mse:.2f}")


Error cuadrático medio: 8.16


## Evaluar el modelo con cross validation

In [33]:
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.neural_network import MLPClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import cross_val_score
from sklearn.model_selection import StratifiedKFold

# Cargar datos
data = load_iris()
X, y = data.data, data.target

# Crear el pipeline
pipeline = Pipeline([
    ('scaler', StandardScaler()),  # Escalador
    ('mlp', MLPClassifier(max_iter=10000, random_state=42))  # Modelo
])

# Aplicar validación cruzada
cv = StratifiedKFold(n_splits=5, random_state=42, shuffle=True)
scores = cross_val_score(pipeline, X, y, cv=cv, scoring='accuracy')

# Resultados
print("Precisión por fold:", scores)
print(f"Precisión media: {scores.mean():.2f}")
print(f"Desviación estándar: {scores.std():.2f}")


Precisión por fold: [1.         0.96666667 0.86666667 1.         0.9       ]
Precisión media: 0.95
Desviación estándar: 0.05
