## Redes neuronales

Para realizar una comparación empezamos utilizando los árboles de decisión

In [3]:
from sklearn.datasets import load_breast_cancer  
from sklearn.model_selection import train_test_split, GridSearchCV  
from sklearn import tree  
import time  
  
dataset = load_breast_cancer() # Carga del dataset Breast cancer  
X, y = dataset.data, dataset.target;  
X_entrenamiento, X_test, y_entrenamiento, y_test =  train_test_split(X,y, test_size=0.4, random_state=13)  
# Definición de los rangos de los parámetros  
parametros_a_ajustar = [{'max_depth': [4,5,6],   
                         'min_samples_split': range(2, 51)}]  
  
# Búsqueda en rejilla con validación cruzada 
# sobre la muestra de entrenamiento  
comienzo = time.process_time()  
arbol = GridSearchCV(tree.DecisionTreeClassifier(),
parametros_a_ajustar,cv=5)  
arbol.fit(X_entrenamiento, y_entrenamiento)  
print("Duración del proceso:",
time.process_time()-comienzo,"segundos")  
        
# Salida de resultados de la búsqueda  
print("Mejor configuración paramétrica:",arbol.best_params_)  
print("Tasa de acierto en validación de la mejor configuración:",
arbol.best_score_)  
print("Estimación del rendimiento real:", arbol.score(X_test, y_test))  


Duración del proceso: 1.703125 segundos
Mejor configuración paramétrica: {'max_depth': 4, 'min_samples_split': 49}
Tasa de acierto en validación de la mejor configuración: 0.9208866155157714
Estimación del rendimiento real: 0.8903508771929824


Lo mismo, pero con el perceptrón multicapa muy simple, con una única capa oculta con solo una neurona. 

El módulo de *scikit-learn* para redes neuronales es `neural_network`, del que importaremos la función `MLPClassifier`, la versión para clasificación del perceptrón multicapa (Multi-Layer Perceptron). 


En el código que sigue, para especificar el número de capas y de neuronas por capa se utiliza el parámetro hidden_layer_sizes, de modo que por ejemplo hidden_layer_sizes = (5,3) requerirá el ajuste de una red con dos capas ocultas, la primera con 5 neuronas y la segunda con 3. La red de una única neurona que se entrenará se especifica entonces con hidden_layer_sizes = (1,). De igual modo, para requerir el uso de funciones de activación logísticas, se ha de especificar activation = 'logistic'. Las expresiones solver = 'sgd' y batch_size = 1 requieren respectivamente el uso del algoritmo habitual de descenso del gradiente para el entrenamiento por retropropagación, y que la actualización de los pesos se realice tras procesar cada ejemplo. Además, se especifica que el entrenamiento lleve a cabo un máximo de max_iter = 50 epochs o vueltas completas al conjunto de entrenamiento. 

In [6]:
from sklearn.neural_network import MLPClassifier 
from sklearn.preprocessing import MinMaxScaler

# Normalización de los inputs  
scaler = MinMaxScaler()  
scaler.fit(X)  
X = scaler.transform(X)  

# Conjuntos de entrenamiento y test normalizados  
X_entrenamiento, X_test, y_entrenamiento, y_test = train_test_split(X,y, test_size=0.4, random_state=13)

# Entrenamiento de la red 
comienzo=time.process_time()  
red = MLPClassifier(hidden_layer_sizes=(1,), activation='logistic',
 	solver='sgd',
 					batch_size=1, max_iter=50, random_state=0);  
red.fit(X_entrenamiento,y_entrenamiento)  
print("Duración del proceso:",time.process_time()-comienzo)  
print("Estimación del rendimiento real:", red.score(X_test, y_test)) 


Duración del proceso: 2.8125
Estimación del rendimiento real: 0.9605263157894737


