## Regresión logística para datos grandes

`LogisticRegression` de scikit-learn ofrece una serie de técnicas para el entrenamiento de una regresión logística, denominadas `solvers`. La mayoría de las veces scikit-learn seleccionará automáticamente el mejor `solvers` o nos advertirá que no puede hacer algo con ese solver. Sin embargo, hay un caso particular que debemos tener en cuenta.

El algorimo de descenso de gradiente estocástico promedio nos permite entrenar un modelo mucho más rápido que otros solvers cuando nuestros datos son muy grandes. Sin embargo, también es muy sensible al escalado de características.

Podemos configurar nuestro algoritmo de aprendizaja para usar este solucionador configurando `solver = sag`. 

In [1]:
# Librerias
from sklearn.linear_model import LogisticRegression
from sklearn import datasets
from sklearn.preprocessing import StandardScaler


In [2]:
# Cargando datos
iris = datasets.load_iris()
X = iris.data
y = iris.target

In [3]:
# caracteristicas estandarizadas
escalador = StandardScaler()
X_std = escalador.fit_transform(X)

In [4]:
# Creamos el objeto regresion logistica con el solver SAG
clf = LogisticRegression(random_state=0, solver='sag')

In [5]:
# Entrenamos el modelo
modelo_rl = clf.fit(X_std, y)