# Regresión logística aplicada a iris

**Lectura del corpus y partición:**

In [None]:
import numpy as np; from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
iris = load_iris(); X = iris.data.astype(np.float16); y = iris.target.astype(np.uint)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, shuffle=True, random_state=23)

**LogisticRegression:** $\;$ implementación de regresión logística en sklearn

In [None]:
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
clf = LogisticRegression(random_state=23).fit(X_train, y_train)
y_test_pred = clf.predict(X_test)
err_train = 1 - accuracy_score(y_train, clf.predict(X_train))
err_test = 1 - accuracy_score(y_test, clf.predict(X_test))
print(f"Error de train: {err_train:.2%}  Error de test: {err_test:.2%}")

**Warnings:** $\;$ sklearn es un poco "insistente" con los warnings; ignoraremos los avisos sobre convergencia

In [None]:
import warnings; from sklearn.exceptions import ConvergenceWarning
warnings.filterwarnings("ignore", category=ConvergenceWarning, module="sklearn")

**Solvers:** $\;$ el parámetro `solver` de LogisticRegression permite elegir entre diferentes solvers (algoritmos de optimitzación)

In [None]:
for solver in ['lbfgs', 'liblinear', 'newton-cg', 'newton-cholesky', 'sag', 'saga']:
    clf = LogisticRegression(random_state=23, solver=solver, max_iter=10000).fit(X_train, y_train)
    err_train = 1 - accuracy_score(y_train, clf.predict(X_train))
    err_test = 1 - accuracy_score(y_test, clf.predict(X_test))
    print(f"Error de train/test después de entrenar con el solver {solver!s}: {err_train:.2%}/{err_test:.2%}")

**Tolerancia:** $\;$ el parámetro `tol` establece un umbral de tolerancia para acabar el entrenamiento (1e4 por defecto)

In [None]:
for tol in (1e-4, 1e-2, 1, 1e2, 1e4):
    clf = LogisticRegression(tol=tol, random_state=23, max_iter=10000).fit(X_train, y_train)
    err_train = 1 - accuracy_score(y_train, clf.predict(X_train))
    err_test = 1 - accuracy_score(y_test, clf.predict(X_test))
    print(f"Error de train/test con tolerancia {tol}: {err_train:.2%}/{err_test:.2%}")

**Regularización:** $\;$ el parámetro `C` (positivo, $1.0$ por defecto) des-regulariza el criterio de entrenamiento
* **Posibilidad de subajuste:** $\;$ con un valor próximo a cero (máxima regularización)
* **Posibilidad de sobreajuste:** $\;$ con un valor positivo muy alto (mínima regularización)

In [None]:
for C in (1e-2, 1e-1, 1, 1e1, 1e2):
    clf = LogisticRegression(C=C, random_state=23, max_iter=10000).fit(X_train, y_train)
    err_train = 1 - accuracy_score(y_train, clf.predict(X_train))
    err_test = 1 - accuracy_score(y_test, clf.predict(X_test))
    print(f"Error de train/test con C {C:g}: {err_train:.2%}/{err_test:.2%}")

**Early stopping:** $\;$ ahorramos cálculo y evitamos sobre-entrenamiento ("regularizamos") acabando pronto (en pocas iteraciones)

In [None]:
for max_iter in (10, 20, 50, 100):
    clf = LogisticRegression(random_state=23, max_iter=max_iter).fit(X_train, y_train)
    err_train = 1 - accuracy_score(y_train, clf.predict(X_train))
    err_test = 1 - accuracy_score(y_test, clf.predict(X_test))
    print(f"Error de train/test con max_iter {max_iter}: {err_train:.2%}/{err_test:.2%}")

**Ejercicio para hacer en clase**
---

Escribe el código python necesario, usando random_state=23, para mostrar los resultados de error de train (err_train) y test (err_test) del dataset de **iris** para combinaciones de diferentes valores de:

1. `max_iter` (probar valores 10, 20, 50, 100, 200, 500, 800, 1000)
2. `solver` (utilizar sag, saga, lbfgs y netwon-cg que son los solvers para problemas multiclase
3. `C` (regularización: 0.01, 0.1, 1.0 , 10.0, 100)
4. `tol` (tolerancia: probar valores 1e-4, 1e-2, 1.0, 1e2, 1e4)

Utliza la cabecera:

`print('#   Iter     solver        C         tol        Etr        Ete');`
---

y la siguiente instrucción para mostrar los resultados:

`print('%8d %10s %8.3f %11.4f %9.2f%% %9.2f%%' %(max_iter, solver, C, tol, err_train*100, err_test*100))`
---

Identifica las combinaciones que devuelven el menor error de entrenamiento y de test y determina la combinación que escogerías entre todas ellas analizando los valores del resto de parámetros de las combinaciones. Justifica la respuesta.