<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#Ejemplo-12" data-toc-modified-id="Ejemplo-12-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>Ejemplo 12</a></span><ul class="toc-item"><li><span><a href="#Regresión-logistica" data-toc-modified-id="Regresión-logistica-1.1"><span class="toc-item-num">1.1&nbsp;&nbsp;</span>Regresión logistica</a></span></li><li><span><a href="#Estado-del-arte" data-toc-modified-id="Estado-del-arte-1.2"><span class="toc-item-num">1.2&nbsp;&nbsp;</span>Estado del arte</a></span><ul class="toc-item"><li><span><a href="#Funcion-logística" data-toc-modified-id="Funcion-logística-1.2.1"><span class="toc-item-num">1.2.1&nbsp;&nbsp;</span>Funcion logística</a></span></li><li><span><a href="#Caso-binario" data-toc-modified-id="Caso-binario-1.2.2"><span class="toc-item-num">1.2.2&nbsp;&nbsp;</span>Caso binario</a></span></li><li><span><a href="#Caso-multinomial" data-toc-modified-id="Caso-multinomial-1.2.3"><span class="toc-item-num">1.2.3&nbsp;&nbsp;</span>Caso multinomial</a></span></li></ul></li><li><span><a href="#Implementación" data-toc-modified-id="Implementación-1.3"><span class="toc-item-num">1.3&nbsp;&nbsp;</span>Implementación</a></span></li><li><span><a href="#Referencias" data-toc-modified-id="Referencias-1.4"><span class="toc-item-num">1.4&nbsp;&nbsp;</span>Referencias</a></span></li></ul></li></ul></div>

## Ejemplo 12

### Regresión logistica

### Estado del arte

La regresión logística se implementa en LogisticRegression. A pesar de su nombre, se implementa como un modelo lineal para la clasificación en lugar de la regresión en términos de la nomenclatura scikit-learn/ML. La regresión logística también se conoce en la literatura como regresión de logit, clasificación de entropía máxima (MaxEnt) o clasificador logarítmicolineal. En este modelo, las probabilidades que describen los posibles resultados de un solo ensayo se modelan utilizando una función logística.

#### Funcion logística

Una función logística o curva logística es una curva común en forma de S (curva sigmoida) con la ecuación
$$ f(x) = \frac{L}{1 + e^{-k(x-x_0)}}$$

Dónde

$$x_0, \text{el valor x del punto medio de la función}$$
$$L, \text{el supremo de los valores de la función}$$
$$k, \text{la tasa de crecimiento logístico o la pendiente de la curva}$$

![Sigmoid function](./Multimedia/sf.png)

Esta implementación puede adaptarse a la regresión logística binaria,  o multinomial con opcional,o regularización de Elastic-Net.

<div class="alert alert-block alert-success">
<b>Nota de Regularización</b> La regularización se aplica de forma predeterminada, lo que es común en el aprendizaje automático, pero no en las estadísticas. Otra ventaja de la regularización es que mejora la estabilidad numérica. Ninguna regularización equivale a establecer C en un valor muy alto.
</div>

<div class="alert alert-block alert-success">
<b>Tenga en cuenta la regresión logística como un caso especial de los modelos lineales generalizados (GLM)</b> 
    La regresión logística es un caso especial de modelos lineales generalizados con una distribución condicional binomial / Bernoulli y un enlace Logit. La producción numérica de la regresión logística, que es la probabilidad predicha, se puede utilizar como clasificador aplicándose un umbral (por defecto, 0,5). Así es como se implementa en scikit-learn, por lo que espera un objetivo categórico, haciendo de la Regresión Logística un clasificador.
</div>

#### Caso binario

Para facilitar la notación, asumimos que el objetivo $y_i$ toma valores en el conjunto ${0,1}$ para el punto de datos $i$. Una vez instalado, elpredict_proba método de LogisticRegression predice la probabilidad de la clase positiva $P(y_i = 1|X_i)$.

$$p(X_i)=expit(X_iw+w_0) = \frac{1}{1+e^{-X_i w - w_0}}$$

Como problema de optimización, regresión logística de clase binaria con término de regularizaciónminimiza la siguiente función de coste:

$$min_w C \sum_{i=1}^{n}(-y_i \log (p(X_i))-(1-y_i)\log(1-p(X_i)))+r(w)$$

#### Caso multinomial

El caso binario se puede extender a $K$ clases que conducen a la regresión logística multinomial, véase también el modelo logarítmicolineal.

<div class="alert alert-block alert-success">
<b>Nota</b> 
    Es posible parametrizar un $K$-modelo de clasificación de clase usando solo $K-1$ vectores de peso, dejando una probabilidad de clase completamente determinada por las probabilidades de la otra clase aprovechando el hecho de que todas las probabilidades de clase deben sumar a una. Elegimos deliberadamente sobreparaparatizar el modelo usando $K$ vectores de peso para facilitar la implementación y para preservar el sesgo inductivo simétrico con respecto al orden de las clases. Este efecto se vuelve especialmente importante cuando se utiliza la regularización. La elección de la sobreparaparatización puede ser perjudicial para los modelos no penalizados, ya que entonces la solución puede no ser única
</div>

$y_i \in 1, ..., K$ ser la variable objetivo codificada etiquetada (ordinal) para la observación. En lugar de un solo vector de coeficiente, ahora tenemos una matriz de coeficientes $W$ donde cada vector de fila $W_k$ corresponde a la clase $k$. Nuestro objetivo es predecir las probabilidades de clase $P(y_i = k|X_i)$ vía predict_probacomo:

$$p_k(X_i)= \frac{e^{X_i W_k +W_{0,k}}}{\sum_{l=0}^{k-1}e^{X_iW_i+W_{0,l}}}$$

El objetivo de la optimización se convierte en:

$$min_w -C \sum_{i=1}^{n}\sum_{k=0}^{k-1}\log (p_k(X_i))+r(W)$$

### Implementación

In [1]:
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

In [2]:
iris = datasets.load_iris()
X = iris.data
y = (iris.target == 2).astype(int)  # 1 si Virginica, 0 si no

In [3]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [4]:
scaler = StandardScaler()
scaler.fit(X_train)

In [5]:
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

In [6]:
log_reg = LogisticRegression(random_state=42)
log_reg.fit(X_train, y_train)

In [7]:
y_pred = log_reg.predict(X_test)

In [8]:
accuracy = accuracy_score(y_test, y_pred)

In [9]:
print(f'Accuracy: {accuracy * 100:.2f}%')

Accuracy: 100.00%


In [10]:
def predecir_tipo_pétalo(modelo, nueva_observación):
    return iris.target_names[log_reg.predict([nueva_observación])][0]

In [11]:
nueva_observacion = np.array([5.1, 3.5, 1.4, 0.2])  
tipo_petalo_predicho = predecir_tipo_pétalo(log_reg, nueva_observacion)
print('Tipo de pétalo predicho para la nueva observación:', tipo_petalo_predicho)


Tipo de pétalo predicho para la nueva observación: setosa


### Referencias

[1] J. Grus, Data Science From Scratch: First Principles With Python. O'Reilly Media, Inc., 2019.

[2] Desarrolladores de scikit-learn. “1.1. linear models”. scikit-learn. Accedido el 4 de octubre de 2023. [En línea]. Disponible: https://scikit-learn.org/stable/modules/linear_model.html