## Regresión logística

La regresión logística es un conocido clasificador binario. En una regresión logística, un modelo linea (por ejemplo $\beta_{0}+\beta_{1}x$) es incluido en una función llamada sigmoide  $\frac{1}{1+e^{-z}}$ tal que:

$$P(y_i=1 \mid X)=\frac{1}{1+e^{-(\beta_{0}+\beta_{1}x)}}$$

donde $P(y_i=1 \mid X)$ es la probabilidad de la  $i$ ésima valor objetivo, $y_i$, siendo la clase 1, $X$ los datos de entrenamiento, $\beta_0$ y $\beta_1$ son los parámetros a aprender y  $e$ es el número de Euler.

In [1]:
# Librerias
from sklearn.linear_model import LogisticRegression
from sklearn import datasets
from sklearn.preprocessing import StandardScaler

In [2]:
# Cargamos datos con solo dos clases
iris = datasets.load_iris()
X = iris.data[:100,:]
y = iris.target[:100]

In [3]:
# caracteristicas estandarizadas
escalador = StandardScaler()
X_std = escalador.fit_transform(X)

In [4]:
# Creamos el objeto regresion logistica
clf = LogisticRegression(random_state=0)

In [5]:
# Entrenamos el modelo
modelo_rl = clf.fit(X_std, y)

In [6]:
# Creamos nuevas observaciones
nuevas_observaciones = [[.5, .5, .5, .5]]

In [7]:
# Prediccion de clases 
modelo_rl.predict(nuevas_observaciones)

array([1])

In [8]:
# Probabilidades predichas
modelo_rl.predict_proba(nuevas_observaciones)

array([[0.18823041, 0.81176959]])