<img style="float: left;;" src='Figures/alinco.png' /></a>

# <center> <font color= #000047> Módulo 2: Aplicación de PSO

## Clasificación usando regresión logística optimizada por un pso.

La regresión logística es un algoritmo de aprendizaje automático que se utiliza para hacer predicciones para encontrar el valor de una variable dependiente, como la de predecir si un tumor es maligno o benigno, la clasificación del correo electrónico (spam o no spam) o la admisión a una universidad (admitido o no admitido), este algoritmo va aprendiendo de variables independientes (varias características relevantes para el problema).

Por ejemplo, para clasificar un correo electrónico, el algoritmo utilizará las palabras del correo electrónico como características y, en función de eso, hará una predicción de si el correo electrónico es spam o no.

### Codificando Regresión Logística

Una regresión Linea puede representarse como:

$$\hat{f}(x) = \beta^T X$$

Aplicando la función sigmoide a la salida de la regresión logística:

$$\hat{f}(x) = \sigma(\beta^T X)$$

Donde la función sigmoide está definida como:

$$\sigma(t) = \frac{1}{1+e^{-t}}$$

Entonces el modelo de regresión logística nos queda:

$$\hat{f}(x) = \frac{1}{1+e^{-\beta^T X}}$$


Si la suma ponderada de las entradas es mayor que cero, la clase predicha es 1 y viceversa. Entonces, el límite de decisión que separa ambas clases se puede encontrar al establecer la suma ponderada de las entradas en 0.

$$
\hat{f}(\textbf{x}) = \begin{cases}  \textrm{>0.5, si  }  \beta^T X \geq 0 \\ \\  \textrm{<0.5, si  } \beta^T X \leq 0\\ \end{cases}
$$

#### Función de costo

Al igual que la regresión lineal, se define una función de costo para nuestro modelo y el objetivo será minimizar el costo.

$$
cost = \begin{cases}  -\log{\hat{f}(x)}, \textrm{si  }  y=1 \\ \\  -\log{(1 - \hat{f}(x)}), \textrm{si  }  y=0 \\ \end{cases}
$$

#### Intuición de la función de costo

Si la clase de los datos reales es 1 y el modelo predice 0, deberíamos penalizar al modelo y viceversa. Como se puede ver en la figura de abajo, para la gráfica $-\log(\hat{f}(x))$ cuando $\hat{f}(x)$ se acerca a 1, el costo es 0 y cuando h(x) se acerca a 0, el costo es infinito (es decir, penalizamos fuertemente el modelo). De manera similar, para la gráfica $-\log(1-\hat{f}(x))$ cuando el valor real es 0 y el modelo predice 0, el costo es 0 y el costo se vuelve infinito cuando $\hat{f}(x)$ se acerca a 1.

<img style="float: center;;" src='Figures/log_reg.png' width="400" height="100"/></a>

Combinando las dos ecuaciones tenemos:

$$cost(\hat{f}(x),y) = -y\log(\hat{f}(x)) - (1-y)\log(1-\hat{f}(x))$$

Entonces el costo de todos los puntos en los datos reales se puede calcular tomando el promedio del costo de todas las muestras:

$$J(\beta) = -\frac{1}{m} \sum_{i=1}^m[y^{(i)}\log\hat{f}(x^{(i)}) + (1-y^{(i)})\log(1 - \hat{f}(x^{(i)}))]$$

### Optimizando con el Gradiente

$$f_{reg} = -25.11 + 10.64*x1 + 5.36*x2$$
$$\hat{f} = \sigma(-25.11 + 10.64*x1 + 5.36*x2)$$

$$\hat{f}(x) = \frac{1}{1+e^{-(-25.11 + 10.64*x1 + 5.36*x2)}}$$

Como hay dos características en nuestro conjunto de datos, la ecuación lineal se puede representar mediante:

$$\hat{f}(x)=\beta_0 + \beta_1 x_1 + \beta_2 x_2$$

El límite de decisión se puede encontrar estableciendo la suma ponderada de las entradas en 0. Es decir igualar $\hat{f}(x)=0$, entonces:

$$x_2 = - \frac{\beta_0 + \beta_1 x_1}{\beta_2}$$

0

$$x_1 = - \frac{\beta_0 + \beta_2 x_2}{\beta_1}$$

### Con Sklearn

In [None]:
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

model = LogisticRegression(fit_intercept=False)
model.fit(Xa, y.ravel())
predict_class = model.predict(Xa)

Beta_sklearn = model.coef_[0]

In [None]:
Beta_sklearn

In [None]:
x_values = [np.min(Xa[:,2]) -5, np.max(Xa[:,2])+5]
y_values = - (Beta_sklearn[0] + np.dot(Beta_sklearn[2],x_values)) / Beta_sklearn[1]

plt.figure(figsize=(6,4))
plt.scatter(X.iloc[:,0].values, X.iloc[:,1].values, c=y)
plt.plot(x_values, y_values, label='frontera de decisión')
plt.xlabel('$x_1$')
plt.ylabel('$x_2$')
plt.show()

## Aplicando PSO