### Práctica de Regresión Lógistica: Cancer de mama

***Por favor, trabaje en una copia de este  colab***

**Base de datos**: [Click](https://drive.google.com/file/d/1YccFuyedpJ7-rek4iR3MSviB0jv80uqZ/view?usp=sharing)

El conjunto de datos contiene casos de un estudio realizado entre 1958 y 1970 en el Hospital Billings de la Universidad de Chicago sobre la supervivencia de pacientes que se habían sometido a cirugía por cáncer de mama.

La base de datos está formada por 306 objetos, cada objeto tiene 3 características (Edad del paciente al momento de la operación, Años de operación y Número de ganglios axilares positivos detectados) y un predictor (variable a predecir estado de supervivencia, 1 si el paciente vivió, 2 si el paciente murío)

*Se pide predecir, en base a las características de un paciente,  si un paciente sobrevivirá o no*

In [8]:
import numpy as np 
import pandas as pd
from sklearn.preprocessing import normalize
from sklearn.model_selection import train_test_split
from google.colab import drive
drive.mount ("/content/gdrive")
data = pd.read_csv('gdrive/My Drive/dataset.data')
X = pd.DataFrame(data, columns = ['edad','anhos','ganglios'])
Y = pd.DataFrame(data, columns = ['pred'])
X = normalize(X)
Y = normalize(Y)
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.3)

Drive already mounted at /content/gdrive; to attempt to forcibly remount, call drive.mount("/content/gdrive", force_remount=True).
     edad  anhos  ganglios
0      30     64         1
1      30     62         3
2      30     65         0
3      31     59         2
4      31     65         4
..    ...    ...       ...
301    75     62         1
302    76     67         0
303    77     65         3
304    78     65         1
305    83     58         2

[306 rows x 3 columns]      pred
0       1
1       1
2       1
3       1
4       1
..    ...
301     1
302     1
303     1
304     2
305     2

[306 rows x 1 columns]




**Hipótesis**:

- Ecuación de la recta o Hiperplano
\begin{equation}
h(x_i) = w_0 + w_1x_i^1 +  w_2x_i^2 ... w_kx_i^k
\end{equation} \\

- Ecuación de la función sigmoidea (clasificador binario)
\begin{equation}
s(x_i) = \frac{1}{1 + e^{-h(x)}} 
\end{equation}






In [12]:
def Hiperplano(x,w):
  # write your code here
  return np.dot(x, np.transpose(w))
def S(x,w):
  result = 1/(1+np.exp(Hiperplano(x,w)))
  return round(result)
  

- **Loss Function** (Cross-Entropy)

\begin{equation}
L = -\frac{1}{n}\sum_{i=0}^n(y_ilog(s(x_i)) + (1-y_i)log(1-s(x_i)))  
\end{equation} \\


In [11]:
def Loss_function(x,y,w):
  # write your code here 
  sum = 0
  for i in range(len(x)): 
    Sx_i = S(x[i],w)
    if Sx_i == 0:
      Sx_i = 0.000000001
    elif Sx_i == 1:
      Sx_i = 0.999999999
    sum += y[i]*np.log(Sx_i) + (1-y[i])*np.log(1-Sx_i)
  sum = sum / len(x)
  return sum

- **Derivatives**

\begin{equation}
\frac{\partial L}{\partial w_j} = \frac{1}{n}\sum_{i=0}^n(y_i - s(x_i))(-x_i^j)
\end{equation} \\

Nota:  $x_i^j$ se refiere a la característica $j-esima$ del objeto $i-esimo$ de entrenamiento


In [None]:
def Derivatives(x,y,w):
  # write your code here
  dw = np.zeros(len(w))

  for i in range(len(x)):
    for j in range(len(x[i])):
      dw[j] += (y[i] - h(x[i],w,b))*(-x[i][j])
  
  dw = dw/len(x)
    
  return db, dw

- Change parameters 

\begin{equation}
 w_j = w_i - \alpha\frac{\partial L}{\partial w_j} 
\end{equation}

In [None]:
def change_parameters(w, derivatives, alpha):
  # write your code here

- **Training** 

Seleccione $70\%$ de los datos del dataset para entrenamiento y el resto para testing. Recuerde, los datos deben ser seleccionados de manera aleatoría.




In [None]:
def training(x,y, epochs):
  for i in range(epochs):
    L =  Loss_function(x,y)
    dw = Derivatives(x,y,w)
    w =  change_parameters(w, dw, alpha)

- **Testing**

Utilize el $30\%$ de los datos restantes para el proceso de testing. 

In [None]:
def Testing(x_test, y_test):
   n = len(y_test)
   y_pred = []
   for i in range(n):
     y_pred.append(S(x_test,w))
   print("Número de datos correctos", sum(y_pred == y))


##Desarrolle las siguientes actividades 

- Implemente funciones para graficar la función de pérdida. 
- Implemente la función para mostrar las funciones de error de training vs testing 
-¿Qué porcentaje de aciertos tiene el método?
-¿Qué porcentaje de fallas tiene el método?
 



Un exelente libro: [click](http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf)