# Trabajo integrador - Parte 1
## Python y Numpy

**Nombre**:

In [1]:
import numpy as np

## Ejercicio 1

Dada una matriz en formato *numpy array*, donde cada fila de la matriz representa un vector matemático, se requiere computar las normas $l_0$, $l_1$, $l_2$, $l_{\infty}$, según la siguientes definiciones:

\begin{equation}
    ||\mathbf{x}||^{p} = \bigg(\sum_{j=1}^{n}{|x_i|^p}\bigg)^{\frac{1}{p}}
\end{equation}

con los casos especiales para $p=0$ y $p=\infty$ siendo:

\begin{equation}
    \begin{array}{rcl}
        ||\mathbf{x}||_0 & = & \bigg(\sum_{j=1 \wedge x_j != 0}{|x_i|}\bigg)\\
        ||\mathbf{x}||_{\infty} & = & \max_{i}{|x_i|}\\
    \end{array}
\end{equation}

In [2]:
def calc_L0(v: np.array):
  return np.count_nonzero(v)

def calc_Lp(v: np.array, p: int):
  return np.power(np.sum(np.power(v, p)),1/p)

def calc_Linf(v: np.array):
  return np.max(np.abs(v))

In [3]:
#Test:

arr = np.asarray([[4, 0, 0], [5, 5, 1], [2, 1, 3]])


In [4]:
calc_Lp(arr, 2)

9.0

In [5]:
calc_L0(arr)

7

In [6]:
calc_Linf(arr)

5

## Ejercicio 2

En clasificación contamos con dos arreglos, la “verdad” y la “predicción”. Cada elemento de los arreglos pueden tomar dos valores, “True” (representado por 1) y “False” (representado por 0). Entonces podemos definir 4 variables:

* True Positive (TP): El valor verdadero es 1 y el valor predicho es 1
* True Negative (TN): El valor verdadero es 0 y el valor predicho es 0
* False Positive (FP): El valor verdadero es 0 y el valor predicho es 1
* False Negative (FN): El valor verdadero es 1 y el valor predicho es 0

A partir de esto definimos:

* Precision = TP / (TP + FP)
* Recall = TP / (TP + FN)
* Accuracy = (TP + TN) / (TP + TN + FP + FN)
 
Calcular las 3 métricas con Numpy y operaciones vectorizadas.

In [7]:
truth = np.array([1,1,0,1,1,1,0,0,0,1])
prediction = np.array([1,1,1,1,0,0,1,1,0,0])

In [8]:
TP = np.sum((truth == 1) & (prediction == 1))
FP = np.sum((truth == 0) & (prediction == 1))
TN = np.sum((truth == 0) & (prediction == 0))
FN = np.sum((truth == 1) & (prediction == 0))

precision = TP / (TP + FP)
print(f"precision = {precision}")

recall = TP / (TP + FN)
print(f"recall = {recall}")

accuracy = (TP + TN) / (TP + TN + FP + FN)
print(f"accuracy = {accuracy}")

precision = 0.5
recall = 0.5
accuracy = 0.4


## Ejercicio 3

Crear una función que separe los datos en train-validation-test. Debe recibir de parametros:

- X: Array o Dataframe que contiene los datos de entrada del sistema.
- y: Array o Dataframe que contiene la(s) variable(s) target del problema.
- train_percentage: _float_ el porcentaje de training.
- test_percentage: _float_ el porcentaje de testing.
- val_percentage: _float_ el porcentaje de validación.
- shuffle: _bool_ determina si el split debe hacerse de manera random o no.

Hints: 

* Usar Indexing y slicing
* Usar np.random.[...]

In [9]:
def split(X_input,
          Y_input,
          train_size=0.7,
          val_size=0.15,
          test_size=0.15,
          random_state=42,
          shuffle=True):
    
      if shuffle:
            indices = np.random.permutation(len(X_input), random_state = random_state)
            X_input = X_input[indices]
            Y_input = Y_input[indices]
            
      total_samples = len(X_input)
      train_size = int(total_samples * train_size)
      val_size = int(total_samples * val_size)
      test_size = total_samples - train_size - val_size

      X_train, y_train = X_input[:train_size], Y_input[:train_size]
      X_val, y_val = X_input[train_size:(train_size + val_size)], Y_input[train_size:(train_size + val_size)]
      X_test, y_test = X_input[test_size:], Y_input[(train_size + val_size):]

      


      return X_train, y_train, X_val, y_val, X_test, y_test