# Trabajo integrador - Parte 1
## Python y Numpy

**Nombre**:

In [1]:
import numpy as np

## Ejercicio 1

Dada una matriz en formato *numpy array*, donde cada fila de la matriz representa un vector matemático, se requiere computar las normas $l_0$, $l_1$, $l_2$, $l_{\infty}$, según la siguientes definiciones:

\begin{equation}
    ||\mathbf{x}||^{p} = \bigg(\sum_{j=1}^{n}{|x_i|^p}\bigg)^{\frac{1}{p}}
\end{equation}

con los casos especiales para $p=0$ y $p=\infty$ siendo:

\begin{equation}
    \begin{array}{rcl}
        ||\mathbf{x}||_0 & = & \bigg(\sum_{j=1 \wedge x_j != 0}{|x_i|}\bigg)\\
        ||\mathbf{x}||_{\infty} & = & \max_{i}{|x_i|}\\
    \end{array}
\end{equation}

In [2]:
def calcular_normas(matriz):
    # Norma l0
    norma_l0 = np.sum(matriz != 0, axis=1)

    # Norma l1
    norma_l1 = np.sum(np.abs(matriz), axis=1)

    # Norma l2
    norma_l2 = np.linalg.norm(matriz, axis=1)

    # Norma linfinito
    norma_inf = np.max(np.abs(matriz), axis=1)

    return norma_l0, norma_l1, norma_l2, norma_inf

# Ejemplo de uso
matriz_ejemplo = np.array([[1, 2, 0],
                           [0, 3, -1],
                           [4, 0, 2]])

norma_l0, norma_l1, norma_l2, norma_inf = calcular_normas(matriz_ejemplo)

print("Norma l0:", norma_l0)
print("Norma l1:", norma_l1)
print("Norma l2:", norma_l2)
print("Norma linfinito:", norma_inf)

Norma l0: [2 2 2]
Norma l1: [3 4 6]
Norma l2: [2.23606798 3.16227766 4.47213595]
Norma linfinito: [2 3 4]


## Ejercicio 2

En clasificación contamos con dos arreglos, la “verdad” y la “predicción”. Cada elemento de los arreglos pueden tomar dos valores, “True” (representado por 1) y “False” (representado por 0). Entonces podemos definir 4 variables:

* True Positive (TP): El valor verdadero es 1 y el valor predicho es 1
* True Negative (TN): El valor verdadero es 0 y el valor predicho es 0
* False Positive (FP): El valor verdadero es 0 y el valor predicho es 1
* False Negative (FN): El valor verdadero es 1 y el valor predicho es 0

A partir de esto definimos:

* Precision = TP / (TP + FP)
* Recall = TP / (TP + FN)
* Accuracy = (TP + TN) / (TP + TN + FP + FN)
 
Calcular las 3 métricas con Numpy y operaciones vectorizadas.

In [3]:
truth = np.array([1,1,0,1,1,1,0,0,0,1])
prediction = np.array([1,1,1,1,0,0,1,1,0,0])

In [5]:
# Definir una función para calcular métricas
def calcular_metricas(truth, prediction):
    # Calcular True Positive (TP)
    TP = np.sum(np.logical_and(truth == 1, prediction == 1))

    # Calcular True Negative (TN)
    TN = np.sum(np.logical_and(truth == 0, prediction == 0))

    # Calcular False Positive (FP)
    FP = np.sum(np.logical_and(truth == 0, prediction == 1))

    # Calcular False Negative (FN)
    FN = np.sum(np.logical_and(truth == 1, prediction == 0))

    # Calcular Precision (TP / (TP + FP))
    precision = TP / (TP + FP) if (TP + FP) > 0 else 0

    # Calcular Recall (TP / (TP + FN))
    recall = TP / (TP + FN) if (TP + FN) > 0 else 0

    # Calcular Accuracy ((TP + TN) / (TP + TN + FP + FN))
    accuracy = (TP + TN) / (TP + TN + FP + FN) if (TP + TN + FP + FN) > 0 else 0

    # Devolver las métricas calculadas
    return precision, recall, accuracy

# Arrays proporcionados
truth = np.array([1, 1, 0, 1, 1, 1, 0, 0, 0, 1])
prediction = np.array([1, 1, 1, 1, 0, 0, 1, 1, 0, 0])

# Llamar a la función para calcular las métricas
precision, recall, accuracy = calcular_metricas(truth, prediction)

# Imprimir las métricas calculadas
print("Precision:", precision)
print("Recall:", recall)
print("Accuracy:", accuracy)



Precision: 0.5
Recall: 0.5
Accuracy: 0.4


## Ejercicio 3

Crear una función que separe los datos en train-validation-test. Debe recibir de parametros:

- X: Array o Dataframe que contiene los datos de entrada del sistema.
- y: Array o Dataframe que contiene la(s) variable(s) target del problema.
- train_percentage: _float_ el porcentaje de training.
- test_percentage: _float_ el porcentaje de testing.
- val_percentage: _float_ el porcentaje de validación.
- shuffle: _bool_ determina si el split debe hacerse de manera random o no.

Hints: 

* Usar Indexing y slicing
* Usar np.random.[...]

In [8]:
def split(X_input, Y_input, train_size=0.7, val_size=0.15, test_size=0.15, random_state=42, shuffle=True):
    # Obtener el número total de muestras
    total_samples = X_input.shape[0] if isinstance(X_input, np.ndarray) else X_input.shape[0]

    # Calcular el tamaño de cada conjunto en base a los porcentajes proporcionados
    train_size = int(train_size * total_samples)
    val_size = int(val_size * total_samples)
    test_size = int(test_size * total_samples)

    # Verificar que los porcentajes suman 1
    assert train_size + val_size + test_size == total_samples, "Los porcentajes de división no suman 1."

    # Configurar la semilla aleatoria para reproducibilidad
    np.random.seed(random_state)

    # Crear índices para las muestras
    indices = np.arange(total_samples)

    # Barajar los índices si se especifica
    if shuffle:
        np.random.shuffle(indices)

    # Dividir los índices en conjuntos de entrenamiento, validación y prueba
    train_indices = indices[:train_size]
    val_indices = indices[train_size:(train_size + val_size)]
    test_indices = indices[(train_size + val_size):]

    # Indexar los datos originales para obtener los conjuntos divididos
    X_train, Y_train = X_input[train_indices], Y_input[train_indices]
    X_val, Y_val = X_input[val_indices], Y_input[val_indices]
    X_test, Y_test = X_input[test_indices], Y_input[test_indices]

    return X_train, Y_train, X_val, Y_val, X_test, Y_test

# Ejemplo de uso
# Suponiendo que tenemos los arrays X_data y Y_data
X_data = np.random.rand(100, 5)  # Datos de entrada de ejemplo
Y_data = np.random.randint(0, 2, size=(100, 1))  # Etiquetas de ejemplo (0 o 1)

# Llamar a la función split
X_train, Y_train, X_val, Y_val, X_test, Y_test = split(X_data, Y_data, train_size=0.7, val_size=0.15, test_size=0.15, shuffle=True)

# Ahora X_train, Y_train contienen los datos de entrenamiento, X_val, Y_val contienen los datos de validación y X_test, Y_test contienen los datos de prueba