In [2]:
import numpy as np

# Ejercicio 1: Operaciones Matriciales
Dada una matriz en formato numpy array, donde cada fila de la matriz representa un vector matemático:

Computar las normas l0, l1, l2, l-infinito 

In [24]:
A = np.random.randint(0, 10, (5, 4))
print(A)

[[2 4 7 5]
 [5 5 6 4]
 [6 8 6 9]
 [6 6 9 9]
 [7 0 1 7]]


#### Norma 0 (I0)

In [25]:
def norma_0(matriz):
    """Calcula la norma cero de los vectores filas de la matriz
    que recibe. Es decir, devuelve la cantidad de valores distintos
    de cero que hay en cada vector"""
    return np.count_nonzero(matriz, axis=1)

#### Norma p
<p style='text-align: justify;'>
    Devuelve la noma:
</p>

<p style='text-align: center;'>
    $||x||_p = \Large (\sum \limits _{i=1} ^{n} |x_i|^p)^{1/p}$
</p>

In [26]:
def norma_p(matriz, p=1):
    """Calcula la norma p de los vectores
    filas de la matriz que recibe."""
    return np.power(np.sum(np.power(np.abs(matriz),p),axis=1),1/p)

#### Norma infinita $\infty$ (I-infinito)
<p style='text-align: center;'>
    $||x||_\infty =  max_i |x_i|$
</p>

In [27]:
def normainf(matriz):
    """Calcula la norma infinito de los vectores filas de la matriz
    que recibe. Es decir, devuelve el elemento de mayor valor que 
    hay en cada vector"""
    return np.amax(matriz,axis = 1)

#### Adicional: Deteccion de elemento de valor minimo

In [28]:
def minimo(matriz):
    return np.amin(matriz,axis = 1)

In [29]:
n_0 = norma_0(A)
n_1 = norma_p(A, 1)
n_2 = norma_p(A, 2)
n_inf = normainf(A)
for vector in range(A.shape[0]):
    print(f"Vector: {A[vector,:]}")
    print(f"Norma 0 (I0): {n_0[vector]}")
    print(f"Norma 1 (I1): {n_1[vector]}")
    print(f"Norma 2 (I2): {n_2[vector]}")
    print(f"Norma inf (I∞): {n_inf[vector]}\n")

Vector: [2 4 7 5]
Norma 0 (I0): 4
Norma 1 (I1): 18.0
Norma 2 (I2): 9.695359714832659
Norma inf (I∞): 7

Vector: [5 5 6 4]
Norma 0 (I0): 4
Norma 1 (I1): 20.0
Norma 2 (I2): 10.099504938362077
Norma inf (I∞): 6

Vector: [6 8 6 9]
Norma 0 (I0): 4
Norma 1 (I1): 29.0
Norma 2 (I2): 14.730919862656235
Norma inf (I∞): 9

Vector: [6 6 9 9]
Norma 0 (I0): 4
Norma 1 (I1): 30.0
Norma 2 (I2): 15.297058540778355
Norma inf (I∞): 9

Vector: [7 0 1 7]
Norma 0 (I0): 3
Norma 1 (I1): 15.0
Norma 2 (I2): 9.9498743710662
Norma inf (I∞): 7



# Ejercicio 2: Sorting
<p style='text-align: justify;'>
    Dada una matriz en formato numpy array, donde cada fila de la matriz representa un vector matemático, se requiere computar la norma l2 de cada vector. Una vez obtenida la norma, se debe ordenar las mísmas de mayor a menor. Finalmente, obtener la matriz original ordenada por fila según la norma l2.


Todas las operaciones debe ser vectorizadas.
</p>

In [85]:
def sort_of_vectors(matriz, p, show = False):
    """Ordena de mayor a menor segun el
    valor de la norma p de los  vectores
    filas de la matriz que recibe
    * Devuelve la matriz con sus filas ordenadas segun la norma-2,
    * El arreglo de indices de la matriz original ordenado segun la norma-2,
    * El arreglo de norma-2 de la matriz original"""
    n2 = norma_p(matriz, p)       #Genero un vector con las normas-2 de cada vector
    orden = np.argsort(n2)[::-1]  #Genero un vector con los indices de manera ordenada segun la norma-2
    matriz_sort = matriz[orden]   #Genero la matriz ordenada segun la norma-2 de los vectores filas
    if show == True:
        # Muestro el orden original
        print("Orden original")
        for vector in range(matriz.shape[0]):
            print(f"Vector: {matriz[vector,:]} \t Norma-{p}: {n2[vector]}")
        print("\nOrdenado segun su norma 2")
        for vector in range(matriz.shape[0]):
            print(f"Vector: {matriz_sort[vector,:]} \t Norma-{p}: {n2[orden[vector]]}")
    return matriz_sort, orden, n2

In [77]:
# Declaro la matriz
B = np.random.randint(0, 10, (5, 4))
print(B)

[[0 6 5 9]
 [6 9 5 0]
 [7 9 5 5]
 [8 8 0 6]
 [7 2 7 0]]


In [86]:
p = 2
BS, orden, n2 = sort_of_vectors(B, p, show = True)

Orden original
Vector: [0 6 5 9] 	 Norma-2: 11.916375287812984
Vector: [6 9 5 0] 	 Norma-2: 11.916375287812984
Vector: [7 9 5 5] 	 Norma-2: 13.416407864998739
Vector: [8 8 0 6] 	 Norma-2: 12.806248474865697
Vector: [7 2 7 0] 	 Norma-2: 10.099504938362077

Ordenado segun su norma 2
Vector: [7 9 5 5] 	 Norma-2: 13.416407864998739
Vector: [8 8 0 6] 	 Norma-2: 12.806248474865697
Vector: [6 9 5 0] 	 Norma-2: 11.916375287812984
Vector: [0 6 5 9] 	 Norma-2: 11.916375287812984
Vector: [7 2 7 0] 	 Norma-2: 10.099504938362077


# Ejercicio 3: Indexing
<p style='text-align: justify;'>
    El objetivo es construir un índice para identificadores de usuarios, es decir id2idx e idx2id. Para ello crear una clase, donde el índice se genere en el constructor. Armar métodos get_users_id y get_users_idx.

    - Identificadores de usuarios : users_id  = [15, 12, 14, 10, 1, 2, 1]
    - Índice de usuarios :          users_idx = [ 0,  1,  2,  3, 4, 5, 4]
    
    id2idx =  [-1     4     5    -1    -1    -1     -1    -1    -1    -1     3     -1      1    -1     2     0]
              [ 0     1     2     3     4     5      6     7     8     9    10     11     12    13    14    15]

    id2idx[15] -> 0 ; id2idx[12] -> 1 ; id2idx[3] -> -1
    idx2id[0] -> 15 ; idx2id[4] -> 1
    
</p>

In [53]:
class UsersIndex:
    def __init__(self,users_ids):
        ids, idxs = np.unique(users_ids, return_index=True)
        idx2 = np.full((np.max(ids)+1),-1)
        idx2[ids]=idxs
        
        self.idx2id = idx2
        self.id2idx = np.arange(ids.max()+1)
        print(f"ID:\t{self.id2idx}")
        print(f"Indice:\t{self.idx2id}")
        
        
    def get_users_id(self, index):
        if index != -1:
            print(f"idx2id[{index}]->{self.id2idx[np.argwhere(self.idx2id == index)[0,0]]}")
        else:
            print(f"idx2id[{index}]->{self.id2idx[np.argwhere(self.idx2id == index)[0,0]]}")

    def get_users_idx(self, identification):
        print(f"id2idx[{identification}]->{self.idx2id[np.argwhere(self.id2idx == identification)[0,0]]}")
        
adm = UsersIndex([15, 12, 14, 10, 1, 2, 1])
print()
adm.get_users_id(0)
adm.get_users_id(4)
print()
adm.get_users_idx(15)
adm.get_users_idx(12)
adm.get_users_idx(3)
adm.get_users_idx(1)

ID:	[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15]
Indice:	[-1  4  5 -1 -1 -1 -1 -1 -1 -1  3 -1  1 -1  2  0]

idx2id[0]->15
idx2id[4]->1

id2idx[15]->0
id2idx[12]->1
id2idx[3]->-1
id2idx[1]->4


# Ejercicio 4: Precision, Recall, Accuracy
<p style='text-align: justify;'>
    En los problemas de clasificación, se cuenta con dos arreglos, la verdad (ground truth) y la predicción (prediction). Cada elemento de los arreglos puede tomar dos valores: True (representado por 1) y False (representado por 0). Por lo tanto, se pueden definir cuatro variables:

- True Positive (TP): la verdad es 1 y la predicción es 1.
- True Negative (TN): la verdad es 0 y la predicción es 0.
- False Negative (FN): la verdad es 1 y la predicción es 0.
- False Positive (FP): la verdad es 0 y la predicción es 1.

A partir de esas cuatro variables, se definen las siguientes métricas:

- Precision = TP / (TP + FP)
- Recall = TP / (TP + FN)
- Accuracy = (TP + TN) / (TP + TN + FP + FN)

Para los siguientes arreglos, representando la verdad y la predicción, calcular las métricas anteriores con operaciones vectorizadas en NumPy.

* truth = [1,1,0,1,1,1,0,0,0,1]
* prediction = [1,1,1,1,0,0,1,1,0,0]
</p>

In [89]:
truth = [1, 1, 0, 1, 1, 1, 0, 0, 0, 1]
pred = [1, 1, 1, 1, 0, 0, 1, 1, 0, 0]
print(truth)
print(pred)

[1, 1, 0, 1, 1, 1, 0, 0, 0, 1]
[1, 1, 1, 1, 0, 0, 1, 1, 0, 0]


In [90]:
def PRA(truth, pred):
    # Calculo el valor True Positive
    TP = sum(np.logical_and(truth,pred))
    # Calculo el valor True Negative
    TN = sum(np.logical_and(np.logical_not(truth),np.logical_not(pred)))
    # Calculo el valor False Negative
    FN = sum(np.logical_and(truth,np.logical_not(pred)))
    # Calculo el valor False Negative
    FP = sum(np.logical_and(np.logical_not(truth),pred))
    PRECISION = TP / (TP + FP)
    RECALL = TP / (TP + FN)
    ACCURACY = (TP + TN) / (TP + TN + FP + FN)
    
    return TP, TN, FN, FP, PRECISION, RECALL, ACCURACY

In [91]:
TP, TN, FN, FP, PRECISION, RECALL, ACCURACY = PRA(truth, pred)
print(f"Cantidad de Verdaderos Positivos: {TP}")
print(f"Cantidad de Verdaderos Negativos: {TN}")
print(f"Cantidad de Falsos Negativos: {FN}")
print(f"Cantidad de Falsos Positivos: {FP}")
print(f"Precision: {PRECISION}")
print(f"Precision: {RECALL}") #sensibilidad?
print(f"Precision: {ACCURACY}")

Cantidad de Verdaderos Positivos: 3
Cantidad de Verdaderos Negativos: 1
Cantidad de Falsos Negativos: 3
Cantidad de Falsos Positivos: 3
Precision: 0.5
Precision: 0.5
Precision: 0.4


# Ejecicio 5: Average Query Precision
<p style='text-align: justify;'>
    En information retrieval o search engines, en general contamos con queries “q” y para cada “q” una lista de documentos que son verdaderamente relevantes. Para evaluar un search engine, es común utilizar la métrica average query precision. Tomando de referencia el siguiente ejemplo, calcular la métrica con NumPy utilizando operaciones vectorizadas.

    q_id            = [1, 1, 1, 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4]
    predicted_rank  = [0, 1, 2, 3, 0, 1, 2, 0, 1, 2, 3, 4, 0, 1, 2, 3]
    truth_relevance = [T, F, T, F, T, T, T, F, F, F, F, F, T, F, F, T] 

* Precision para q_id 1 = 2 / 4
* Precision para q_id 2 = 3 / 3
* Precision para q_id 3 = 0 / 5
* Precision para q_id 4 = 2 / 4

Average query precision = ((2/4) + (3/3) + (0/5) + (2/4)) / 4
</p>