### Instrucciones generales <a class="tocSkip"></a>
1. Forme un grupo de **máximo dos estudiantes**
1. Versione su trabajo usando un **repositorio privado de github**. Agregue a su compañero y a su profesor (usuario github: phuijse) en la pestaña *Settings/Manage access*
1. Se evaluará 
    1. el **resultado y la calidad de su implementación** en base al último commit antes de la fecha y hora de entrega
    1. su **proceso de desarrollo** en base a su histórico de commits
1. [Sean honestos](https://www.acm.org/about-acm/code-of-ethics-in-spanish)

# Tarea 3: Los K-vecinos 

![vecinos.png](https://i.imgur.com/qi04vM6.png)

Los $K$-vecinos es un método clásico de aprendizaje de máquinas para hacer clasificación

Sea una base de datos $E = \{(x_j, y_j), j=1, \ldots, N\}$, con $N$ ejemplos donde $x_j \in \mathbb{R}^{D}$ es un atributo d-dimensional e $y_j \in \{0, 1, 2, \ldots, C\}$ son sus etiquetas de clase

Sea ahora una segunda base de datos $T = \{(z_i), i=1, \ldots, M\}$ con $M$ ejemplos donde $z_i \in \mathbb{R}^{D}$ es un atributo d-dimensional. Esta base de datos no tiene etiquetas

> Este método clasifica cada elemento de $T$ en base a las etiquetas de sus $K$ ejemplos más cercanos de la base de datos $E$



Para clasificar el i-esimo elemento de Z:
1. Calculamos la distancia entre $z_i$ y cada elemento de $E$ usando
$$
d(z_i, x_j) = \left ( \sum_{d=1}^D  |z_{id} - x_{jd}|^p \right)^{1/p}
$$
1. Buscamos las $k$ tuplas $(x_k^{(i)}, y_k^{(i)})$ con menor distancia a $z_i$
1. Seleccionamos la clase de $z_i$ según
$$
\text{arg}\max_{c=0, 1, \ldots} \sum_{k=1}^K \frac{\mathbb{1}(c=y^{(i)}_k)}{d(z_i, x^{(i)}_k)}
$$
donde 
$$
\mathbb{1}(a=b) = \begin{cases} 1 & \text{si } a=b \\ 0 &  \text{si } a\neq b \end{cases}
$$
se conoce como función indicadora

Esta versión particular del algoritmo se conoce como clasificador de $k$ vecinos ponderado

# Actividades

- Considere la implementación "inocente" del algoritmo KNN que se adjunta a esta tarea con los parámetros $p$ y $k$ por defecto
    - Use la función adjunta `create_data` para crear un conjunto de N=1000 datos
    - Realice un profiling completo de la función `KNN` usando las magias `timeit`, `prun` y `lprun`
    - Reporte sus resultados y comente sobre los cuellos de botella del algoritmo
- Implemente una nueva versión de la función `KNN`
    - Utilice `Cython` con tipos fijos, vistas de arreglos y funciones de la librería estándar matemática de `C`
    - Muestre que obtiene el mismo resultado que la versión original
    - Grafique el *speed-up* de su nueva función con respecto a la implementación "inocente" original para $N=[10, 50, 100, 500, 1000, 5000, 10000]$
- Usando la nueva versión de `KNN` y un conjunto de $1000$ datos creados con `create_data` realice una validación cruzada en el conjunto $E$ para encontrar el mejor valor de los parámetros $k$ y $p$
- Evalue su clasificador en el conjunto $T$ y haga un reporte completo de resultados. Muestre una gráfica de la frontera de decisión de su clasificador en el rango $[(-2,2), (-2,2)]$

**Justifique adecuadamente todas sus decisiones de diseño**

# Ejemplo generación de datos

In [1]:
%matplotlib notebook
import numpy as np
import matplotlib.pyplot as plt
from funciones import create_data, KNN

fig, ax = plt.subplots(figsize=(3, 3), tight_layout=True)
E, T = create_data(N=1000)
x, y = E # Use E para realizar validación cruzada
for c in np.unique(y):
    mask = y == c
    ax.scatter(x[mask, 0], x[mask, 1], label=c, s=5)
z, w = T # Use las etiquetas w para evaluar sus resultados finales
ax.scatter(z[:, 0], z[:, 1], c='k', s=5, marker='x',  alpha=0.2, label='T')
ax.legend();

<IPython.core.display.Javascript object>

```python
%time mi_resultado = mi_funcion(mis_argumentos)

%timeit -r10 -n5 mi_funcion(mis_argumentos)

#retortnar y guardar objeto '-o'
xd = %timeit -r10 -n5 -o mi_funcion(mis_argumentos)

#ademas guardar lo que retorna la funcion a evaluar
xd = %timeit -r10 -n5 -o xdd = mi_funcion(mis_argumentos)

#mide la cantidad de llamadas y el tiempo de cada función
%prun mi_funcion()

#ordenado segun el tiempo acumulado
%prun -s cumtime mi_funcion()

#line profiler
#conda install line_profiler
%load_ext line_profiler

%lprun -f mi_método mi_rutina

#verificar resultados
np.allclose(result1, result2)
```


In [39]:
print(f"x: {x.shape}, y: {y.shape}, z: {z.shape}")
print(250*750)
print(x.dtype)

x: (250, 2), y: (250,), z: (750, 2)
187500
float64


### KNN de sklearn

Para obtener un objetivo a alcanzar para nuestra versión optimizada de KNN, podemos utilizar `KNeighborsClassifier` de `sklearn.neighbors` y medir su tiempo de ejecución con la misma entrada.
En primer lugar instanciamos el clasificador con las mismas características que la función `KNN inocente` que fue proporcionada:

In [2]:
from sklearn.neighbors import KNeighborsClassifier
neigh = KNeighborsClassifier(n_neighbors=5, weights='distance',
                             algorithm='brute', p=2, n_jobs=1)

Medimos el tiempo de ajuste y predicción, para luego almacenarlo en la variable `totalTimeSklearn`

In [4]:
%%timeit -r 10 -n 10 -o 
neigh.fit(x, y)
neigh.predict(z)

17.1 ms ± 768 µs per loop (mean ± std. dev. of 10 runs, 10 loops each)


<TimeitResult : 17.1 ms ± 768 µs per loop (mean ± std. dev. of 10 runs, 10 loops each)>

In [5]:
totalTimeSklearn = _

Comparamos los resultados de las predicciones para los dos algoritmos:

In [6]:
zySklearn = neigh.predict(z)
zy = KNN(x, y, z, k=5, p=2.)
display(np.allclose(zy, zySklearn))
#mask = zy - zySklearn != 0

True

Medimos el tiempo de ejecución de la implementación naive

In [7]:
totalTimeNaive = %timeit -r 10 -n 1 -o KNN(x, y, z, k=5, p=2.)

11.3 s ± 40.8 ms per loop (mean ± std. dev. of 10 runs, 1 loop each)


Lo que nos entrega el siguiente speed-up:

In [8]:
print(f"speedup knn naive / knn_skl:\n{totalTimeNaive.average / totalTimeSklearn.average : .3f}")

speedup knn naive / knn_skl:
 662.988


### 1- Realice un profiling completo de la función KNN usando las magias timeit, prun y lprun

**Tiempo total de la función KNN con la magia `%timeit` (previamente calculado)**

In [9]:
display(totalTimeNaive)
print(f"min : {totalTimeNaive.best:.3f}[s], max: {totalTimeNaive.worst:.3f}[s]")

<TimeitResult : 11.3 s ± 40.8 ms per loop (mean ± std. dev. of 10 runs, 1 loop each)>

min : 11.290[s], max: 11.429[s]


**Cantidad de llamadas y el tiempo de cada función ejecutada por `KNN` utilizando la magia `%prun`**

In [13]:
%prun -s tottime KNN(x, y, z, k=5, p=2.)

 

De este profiling se observa la gran cantidad de funciones que son llamadas dentro del primer ciclo for anidado, o sea, la linea 21 de `funciones.py` que se ejecuta N * M veces.


```python
dist[i, j] = np.power(np.sum(np.power(np.absolute(Z[i] - X[j]), p)), 1./p)
```

Probablemente sea esta linea el principal contribuyente al tiempo que tarda el algoritmo.

**Profiling línea a línea con `%lprun`**

In [14]:
%load_ext line_profiler

In [15]:
lineProf = %lprun -r -f KNN KNN(x, y, z, k=5, p=2.)

In [16]:
lineProf.print_stats()

Timer unit: 1e-07 s

Total time: 3.35924 s
File: C:\Users\josenoob\Desktop\INFO147\INFO147_TAREA03\funciones.py
Function: KNN at line 14

Line #      Hits         Time  Per Hit   % Time  Line Contents
    14                                           def KNN(X, Y, Z, k=5, p=2.):
    15         1       1819.0   1819.0      0.0      C = np.unique(Y)
    16         1         29.0     29.0      0.0      N, D = X.shape
    17         1         13.0     13.0      0.0      M, _ = Z.shape
    18         1       1200.0   1200.0      0.0      dist = np.zeros(shape=(M, N))
    19       751       4362.0      5.8      0.0      for i in range(M):
    20    188250    1398973.0      7.4      4.2          for j in range(N):
    21    187500   31766444.0    169.4     94.6              dist[i, j] = np.power(np.sum(np.power(np.absolute(Z[i] - X[j]), p)), 1./p)
    22         1      69782.0  69782.0      0.2      neighbours = np.argsort(dist, axis=1)[:, :k]
    23         1         73.0     73.0      0.0   

Como sospechábamos, un enorme margen del tiempo total de ejecución se debe a la línea que calcula y almacena la distancia entre cada par de datos que, junto a su respectivo `for` **acumulan cerca del 98% del total del tiempo de ejecución:**


```python
20) for j in range(N):
21)    dist[i, j] = np.power(np.sum(np.power(np.absolute(Z[i] - X[j]), p)), 1./p)
```


Principalmente la línea (21) con más del 94% del total, línea que llamó nuestra atención en el profiling previo por todas las llamadas a funciones que realiza debido a los numerosos cálculos matemáticos complejos que efectúa.

Con esto en mente, buscaremos optimizar esta problemática línea, y la función en general, con el fin de reducir el tiempo de ejecución del algoritmo. Para esto, utilizaremos **Cython** aplicando las mejoras que aprendimos en el curso como el uso de **tipos estáticos** y de **funciones nativas de C** para los cálculos matemáticos.

In [10]:
%load_ext cython

In [11]:
from Cython.Compiler import Options
Options.get_directive_defaults()['profile'] = True
Options.get_directive_defaults()['linetrace'] = True
Options.get_directive_defaults()['binding'] = True

%%cython -a --compile-args=-DCYTHON_TRACE=1 --force

In [57]:
%%cython -a --compile-args=-DCYTHON_TRACE=1 --force
import numpy as np
cimport cython
cimport numpy as npc

ctypedef npc.float64_t TIPO_t
TIPO = np.float64

ctypedef npc.int64_t TIPO_i
TIPI = np.int64

cdef extern from "math.h":
    TIPO_t pow(TIPO_t, TIPO_t)
    TIPO_t fabs(TIPO_t)

@cython.boundscheck(False)
@cython.wraparound(False)
@cython.cdivision(True)
def KNN_Cython(TIPO_t [:, ::1] X, TIPO_i [:] Y, TIPO_t [:, ::1] Z, int k=5, TIPO_t p=2.):    
    
    Cn = np.unique(Y)
    cdef:
        TIPO_i [:] C = Cn
        int nUniques = Cn.shape[0]
        Py_ssize_t N = X.shape[0]
        Py_ssize_t D = X.shape[1]
        Py_ssize_t M = Z.shape[0]
        Py_ssize_t i, j, l
        
    dist = np.zeros(shape=(M, N), dtype=TIPO)
    cdef TIPO_t [:, ::1] dist_view = dist
        
    for i in range(M):
        for j in range(N):
            for l in range(D):
                dist_view[i, j] += pow(fabs(Z[i][l] - X[j][l]), p)
            dist_view[i, j] = pow(dist_view[i, j], (1./p))

    neighbros = np.asarray(np.argsort(dist_view, axis=1)[:, :k], order='C')
    Zz_Y = np.zeros(shape=(M, ), dtype=TIPO)
    crit = np.zeros(shape=(nUniques,), dtype=TIPO)

    cdef:
        TIPO_i [:, ::1] neighbours = neighbros
        TIPO_t [:] Z_Y = Zz_Y
        TIPO_t [:] criterion = crit
        TIPO_i neigh, argmax
        TIPO_t valmax
        
    for i in range(M):
        valmax = 0.
        for j in range(nUniques):
            criterion[j] = 0.
            for l in range(k):
                neigh = neighbours[i][l]
                if(Y[neigh] == C[j]):
                    criterion[j] += 1/(dist_view[i, neigh])
            if valmax < criterion[j]:
                argmax = j
                valmax = criterion[j]
        Z_Y[i] = argmax
    return Zz_Y

In [51]:
%%cython -a --compile-args=-DCYTHON_TRACE=1 --force

import numpy as np
cimport cython

cdef extern from "math.h":
    double pow(double, double)
    double fabs(double)

@cython.boundscheck(False)
@cython.wraparound(False)
@cython.cdivision(True)
def KNN_CythonB(double [:, ::1] X, long long [:] Y, double [:, ::1] Z, int k=5, double p=2.):    
    Cn = np.unique(Y)
    cdef long long [:] C = Cn
    cdef int nUniques = Cn.shape[0]
    cdef int N = X.shape[0]
    cdef int D = X.shape[1]
    cdef int M = Z.shape[0]
    dist = np.empty(shape=(M, N), dtype=np.double)
    cdef double [:, ::1] dist_view = dist
    cdef Py_ssize_t i, j, l
    for i in range(M):
        for j in range(N):
            for l in range(D):
                dist_view[i, j] += pow(fabs(Z[i][l] - X[j][l]), p)
            dist_view[i, j] = pow(dist_view[i, j], (1./p))
    neighbros = np.asarray(np.argsort(dist_view, axis=1)[:, :k], order='C')
    cdef long long [:, ::1] neighbours = neighbros
    Zz_Y = np.zeros(shape=(M, ), dtype=np.double)
    cdef double [:] Z_Y = Zz_Y
    crit = np.zeros(shape=(nUniques,), dtype=np.double)
    cdef double [:] criterion = crit
    cdef long long neigh
    cdef double valmax
    cdef long long argmax
    for i in range(M):
        valmax = 0.
        for j in range(nUniques):
            criterion[j] = 0
            for l in range(k):
                neigh = neighbours[i][l]
                if(Y[neigh] == C[j]):
                    criterion[j] += 1/(dist_view[i, neigh] + 0.000001)
            if valmax < criterion[j]:
                argmax = j
                valmax = criterion[j]
        Z_Y[i] = argmax
    return Zz_Y

In [58]:
#display(np.allclose(KNN(x, y, z, k=5, p=2.), KNN_Cython(x, y, z, k=int(5), p=2.)))
display(np.allclose(neigh.predict(z), KNN_Cython(x, y, z, k=5, p=2.)))
display(np.allclose(neigh.predict(z), KNN_CythonB(x, y, z, k=5, p=2.)))
%timeit -r 10 -n 5 KNN_Cython(x, y, z, k=5, p=2.)
%timeit -r 10 -n 5 KNN_CythonB(x, y, z, k=5, p=2.)

#timeCXD = %timeit -o -r 10 -n 5 KNN_Cython(x, y, z, k=5, p=2.)
#display(timeCXD.best)

True

True

52.5 ms ± 869 µs per loop (mean ± std. dev. of 10 runs, 5 loops each)
52.3 ms ± 312 µs per loop (mean ± std. dev. of 10 runs, 5 loops each)


In [59]:
import line_profiler
profile = line_profiler.LineProfiler(KNN_Cython)
profile.runcall(KNN_Cython, x, y, z, k=5, p=2.)
profile.print_stats()

Timer unit: 1e-06 s

Total time: 1.23619 s
File: /home/joselo/.cache/ipython/cython/_cython_magic_66b6f0a7cbc13dc48338d0983fe546ef.pyx
Function: KNN_Cython at line 18

Line #      Hits         Time  Per Hit   % Time  Line Contents
    18                                           def KNN_Cython(TIPO_t [:, ::1] X, TIPO_i [:] Y, TIPO_t [:, ::1] Z, int k=5, TIPO_t p=2.):    
    19                                               
    20         1        291.0    291.0      0.0      Cn = np.unique(Y)
    21                                               cdef:
    22         1         20.0     20.0      0.0          TIPO_i [:] C = Cn
    23         1          4.0      4.0      0.0          int nUniques = Cn.shape[0]
    24         1          1.0      1.0      0.0          Py_ssize_t N = X.shape[0]
    25         1          2.0      2.0      0.0          Py_ssize_t D = X.shape[1]
    26         1          1.0      1.0      0.0          Py_ssize_t M = Z.shape[0]
    27                            