# Fundamentos de Aprendizaje Automático y Reconocimiento de Patrones
***
# Práctico 0

In [1]:
# Se importa la biblioteca numpy
import numpy as np

## Objetivos

Es un objetivo del plantel docente que los estudiantes adquieran ciertas habilidades de programación que le permitan implementar algoritmos de *aprendizaje automático*.  Este práctico busca brindarle al estudiante una serie de ejercicios de programación que le permitan:

- enfrentarse rápidamente a algunas tareas de programación típicas del curso
- evaluar si ya cuenta con los conocimientos necesarios para resolverlos 
- identificar qué aspectos de la programación en *python* (y su biblioteca asociada *numpy*) son más relevantes para el curso.  

### Observaciones

Los ejercicios aquí propuestos surgen a partir de la identificación de algunas de las dificultades más comunes  que enfrentaron los estudiantes de la edición anterior del curso. No se espera que todos los estudiantes sean capaces de resolver los ejercicios en la primera semana del curso. Somos conscientes que en muchos casos éste será el primer contacto con las herramientas de programación del curso. Sin embargo, consideramos **necesario** que puedan resolver este tipo de tareas  **antes** de la instancia del **primer parcial**.     

**Nota 1:** Para aquellos que no están familiarizados con Python/numpy se **recomienda fuertemente** la lectura del siguiente tutorial antes de realizar estos ejercicios.

- [Python-Numpy tutorial](https://cs231n.github.io/python-numpy-tutorial/): Introducción rápida al lenguaje de programación Python, y al uso de Python para computación científica.



**Nota 2:** Los parciales y los prácticos se harán en Jupyter Notebook. Pueden encontrar una [guía de instalación](https://eva.fing.edu.uy/mod/page/view.php?id=90800) del ambiente de trabajo (miniconda) en el eva del curso. 

*** 

## Lista de ejercicios

[Ejercicio 1](#Ejercicio1): Indices en arreglos 1d y 2d    
[Ejercicio 2](#Ejercicio2): Comparación de arreglos  
[Ejercicio 3](#Ejercicio3): No es copia   
[Ejercicio 4](#Ejercicio4): Atentos al broadcasting   
[Ejercicio 5](#Ejercicio5): Sin loops por favor

<a id="Ejercicio1"></a>
### Ejercicio 1 

**Parte a)** 

Modificar la siguiente celda de forma que al ejecutarla, la salida sea la siguiente: 

```
---------------------------------------
[0 1 2 3 4 5 6 7 8 9]
[2 3 4]
[1 3 5]
[9 8 7 6]
[9 8 7 6 5 4 3 2 1 0]
---------------------------------------
```

In [3]:
print('---------------------------------------')

x = np.arange(10)
print(x)

y = x[2:5] #corregir
print(y)

y = x[1:6:2] #corregir
print(y)

y = x[-1:5:-1] #corregir
print(y)

y = x[-1::-1] #corregir
print(y)

print('---------------------------------------')

---------------------------------------
[0 1 2 3 4 5 6 7 8 9]
[2 3 4]
[1 3 5]
[9 8 7 6]
[9 8 7 6 5 4 3 2 1 0]
---------------------------------------


**Parte b)** Manipulación de arreglos

Modificar la siguiente celda de forma que al ejecutarla, la salida sea la siguiente: 

```
---------------------------------------
[[1 2 3]  
 [4 5 6]]  
[2 5]  
[[3 2 1]  
 [6 5 4]]  
---------------------------------------
```

In [8]:
print('---------------------------------------')

b = np.array([[1,2,3],[4,5,6]])
print(b)

y = b[:,1] #corregir
print(y)

y = b[:, -1::-1]  #corregir
print(y)

print('---------------------------------------')

---------------------------------------
[[1 2 3]
 [4 5 6]]
[2 5]
[[3 2 1]
 [6 5 4]]
---------------------------------------


**Parte c)** Completar el código de la función `generar_marco_2d()`. 

In [13]:
def generar_marco_2d(N, M):
    '''
    Genera un arreglo 2D de dimensiones (N,M). 
    Los elementos del arreglo valen 0 salvo en los bordes donde valen 1.

    Sugerencia: no debería llevarle más de tres líneas

    Entrada:
    --------
        N: número de filas del marco
        M: número de columas del marco

    Salida:
    -------
        marco: arreglo de tamaño (M,M)
    '''
    ##########################################
    ### EMPIEZA ESPACIO PARA COMPLETAR CÓDIGO
    ##########################################
    
    marco = np.ones((N,M))
    marco[1:-1, 1:-1] = 0

    ##########################################
    ### TERMINA ESPACIO PARA COMPLETAR CÓDIGO
    ##########################################
    return marco

La siguiente celda verifica que la implementación de la generación del marco sea correcta.

In [15]:
from numpy.testing import assert_equal, assert_array_equal
# se verifica el funcionamiento con algunas muestras
assert_array_equal(generar_marco_2d(1, 1), [[1]])
assert_array_equal(generar_marco_2d(2, 2), [[1, 1], [1, 1]])
assert_array_equal(generar_marco_2d(3, 3), [[1, 1, 1], [1, 0, 1], [1, 1, 1]])
assert_array_equal(generar_marco_2d(3, 4), [[1, 1, 1, 1], [1, 0, 0, 1], [1, 1, 1, 1]])

# se verifica con algunos marcos generados aleatoriamente
for i in range(10):
    n, m = np.random.randint(2, 1000, 2)
    result = generar_marco_2d(n, m)

    # se verifica el tamaño
    assert_equal(result.shape, (n, m))

    # se verifican los bordes
    assert (result[0] == 1).all()
    assert (result[-1] == 1).all()
    assert (result[:, 0] == 1).all()
    assert (result[:, -1] == 1).all()

    # Se verifica el interior
    assert np.sum(result) == (2*n + 2*m - 4)

print("Éxito!")

Éxito!


<a id="Ejercicio2"></a>
### Ejercicio 2

La siguiente celda genera dos arreglos binarios de tamaño 10. Utilizando una línea de código, calcular la cantidad de elementos que tienen el mismo valor.  

In [18]:
a = np.random.randint(0,2,10)
b = np.random.randint(0,2,10)
print(a)
print(b)

numero_coincidencias = 10 - np.count_nonzero(a-b)
print(numero_coincidencias)

[0 1 1 1 0 0 1 1 0 0]
[1 0 0 0 1 1 1 1 0 0]
4


<a id="Ejercicio3"></a>
### Ejercicio 3
**Parte a)**  Explicar la salida de la siguiente celda

In [19]:
a=np.array([1,2,3])
b=-a
b[1]=0
print(a)
print(b)

[1 2 3]
[-1  0 -3]


In [21]:
a=np.array([1,2,3])
b=a
b[1]=0
print(a)
print(b)

[1 0 3]
[1 0 3]


**Parte b)**  ¿Qué sucede cuando la segunda línea se sustituye por $b=a$? ¿Cambia el comportamiento si se usa b=a.copy()?

**Respuesta:** 

i) b actua como un puntero al array de a, por lo que si se modifica b se modifica a

ii) Se copia un nuevo arreglo a partir del de a en b

<a id="Ejercicio4"></a>
### Ejercicio 4

Se considera el siguiente bloque de código

In [50]:
d=4
unos  = np.ones(d)
X = np.random.rand(d,d)
print(unos)
print(X)

[1. 1. 1. 1.]
[[0.44844392 0.98139034 0.84973487 0.52033738]
 [0.66487959 0.22687983 0.25144879 0.0215292 ]
 [0.55487383 0.16184714 0.24593643 0.65761831]
 [0.94899172 0.81343677 0.10209593 0.14127369]]


**Parte a)** Explicar qué es lo que hacen las líneas 2 y 3 de la celda

**Respuesta:** 

2: un array de 1s de largo d

3: una matriz de dxd con elementos random entre 0 y 1 

**Parte b)**  Explicar la salida de la siguiente celda. En particular, observe que las dimensiones de $X$ y $unos$ no coinciden y sin embargo las operaciones no generan error.

**Respuesta:**

Y1 es la matriz resultante de la suma del vector a cada de fila de la matriz

Y2 es la matriz resultante de multiplicar 1 a 1 los elementos del vector y las filas de la matriz


In [51]:
Y1 = X + unos
Y2 = X*unos
print(Y1)
print(Y2)

[[1.44844392 1.98139034 1.84973487 1.52033738]
 [1.66487959 1.22687983 1.25144879 1.0215292 ]
 [1.55487383 1.16184714 1.24593643 1.65761831]
 [1.94899172 1.81343677 1.10209593 1.14127369]]
[[0.44844392 0.98139034 0.84973487 0.52033738]
 [0.66487959 0.22687983 0.25144879 0.0215292 ]
 [0.55487383 0.16184714 0.24593643 0.65761831]
 [0.94899172 0.81343677 0.10209593 0.14127369]]


**Pate c)** Explique qué operación se realiza en la siguiente celda.

Se hace el producto interno entre el vector y las filas de la matriz. 

In [59]:
Z1 = np.dot(X, unos)
Z2 = X @ unos
print(Z1)
print(Z2)

[2.79990652 1.16473741 1.62027571 2.00579811]
[2.79990652 1.16473741 1.62027571 2.00579811]


**Parte d)** Se quiere construir una matriz X_ agregando una columna de unos antes de la primera columna de la matriz X. La siguiente celda da error. Proponga una forma de lograrlo utilizando la misma función de numpy `hstack`.

In [65]:
unos = np.ones((d,1))
X_ = np.hstack((unos, X))
print(X_)

[[1.         0.44844392 0.98139034 0.84973487 0.52033738]
 [1.         0.66487959 0.22687983 0.25144879 0.0215292 ]
 [1.         0.55487383 0.16184714 0.24593643 0.65761831]
 [1.         0.94899172 0.81343677 0.10209593 0.14127369]]


<a id="Ejercicio5"></a>
### Ejercicio 5

Completar la función `distancia_euclidea()` que para dos vectores de entrada $\mathbf{a}$ y $\mathbf{b}$ de dimensión $d$ tiene como salida
$$
d(\mathbf{a}, \mathbf{b}) = \sqrt{\sum_{i=1}^d (a_i - b_i) ^ 2}
$$

La implementación se hará en una línea de código y deberá utilizar la función `np.sqrt()`. 

In [73]:
def distancia_euclidea(a, b):
    '''
    Calcula la distancia Euclídea entre los vectores a y b.
    
    Entrada
    ----------
    a, b : numpy arrays del mismo tamaño o escalares 
    
    Salida
    -------
    dist: distancia Euclídea entre a y b
    
    '''
    
    ##########################################
    ### EMPIEZA ESPACIO PARA COMPLETAR CÓDIGO
    ##########################################
   
    dist = np.sqrt(np.sum(np.square(a-b)))

    ##########################################
    ### TERMINA ESPACIO PARA COMPLETAR CÓDIGO
    ##########################################
    
    return dist

Pueden correr la siguiente celda para verificar si su implementación es correcta.

In [74]:
from numpy.testing import assert_equal, assert_raises

# verifica el cálculo de la distancia para arreglos de tamaño 3
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
assert_equal(distancia_euclidea(a, b), 5.196152422706632)

# verifica el cálculo de la distancia para arreglos de tamaño 4
x = np.array([3.6, 7., 203., 3.])
y = np.array([6., 20.2, 1., 2.])
assert_equal(distancia_euclidea(x, y), 202.44752406487959)

# verifica el cálculo en el caso de escalares
assert_equal(distancia_euclidea(1, 0.5), 0.5)

# verifica que haya error en el caso que los arreglos tengan distinto tamanho
a = np.array([1, 2, 3])
b = np.array([4, 5])
assert_raises(ValueError, distancia_euclidea, a, b)
assert_raises(ValueError, distancia_euclidea, b, a)

print("Éxito!")

Éxito!
