# Cuaderno 2: NumPy y Matplotlib

Este cuaderno es el segundo de dos cuadernos introductorios al lenguaje de programación Python.

En el tutorial anterior vimos algunos aspectos básicos de la programación en Python, como los diferentes tipos de datos que se puede manejar, en qué tipo de contenedores podemos almacenarlos y operaciones básicas sobre los mismos.

En este cuaderno veremos algunas bibliotecas base de Python, como lo son [NumPy](https://numpy.org/) y [Matplotlib](https://matplotlib.org/).

* Numpy permite manipular otros tipos de datos más complejos, como las matrices ([`ndarray`](https://numpy.org/doc/stable/reference/arrays.html)).
* Matplotlib es una librería que cuenta con funciones para graficar nuestras secuencias de datos.

Este cuaderno fue generado por Valentina Gascue para el Curso "Redes Neuronales como modelos de Cognición", tomando como referencia los cuadernos generados previamente en el curso Neurociencia Cognitiva y Computacional.

**Sobre los paquetes en Python**

En el cuaderno anterior aún no utilizamos ninguna librería de Python. Estas son conjuntos de código generadas por la comunidad que resuelven problemas comúnes que uno puede tener al programar en Python, a la vez que expanden las funcionalidades del mismo.

Las librerías que presentaremos aquí son bloques esenciales en cualquier trabajo de redes neuronales (y de programacion en general) en Python.

Al ser agregados a la base del lenguaje de programación debemos primero instalarlas y posteriormente cargarlas cuando las queramos usar. Al estar usando Google Colab, las librerias base de Python ya están instaladas pero por una guia sobre como instalar paquetes puede consultar esta [fuente](https://packaging.python.org/en/latest/tutorials/installing-packages/).

En la siguiente celda importaremos las librerias a utilizar en este cuaderno, no olvide correr la celda para que queden cargadas.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

La sintaxis allí utilizada se aplica para cualquier paquete.
Notará que en los tres casos utilizamos `as` seguido de una abreviatura. Esto se conoce como *alias* y se usan ciertos alias convencionales para paquetes grandes como estos.

Lo que permiten los alias es que cuando haya que hacer referencia en el código a ese paquete solo baste con usar el alias y no el nombre completo.

## [NumPy](https://numpy.org/)

[NumPy](https://numpy.org/) es un paquete central en el desarrollo de funcionalidades en ciencia de datos y aplicaciones de redes neuronales. Su nombre surge como abreviatura de *Numerical Python* y es, de hecho, lo que brinda: funcionalidad para trabajar con datos numéricos de manera rápida y eficiente.

El tipo de datos que brinda NumPy son los objetos de tipo [`ndarray`](https://numpy.org/doc/stable/reference/arrays.html), que se pueden manipular matematicamente de la misma manera que las matrices.

### Generación de matrices en NumPy

Hay muchas formas de generar matrices, aquí discutiremos algunas básicas.

Se puede iniciar una numpy array vacia o llena de ceros o unos con las siguientes funciones:

*Matriz vacía*:

```
np.empty(dimensión)
```

A la función [`empty()`](https://numpy.org/doc/stable/reference/generated/numpy.empty.html) se le debe dar como argumento las dimensiones de la matriz que queremos que genere, por ejemplo: `(2, 1)` generará una matriz vacia de dos filas y 1 columna:

In [None]:
array = np.empty((2, 1))
print(array)

De forma análoga a la [`ndarray`](https://numpy.org/doc/stable/reference/arrays.html) vacía, se pueden generar [`ndarrays`](https://numpy.org/doc/stable/reference/arrays.html) rellenas con ceros o unos.

*Matriz de ceros*:

In [None]:
array = np.zeros((2, 1))
print(array)

*Matriz de unos*:

In [None]:
array = np.ones((2, 1))
print(array)

Por último, podemos generar matrices a partir de listas usando la función [`np.array()`](https://numpy.org/doc/stable/reference/generated/numpy.array.html) con la siguiente sintaxis:

```
matriz = np.array(lista)
```

In [None]:
lista = [1, 2, 3, 4, 5]
matriz = np.array(lista)
print(matriz)

### Ejercicio de codificación 1: `linspace`

NumPy tiene una función integrada [`np.linspace(i,j,k)`](https://numpy.org/doc/stable/reference/generated/numpy.linspace.html) que genera matrices numéricas con un rango entre i y j con k elementos. Si bien es similar a la función `range()`, notar que en aquella se le definia el salto entre datos consecutivos mientras que a [`np.linspace()`](https://numpy.org/doc/stable/reference/generated/numpy.linspace.html) se le indica el número de datos totales que quiero que contenga mi matriz.

Generá una matriz de 10 números entre 0 y 100 usando [`np.linspace()`](https://numpy.org/doc/stable/reference/generated/numpy.linspace.html). Luego imprimí la matriz para evaluar si obtuvo lo buscado.

- ¿De qué tipo son los datos obtenidos?
- ¿Qué dimensiones debería tener la matriz?

Podés corroborar las dimensiones de tu matriz usando la función [`np.shape()`](https://numpy.org/doc/stable/reference/generated/numpy.shape.html) (que también puede usar como método) con la sintaxis:

```
np.shape(matriz)
```

In [None]:
matriz = ...
print(matriz)

dimension = ...
print("Dimensión:", dimension)

[Hacé click para la solución](https://raw.githubusercontent.com/MaestriaCienciasCognitivas/ncc/main/book/solutions/Cuaderno2_Ejercicio1.py)

_Salida esperada:_

```
[  0.          11.11111111  22.22222222  33.33333333  44.44444444
  55.55555556  66.66666667  77.77777778  88.88888889 100.        ]
Dimensión: (10,)
```

### Acceder a datos de una matriz

Podemos seleccionar un elemento de una matriz de la misma forma que lo hacemos para una lista: utilizando paréntesis rectos. De forma que:

```
array[i]
```

devuelve el elemento con índice i de la matriz. Al igual que en las listas, los indices de las matrices comienzan desde 0.

Note que las matrices pueden tener más de una dimensión. En ese caso, la selección se debe hacer indicando el índice en cada dimensión. Por ejemplo, para seleccionar un elemento en una matriz de 3 dimensiones debe escribir:

```
array[i,j,k]
```

Siendo i,j y k los indices de ese elemento en cada una de las dimensiones de la matriz.

Puede también seleccionar regiones de la matriz utilizando los dos puntos `:`. Por ejemplo:

```
array[i:j]
```

nos devolverá los elementos entre i y j, no inclusive, de la matriz.

Esta sintaxis se puede usar en matrices multidimensionales para indicar una rebanada de una de las dimensiones y no es necesario que se use en todas. Por ejemplo, podemos elegir los elementos de las filas del 1 al 5 y columna 8 de una matriz como sigue:

```
array[1:5,8]
```

Si solo se indican los dos puntos, se tomarán todos los elementos en esa dimensión. Por ejemplo, el siguiente código:

```
array[:,8]
```

Devuelve todas las filas de la columna 8.

### Algunas operaciones con matrices

NumPy trae consigo una variedad de operaciones matemáticas integradas ([puede consultar la documentación aquí](https://numpy.org/doc/stable/reference/routines.math.html)), que se le pueden aplicar a sus matrices.

Para aplicar cualquiera de esas funciones a su matriz debe seguir la siguiente sintaxis:

```
np.funcion(array)
```

donde debe sustituír `funcion` por el nombre de la funcion a aplicar, por ejemplo `sin()`, y `array` por el nombre de su matriz.

Estas funciones serán aplicadas a cada uno de los elementos de su matriz.

NumPy también trae integradas diversas funciones que se aplican a su matriz en conjunto y no a sus elementos aislados. A continuación se muestran algunos ejemplos.

In [None]:
suma = np.sum([2, 3, 4, 5])
print(suma)

In [None]:
producto = np.prod([2, 3, 4, 5])
print(suma)

In [None]:
promedio = np.mean([2, 3, 4, 5])
print(promedio)

In [None]:
minimo = np.min([2, 3, 4, 5])
print(minimo)

In [None]:
maximo = np.max([2, 3, 4, 5])
print(maximo)

Otro tipo de operación que se puede realizar sobre una matriz es testear condiciones lógicas.

Utilizando los operadores lógicos mencionados en los condicionales, podemos testear una condición, por ejemplo:

```
array > 5
```

esta línea de código nos devolverá una matriz de booleanos de la misma dimensión que nuestra matriz, donde en la posición de cada elemento nos dirá `True` o `False` según si ese elemento cumple con la condición.

A raíz de esto, se puede filtrar una matriz usando condicionales con la siguiente sintaxis:

```
array[condicion]
```

Esto genera una matriz con los valores que cumplen esa condición. Por ejemplo, para la condición anterior:

```
array[array>5]
```

retorna una matriz con los elementos de la matriz anterior que son mayores que 5.

### Ejercicio de codificación 2: Simulación de una corriente de entrada

Dada la ecuación:

$$I(t)=I_{mean}(1 + \sin(\dfrac{2 \pi}{0.01}t))$$

donde $I(t)$ es la entrada sináptica a una neurona a lo largo del tiempo e $I_{mean}$ es la entrada sináptica promedio, calculá los valores de la entrada sináptica entre $t=0$ y $t=0.009$ con $\Delta t=0.001$.

In [None]:
dt = 0.001       # en segundos
i_mean = 25e-11  # en amperios

# Itera sobre 10 pasos, la variable 'step' toma valores de 0 a 9
for step in range(10):
  # Calcula el valor de t
  t = step * dt

  # Calcula el valor de I en el instante t
  i = ...

  print(i)

[Hacé click para la solución](https://raw.githubusercontent.com/MaestriaCienciasCognitivas/ncc/main/book/solutions/Cuaderno2_Ejercicio2.py)

_Salida esperada:_

```
2.5e-10
3.969463130731183e-10
4.877641290737885e-10
4.877641290737885e-10
3.9694631307311837e-10
2.5000000000000007e-10
1.0305368692688176e-10
1.2235870926211617e-11
1.223587092621159e-11
1.0305368692688186e-10
```

## Matplotlib

[Matplotlib](https://matplotlib.org) es una librería gráfica de Python que nos permite generar múltiples tipos de gráficos y visualizaciones. En este cuaderno haremos solamente una breve introducción a lo que se puede hacer con esta librería pero por más información puede consultar la [documentación](https://matplotlib.org/stable/users/index.html).

Comencemos con un gráfico simple. La función más simple de usar para graficar es [`plt.plot()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html). Esta función realiza gráficos de línea a menos que le indiquemos otra cosa, a partir de dos series de datos (si solo se le pasa una serie genera el eje x de forma automática).

*Nota: recuerde que `plt` es el alias con el cual importamos [`Matplotlib`](https://matplotlib.org), por ende lo usamos en lugar del nombre completo de la librería.*

In [None]:
# Generemos dos vectores x e y.
x = [1, 2, 3, 4, 5, 6]
y = [10, 20, 30, 40, 50, 60]

# Grafiquemos estos dos vectores usando Matplotlib.
plt.plot(x, y)

# Le pedimos que nos muestre lo graficado.
plt.show()

La sintaxis observada más arriba es la general para hacer un gráfico con Matplotlib. Notar que debemos pedirle, con [`plt.show()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.show.html#matplotlib.pyplot.show) que nos muestre el gráfico.

Agreguemosle ahora un titulo y nombres a los ejes.

In [None]:
# Grafiquemos estos dos vectores
plt.plot(x,y)

# Definimos el titulo del gráfico
plt.title('Grafico')

# Definimos los nombres de los ejes
plt.xlabel('Eje x')
plt.ylabel('Eje y')

# Le pedimos que nos muestre lo graficado
plt.show()

Otro método que puede resultar de utilidad es el método [`plt.figure()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.figure.html) que nos permite definir a la figura y sus caracteristicas como el tamaño. Esto puede ser especialmente relevante cuando querramos posteriormente exportar una figura generada en Python.

In [None]:
# Grafiquemos estos dos vectores
plt.plot(x,y)

# Definimos el titulo del gráfico
plt.title('Grafico')

# Definimos la figura
plt.figure(figsize=(100, 120))

# Le pedimos que nos muestre lo graficado
plt.show()

Si queremos graficar más de un gráfico en una misma figura podemos usar el método [`plt.subplot()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.subplot.html). La sintaxis es:

```
plt.subplot(nrows, ncols, indice)
```

Los primeros dos argumentos nos indican en cuantas filas y columnas, respectivamente queremos que se divida nuestra figura. El indice nos dice en cual de esas subfiguras graficar el grafico particular.

Veamos un ejemplo:

In [None]:
# Generamos las subplots
plt.subplot(1, 2, 1)
plt.plot(x, y)
plt.title('Subplot 1')

# Generamos la otra subplot
plt.subplot(1, 2, 2)
plt.plot(x, y)
plt.title('Subplot 2')

# Mostramos la figura
plt.show()

### Definir una figura

Acabamos de generar gráficos de forma aislada, lo cual hace que su personalización se vuelva un poco más complicada. Lo más prolijo a la hora de graficar es generar primero una figura y un set de ejes. Luego, graficaremos dentro de esa figura y set de ejes.

In [None]:
# Creamos una figura `fig` y un set de ejes `ax`.
# Notar que esta funcion (subplots) es diferente a la usada anteriormente (subplot).
fig, ax = plt.subplots()

# Graficamos sobre nuestra figura.
ax.plot(x, y)

# Seteamos los nombres y titulo.
ax.set(xlabel='Eje x', ylabel='Eje y', title='Grafico')

# Mostramos el gráfico.
plt.show()

En el código propuesto, podriamos dar como argumento a [`plt.subplots()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.subplots.html) dimensiones para generar mas de una `subplot`.

### Graficos de dispersión

Matplotlib tiene una gran cantidad de funciones para graficar todo tipo de gráficos. Aquí veremos simplemente cómo graficar un gráfico de dispersión. Para eso tenemos la función [`plt.scatter()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.scatter.html).

Veamos un ejemplo:

In [None]:
# Creamos una figura `fig` y un set de ejes `ax`.
fig, ax = plt.subplots()

# Graficamos sobre nuestra figura
ax.scatter(x, y)

# Seteamos los nombres y titulo
ax.set(xlabel='Eje x', ylabel='Eje y', title='Grafico')

# Mostramos el gráfico
plt.show()

### Personalización

Podemos personalizar de diversas maneras nuestro gráfico. Desde el color de nuestros puntos, la forma y tamaño de los puntos, el tamaño de la linea, la opacidad, el fondo de la gráfica y muchas cosas que se le puedan ocurrir.

Aquí veremos algunos ejemplos. Para gráficos y visualizaciones más complejas y personalizables hay otras librerias disponibles, como [Seaborn](https://seaborn.pydata.org).

Arranquemos personalizando el color de nuestro gráfico. Para esto, la función plot tiene un argumento `color` que podemos setear como queramos. Matplotlib trae algunos [colores incorporados](https://matplotlib.org/stable/gallery/color/named_colors.html) que se pueden llamar por su nombre, o puede incluso darle un código HEX con el color especifico que prefiera.

In [None]:
# Definimos la figura
fig, ax = plt.subplots(figsize=(10, 6))

# Definimos la gráfica
ax.plot(x, y, color='red')

# Seteamos los titulos
ax.set(title="Gráfico", xlabel="Eje X", ylabel="Eje y")

# Mostramos la gráfica
plt.show()

Cambiemos ahora la forma de los puntos en nuestro gráfico de dispersión. De forma similar a lo que vimos para el color, hay un parámetro `marker` que tiene la función [`plt.scatter()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.scatter.html) asi como la función [`plt.plot()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html). Puede consultar [aquí](https://matplotlib.org/stable/api/markers_api.html) los diferentes códigos para los diferentes puntos que puede usar.

In [None]:
# Definimos la figura
fig, ax = plt.subplots(figsize=(10, 6))

# Definimos la gráfica
ax.plot(x, y, color='red', marker='v')

# Seteamos los titulos
ax.set(title="Gráfico", xlabel="Eje X", ylabel="Eje y")

# Mostramos la gráfica
plt.show()

El úlimo ejemplo de personalización que veremos es la opacidad de nuestro gráfico. Esto es especialmente relevante en graficos de dispersion donde se acumulan muchos puntos juntos. Esta se setea con el argumento `alpha que va desde 0 a 1, siendo 1 el color normal y 0 completamente transparente.

Veamos un ejemplo:

In [None]:
# Definimos una figura con dos subplots
fig, [ax1, ax2] = plt.subplots(nrows=1, ncols=2)

# Graficamos la primera con opacidad=1 (por defecto)
ax1.plot(x, y, color='darkblue', marker='v')

# Graficamos la segunda con opacidad=0.5
ax2.plot(x, y, color='darkblue', marker='v', alpha=0.5)

# Mostramos la gráfica
plt.show()

Alli se puede ver claramente el efecto de modificar el parámetro `alpha`. De paso vimos como generar dos subplots en una misma figura con la sintaxis que venimos trabajando.

### Ejercicio de codificación 3: Simulación de una corriente de entrada (segunda parte)

Dada la ecuación:

$$I(t)=I_{mean}(1 + \sin(\dfrac{2 \pi}{0.01}t))$$

donde $I(t)$ es la entrada sináptica a una neurona a lo largo del tiempo e $I_{mean}$ es la entrada sináptica promedio, calculá los valores de la entrada sináptica entre $t=0$ y $t=0.009$ con $\Delta t=0.001$. Esta vez, queremos guardar los resultados intermedios y graficarlos al final del bucle.

In [None]:
dt = 0.001       # en segundos
i_mean = 25e-11  # en amperios
steps = 10
i = np.zeros(steps)

# Itera sobre varios pasos, la variable 'step' toma valores de 0 a `steps`
for step in range(steps):
  # Calcula el valor de t
  t = step * dt

  # Calculá el valor de I en el instante t y guardalo en el array `i`
  ...

...
plt.show()

[Hacé click para la solución](https://raw.githubusercontent.com/MaestriaCienciasCognitivas/ncc/main/book/solutions/Cuaderno2_Ejercicio3.py)

_Salida esperada:_

![static](https://raw.githubusercontent.com/MaestriaCienciasCognitivas/ncc/main/book/static/Cuaderno1_Ejercicio3_Solucion.png)

## Bonificación: Ejercicios adicionales

### Ejercicio adicional 1: Manipulación y visualización de una imagen

En este ejercicio importaremos una imagen usando el paquete [imageio](https://imageio.readthedocs.io) la cual visualizaremos usando una función integrada de Matplotlib [`plt.imshow()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.imshow.html). Para esto debemos leer la imagen como una matriz de NumPy.

Usando manipulaciones básicas de matrices podremos modificar esta imagen de diferentes maneras, como rotarla y espejarla.

In [None]:
import imageio.v3 as iio

# Cargamos la imagen desde la URL
imagen = iio.imread('https://i.natgeofe.com/n/548467d8-c5f1-4551-9f58-6817a8d2c45e/NationalGeographic_2572187_square.jpg')

A continuación, evalúa la forma (o dimensión) de esta matriz que generamos:

In [None]:
print(...)

_Salida esperada:_

```
(3072, 3072, 3)
```

Cuando leemos una imagen como una matriz tendremos 3 dimensiones: 2 dimensiones de pixeles y una tercera que nos da el color o intensidad del pixel. Cuando la imágen está a color esta tercera dimensión tiene 3 canales (RGB). La siguiente celda visualiza la imagen cargada.

¿Es consistente con las dimensiones que observó anteriormente?

In [None]:
plt.imshow(imagen)
plt.show()

A continuación genere una nueva matriz seleccionando diferentes regiones de la imagen usando lo que aprendió anteriormente para acceder a elementos de una matriz.

*Sugerencia: note que las primeras dos dimensiones definen la región de la imagen y la tercera su color.*

In [None]:
seleccion = ...
# plt.imshow(seleccion)    # descomenta esta línea
plt.show()

### Ejercicio adicional 2: Valores aleatorios

Una funcionalidad muy útil de NumPy es el modulo [`random`](https://numpy.org/doc/stable/reference/random/index.html). En general, los paquetes grandes como los que hemos trabajado se componen de varios modulos, que incluso podemos importar por separado. En este ejercicio usaremos el modulo `random` de NumPy para generar una matriz con numeros al azar en un determinado rango y luego muestrear aleatoriamente de esa misma matriz.

Para comenzar, tenga a mano la [documentacion](https://numpy.org/doc/stable/reference/random/index.html) del modulo `random`. Alli encontrará una introducción general al modulo al igual que la documentacion de cada una de las funciones que contiene.

Podemos llamar a las funciones de random (o de cualquier otro modulo) como sigue:

```
np.random.funcion
```


Ahora si, comencemos con el ejercicio. Utilizaremos la funcion [`np.rand()`](https://numpy.org/doc/stable/reference/random/generated/numpy.random.rand.html) para generar una matriz de 3x3 con numeros aleatorios.

In [None]:
# Primero definimos el numero de filas y columnas que queremos para nuestra matriz
num_filas = 3
num_cols = 3

# Establecemos el generador de números aleatorios
np.random.seed(0)

# Generamos nuestra matriz
random_array = np.random.rand(num_filas, num_cols)

# Imprimimos la matriz para ver que nos genero
print(random_array)

Notaran que los numeros que nos generó estan todos entre 0 y 1. Esto es porque la funcion `np.rand()` solo genera numeros en este rango. 

Suponga que ahora queremos una matriz con numeros entre 10 y 20, al azar. Genere el codigo necesario para lograrlo.

In [None]:
def generar_matriz(num_filas, num_cols, rango):
    return ...

# Establecemos el generador de números aleatorios
np.random.seed(0)

print(generar_matriz(3, 3, [10, 20]))

_Salida esperada:_

```
[0.71518937 0.43758721 0.891773  ]
```

Ahora pasemos al muestreo aleatorio de una matriz.
Para esto utilizaremos la función [`np.choice()`](https://numpy.org/doc/stable/reference/random/generated/numpy.random.choice.html).

Esta funcion funciona sobre arrays de 1 dimensión. La sintaxis es como sigue:

```
muestra = random.choice(array, size=n)
```

Siendo n el tamaño de la muestra que queremos. Muestreemos 2 elementos al azar de la matriz que generamos. Como choice acepta solo matrices de una dimensión, primero debemos "aplastar" nuestra matriz a una dimension. Para esto usaremos el método [`np.flatten()`](https://numpy.org/doc/stable/reference/generated/numpy.ndarray.flatten.html).

In [None]:
muestra = np.random.choice(np.array([1, 2, 3, 4, 5]).flatten(), size=2)
print("Muestra:", muestra)

A continuación, genere una muestra de n=3 de la matriz que genero con valores entre 10 y 20.

In [None]:
def generar_muestra(matriz, n):
    return ...

# Establecemos el generador de números aleatorios
np.random.seed(0)

print(generar_muestra(generar_matriz(3, 3, [10, 20]), 3))

_Salida esperada:_

```
[17.15189366 14.37587211 18.91773001]
```

Para terminar, escriba una función que:

- Tome como argumentos un rango de numeros, un tamaño de matriz (nfilas y ncolumnas) y un tamaño de muestra
- Devuelva un matriz en dos dimensiones del tamaño indicado y una muestra del tamaño indicado de esa matriz.

In [None]:
def funcion(n_filas, n_columnas, rango, n_muestra):
  array = ...
  muestra = ...
  return array, muestra

# Establecemos el generador de números aleatorios
np.random.seed(0)

array, muestra = funcion(3, 2, [0, 20], 3)
print(array)
print(muestra)

_Salida esperada:_

```
[[10.97627008 14.30378733]
 [12.05526752 10.89766366]
 [ 8.47309599 12.91788226]]
[ 8.47309599 10.97627008 10.97627008]
 ```