# Introducción a Numpy y Matplotlib

## Introducción

Dos paquetes que van a resultar muy importantes para nosotros son los paquetes **numpy** y **matplotlib**. Como con todos los módulos, se cargan utilizando la palabra `import`, tal como hicimos en los ejemplos anteriores. Existen variantes en la manera de importar los módulos que son "equivalentes". En este caso le vamos a dar un alias que sea más corto de tipear. Después podemos utilizar sus funciones y definiciones.


In [None]:
import numpy as np               # Importa el paquete numpy para trabajo numérico
import matplotlib.pyplot as plt  # Importa el paquete matplotlib para graficación

Un ejemplo muy común es la graficación de datos que obtuvimos previamente:

In [None]:
x, y = np.loadtxt('data/ejemplo_plot_07_1.dat', unpack=True)
plt.plot(x, y)

## Lectura y escritura de datos a archivos

Numpy tiene funciones que permiten escribir y leer datos de varias maneras, tanto en formato *texto* como en *binario*. En general el modo *texto* ocupa más espacio pero puede ser leído y modificado con un editor.

Veamos qué datos hay en el archivo:

Hay dos columnas, en la primera fila hay texto, y en las siguientes hay valores separados por un espacio.

Dos funciones simples y útiles para entrada y salida de datos son `np.loadtxt()` para lectura,  y `np.savetxt()` para escritura.

In [None]:
x, y = np.loadtxt('data/ejemplo_plot_07_1.dat', unpack=True)

La función `np.loadtxt()` carga estos valores a las variables `x` e `y`

In [None]:
len(x), len(y)

In [None]:
print(x[:10])

Vemos que, con este uso, la variable `x` contiene los valores de la primera columna y la variable `y` los de la segunda.

Para grabar datos a un archivo le damos como primer argumento el nombre del archivo y como segundo los datos a guardar. Vamos a ver detalles más adelante.

In [None]:
np.savetxt('test.out', y)

In [None]:
!head test.out


En la primera línea hay texto explicativo, en las siguientes líneas el archivo tiene dos columnas.

Veamos que tipo de variable son `x` e `y`:

In [None]:
type(x), type(y)

Como vemos, el tipo de la variable **no es una lista** sino un nuevo tipo: **ndarray**, o simplemente **array**. Veamos cómo trabajar con ellos.

## Características de *arrays* en **Numpy**

Numpy define unas nuevas estructuras llamadas *ndarrays* o *arrays* para trabajar con vectores de datos, en una dimensión o más dimensiones ("matrices").
Los arrays son variantes de las listas de python preparadas para trabajar a mayor velocidad y menor consumo de memoria. Por ello se requiere que los arrays sean menos generales y versátiles que las listas usuales. Analicemos brevemente las diferencias entre estos tipos y las consecuencias que tendrá en su uso para nosotros.

### Comparación de listas y *arrays*

Comparemos como operamos sobre un conjunto de números cuando los representamos por una lista, o por un array:

In [None]:
dlist = [1.5, 3.8, 4.9, 12.3, 27.2, 35.8, 70.2, 90., 125., 180.]

In [None]:
d = np.array(dlist)

In [None]:
d is dlist

In [None]:
print(dlist)

In [None]:
print(d)

Veamos cómo se hace para operar con estos dos tipos. Si los valores representan ángulos en grados, hagamos la conversión a radianes (radián = $\pi/180$ grado)

In [None]:
from math import pi
drlist = [a*pi/180 for a in dlist]

In [None]:
print(drlist)

In [None]:
dr = d*(pi/180)

In [None]:
print(dr)

Vemos que el modo de trabajar es más simple ya que los array permiten trabajar con operaciones elemento-a-elemento mientras que para las listas tenemos que usar comprensiones de listas. Veamos otros ejemplos:

In [None]:
print([np.sin(a*pi/180) for a in dlist])

In [None]:
print(np.sin(np.deg2rad(d)))

Además de la simplicidad para trabajar con operaciones que actúan sobre cada elemento, el paquete tiene una gran cantidad de funciones y constantes definidas (como por ejemplo `np.pi` para $\pi$).

In [None]:
plt.plot(d, np.sin(np.deg2rad(d)),'o-')
plt.show()

### Uso de memoria de listas y arrays

Las listas son sucesiones de elementos, completamente generales y no necesariamente todos iguales. Un esquema de su representación interna se muestra en el siguiente gráfico para una lista de números enteros (Las figuras y el análisis de esta sección son de www.python-course.eu/numpy.php)

![Representación en memoria de una lista](figuras/list_structure.png)

Básicamente en una lista se guarda información común a cualquier lista, un lugar de almacenamiento que referencia donde buscar cada uno de sus elementos (que puede ser un objeto diferente) y luego el lugar efectivo para guardar cada elemento. Veamos cuanta memoria se necesita para guardar una lista de enteros:

In [None]:
from sys import getsizeof
lst = [24, 12, 57]
size_of_list_object = getsizeof(lst)   # La lista sin sus datos
#size_of_elements = getsizeof(lst[0]) + getsizeof(lst[1]) + getsizeof(lst[2])
size_of_elements = sum(getsizeof(l) for l in lst)
total_list_size = size_of_list_object + size_of_elements
print("Tamaño sin considerar los elementos: ", size_of_list_object)
print("Tamaño de los elementos: ", size_of_elements)
print("Tamaño total: ", total_list_size)

Para calcular cuánta memoria se usa en cada parte de una lista analicemos el tamaño de distintos casos:

In [None]:
print('Una lista vacía ocupa: {} bytes'.format(getsizeof([])))
print('Una lista con un elem: {} bytes'.format(getsizeof([24])))
print('Una lista con 2 elems: {} bytes'.format(getsizeof([24,12])))
print('Un entero en Python  : {} bytes'.format(getsizeof(24)))

Vemos que la "Información general de listas" ocupa **56 bytes**, y la referencia a cada elemento entero ocupa adicionalmente **8 bytes**, por lo que la lista con dos elementos ocupa **72 bytes**.
Además, cada elemento, un entero de Python, en este caso ocupa **28 bytes**, por lo que el tamaño total de una **lista** de $n$ números enteros será:

$$  M_{L}(n) = 56 + n \times 8 + n \times 28 $$

En contraste, los *arrays* deben ser todos del mismo tipo por lo que su representación es más simple (por ejemplo, no es necesario guardar sus valores separadamente)

![Representación en memoria de una lista](figuras/array_structure.png)

In [None]:
a = np.array(lst, dtype='int')
print(getsizeof(a))

Para analizar como se distribuye el consumo de memoria en un array vamos a calcular el tamaño de cada uno de los elementos como hicimos con las listas:

In [None]:
print('Un array vacío ocupa: {} bytes'.format(getsizeof(np.array([]))))
print('Un array con un elem: {} bytes'.format(getsizeof(np.array([24]))))
print('Un array con 2 elems: {} bytes'.format(getsizeof(np.array([24,12]))))
print('Un entero de Numpy es: {}'.format(type(a[0])))
print('Un entero de Numpy usa: {}'.format(getsizeof(a[0])))

Vemos que la información general sobre arrays ocupa **96 bytes** (en contraste a **64** para listas), y por cada elemento otros **8 bytes** adicionales (`numpy.int64` corresponde a 64 bits), por lo que el tamaño total será:

$$  M_{a}(n) = 96 + n \times 8 $$

In [None]:
from sys import getsizeof
lst1 = list(range(10000))
total_list_size = getsizeof(lst1) + sum(getsizeof(l) for l in lst1)
print("Tamaño total de la lista: ", total_list_size)
a1 = np.array(lst1)
print("Tamaño total de array: ", getsizeof(a1))

### Velocidad de **Numpy**
Una de las grandes ventajas de usar *Numpy* está relacionada con la velocidad de cálculo. Veamos (superficialmente) esto

In [None]:
# %load scripts/timing.py
# Ejemplo del libro en www.python-course.eu/numpy.php

import numpy as np
from timeit import Timer
Ndim = 200000


def pure_python_version():
  X = range(Ndim)
  Y = range(Ndim)
  Z = []
  for i in range(len(X)):
    Z.append(X[i] + Y[i])
  return Z


def numpy_version():
  X = np.arange(Ndim)
  Y = np.arange(Ndim)
  Z = X + Y
  return Z

timer_obj1 = Timer("pure_python_version()", "from __main__ import pure_python_version")
timer_obj2 = Timer("numpy_version()", "from __main__ import numpy_version")
t1 = timer_obj1.timeit(10)
t2 = timer_obj2.timeit(10)

print(f"Numpy es en este ejemplo {t1 / t2 : .3f} más rápido")


Como vemos, utilizar *Numpy* puede ser considerablemente más rápido que usar *Python puro*.

### Propiedades de **Numpy** arrays

Hay tres propiedades básicas que caracterizan a un array:

* `shape`: Contiene información sobre la forma que tiene un array (sus dimensiones: vector, matriz, o tensor)
* `dtype`: Es el tipo de cada uno de sus elementos (todos son iguales)
* `stride`: Contiene la información sobre como recorrer el array. Por ejemplo si es una matriz, tiene la información de cuántos bytes en memoria hay que pasar para pasar de una fila a la siguiente y de una columna a la siguiente.

In [None]:
arr = np.array([[1,2,3], [4,5,6]])

In [None]:
print( 'shape  :', arr.shape)
print( 'dtype  :', arr.dtype)
print( 'strides:', arr.strides)

Los array tienen otros atributos que nos dan información sobre sus características, por ejemplo `size` y `ndim` que nos dan el tamaño total y el 
número de dimensiones:

In [None]:
print( 'Número total de elementos :', arr.size)
print( 'Número de dimensiones     :', arr.ndim)

## Creación de *arrays* en **Numpy**

Un `array` en numpy es un tipo de variable parecido a una lista, pero está optimizado para realizar trabajo numérico.

Todos los elementos deben ser del mismo tipo, y además de los valores, contiene información sobre su tipo. Veamos algunos ejemplos de cómo crearlos y utilizarlos:

### Creación de *Arrays* unidimensionales

In [None]:
i1 = np.array([1, 2, 3, 1, 5, 1, 9, 22, 0])
r1 = np.array([1.4 ,2.3 ,3.0 ,1, 5, 1, 9, 22, 0])

In [None]:
print(i1)
print(r1)

In [None]:
print(f"tipo de i1: {i1.dtype} \ntipo de r1: {r1.dtype}")

In [None]:
print(f"Para i1:\n      Número de dimensiones: {np.ndim(i1)}\n      Longitud: {len(i1)}")

In [None]:
print(f"Para r1:\n      Número de dimensiones: {r1.ndim}\n      Longitud: {len(r1)}")

### Arrays multidimensionales

Podemos crear explícitamente *arrays* multidimensionales con la función `np.array` si el argumento es una lista anidada

In [None]:
L = [ [1, 2, 3], [.2, -.2, -1], [-1, 2, 9], [0, 0.5, 0] ]

A = np.array(L)

In [None]:
A

In [None]:
print(A)

In [None]:
print(np.ndim(A), A.ndim) # Ambos son equivalentes

In [None]:
print(len(A))

Vemos que la dimensión de `A` es 2, pero la longitud que me reporta **Python** corresponde al primer eje. Los *arrays* tienen un atributo que es la "forma" (shape)

In [None]:
print(A.shape)

In [None]:
r1.shape # una tupla de un solo elemento

### Generación de datos equiespaciados

Para obtener datos equiespaciados hay dos funciones complementarias

In [None]:
a1 = np.arange(0,190,10)
a2 = np.linspace(0,180,19)

In [None]:
a1

In [None]:
a2

Como vemos, ambos pueden dar resultados similares, y es una cuestión de conveniencia cual utilizar. El uso es:

```python
np.arange([start,] stop[, step,], dtype=None)

np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
```

Mientras que a `arange()` le decimos cuál es el paso a utilizar, a `linspace()` debemos (podemos) darle como tercer argumento el número de valores que queremos.

In [None]:
# Si queremos que devuelva enteros:
np.arange(0,180.,7.8, dtype=int)

In [None]:
# Pedimos que devuelva el paso también
v1, step1 = np.linspace(0,10,20, endpoint=True, retstep=True)
v2, step2 = np.linspace(0,10,20, endpoint=False, retstep=True)

In [None]:
print(step1)
print(step2)

In [None]:
v1

In [None]:
v2

In [None]:
plt.plot(a2, np.sin(np.deg2rad(a2)),'o-')
plt.show()

Además de valores linealmente espaciados podemos obtener valores espaciados en escala logarítmica

In [None]:
w = np.logspace(0,10,10)

In [None]:
plt.plot( w, 'o-')
plt.show()

In [None]:
w1 = np.logspace(0,2,3) # Start y Stop son los exponentes
print(w1)

In [None]:
w2 = np.geomspace(1,100,3) # Start y Stop son los valores
print(w2)

### Otras formas de creación

Hay otras maneras de crear **numpy arrays**. Algunas, de las más comunes es cuando necesitamos crear un array con todos ceros o unos o algún valor dado

In [None]:
a = np.zeros(5)

In [None]:
a.dtype                         # El tipo default es float de 64 bits

In [None]:
print(a)

In [None]:
i= np.zeros(5, dtype=int)

In [None]:
print(i)

In [None]:
i.dtype

In [None]:
c= np.zeros(5,dtype=complex)
print(c)
print(c.dtype)

En lugar de inicializarlo en cero podemos inicializarlo con algún valor

In [None]:
np.ones(5, dtype=complex)     # Algo similar pero inicializando a unos

Ya vimos que también podemos inicializarlos con valores "equiespaciados" con `np.arange()`, con `np.linspace()` o con `np.logspace()`

In [None]:
v = np.arange(2,15,2) # Crea un array con una secuencia (similar a la función range)

Para crear *arrays* multidimensionales usamos:


In [None]:
np.ones((4,5))

In [None]:
np.ones((4,3,6))

In [None]:
np.eye(4)

In [None]:
np.eye(3,7)

En este último ejemplo hemos creado matrices con unos en la diagonal y ceros en todos los demás lugares.

## Acceso a los elementos

El acceso a los elementos tiene una forma muy parecida a la de las listas (pero no exactamente igual). 

In [None]:
print(r1)

Si queremos uno de los elementos usamos la notación:

In [None]:
print(r1[0], r1[3], r1[-1])

y para "tajadas" (*slices*)

In [None]:
print(r1[:3])

In [None]:
print(r1[-3:])

In [None]:
print(r1[5:7])

In [None]:
print(r1[0:8:2])

Como con vectores unidimensionales, con arrays multidimensionales, se puede ubicar un elemento o usar *slices*:

In [None]:
X = np.arange(55).reshape((5,11))

In [None]:
X

In [None]:
print("primer y segundo elementos", X[0,0], X[0,1])

In [None]:
print( 'Slicing parte de la segunda fila :', X[1, 2:4])
print('Todas las filas, tercera columna :', X[:, 2])

In [None]:
print( 'Primera fila   :\n', X[0], '\nes igual a :\n', X[0,:])

In [None]:
print( 'Segunda fila   :\n', X[1], '\nes igual a :\n', X[1,:])

In [None]:
print( 'Primera columna:', X[:,0])

In [None]:
print( 'Última columna : \n', X[:,-1])

In [None]:
print( 'Segunda fila, elementos impares (0,2,...) : ', X[1,::2])

In [None]:
print( 'Segunda fila, todos los elementos pares : ', X[1,1::2])

Cuando el *slicing* se hace de la forma `[i:f:s]` significa que tomaremos los elementos entre `i` (inicial), hasta `f` (final, no incluido), pero tomando sólo uno de cada `s` (stride) elementos

![](figuras/numpy_indexing.png) 

En [Scipy Lectures at http://scipy-lectures.github.io](http://scipy-lectures.github.io) hay una descripción del acceso a arrays.

  

## Operaciones sobre arrays

### Operaciones básicas

Los array se pueden usar en operaciones:

In [None]:
arr = np.linspace(1,10,10)+ 1

In [None]:
# Suma de una constante
arr1 = 2* arr[::-1]              # Creamos un segundo array

In [None]:
arr[::-1]

In [None]:
arr1

In [None]:
# Multiplicación y división por constantes y suma/resta de arrays
2*arr1 - arr/2

In [None]:
# Multiplicación entre arrays
arr * arr1

In [None]:
arr / arr1

Como vemos, están definidas todas las operaciones por constantes y entre arrays. En operaciones con constantes, se aplican sobre cada elemento del array. En operaciones entre arrays se realizan elemento a elemento (y el número de elementos de los dos array debe ser compatible).

### Comparaciones 

También se pueden comparar dos arrays elemento a elemento

In [None]:
v = np.linspace(0,19,20)
w = np.linspace(0.5,18,20)

In [None]:
print (v)
print (w)

In [None]:
# Comparación de un array con una constante
print(v > 12)

In [None]:
# Comparación de un array con otro
print(v > w)

### Funciones definidas en **Numpy**

Algunas de las funciones definidas en numpy se aplican a cada elemento. Por ejemplo, las funciones matemáticas:

In [None]:
np.sin(arr1)

In [None]:
np.exp(-arr**2/2)

-----

## Ejercicios 10 (a)

1. Genere arrays en 2d, cada uno de tamaño 10x10 con:
   1. Un array con valores 1 en la "diagonal principal" y 0 en el resto (Matriz identidad).
   
   2. Un array con valores 0 en la "diagonal principal" y 1 en el resto.
   
   3. Un array con valores 1 en los bordes y 0 en el interior.
   
   4. Un array con números enteros consecutivos (empezando en 1) en los bordes y 0 en el interior.

2. Diga qué resultado produce el siguiente código, y explíquelo
  ```python
  # Ejemplo propuesto por Jake VanderPlas
  print(sum(range(5),-1))
  from numpy import *
  print(sum(range(5),-1))
  ```

3. Escriba una función `suma_potencias(p, n)` (utilizando arrays y **Numpy**) que calcule la operación $$s_{2} = \sum_{k=0}^{n}k^{p}$$. 

4.   Usando las funciones de numpy `sign` y `maximum` definir las siguientes funciones, que acepten como argumento un array y devuelvan un array con el mismo *shape*:
  - función de Heaviside, que vale 1 para valores positivos de su argumento y 0 para valores negativos.
  - La función escalón, que vale 0 para valores del argumento fuera del intervalo $(-1,1)$ y 1 para argumentos en el intervalo.
  - La función rampa, que vale 0 para valores negativos de $x$ y $x$ para valores positivos.


-----