# Librería Numpy



### ¿Qué es `NumPy`?

> - Una biblioteca para `Python`: `ndarray` + `ufunc`

> - Los arrays multidimensionales (`ndarray`) nos permiten almacenar datos de manera estructurada

> - Las funciones universales (`ufunc`) nos permiten operar con esos datos de manera eficiente

> `Python` está organizado en módulos, que son archivos con extensión `*.py` que contienen funciones, variables y otros objetos, y paquetes, que son conjuntos de módulos. 


> Cuando queremos utilizar objetos que están definidos en un módulo tenemos que *importarlo*, y una vez que lo hemos hecho podemos usar el operador "." para ir descendiendo en la jerarquía de paquetes y acceder al objeto que necesitamos.

In [None]:
import numpy

In [None]:
numpy

<module 'numpy' from '/opt/anaconda3/lib/python3.8/site-packages/numpy/__init__.py'>

In [None]:
import math

In [None]:
math

<module 'math' from '/opt/anaconda3/lib/python3.8/lib-dynload/math.cpython-38-darwin.so'>

In [None]:
numpy.random

<module 'numpy.random' from '/opt/anaconda3/lib/python3.8/site-packages/numpy/random/__init__.py'>

In [None]:
import random

In [None]:
random

<module 'random' from '/opt/anaconda3/lib/python3.8/random.py'>

> Y de esta manera accedemos a la función `det`, que calcula el determinante de un array:

In [None]:
?numpy.linalg

> La función *det* está dentro del paquete *linalg*, que a su vez está dentro del paquete NumPy.

In [None]:
from numpy import *

In [None]:
import numpy as np

> Para encontrar ayuda sobre cierto tema podemos usar la función `lookfor`:

In [None]:
np.lookfor("solve")

### Constantes y funciones matemáticas

> Además de arrays, NumPy contiene también constantes y funciones matemáticas de uso cotidiano.

In [None]:
np.e

2.718281828459045

In [None]:
np.pi

3.141592653589793

In [None]:
np.log(2)

0.6931471805599453

In [None]:
lista = np.log([10., np.e, np.e**2, 0])
print(lista)

[2.30258509 1.         2.               -inf]


  lista = np.log([10., np.e, np.e**2, 0])


In [None]:
type(lista)

numpy.ndarray

In [None]:
lista=[1,2,3,4]
lista1=np.log(lista)
print(lista1)
type(lista1)

[0.         0.69314718 1.09861229 1.38629436]


numpy.ndarray

### ¿Qué es exactamente un array?

> Un array de NumPy es una colección de *N* elementos, igual que una secuencia de Python (por ejemplo, una lista). 


> Tiene las mismas propiedades que una secuencia y alguna más. 


> Para crear un array, la forma más directa es pasarle una secuencia a la función *np.array*.

In [None]:
lista1 = [1,2,3]
lista2 = [4,5,6,7]
lista3 = lista1+lista2
print(lista3)
print(type(lista3))

[1, 2, 3, 4, 5, 6, 7]
<class 'list'>


In [None]:
lista3 = []
for i in range(len(lista1)):
    lista3.append(lista1[i]+lista2[i])
print(lista3)

[5, 7, 9]


In [None]:
lista1 = [1,2,3]
lista2 = [4,5,6]
arreglo1 = np.array(lista1)
arreglo2 = np.array(lista2)
arreglo3 = np.append(arreglo1, arreglo2)
#arreglo
print(arreglo3)
arreglo3.dtype
type(arreglo3)

[1 2 3 4 5 6]


numpy.ndarray

In [None]:
arreglo3 = arreglo1 + arreglo2
print(arreglo3)

[5 7 9]


> Los arrays de NumPy son *homogéneos*, es decir, todos sus elementos son del mismo tipo. 


> Si le pasamos a *np.array* una secuencia con objetos de tipos diferentes, promocionará todos al tipo con más información. 


> Para acceder al tipo del array, podemos usar el atributo *dtype*.

In [None]:
a = np.array([1, 2., 3])
print(a)
print(a.dtype)

[1. 2. 3.]
float64


In [None]:
np.array([1, 2, 3, "3"])

array(['1', '2', '3', '3'], dtype='<U21')

<div class="alert alert-warning">**Nota**: Si *NumPy* no entiende el tipo de datos o construimos un array con argumentos incorrectos devolverá un array con *dtype* *object*. Estos arrays rara vez son útiles y su aparición suele ser signo de que algo falla en nuestro programa.</div>

> *NumPy* intentará automáticamente construir un array con el tipo adecuado teniendo en cuenta los datos de entrada, aunque nosotros podemos forzarlo.

In [None]:
a = np.array([1.,2.,3.],dtype=complex)
print(a.dtype)
print(a)

complex128
[1.+0.j 2.+0.j 3.+0.j]


In [None]:
np.array([1, 2, 3], dtype=complex)

array([1.+0.j, 2.+0.j, 3.+0.j])

> También podemos convertir un array de un tipo a otro utilizando el método *.astype*.

In [None]:
a

array([1.+0.j, 2.+0.j, 3.+0.j])

In [None]:
a.astype(str)

array(['(1+0j)', '(2+0j)', '(3+0j)'], dtype='<U64')

### Motivo: eficiencia

* Los CICLOS son costosos
* Eliminar bucles: **vectorizar** operaciones
* Los bucles se ejecutan en Python, las operaciones vectorizadas en C
* Las operaciones entre arrays de *NumPy* se realizan **elemento a elemento**

Ejemplo:

$$ a_{ij} = b_{ij} + c_{ij} $$

In [None]:
k = 2
a = np.zeros(k*3)
print(a)

[0. 0. 0. 0. 0. 0.]


In [None]:
N, M = 3, k
a = np.zeros(k*3).reshape(N, M)
print(a)

[[0. 0.]
 [0. 0.]
 [0. 0.]]


In [None]:
b=np.random.rand(k*3).reshape(N,M)
print(b)

[[9.92687031e-01 5.92924024e-02]
 [4.22103531e-02 2.95766392e-01]
 [1.82629711e-04 8.85755414e-01]]


In [None]:
b

array([[9.92687031e-01, 5.92924024e-02],
       [4.22103531e-02, 2.95766392e-01],
       [1.82629711e-04, 8.85755414e-01]])

In [None]:
k=100
N, M = k, k
a = np.empty(k*k).reshape(N, M)
b=np.random.rand(k*k).reshape(N,M)
c=np.random.rand(k*k).reshape(N,M)
a

array([[0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       ...,
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.]])

In [None]:
import time

In [None]:
#%%timeit

tin = time.time()
for i in range(N):
    for j in range(M):
        a[i, j] = b[i, j] + c[i, j]
tout = time.time()
elapsedt = tout - tin
print("el tiempo de solucion fue de: ", elapsedt)

el tiempo de solucion fue de:  0.005347013473510742


In [None]:
#%%timeit
tin = time.time()
a = b + c
tout = time.time()
elapsedt = tout - tin
print("el tiempo de solucion fue de: ", elapsedt)

el tiempo de solucion fue de:  0.00021219253540039062


In [None]:
print(a)

> ¡1000 veces más rápido! Se hace fundamental **vectorizar** las operaciones y aprovechar al máximo la velocidad de *NumPy*.

### Indexación de arrays

> Una de las herramientas más importantes a la hora de trabajar con arrays es el indexado. 


> - Consiste en seleccionar elementos aislados o secciones de un array. 


> - En este curso se verá la indexación básica, pero existen técnicas de indexación avanzada que convierten los arrays en herramientas potentísimas.

In [None]:
a = np.array([[1, 2, 3],[4,5,6],[7,8,9]])
print(a)

[[1 2 3]
 [4 5 6]
 [7 8 9]]


> Los índices se indican entre corchetes justo después del array. 


> - Recuerda que en Python la indexación empieza en 0. 

> - Si recuperamos el primer elemento de un array de dos dimensiones, obtenemos la primera fila.

In [None]:
a[2][1]
a[2,1]

8

In [None]:
a[2]

3

> En vez de usar *a*[0][0] para recuperar el primer elemento de la primera fila, podemos abreviar aún más la sintaxis:

In [None]:
print(a)
a[0, 0]

> No solo podemos recuperar un elemento aislado, sino también porciones del array, utilizando la sintaxis `[<inicio>:<final>:<salto>]`.

In [None]:
a[0, 1:3]

array([2, 3])

In [None]:
a[:, 0:1]

array([[1],
       [4],
       [7]])

### Creación de arrays

> Muchos métodos y muy variados

> - A partir de datos existentes: `array`, `copy`
> - Unos y ceros: `empty`, `eye`, `ones`, `zeros`, `*_like`
> - Rangos: `arange`, `linspace`, `logspace`, `meshgrid`
> - Aleatorios: `rand`, `randn`

In [None]:
b = np.logspace(1,10,19)
print(b)

### Unos y ceros

> - `empty(shape)` crea un array con «basura», equivalente a no inicializarlo, ligeramente más rápido que `zeros` o `ones`
> - `eye(N, M=None, k=0)` crea un array con unos en una diagonal y ceros en el resto
> - `identity(n)` devuelve la matriz identidad
> - Las funciones `*_like(a)` construyen arrays con el mismo tamaño que uno dado

In [None]:
a=np.identity(5).astype(int)
a

array([[1, 0, 0, 0, 0],
       [0, 1, 0, 0, 0],
       [0, 0, 1, 0, 0],
       [0, 0, 0, 1, 0],
       [0, 0, 0, 0, 1]])

In [None]:
a.shape

(5, 5)

> Si la función recibe como argumento *shape*, debemos pasarle el número de filas y columnas como una tupla (es decir, encerrado entre paréntesis).

In [None]:
np.identity(10)

array([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]])

> <div class="alert alert-warning">**Nota**: Un error muy típico es tratar de construir un array llamando a la función con dos argumentos, como se ejemplifica en la celda siguiente. Esto produce un error, porque NumPy espera un solo argumento: una tupla con el número de filas y el número de columnas. Es conveniente asegurarse de cuál es el convenio en cada caso porque no siempre hay consistencia interna.</div>

In [None]:
np.zeros((3, 4))

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [None]:
np.ones((3, 4))

array([[1., 1., 1., 1.],
       [1., 1., 1., 1.],
       [1., 1., 1., 1.]])

In [None]:
i3 = np.identity(3)
i3

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

In [None]:
i3.shape

(3, 3)

In [None]:
np.ones(i3.shape)

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

> Si en lugar de pasar directamente la forma del array ya sabemos que queremos crear un array con la misma forma que otro, podemos usar las funciones `*_like`, que reciben un array en vez de una tupla.

In [None]:
np.ones_like(i3)

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

### Rangos

> - `linspace(start, stop, num=50)` devuelve números equiespaciados dentro de un intervalo
> - `logspace(start, stop, num=50, base=10.0)` devuelve números equiespaciados según una escala logarítmica
> - `meshgrid(x1, x2, ...)` devuelve matrices de n-coordenadas

In [None]:
np.linspace(0, 1, num=11)

array([0. , 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1. ])

In [None]:
np.logspace(0, 3, num=10)

array([   1.        ,    2.15443469,    4.64158883,   10.        ,
         21.5443469 ,   46.41588834,  100.        ,  215.443469  ,
        464.15888336, 1000.        ])

> La función *np.meshgrid* se utiliza mucho a la hora de representar funciones en dos dimensiones, y crea dos arrays: uno varía por filas y otro por columnas. Combinándolos, podemos evaluar la función en un cuadrado.

In [None]:
x = np.linspace(0, 1, num=5)
y = np.linspace(0, 1, num=5)

xx, yy = np.meshgrid(x, y)

In [None]:
xx, yy

(array([[0.  , 0.25, 0.5 , 0.75, 1.  ],
        [0.  , 0.25, 0.5 , 0.75, 1.  ],
        [0.  , 0.25, 0.5 , 0.75, 1.  ],
        [0.  , 0.25, 0.5 , 0.75, 1.  ],
        [0.  , 0.25, 0.5 , 0.75, 1.  ]]),
 array([[0.  , 0.  , 0.  , 0.  , 0.  ],
        [0.25, 0.25, 0.25, 0.25, 0.25],
        [0.5 , 0.5 , 0.5 , 0.5 , 0.5 ],
        [0.75, 0.75, 0.75, 0.75, 0.75],
        [1.  , 1.  , 1.  , 1.  , 1.  ]]))

In [None]:
xx + 1j * yy

In [None]:
import numpy as np

### Operaciones con arrays

> Las **funciones universales** (`ufunc`) operan sobre arrays de NumPy elemento a elemento y siguiendo las reglas de _broadcasting_.

> - Funciones matemáticas: `sin`, `cos`, `sqrt`, `exp`, ...
> - Operaciones lógicas: `<`, `~`, ...
> - Funciones lógicas: `all`, `any`, `isnan`, `allclose`, ...

> <div class="alert alert-warning">**Nota**: Las funciones matemáticas siempre devuelven el mismo tipo de datos de entrada</div>

In [None]:
a = np.arange(start=6, stop=18, step=2)
a

array([ 6,  8, 10, 12, 14, 16])

In [None]:
a.shape

(6,)

In [None]:
np.arange(-3, 3).astype(float)

array([-3., -2., -1.,  0.,  1.,  2.])

In [None]:
a = np.arange(6,18,2).reshape(2, 3)
a

array([[ 6,  8, 10],
       [12, 14, 16]])

In [None]:
np.sqrt(a)

array([[2.44948974, 2.82842712, 3.16227766],
       [3.46410162, 3.74165739, 4.        ]])

In [None]:
np.sqrt(np.arange(6, 18,2).reshape(2, 3))

array([[2.44948974, 2.82842712, 3.16227766],
       [3.46410162, 3.74165739, 4.        ]])

In [None]:
np.sqrt(_)

array([[1.56508458, 1.68179283, 1.77827941],
       [1.86120972, 1.93433642, 2.        ]])

### Funciones de comparación

> Las comparaciones devuelven un array de booleanos:

In [None]:
a = np.arange(6)
b = np.ones(6).astype(int)
a, b

(array([0, 1, 2, 3, 4, 5]), array([1, 1, 1, 1, 1, 1]))

In [None]:
a < b

array([ True, False, False, False, False, False])

In [None]:
np.any(a < b)

True

In [None]:
np.all(a < b)

False

In [None]:
a = np.arange(6).astype(float)
b = np.ones(6)
a, b

(array([0., 1., 2., 3., 4., 5.]), array([1., 1., 1., 1., 1., 1.]))

> Las funciones `isclose` y `allclose` realizan comparaciones entre arrays especificando una tolerancia:

In [None]:
np.isclose(a, b, rtol=1e-6)

array([False,  True, False, False, False, False])

In [None]:
np.allclose(a, b, rtol=1e-6)

> <div class="alert alert-error">**¡Importante!** Ni en Python ni en ningún otro lenguaje debemos hacer comparaciones exactas entre números de punto flotante. Las operaciones matemáticas con estos números producen casi siempre resultados poco intuitivos y hay que tener cuidado con ellas. Para una introducción a estas peculiaridades existe la web http://puntoflotante.org/. </div>

In [None]:
0.1 + 0.2 + 0.3

In [None]:
0.3 + 0.2 + 0.1

In [None]:
0.1 + 0.2 + 0.3 == 0.3 + 0.2 + 0.1

## Ejercicios

### Ejercicio 1.

1. Crear un array `z1` 3x4 lleno de ceros de tipo entero.
2. Crear un array `z2` 3x4 lleno de ceros salvo la primera fila que serán todo unos.
3. Crear un array `z3` 3x4 lleno de ceros salvo la última fila que será el rango entre 5 y 8.

In [None]:
import numpy
z1=numpy.zeros((3,4)).astype(int)
z1

array([[0, 0, 0, 0],
       [0, 0, 0, 0],
       [0, 0, 0, 0]])

In [None]:
z2=numpy.zeros((3,4)).astype(int)
z2
z2[0,:]=1
z2

array([[1, 1, 1, 1],
       [0, 0, 0, 0],
       [0, 0, 0, 0]])

In [None]:
z3=numpy.zeros((3,4)).astype(int)
z3
z3[2,:]=np.linspace(5, 8, num=4)
z3

array([[0, 0, 0, 0],
       [0, 0, 0, 0],
       [5, 6, 7, 8]])

In [None]:
seq = np.random.randint(0, 100, size=10)
seq

array([ 5, 78, 94, 65, 39, 93, 14, 21, 17, 55])

### Ejercicio 2.

1. Crea un vector de 10 elementos, siendo los impares unos y los pares doses.
2. Crea un «tablero de ajedrez», con unos en las casillas negras y ceros en las blancas.

### Ejercicio 3.

1. Crea una matriz aleatoria 5x5 y halla los valores mínimo y máximo.
2. Normaliza esa matriz entre 0 y 1.

In [None]:
a + 1

array([2, 3, 4, 5])

In [None]:
2**a

array([ 2,  4,  8, 16])

In [None]:
a = np.array([1, 2, 3, 4])
a

array([1, 2, 3, 4])

In [None]:
b = np.ones(4) + 1
b

array([2., 2., 2., 2.])

In [None]:
a - b

array([-1.,  0.,  1.,  2.])

In [None]:
a * b

array([2., 4., 6., 8.])

In [None]:
j = np.arange(5)
j

array([0, 1, 2, 3, 4])

In [None]:
2**(j + 1) - j

array([ 2,  3,  6, 13, 28])

## Bibliografía

* Documentación de NumPy http://docs.scipy.org/doc/numpy
* Travis Oliphant, "Guide to NumPy" http://csc.ucdavis.edu/~chaos/courses/nlp/Software/NumPyBook.pdf
* SciPy Lecture Notes http://scipy-lectures.github.io
* Nicolas Rougier, "100 NumPy exercises" http://www.loria.fr/~rougier/teaching/numpy.100/index.html