## ¿Qué es NumPy?

NumPy es una libreria de bajo nivel, escrita en C (y FORTRAN) para funciones matemáticas de alto nivel. De una manera muy inteligente NumPy resuleve el problema de correr algoritmos muy lentos en Python, utilizando Arrays multidimensionales y funciones que operan en esos arreglos.

NumPy forma parte del proyecto SciPy, y está liberado como una libreria aparte para que las personas que solo necesitan los requerimientos básicos puedan hacer uso de ella sin tner que instalar el resto de SciPy.

Python está organizado en módulos, que son archivos con extensión .py que contienen funciones, variables y otros objetos, y paquetes, que son conjuntos de módulos. Cuando queremos utilizar objetos que están definidos en un módulo tenemos que importarlo, y una vez que lo hemos hecho podemos usar el operador . para ir descendiendo en la jerarquía de paquetes y acceder al objeto que necesitamos. Por ejemplo, de esta manera importamos NumPy:

In [1]:
import numpy

Y de esta manera accedemos a la función norm, que calcula la norma (o módulo) de un array:

In [2]:
numpy.linalg.norm

<function numpy.linalg.norm(x, ord=None, axis=None, keepdims=False)>

La función norm está dentro del paquete linalg, que a su vez está dentro del paquete NumPy.


La convención para importar NumPy siempre es esta:

In [2]:
import numpy as np

## Constantes y funciones matemáticas

Además de arrays, NumPy contiene también constantes y funciones matemáticas de uso cotidiano.

In [3]:
np.e

2.718281828459045

In [5]:
np.pi

3.141592653589793

In [6]:
np.log(2)

0.6931471805599453

## ¿Qué es un Array?

El objeto principal de NumPy es el arreglo multidimensional homogénea. Es una tabla de elementos (generalmente números), todos del mismo tipo, indexados por una tupla de enteros no negativos. En NumPy las dimensiones se llaman ejes.

Por ejemplo, las coordenadas de un punto en el espacio 3D [1, 2, 1] tienen un eje. Ese eje tiene 3 elementos, por lo que decimos que tiene una longitud de 3.

In [7]:
np.array([1, 2, 3])

array([1, 2, 3])



Los arrays de NumPy son homogéneos, es decir, todos sus elementos son del mismo tipo. Si le pasamos a np.array una secuencia con objetos de tipos diferentes, promocionará todos al tipo con más información. Para acceder al tipo del array, podemos usar el atributo dtype.


In [8]:
a = np.array([1, 2, 3.0])
print(a.dtype)

float64




NumPy intentará automáticamente construir un array con el tipo adecuado teniendo en cuenta los datos de entrada, aunque nosotros podemos forzarlo.


In [9]:
np.array([1, 2, 3], dtype=float)

array([1., 2., 3.])

In [10]:
np.array([1, 2, 3], dtype=complex)

array([1.+0.j, 2.+0.j, 3.+0.j])



También podemos convertir un array de un tipo a otro utilizando el método .astype.


In [11]:
a

array([1., 2., 3.])

In [12]:
a.astype(int)

array([1, 2, 3])

## Eficiencia

• Los bucles en Python son lentos

• Eliminar bucles: Vectorizar las operaciones

• Los bucles se ejecutan en Python, las operaciones vectorizadas en C

• Las operaciones entre arrays de NumPy se realizan elemento a elemento

 Ejemplo: $aij=bij+cij$

In [13]:
N, M = 100, 100
a = np.empty(10000).reshape(N, M)
b = np.random.rand(10000).reshape(N, M)
c = np.random.rand(10000).reshape(N, M)

In [14]:
%%timeit
for i in range(N):
    for j in range(M):
        a[i, j] = b[i, j] + c[i, j]

32.1 ms ± 6.35 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [15]:
%%timeit
a = b + c

58 µs ± 9.96 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


¡1000 veces más rápido! Se hace fundamental vectorizar las operaciones y aprovechar al máximo la velocidad de NumPy.

## Indexación de Arrays

Una de las herramientas más importantes a la hora de trabajar con arrays es el indexado. Consiste en seleccionar elementos aislados o secciones de un array.

In [16]:
a = np.array([
    [1, 2, 3],
    [4, 5, 6]
])
a

array([[1, 2, 3],
       [4, 5, 6]])

Los índices se indican entre corchetes justo después del array. Si recuperamos el primer elemento de un array de dos dimensiones, obtenemos la primera fila.

In [17]:
a[0]

array([1, 2, 3])



En vez de usar a[0][0] para recuperar el primer elemento de la primera fila, podemos abreviar aún más la sintaxis:


In [18]:
a[ 0 , 0 ]

1



No solo podemos recuperar un elemento aislado, sino también porciones del array, utilizando la sintaxis [< inicio>:< final>:< salto>].


In [20]:
a[0,1:3]

array([2, 3])

In [21]:
a[0,::2]

array([1, 3])

## Creación de Arrays

Muchos métodos y muy variados:

    • A partir de datos existentes: array, copy
    • Unos y ceros: empty, eye, ones, zeros, *_like
    • Rangos: arange, linspace, logspace, meshgrid
    • Aleatorios: rand, randn

### Unos y ceros


    • empty(shape) crea un array con «basura», equivalente a no inicializarlo, ligeramente más rápido que zeros o ones
    • eye(N, M=None, k=0) crea un array con unos en una diagonal y ceros en el resto
    • identity(n) devuelve la matriz identidad
    • Las funciones *_like(a) construyen arrays con el mismo tamaño que uno dado


In [23]:
np.identity(5).astype(int)

array([[1, 0, 0, 0, 0],
       [0, 1, 0, 0, 0],
       [0, 0, 1, 0, 0],
       [0, 0, 0, 1, 0],
       [0, 0, 0, 0, 1]])

In [24]:
_.shape

(5, 5)

Si la función recibe como argumento shape, debemos pasarle el número de filas y columnas como una tupla (es decir, encerrado entre paréntesis).

In [25]:
np.zeros((3, 4))

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [None]:
np.zeros(3, 4)

In [None]:
np.ones((3, 4))

In [26]:
i3 = np.identity(3)
i3

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

In [27]:
i3.shape

(3, 3)

In [28]:
np.ones(i3.shape)

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

Si en lugar de pasar directamente la forma del array ya sabemos que queremos crear un array con la misma forma que otro, podemos usar las funciones *_like, que reciben un array en vez de una tupla.

In [29]:
np.ones_like(i3)

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

### Rangos

    • linspace(start, stop, num=50) devuelve números equiespaciados dentro de un intervalo
    • logspace(start, stop, num=50, base=10.0) devuelve números equiespaciados según una escala logarítmica
    • meshgrid(x1, x2, ...) devuelve matrices de n-coordenadas


In [32]:
np.linspace(1, 10, num=10)

array([ 1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.])

In [33]:
np.logspace(0, 3)

array([   1.        ,    1.1513954 ,    1.32571137,    1.52641797,
          1.75751062,    2.02358965,    2.32995181,    2.6826958 ,
          3.0888436 ,    3.55648031,    4.09491506,    4.71486636,
          5.42867544,    6.25055193,    7.19685673,    8.28642773,
          9.54095476,   10.98541142,   12.64855217,   14.56348478,
         16.76832937,   19.30697729,   22.22996483,   25.59547923,
         29.47051703,   33.93221772,   39.06939937,   44.98432669,
         51.79474679,   59.63623317,   68.6648845 ,   79.06043211,
         91.0298178 ,  104.81131342,  120.67926406,  138.94954944,
        159.98587196,  184.20699693,  212.09508879,  244.20530945,
        281.1768698 ,  323.74575428,  372.75937203,  429.19342601,
        494.17133613,  568.9866029 ,  655.12855686,  754.31200634,
        868.51137375, 1000.        ])

La función np.meshgrid se utiliza mucho a la hora de representar funciones en dos dimensiones, y crea dos arrays: uno varía por filas y otro por columnas. Combinándolos, podemos evaluar la función en un cuadrado.

In [34]:
nx, ny = 3, 2
x = np.linspace(0, 1, nx)
x

array([0. , 0.5, 1. ])

In [35]:
y = np.linspace(0, 1, ny)
y

array([0., 1.])

In [37]:
xv, yv = np.meshgrid(x, y)
xv

array([[0. , 0.5, 1. ],
       [0. , 0.5, 1. ]])

In [38]:
yv

array([[0., 0., 0.],
       [1., 1., 1.]])

## Operaciones con Arrays

Las funciones universales (ufunc) operan sobre arrays de NumPy elemento a elemento y siguiendo las reglas de broadcasting.

    • Funciones matemáticas: sin, cos, sqrt, exp, ...
    • Operaciones lógicas: <, ~, ...
    • Funciones lógicas: all, any, isnan, allclose, ...


In [40]:
a = np.arange(2 * 3).reshape(2, 3)
a

array([[0, 1, 2],
       [3, 4, 5]])

In [41]:
np.sqrt(a)

array([[0.        , 1.        , 1.41421356],
       [1.73205081, 2.        , 2.23606798]])

In [42]:
np.sqrt(np.arange(-3, 3))

  """Entry point for launching an IPython kernel.


array([       nan,        nan,        nan, 0.        , 1.        ,
       1.41421356])

In [43]:
np.arange(-3, 3).astype(complex)

array([-3.+0.j, -2.+0.j, -1.+0.j,  0.+0.j,  1.+0.j,  2.+0.j])

In [44]:
np.sqrt(_)

array([0.        +1.73205081j, 0.        +1.41421356j,
       0.        +1.j        , 0.        +0.j        ,
       1.        +0.j        , 1.41421356+0.j        ])

## Funciones de comparación

Las comparaciones devuelven un array de booleanos:

In [4]:
a = np.arange(6)
b = np.ones(6).astype(int)
a, b

(array([0, 1, 2, 3, 4, 5]), array([1, 1, 1, 1, 1, 1]))

In [5]:
a < b

array([ True, False, False, False, False, False])

In [6]:
np.any(a < b)

True

In [7]:
np.all(a < b)

False

In [8]:
a = np.arange(6).astype(float)
b = np.ones(6)
a, b

(array([0., 1., 2., 3., 4., 5.]), array([1., 1., 1., 1., 1., 1.]))

Las funciones isclose y allclose realizan comparaciones entre arrays especificando una tolerancia:

In [9]:
np.isclose(a, b, rtol=1e-6)

array([False,  True, False, False, False, False])

In [10]:
np.allclose(a, b, rtol=1e-6)

False


**¡Importante!** Ni en Python ni en ningún otro lenguaje debemos hacer comparaciones exactas entre números de punto flotante. Las operaciones matemáticas con estos números producen casi siempre resultados poco intuitivos y hay que tener cuidado con ellas.

In [11]:
0.1 + 0.2 + 0.3

0.6000000000000001

In [12]:
0.3+0.2+0.1

0.6

In [13]:
0.1+0.2+0.3==0.3+0.2+0.1

False


## Ejemplos

### Ejercicio 1.

    Crear un array z1 3x4 lleno de ceros de tipo entero.
    Crear un array z2 3x4 lleno de ceros salvo la primera fila que serán todo unos.
    Crear un array z3 3x4 lleno de ceros salvo la última fila que será el rango entre 5 y 8.



In [15]:
a = np.zeros((3,4))
a

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [17]:
a[0,:]=1
a

array([[1., 1., 1., 1.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [18]:
b=np.zeros((3,4))
b[-1]=np.arange(5,9)
b

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [5., 6., 7., 8.]])



### Ejemplos 2


    1. Crea un vector de 10 elementos, siendo los impares unos y los pares doses.
    2. Crea un «tablero de ajedrez», con unos en las casillas negras y ceros en las blancas.


In [19]:
v=np.ones(10)
v

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [20]:
v[::2]=2
v

array([2., 1., 2., 1., 2., 1., 2., 1., 2., 1.])

In [21]:
tablero = np.zeros((8, 8))
tablero

array([[0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0.]])

In [24]:
tablero[1::2, ::2] = 1
tablero[::2, 1::2] = 1
tablero

array([[0., 1., 0., 1., 0., 1., 0., 1.],
       [1., 0., 1., 0., 1., 0., 1., 0.],
       [0., 1., 0., 1., 0., 1., 0., 1.],
       [1., 0., 1., 0., 1., 0., 1., 0.],
       [0., 1., 0., 1., 0., 1., 0., 1.],
       [1., 0., 1., 0., 1., 0., 1., 0.],
       [0., 1., 0., 1., 0., 1., 0., 1.],
       [1., 0., 1., 0., 1., 0., 1., 0.]])

## Ejercicio.

    Crea una matriz aleatoria 5x5 y halla los valores mínimo y máximo.