# El paquete Numpy

Python se ha colocado como una herramienta computacional que aporta sencillez, productividad, flexibilidad al quehacer científico. El conjunto de paquetes científico que están implementados para Python enriquece la potencia del lenguaje y los científicos de diversas áreas se ven beneficiados considerablemente al abordar sus soluciones mediante Python y su entorno científico. 

## Introducción a NumPy

El paquete _**Numpy**_ es una biblioteca para Python que funciona principalmente con arreglos numéricos `ndarray` + `ufunc`. Los arreglos multidimensionales `ndarray` ofrecen la posibilidad de almacenar datos de manera estructurada. Las funciones universales `ufunc` nos permiten operar con este tipo de datos de manera optimizada y eficiente.

In [1]:
from IPython.display import HTML
HTML('<iframe src=https://www.numpy.org width=900 height=350></iframe>')

Como ya hemos mencionado, la funcionalidad de Python se basea en el uso de módulos que son archivos con extensión `.py`, en estos módulos se han implementado funciones, definido variables y otro tipo de objetos. Los paquetes son conjuntos de módulos. Al importar un módulo se puede tener acceso al conjunto de objetos definidos en él, para esto es necesario utilizar  `import package` y acceder al objeto por medio del operador punto `.`. El operador punto nos permite descender en la jerarquía de paquetes hasta el objeto requerido.

In [None]:
# importacion de NumPy
import numpy

Acceso a la función `randint` que devuelve un número aleatorio entero:

In [None]:
numpy.random.randint

La función `randint` está dentro del paquete `random` que a su vez está dentro del paquete `Numpy`

La convención para importar `NumPy` siempre es la siguiente:

In [None]:
import numpy as np

Se crea un alias del paquete `NumPy` de nombre `np` con la finalidad de abreviar código. Esta forma de organizar las funciones por medio de paquetes (**espacio de nombres**) ayuda a obtener legibilidad en el código y evitar ambigüedades.

Para obtener ayuda de cierto tema con la función utilizamos la función `lookfor()` colocando como argumento el tema buscado.

In [None]:
np.lookfor('random')

## Constantes y funciones matemáticas

In [None]:
np.pi

In [None]:
np.e

In [None]:
np.log(2)

In [None]:
np.log(np.e)

## Arrays de NumPy

Un array de NumPy es una colección de `N` elementos de dimensión `D`. De la misma forma que un ebjeto iterable en los elementos del array son indexables y extraíbles (*slicing*) como lo son las listas o los objetos range.

Para crear un array de Numpy, la forma más sencilla es pasar una secuencia a la función `np.array()`

In [None]:
np.array([10, 20, 30])

In [88]:
type(np.array([10, 20, 30]))

numpy.ndarray

Los arrays de Numpy son objetos del tipo `ndarray`: *N-dimensional array*

Para acceder al tipo de datos del array se utiliza el atributo `dtype` del objeto `ndarray`

In [89]:
np.array([10, 20, 30]).dtype

dtype('int64')

In [91]:
a = np.array([10, 20, 30])
a.dtype

dtype('int64')

Los tipos de datos contenidos en un array de Numpy son del mismo tipo (**homogéneos**). Si se pasa al constructor del array una lista de objetos de tipos diferentes, `np.array()` promocionará (cast) todos los objetos al tipo de objeto con más información.  

In [None]:
np.array([1, 2, 3.]).dtype

In [None]:
np.array([1, 2, '3'])

NumPy intentará construir un array con el tipo adecuado aunque es posible forzar el tipo del array.

In [None]:
np.array([1, 2, 3], dtype=float)

In [None]:
np.array([1, 2, 3], dtype=complex)

Otra forma de convertir el tipo de un array es usando el método `.astype`

In [None]:
c = np.array([1, 2, 3])
print(c.dtype)

In [None]:
c.astype(float)

## Eficiencia de los ndarrays

La importancia de usar arrays de numpy consiste en la optimización de la eficiencia al hacer cálculos con ellos. Elementos a considerar:
* En Python la ejecución de ciclos es computacionalmente costosa
* Las operaciones con arrays de NumPy se realizan elemento a elemento (**vectorizado**)
* Los ciclos o bucles se ejecutan en Python, las operaciones vectorizadas en lenguaje C
* Se sugiere eliminar ciclos y utilizar operaciones vectorizadas en su lugar



In [None]:
%timeit pass   # magic command. one line

In [None]:
%%timeit   # magic command. block lines
pass

In [None]:
%%timeit
L = []
for n in range(1000):
    L.append(n**2)


**Ejemplo:** Calcular el rendimiento del cálculo de $a_{ij} = b_{ij} + c_{ij}$ cuando se hace por medio de ciclos de Python comparado con el cálculo vectorizado

In [None]:
# definicion de dimensiones
N,M = 100, 100

# crea matrices de elementos

# matriz vacía
a = np.empty(10000).reshape(N, M)

# matrices con elementos aleatorios
b = np.random.rand(10000).reshape(N, M)
c = np.random.rand(10000).reshape(N, M)

In [None]:
%%timeit
for i in range(N):
    for j in range(M):
        a[i,j] = b[i,j] + c[i,j]

In [None]:
%%timeit
a = b + c

## Indexado de arrays

El indexado consiste en seleccionar uno o más elementos de un array. Es uno de los conceptos básicos al momento de trabajar con un los array. Existen distintas técnicas de indexado que potencían los arrays.

Construyamos un array de Numpy por medio de una lista de listas:

In [None]:
a = np.array([[1, 2, 3], [4, 5, 6]])
a

In [None]:
# indexado como lista de listas
a[0][0]

In [None]:
a[1][2]

In [None]:
# indexado abreviado
a[0,0]

In [None]:
# slicing
a[0:2, 1:3]

In [None]:
a[:, 1:3]

Recordar que los índices en Python inician en 0 y al indexar el valor de la izquierda es inclusivo y el de la derecha excluyente.

In [None]:
# indexa por renglón
a[0]

In [None]:
a[1]

In [None]:
a[:]

In [None]:
# indexa por renglón y salta 2 por columna
a[0][0:3:2]

In [None]:
# forma abreviada de la anterior
a[0][::2]

In [None]:
a[:, 0:2]

## Creación de arrays

Existen métodos muy variados para crear arrays:
* A partir de datos existentes: `array`, `copy`
* Unos y Ceros: `empty`, `ones`, `zeros`, `*_like`
* Rangos: `arange`, `linspace`, `logspace`, `meshgrid`
* Aleatorios: `rand`, `randn`


### Unos y Ceros

* `empty(shape)` crea un array con "basura", equivalente a  no inicializarlo, es ligeramente más rápido que `zeros` y `unos`
* `eye(N, N=None, k=0)` crea un array con unos en una diagonal y ceros en el resto
* `identity(n)` devuelve la matriz identidad
* Las funciones `*_like()` constituyen arrays con el mismo tamaño que uno dado

In [None]:
np.empty((3,4))

Esta función no se recomienda ya que pueden quedar valores sin inicializar

In [None]:
np.zeros((3,4))

In [None]:
np.zeros([3,4])

Por convención el argumento `shape` es una tupla con las dimensiones del arreglo

In [None]:
np.ones((3,4))

In [None]:
np.identity(5)

In [None]:
np.identity(5).astype(int)

El método `astype` convierte los elementos de un arreglo a un tipo deseado

In [None]:
np.eye(5)

In [None]:
np.eye(5,5,2)

`eye()` genera una matriz de dimensión 5x5 con 1's en la segunda diagonal

In [None]:
m = np.identity(3)
m

In [None]:
m.shape

In [None]:
np.ones(m.shape)

Utiliza la forma (`shape`) de m y construye una matriz de 1's con esa forma

In [None]:
np.ones_like(m)

`one_like` crea una matriz de 1's con las propiedades de la matriz m

### Rangos
* `linspace(start, stop, num=10)` devuelve números equiespaciados dentro de un intervalo
* `logspace(start, stop, num=10` devuelve números equiespaciados según una escala logarítmica
* `meshgrid(x1, x2, ...)` devuelve matrices de n-coordenadas

In [None]:
np.linspace(0,1)

In [None]:
# genera solo 10 elementos
np.linspace(0, 1, num=10)

In [None]:
#genera una escala logaritmica
np.logspace(0, 3, num=20, base=10)

In [None]:
x = np.linspace(0, 1, num=5)
y = np.linspace(0, 1, num=5)

xx, yy = np.meshgrid(x, y)

In [None]:
xx, yy

`meshgrid` elabora un *grid* o malla de datos de las dimensiones especificadas