# Introducción a Numpy

<img src='figuras/numpy_logo.png' width="50%"/>

NumPy es el paquete fundamental para la computación científica con Python. Contiene, entre otras cosas:

* un poderoso objeto de matrice de N-dimensiones
* funciones sofisticadas (broadcasting)
* herramientas para integrar el código C/C ++ y Fortran
* capacidades utiles en álgebra lineal, transformada de Fourier y números aleatorios

Además de sus usos científicos obvios, NumPy también se puede usar como un contenedor multidimensional eficiente de datos genéricos. Se pueden definir tipos de datos arbitrarios. Esto permite a NumPy integrarse de manera rápida y sin problemas con una amplia variedad de bases de datos.

## Diferencia entre una variable en C y en Python

La diferencia entre una variable C (estoy usando C como un representante para lenguajes compilados) y una variable Python se resume en este diagrama:

<img src="figuras/cint_vs_pyint.png" width="50%">

## Numpy

Numpy es la biblioteca principal para la computación científica en Python. Proporciona un objeto arreglo multidimensional de alto rendimiento y herramientas para trabajar con estos arreglos.

Para usar Numpy, Primero necesitamos importar el paquete `numpy`:

In [None]:
import numpy as np

### Arreglos

Una matriz numpy es una cuadrícula de valores, todos del mismo tipo, e indexada por una tupla de enteros no negativos. El número de dimensiones es el rango de la matriz; La forma de una matriz es una tupla de enteros que da el tamaño de la matriz a lo largo de cada dimensión.

![Picture1.png](attachment:0ff23fb3-be21-4c25-925e-f2e1efb0441d.png)Una matriz NumPy en su forma más simple es un objeto Python construido alrededor de una matriz C. Es decir, tiene un puntero a un búfer de datos contiguo de valores. Una lista de Python, por otro lado, tiene un puntero a un búfer contiguo de punteros, cada uno de los cuales apunta a un objeto Python que a su vez tiene referencias a sus datos (en este caso, enteros). Como se muestra en le siguiente esquema:

<img src="figuras/Picture1.png" width="75%">

Podemos inicializar la matriz numpy de las listas anidadas de Python y acceder a los elementos usando corchetes:

In [None]:
a = np.array([1, 2, 3])  # Crear un arreglo de orden 1
print(type(a), a.shape, a[0], a[1], a[2])
a[0] = 5                 # Cambiar un elemento del arreglo
print(a)               

In [None]:
a.shape

In [None]:
a.reshape(3,1)

In [None]:
b = np.array([[1,2,3],[4,5,6]])   # Crear un arreglo de orden 2 (matriz)
print(b)

In [None]:
b.shape


In [None]:
b.size

In [None]:
print (b.shape)                   
print (b[0, 0], b[0, 1], b[1, 0])

Numpy también proporciona muchas funciones para crear matrices:

In [None]:
a = np.zeros((5,5))  # Crear una matriz de ceros
print (a)

In [None]:
b = np.ones((4,5))   # Crear una matriz de unos
print (b)

In [None]:
b.shape

In [None]:
OTRA = b*7
OTRA

In [None]:
c = np.full((4,5), 7) # Crear una matriz de constantes
print (c) 

In [None]:
d = np.eye(5)        # Crear una matriz de indentidad 2x2
print (d)

In [None]:
e = np.random.random((4,2)) # Crear una matriz con valores aleatorios
print (e)

In [None]:
e = np.random.randint(5,size=(3,2)) # Crear una matriz con valores aleatorios
print (e)

In [None]:
f = np.empty((2, 3))  # Crear una matriz vacía, con valores residuales de la memoria
print (f)

### Indexado de las matrices

Numpy ofrece varias formas de indexar las matrices.

- Mediante Rebanado (Slicing): Similar a las listas de Python, las matrices numpy se pueden cortar. Dado que las matrices pueden ser multidimensionales, debe especificar una división para cada dimensión de la matriz:

In [None]:
import numpy as np

# Crear la siguiente matriz de orden 2 con forma (3, 4)
# [[ 1  2  3  4]
#  [ 5  6  7  8]
#  [ 9 10 11 12]]
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
print(a)
# Usando rebanado extraer la sub-matrix que consta de las primeras 2 filas
# y las columnas 1 y 2
# [[2 3]
#  [6 7]]
b = a[:2, 1:3]
print (b)

Una porción de una matriz es una vista de los mismos datos, por lo que la modificación modificará la matriz original.

In [None]:
print (a[0, 1])  
b[0, 0] = 77    # b[0, 0] es el mismo dato que a[0, 1]
b *=2
print (b) 
print(a)

In [None]:
print(a)

**Nota**: Si necesitas una copia independiente (que no afecte al array original), debes usar copy(), por ejemplo:

In [None]:
c = a[:2, 1:3].copy()

In [None]:
print(c)

In [None]:
c += 5
print(c)

In [None]:
print(a)

También puede mezclar índices enteros con indexación por sectores. Sin embargo, al hacerlo, se obtendrá una matriz de menor orden que la matriz original:

In [None]:
# Crear la siguiente matrix de orden 2 con forma (3, 4)
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
print (a)
c = a[2,1:3]
print(c)
print(c.shape)

In [None]:
c = c * 2    # OJO A LA DIFERECIA ENTRE c *= 2 (in-place)  y  c = c * 2  (no in-place)
print(c)

In [None]:
print(a)

Dos formas de acceder a los datos en la fila central de la matriz. La mezcla de índices enteros con rebanadas produce una matriz de menor orden, mientras que el uso de sólo rebanadas produce una matriz del mismo orden que la matriz original:

In [None]:
row_r1 = a[1, :]    # Orden 1 vista de la segunda fila de a  
row_r2 = a[1:2, :]  # Orden 2 vista de la segunda fila de a
row_r3 = a[[1],:]  # Orden 2 vista de la segunda fila de a 
print (row_r1, row_r1.shape) 
print (row_r2, row_r2.shape)
print (row_r3, row_r3.shape)

In [None]:
# Podemos hacer la misma distinción al acceder a las columnas de una matriz:
col_r1 = a[:, 1]
col_r2 = a[:, 1:2]
print (col_r1, col_r1.shape)
print (col_r2, col_r2.shape)

**Indexación de matriz con números enteros:** Cuando se indexa en matrices numpy utilizando rebanado, la vista de la matriz resultante siempre será una sub-matriz de la matriz original. Por el contrario, la indexación de matriz con números enteros permite construir matrices arbitrarias utilizando los datos de otra matriz. Por ejemplo:

In [None]:
a = np.array([[1,2], [3, 4], [5, 6]])
print(a)
# Un ejemplo con indexado entero.
# La matriz resultante tendra la forma (3,) y 
print (a[[0, 1, 2], [0, 1, 0]])

# El ejemplo de arriba con indexado entero es equivalente a:
print (np.array([a[0, 0], a[1, 1], a[2, 0]]))

In [None]:
# Cuando utilice la indexación de matriz con números enteros, puede reutilizar el mismo
# elemento de la matriz original:
print (a[[0, 0], [1, 1]])

# Equivalente al ejemplo previo de indexado de matriz con números enteros
print (np.array([a[0, 1], a[0, 1]]))

Un truco útil con la indexación de matriz con números enteros es la selección o mutación de un elemento de cada fila de una matriz:

In [None]:
# Crear una matriz de la cual seleccionaremos elementos
a = np.array([[1,2,3], [4,5,6], [7,8,9], [10, 11, 12]])
print (a)

In [None]:
# Crear un arreglo de indices
b = np.array([0, 2, 0, 1])

# Seleccionar un elemento de cada fila usando los indices en b
print (a[np.arange(4), b])  # Imprime "[ 1  6  7 11]"

In [None]:
# Mutar un elemento de cada fila de a usando los índices en b
a[np.arange(4), b] += 10
print (a)

**Indexación boolena de matriz:** La indexación boleana de matriz permite seleccionar elementos arbitrarios de una matriz. Con frecuencia, este tipo de indexación se utiliza para seleccionar los elementos de una matriz que satisfacen alguna condición. Por ejemplo:

In [None]:
#import numpy as np

a = np.array([[1,2], [3, 4], [5, 6]])

bool_idx = (a > 3)  # Encontrar los elementos de a que sean mayores que 2;
                    # Esto devuelve una matriz numpy de booleanos con la misma
                    # forma que a, donde cada celda de bool_idx indica
                    # si ese elemento de a es > 2.
print(a)
print (bool_idx)

In [None]:
# Utilizamos indexación booleana de matriz para construir una matriz de rango 1
# Consistente en los elementos de a correspondientes a los valores Verdaderos
# de bool_idx
print (a[bool_idx])

# Podemos hacer todo lo anterior en una sola declaración concisa:
print (a[a > 3])

In [None]:
print(a)

In [None]:
c = a[a > 3]
print(c)

In [None]:
c[0] = 10
print(c)
print(a)

### Tipos de Datos

Cada matriz numpy es una cuadrícula de elementos del mismo tipo. Numpy proporciona una gran diversidad de tipos de datos numéricos que puede utilizar para construir matrices. Numpy intenta adivinar un tipo de datos cuando se crea una matriz, pero las funciones que construyen matrices también suelen incluir un argumento opcional para especificar explícitamente el tipo de datos. Por ejemplo:

In [None]:
x = np.array([1, 2])  # Deja que numpy elija el tipo de datos
y = np.array([1.0, 2.0])  # Deja que numpy elija el tipo de datos
z = np.array([1, 2], dtype=np.float64)  # Forzar un tipo de datos particular

print (x.dtype, y.dtype, z.dtype)

Puede leer todo acerca de los tipos de datos numpy en la [documentación](http://docs.scipy.org/doc/numpy/reference/arrays.dtypes.html).

### Matemática con Matrices

Las funciones matemáticas básicas operan por cada elemento de las matrices, y están disponibles tanto como operadores sobrecargados o como funciones en el módulo numpy:

In [None]:
x = np.array([[1,2],[3,4]], dtype=np.float64)
y = np.array([[5,6],[7,8]], dtype=np.float64)
print(x)
print(y)
# Suma por elementos; ambas producen la matriz
print (x + y)
print (np.add(x, y))

In [None]:
# Resta por elementos; ambas producen la matriz
print (x - y)
print (np.subtract(x, y))

In [None]:
# Multiplicación por elementos; ambas producen la matriz
print(x)
print("=======")
print(y)
print("=======")
print (x * y)
print (np.multiply(x, y))

In [None]:
# División por elementos; ambas producen la matriz
# [[ 0.2         0.33333333]
#  [ 0.42857143  0.5       ]]
print (x / y)
print (np.divide(x, y))

In [None]:
# Raiz cuadrada por elementos; produce la matriz
# [[ 1.          1.41421356]
#  [ 1.73205081  2.        ]]
print (np.sqrt(x))   

**Tenga en cuenta que a diferencia de MATLAB**, * es multiplicación elemento por elemento, no es multiplicación de matrices. Utilizamos la función `dot` para calcular productos internos de vectores, multiplicar un vector por una matriz y multiplicar matrices. `dot` está disponible tanto como una función en el módulo `numpy` como un método de instancia de objetos de matriz:

In [None]:
x = np.array([[1,2],[3,4]])
y = np.array([[5,6],[7,8]])

v = np.array([9,10])  # 1 x 2  1 X 2
w = np.array([11, 12])
# Producto interno de vectores; ambas producen 219
print (v.dot(w))
print (np.dot(v, w))
print (v @ w)
v

In [None]:
# Producto de Matriz por vector; ambas producen la matrix de rango 1 [29 67]
print (x.dot(v))
print (np.dot(x, v))

In [None]:
# Producto de Matriz por Matriz; ambas producen la matrix de rango 1
# [[19 22]
#  [43 50]]
print (x.dot(y))
print (np.dot(x, y))

In [None]:
a = np.array([[3,2,1],[4,5,6]])
print(a)

In [None]:
b = np.array([[5,1,1],[4,1,6]])
print(b)
print("====")
print(b.T)

In [None]:
c = a @ b

In [None]:
r = a.dot(b.T)
print(r)

In [None]:
b.T

In [None]:
a.shape

In [None]:
(b.T).shape

In [None]:
r = a @ b.T
r

In [None]:
r2 = b.T @ a
r2

Numpy proporciona muchas funciones útiles para realizar cálculos en matrices; Una de los más útiles es `sum`:

In [None]:
x = np.array([[1,21],[3,4]])
print(x)
print("==========")
print (np.mean(x))  # Calcular la suma de todos los elementos; imprime "10"
print (np.mean(x, axis=0))  # Calcular la suma de cada columna; imprime "[4 6]"
print (np.mean(x, axis=1))  # Calcular la suma de cada fila; imprime "[3 7]"

Puede encontrar las funciones matemáticas proporcionadas por numpy en la [documentación](http://docs.scipy.org/doc/numpy/reference/routines.math.html).

Aparte de la computación de funciones matemáticas utilizando matrices, con frecuencia necesitamos cambiar la forma o de otra manera manipular datos en matrices. El ejemplo más simple de este tipo de operación es la transposición de una matriz; Para transponer una matriz, simplemente use el atributo T de un objeto de matriz:

In [None]:
print (x)
print (x.T)



In [None]:
v = np.array([[1,2,3]])
print (v) 
print (v.T)

### Broadcasting

Broadcasting es un potente mecanismo que permite a numpy trabajar con matrices de diferentes formas al realizar operaciones aritméticas. Con frecuencia tenemos una matriz más pequeña y una matriz más grande, y queremos usar la matriz más pequeña varias veces para realizar alguna operación en la matriz más grande.

Por ejemplo, supongamos que queremos agregar un vector constante a cada fila de una matriz. Podríamos hacerlo así:

In [None]:
# Sumar el vector v a cada fila de la matriz x,
# almacenando el resultado en la matriz y
x = np.array([[1,2,3], [4,5,6], [7,8,9], [10, 11, 12]])
print("======")
print(x)
v = np.array([1, 0, 1])
print("======")
print(v)
y = np.empty_like(x)   # Crear una matriz vacía con la misma forma que x

# Sume el vector v a cada fila de la matriz x con un bucle explícito
for i in range(4):
    y[i, :] = x[i, :] + v

print (y)

Esto funciona; Sin embargo, cuando la matriz `x` es muy grande, el cálculo de un bucle explícito en Python podría ser lento. Tenga en cuenta que la adición del vector `v` a cada fila de la matriz `x` es equivalente a formar una matriz `vv` apilando múltiples copias de `v` verticalmente, realizando entonces la suma elemental de `x` y `vv`. Podríamos implementar este enfoque de la siguiente manera:

In [None]:
vv = np.tile(v, (4, 1))  # Apilar 4 copias de v una encima de otra
print (vv)               # Imprime "[[1 0 1]
                         #          [1 0 1]
                         #          [1 0 1]
                         #          [1 0 1]]"

In [None]:
y = x + vv  # Sumar x y vv elemento por elemento
print (y)

Numpy broadcasting nos permite realizar este cálculo sin realmente crear múltiples copias de `v`. Considere esta versión, utilizando la broadcasting:

In [None]:
# Sumar el vector v a cada fila de la matriz x,
# almacenando el resultado en la matriz y
x = np.array([[1,2,3], [4,5,6], [7,8,9], [10, 11, 12]])
v = np.array([1, 0, 1])
y = x + v  # Sumar v a cada fila de x usando broadcasting
print (y)

Por lo general, broadcasting hace que su código sea más conciso y rápido, por lo que debe esforzarse por utilizarlo cuando sea posible.

Este breve resumen ha tocado muchas de las cosas importantes que usted necesita saber acerca de numpy, pero está lejos de ser completa. Revise la [referencia de numpy](http://docs.scipy.org/doc/numpy/reference/) para averiguar mucho más sobre numpy.

In [None]:
x

In [None]:
y = x + 1

In [None]:
y
