Shortcut          | Significado   
------------------|----------------
**CTRL + Enter**  | ejecutar celta 
**SHIFT + Enter** | ejecutar celda y pasar a siguiente
**ALT + Enter**   | ejecutar celda y crear una debajo

![numpy.jpg](attachment:numpy.jpg)

---
# NumPy I - operaciones con arrays

_Ya se han repasado los tipos de datos más básicos que nos ofrece Python: integer, real, complex, boolean, list, tuple... En el notebook 03 al explorar las funciones se hizo una primera aproximación a NumPy._

_En este notebook se entrará con más detalle en NumPy, creando arrays y operando con ellos_.

**Objetivos**:

* Crear arrays manualmente
* Usar las principales funciones para crear arrays
* Operar con arrays: operaciones básicas y Álgebra lineal

---
## ¿Qué es NumPy?

[NumPy](http://www.numpy.org/) es un paquete fundamental para la programación científica que __proporciona un objeto tipo array__ para almacenar datos de forma eficiente y una serie de __funciones__ para operar y manipular esos datos.
Para usar NumPy lo primero que se debe hacer es importarlo:

In [1]:
import numpy as np
np.__version__  # Visualiza la versión que tenemos instalada

'1.14.0'

## El primer array

Un array es un **bloque de memoria**, que permite almacenar datos (vectores, matrices) y acceder a ellos mediante sus índices, pudiendo evaluar funciones en batch, guardar series temporales, discretizaciones espaciales, etc.

¿Qué diferencia tienen con las listas? Son más compactos, "gastan" menos memoria y su acceso está más optimizado (el algoritmo será más rápido con arrays de Numpy). Alex Martelli [lo explica](https://stackoverflow.com/questions/993984/why-numpy-instead-of-python-lists) bien en StackOverflow, y para ver ejemplos, este notebooks de [Aeropython](https://github.com/AeroPython/Curso_AeroPython/blob/master/notebooks_completos/011-NumPy-CaracteristicasArrays.ipynb).

In [7]:
primer_array = np.array([1, 2, 3, 4])  # Array de una dimensión
print(primer_array)

[1 2 3 4]


In [4]:
type(primer_array)  # Comprobar el tipo

numpy.ndarray

In [5]:
primer_array.dtype  # Comprobar el tipo de los datos que contiene

dtype('int32')

Los arrays 1D se crean pasándole una lista como argumento a la función [`np.array`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.array.html). Para crear un array 2D es necesaria una _lista de listas_:

In [5]:
segundo_array = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])  # Array de dos dimensiones
segundo_array

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

<div class="alert alert-info">Se puede indicar fin de línea usando `\`, sin necesidad de escribirlo dentro de paréntesis o corchetes</div>

Esto sería una buena manera de definirlo, de acuerdo con el [PEP 8 (indentation)](http://legacy.python.org/dev/peps/pep-0008/#indentation):

In [4]:
segundo_array = np.array([[1, 2, 3],
                          [4, 5, 6],
                          [7, 8, 9]]) 

## Funciones y constantes de NumPy

NumPy también incorporá __funciones__. Un ejemplo sencillo:

In [8]:
primer_array

array([1, 2, 3, 4])

In [9]:
np.sum(primer_array)  # Suma

10

In [10]:
np.max(primer_array)  # Máximo

4

In [11]:
np.sin(primer_array)

array([ 0.84147098,  0.90929743,  0.14112001, -0.7568025 ])

In [10]:
np.sin(segundo_array)  # Seno

array([[ 0.84147098,  0.90929743,  0.14112001],
       [-0.7568025 , -0.95892427, -0.2794155 ],
       [ 0.6569866 ,  0.98935825,  0.41211849]])

Y algunas __constantes__ útiles:

In [11]:
np.pi, np.e

(3.141592653589793, 2.718281828459045)

## Funciones para crear arrays

La función `np.array()` permite crear arrays con valores introducidos manualmente mediante listas. Numpy incorpora también funciones para generar ciertos tipos de arrays automáticamente.

#### array de ceros

In [12]:
np.zeros(100)  # 1D

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [13]:
np.zeros([10,10])  # 2D

array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]])

<div class="alert alert-info"><strong>Nota:</strong> 
para 1D es válido tanto `np.zeros([5])` como sin corchetes `np.zeros(5)`, pero no lo será para el caso nD
</div>

#### array "vacío"

In [14]:
np.empty(10)

array([2.37663561e-312, 2.58883487e-312, 2.41907520e-312, 2.44029516e-312,
       1.03977794e-312, 1.01855798e-312, 6.79038653e-313, 7.42698527e-313,
       1.03977794e-312, 6.36598741e-314])

<div class="alert alert-error"><strong>Importante:</strong> el array vacío se crea en un tiempo algo inferior al array de ceros. Sin embargo, el valor de sus elementos será arbitrario y dependerá del estado de la memoria. Si se utiliza se debe tener esto en cuenta porque podría introducir resultados erróneos. </div>

#### array de unos

In [15]:
np.ones([3, 2])

array([[1., 1.],
       [1., 1.],
       [1., 1.]])

<div class="alert alert-info"><strong>Nota:</strong> otras funciones útiles son `np.zeros_like` y `np.ones_like`, que generan un array del mismo tamaño y forma que otro usado de referencia</div>

#### array identidad

In [16]:
np.identity(4)

array([[1., 0., 0., 0.],
       [0., 1., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 0., 1.]])

<div class="alert alert-info"><strong>Nota:</strong> también son útiles `np.eye()` y `np.diag()`</div>

In [17]:
np.eye(4, 2)

array([[1., 0.],
       [0., 1.],
       [0., 0.],
       [0., 0.]])

In [18]:
np.diag([1, 2, 3])

array([[1, 0, 0],
       [0, 2, 0],
       [0, 0, 3]])

### Rangos

#### np.arange

Generar un array que recorra de 0 a 5:

In [2]:
a = np.arange(0, 5)
a

array([0, 1, 2, 3, 4])

<div class="alert alert-error">En el resultado anterior es importante resaltar que __el último elemento no es 5 sino 4__</div>

Generar un array que vaya de 0 a 10, en saltos de 3:

In [4]:
np.arange(0, 11, 3)

array([0, 3, 6, 9])

#### np.linspace

Similar a la función de MATLAB:

In [6]:
np.linspace(0, 10, 21)  # divide el intervalo [0, 10] en 20 segmentos

array([ 0. ,  0.5,  1. ,  1.5,  2. ,  2.5,  3. ,  3.5,  4. ,  4.5,  5. ,
        5.5,  6. ,  6.5,  7. ,  7.5,  8. ,  8.5,  9. ,  9.5, 10. ])

In [22]:
np.logspace(0, 10, 7)

array([1.00000000e+00, 4.64158883e+01, 2.15443469e+03, 1.00000000e+05,
       4.64158883e+06, 2.15443469e+08, 1.00000000e+10])

En este caso sí se incluye el último elemento.

### reshape

La función [`np.arange()`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.arange.html) crea "vectores" cuyos elementos tomen valores consecutivos o equiespaciados. Para hacer lo mismo con "matrices" se necesita otra función. Sea el objetivo crear algo la siguiente matriz:

\begin{pmatrix}
    1 & 2 & 3\\ 
    4 & 5 & 6\\
    7 & 8 & 9\\
    \end{pmatrix}
    
* Primero se creará un array 1D con los valores $(1,2,3,4,5,6,7,8,9)$ mediante `np.arange()`.
* Después se le dará forma de array 2D con [`np.reshape(array, (dim0, dim1))`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.reshape.html).

In [23]:
a = np.arange(1, 10)
M = np.reshape(a, [3, 3])
M

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

También funciona como método:

In [24]:
N = a.reshape([3,3])
N

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

<div class="alert alert-info"><strong>Nota:</strong> los métodos son conceptos sociados a la programación orientada a objetos (en Python todo es un objeto). Son funciones especiales en las que el argumento más importante (sobre el que se realiza la acción) se escribe delante seguido de un punto: `<objeto>.método(argumentos)`
</div>

## Operaciones

### Operaciones elemento a elemento

El funcionamiento es el habitual en FORTRAN y MATLAB:

In [9]:
arr = np.arange(11)  # Crea un array
print(arr)
arr + 55   # Suma un número

[ 0  1  2  3  4  5  6  7  8  9 10]


array([55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65])

In [6]:
arr * 2  # Multiplica por un número

array([ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18, 20])

In [7]:
arr ** 2  # Eleva al cuadrado

array([  0,   1,   4,   9,  16,  25,  36,  49,  64,  81, 100], dtype=int32)

In [29]:
# Calcular una función
np.tanh(arr)

array([0.        , 0.76159416, 0.96402758, 0.99505475, 0.9993293 ,
       0.9999092 , 0.99998771, 0.99999834, 0.99999977, 0.99999997,
       1.        ])

<div class="alert alert-info"><strong>Entrenamiento:</strong> se puede comparar la diferencia de tiempo entre realizar la operación en bloque, como ahora, y realizarla elemento a elemento, recorriendo el array con un bucle.</div>

__Si las operaciones involucran dos arrays también se realizan elemento a elemento__

In [7]:
arr1 = np.arange(0, 11)
arr2 = np.arange(20, 31)

print('arr1 = ', arr1)
print('arr2 = ', arr2)

arr1 =  [ 0  1  2  3  4  5  6  7  8  9 10]
arr2 =  [20 21 22 23 24 25 26 27 28 29 30]


In [8]:
arr1 + arr2  # Suma

array([20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40])

In [10]:
arr1 * arr2  # Multiplicación
# Tensorial sería: np.tensordot(arr1, arr2, axes=0)


array([  0,  21,  44,  69,  96, 125, 156, 189, 224, 261, 300])

In [9]:
np.tensordot(arr1, arr2, axes=0)

array([[  0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0],
       [ 20,  21,  22,  23,  24,  25,  26,  27,  28,  29,  30],
       [ 40,  42,  44,  46,  48,  50,  52,  54,  56,  58,  60],
       [ 60,  63,  66,  69,  72,  75,  78,  81,  84,  87,  90],
       [ 80,  84,  88,  92,  96, 100, 104, 108, 112, 116, 120],
       [100, 105, 110, 115, 120, 125, 130, 135, 140, 145, 150],
       [120, 126, 132, 138, 144, 150, 156, 162, 168, 174, 180],
       [140, 147, 154, 161, 168, 175, 182, 189, 196, 203, 210],
       [160, 168, 176, 184, 192, 200, 208, 216, 224, 232, 240],
       [180, 189, 198, 207, 216, 225, 234, 243, 252, 261, 270],
       [200, 210, 220, 230, 240, 250, 260, 270, 280, 290, 300]])

#### Comparaciones (también elemento a elemento)

In [17]:
# >,<
print(arr1)
print(arr2)

comparacion = arr1 > arr2

print(comparacion, 'es un', type(comparacion))

[ 0  1  2  3  4  5  6  7  8  9 10]
[20 21 22 23 24 25 26 27 28 29 30]
[False False False False False False False False False False False] es un <class 'numpy.ndarray'>


In [18]:
arr1

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [20]:
print(arr1)

[ 0  1  2  3  4  5  6  7  8  9 10]


In [34]:
# ==
arr1 == arr2 # ¡Ojo! los arrays son de integers, no de floats

array([False, False, False, False, False, False, False, False, False,
       False, False])

## Álgebra lineal

Las operaciones del álgebra lineal aparecen a la hora de resolver sistemas de ecuaciones en derivadas parciales y al linealizar problemas de todo tipo, siendo necesario resolver sistemas con un número enorme de ecuaciones e incógnitas. Gracias a los arrays de NumPy podemos abordar este tipo de cálculos en Python, ya que todas las funciones están escritas en C o Fortran y tenemos la opción de usar bibliotecas optimizadas al límite.

El paquete de álgebra lineal en NumPy se llama [`linalg`](https://docs.scipy.org/doc/numpy/reference/routines.linalg.html), así que importando NumPy con la convención habitual se puede acceder a él escribiendo `np.linalg`. En la ayuda del paquete se observa que contiene módulos para:

* Funciones básicas (norma de un vector, inversa de una matriz, determinante, traza)
* Resolución de sistemas
* Autovalores y autovectores
* Descomposiciones matriciales (QR, SVD)
* Pseudoinversas


<div class="alert alert-warning"> Hay otra biblioteca en Python llamada `SciPy`, que contiene también funciones de Álgebra Lineal. ¿Cuáles usar? Una respuesta en este enlace: https://docs.scipy.org/doc/scipy-0.18.1/reference/tutorial/linalg.html#scipy-linalg-vs-numpy-linalg </div>




In [36]:
import numpy as np
help(np.linalg)  # Accediendo a la ayuda

Help on package numpy.linalg in numpy:

NAME
    numpy.linalg

DESCRIPTION
    Core Linear Algebra Tools
    -------------------------
    Linear algebra basics:
    
    - norm            Vector or matrix norm
    - inv             Inverse of a square matrix
    - solve           Solve a linear system of equations
    - det             Determinant of a square matrix
    - lstsq           Solve linear least-squares problem
    - pinv            Pseudo-inverse (Moore-Penrose) calculated using a singular
                      value decomposition
    - matrix_power    Integer power of a square matrix
    
    Eigenvalues and decompositions:
    
    - eig             Eigenvalues and vectors of a square matrix
    - eigh            Eigenvalues and eigenvectors of a Hermitian matrix
    - eigvals         Eigenvalues of a square matrix
    - eigvalsh        Eigenvalues of a Hermitian matrix
    - qr              QR decomposition of a matrix
    - svd             Singular value decomposition 

Para usar una función de un paquete sin escribir la "ruta" completa cada vez, se usa la sintaxis `from package import func`:

In [37]:
from numpy.linalg import norm, det  # Importar norma y determinante
norm

<function numpy.linalg.linalg.norm>

El producto matricial usual (no el que se hace elemento a elemento, sino el del álgebra lineal) se calcula con la misma función que el producto matriz-vector y el producto escalar vector-vector: la función [`dot`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.dot.html), que **no** está en el paquete `linalg` sino en `numpy` y no hace falta importarlo.

In [38]:
np.dot

<function numpy.core.multiarray.dot>

Una consideración importante a tener en cuenta es que en NumPy no hace falta ser estricto a la hora de manejar vectores como si fueran matrices columna, siempre que la operación sea consistente. Un vector es una matriz con una sola dimensión, por eso la aplicación de la traspuesta no funciona.

In [39]:
M = np.array([[1, 2],
              [3, 4]])
v = np.array([1, -1])

v.T  # traspuesta de v

array([ 1, -1])

In [40]:
u = np.dot(M, v)  # producto matriz vector
u

array([-1, -1])

Para hacer comparaciones entre arrays de punto flotante se pueden usar las funciones [`np.allclose`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.allclose.html) y [`np.isclose`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.isclose.html). La primera comprueba si todos los elementos de los arrays son iguales dentro de una tolerancia, y la segunda compara elemento a elemento y devuelve un array de valores `True` y `False`.

In [41]:
u, v

(array([-1, -1]), array([ 1, -1]))

In [42]:
np.allclose(u, v)

False

In [43]:
np.isclose([0.0, 0], [1e-8, 0], atol=1e-7)

array([ True,  True])

__En la versión 3.5 de Python se incorporó un nuevo operador `@` para poder calcular hacer multiplicaciones de matrices de una forma más legible__

Para más información, [este artículo](http://pybonacci.org/2016/02/22/el-producto-de-matrices-y-el-nuevo-operador/) en Pybonacci escrito por _Álex Sáez_.

### Ejercicios

#### 1- Hallar el producto de estas dos matrices y su determinante:

$$\begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 1 \\ -1 & 0 & 1 \end{pmatrix} \begin{pmatrix} 2 & 3 & -1 \\ 0 & -2 & 1 \\ 0 & 0 & 3 \end{pmatrix}$$

In [23]:
from numpy.linalg import det

A = np.array([[1, 0, 0],
              [2, 1, 1],
              [-1, 0, 1]])

B = np.array([[2, 3, -1],
              [0, -2, 1],
              [0, 0, 3]])
print('A =', A)
print('B =', B)

A = [[ 1  0  0]
 [ 2  1  1]
 [-1  0  1]]
B = [[ 2  3 -1]
 [ 0 -2  1]
 [ 0  0  3]]


In [45]:
C = A @ B
C

array([[ 2,  3, -1],
       [ 4,  4,  2],
       [-2, -3,  4]])

In [46]:
det(C)

-12.0

#### 2- Resolver el siguiente sistema:

$$ \begin{pmatrix} 2 & 0 & 0 \\ -1 & 1 & 0 \\ 3 & 2 & -1 \end{pmatrix} \begin{pmatrix} 1 & 1 & 1 \\ 0 & 1 & 2 \\ 0 & 0 & 1 \end{pmatrix} \begin{pmatrix} x \\ y \\ z \end{pmatrix} = \begin{pmatrix} -1 \\ 3 \\ 0 \end{pmatrix} $$

In [47]:
M = (np.array([[2, 0, 0],
               [-1, 1, 0],
               [3, 2, -1]])
     @
     np.array([[1, 1, 1],
               [0, 1, 2],
               [0, 0, 1]]))

N = np.array([-1, 3, 0])
M

array([[ 2,  2,  2],
       [-1,  0,  1],
       [ 3,  5,  6]])

In [48]:
x = np.linalg.solve(M, N)
x

array([ 0.5, -4.5,  3.5])

In [49]:
np.allclose(M @ x, N)

True

### Autovalores y autovectores

In [50]:
A = np.array([[1, 0, 0],
              [2, 1, 1],
              [-1, 0, 1]])

np.linalg.eig(A)

(array([1., 1., 1.]),
 array([[ 0.00000000e+00,  0.00000000e+00,  4.93038066e-32],
        [ 1.00000000e+00, -1.00000000e+00, -1.00000000e+00],
        [ 0.00000000e+00,  2.22044605e-16,  2.22044605e-16]]))

---
___Se ha visto:___

* A usar las principales funciones para crear arrays
* A operar con arrays: tanto operaciones básicas, como de Álgebra lineal
---
**Referencias**

Algunos enlaces en Pybonacci:

* [Álgebra lineal en Python con NumPy](http://pybonacci.org/2012/06/07/algebra-lineal-en-python-con-numpy-i-operaciones-basicas/)
* [Cómo crear matrices en Python con NumPy](http://pybonacci.wordpress.com/2012/06/11/como-crear-matrices-en-python-con-numpy/)
* [Números aleatorios en Python con NumPy y SciPy](http://pybonacci.wordpress.com/2013/01/11/numeros-aleatorios-en-python-con-numpy-y-scipy/)

Algunos enlaces en otros sitios:

* [101 NumPy Exercises for Data Analysis](https://www.machinelearningplus.com/python/101-numpy-exercises-python/)
* [100 numpy Exercises](http://www.labri.fr/perso/nrougier/teaching/numpy.100/index.html)
* [NumPy and IPython SciPy 2013 Tutorial](http://conference.scipy.org/scipy2013/tutorial_detail.php?id=100)
* [NumPy and SciPy documentation](http://docs.scipy.org/doc/)

---
[@AeroPython](https://github.com/aeropython): Juan Luis Cano, Mabel Delgado, Alejandro Sáez, Andrés Quezada