###### Contenido bajo licencia Creative Commons Attribution CC-BY 4.0, código bajo licencia BSD 3-Clause © 2017 L.A. Barba, N.C. Clementi

# Conociendo arrays y gráficos

Bienvenido a la **Lección 4** del primer módulo del curso _"Cálculos Computacionales en ingeniería"_. ¡Ya has recorrido un largo camino!

Recuerda, este curso no asume ninguna experiencia de programación por lo que las tres primeras lecciones se centraron en crear una base con construcciones de programación de Python sin utilizar Matemáticas. Las lecciones anteriores son:

* [Lección 1](./1_Interactuando_con_Python.ipynb): Interactuando con Python
* [Lección 2](./2_Strings_y_listas_en_accion.ipynb): String y listas en acción.
* [Lección 3](./3_Jugando_con_archivo_de_cursos.ipynb): Jugando con archivo de cursos.

En la mayoría de las necesidades informáticas en ingeniería es conveniente el uso de *arrays*: secuencias de datos del mismo tipo. Se comportan como listas, a excepción de la restricción en el tipo de sus elementos. Hay una gran ventaja de eficiencia cuando sabes que todos los elementos de una secuencia son del mismo tipo, por lo que los métodos equivalentes de arrays se ejecutan mucho más rápido que los de las listas (*Nota de la traducción*: arrays y matrices son distintos tipos en python, por lo que se utilizará la palabra arrays sin traducirla).

El lenguaje Python se extiende con la utilización de **librerías** o bibliotecas. La librería más importante en ciencia e ingeniería es **NumPy**, que proporciona la estructura de datos _array n-dimensional_ (llamado `ndarray`) y una gran cantidad de funciones, operaciones y algoritmos para cálculos de álgebra lineal extremadamente eficientes.

En esta lección, comenzarás a jugar con arrays de NumPy y descubrirás su poder. También se encontrará con la librería **Matplotlib**, muy apreciada para crear gráficos bidimensionales de datos.

## Importando librerías

Primero, algunos consejos sobre al importar librerías para expandir Python. Debido a que las librerías son grandes colecciones de código y son para fines especiales, no se cargan automáticamente al iniciar Python (o IPython, o Jupyter). Tienes que importar una librería usando el comando `import`. Por ejemplo, para importar **NumPy** y recibir todos los beneficios del álgebra lineal, ingresamos:

```python
import numpy
```

Una vez que se ejecuta ese comando en una celda de código, puedes llamar a cualquier función de NumPy usando la notación de puntos, anteponiendo el nombre de la librería. Por ejemplo, algunas funciones comúnmente usadas son:

* [`numpy.linspace()`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.linspace.html)
* [`numpy.ones()`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.ones.html#numpy.ones)
* [`numpy.zeros()`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.zeros.html#numpy.zeros)
* [`numpy.empty()`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.empty.html#numpy.empty)
* [`numpy.copy()`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.copy.html#numpy.copy)

Los enlaces anteriores te llevarán a la documentación de estas útiles funciones de NumPy.

##### Advertencia:

Encontrará gran variedad de código en internet con distintas sintaxis para importar librerías. Algunos usarán:
```python
import numpy como np
```

Lo anterior crea un alias para `numpy` con la cadena más corta `np`, por lo que llamaría a una función **NumPy** de esta manera: `np.linspace()`. Esta es sólo una forma alternativa de hacerlo, para personas que les resulta demasiado largo escribir `numpy` y quieren evitar escribir 3 caracteres cada vez. En estos notebooks escribiremos `numpy` porque nos parece más legible y hermoso. Por lo tanto, usaremos simplemente:

In [None]:
import numpy

## Creando arrays

Para crear un array de NumPy a partir de una lista existente de números homogéneos, llamamos **`numpy.array ()`**, así:

In [None]:
numpy.array([3, 5, 8, 17])

NumPy ofrece muchas [formas de crear arrays](https://docs.scipy.org/doc/numpy/reference/routines.array-creation.html#routines-array-creation) además de lo anterior. Ya hemos mencionado algunos de ellos anteriomente en el notebook.

Juega con `numpy.ones ()` y `numpy.zeros ()`: estas funciones permiten crear arrays llenos de unos y ceros, respectivamente. Pasamos como argumento la cantidad de elementos del array que queremos obtener.

In [None]:
numpy.ones(5)

In [None]:
numpy.zeros(3)

Otra función útil: `numpy.arange ()`, nos regresa un array de valores espaciados uniformemente en un intervalo definido. Es el equivalente de la función range pero en su versión rápida de Numpy.

*Sintaxis:*

`numpy.arange(start, end, step)`

donde `start` (inicio) por defecto es cero, `stop` (fin) no se incluye, y el valor predeterminado
para `step` (el paso) es 1. ¡Te aconsejamos jugar con algunos valores para acostumbrarte!

In [None]:
numpy.arange(4)

In [None]:
numpy.arange(2, 6)

In [None]:
numpy.arange(2, 6, 2)

In [None]:
numpy.arange(2, 6, 0.5)

La funcion `numpy.linspace()` es similar a `numpy.arange()`, pero permite que digas el número de elementos a obtener en lugar del un tamaño de paso. Devuelve un array con números espaciados uniformemente durante el intervalo especificado.

*Sintaxis:*

`numpy.linspace(start, stop, num)`

`stop` está incluido por defecto (se puede eliminar, como indica la documentación), y ` num` de forma predeterminada es 50.

In [None]:
numpy.linspace(2.0, 3.0)

In [None]:
len(numpy.linspace(2.0, 3.0))

In [None]:
numpy.linspace(2.0, 3.0, 6)

In [None]:
numpy.linspace(-1, 1, 9)

## Operaciones de arrays

Creemos algunas variables de tipo array para poder realizar algunas operaciones con ellos.

In [None]:
x_array = numpy.linspace(-1, 1, 9)

Ahora que lo hemos guardado como una variable, podemos hacer algunos cálculos con el array. Por ejemplo, aplicar el cuadrado a cada elemento del array (¡de una sola vez!):

In [None]:
y_array = x_array**2
print(y_array)

También podemos tomar la raíz cuadrada de un array de valores positivos, usando la función `numpy.sqrt()`:

In [None]:
z_array = numpy.sqrt(y_array)
print(z_array)

Ahora que tenemos dos arrays diferentes `x_array`, ` y_array` y `z_array`, podemos hacer más cálculos, como sumarlos o multiplicarlos. Por ejemplo:

In [None]:
add_array = x_array + y_array 
print(add_array)

La adición de arrays se define elemento a elemento (en inglés, esto se dice element-wise). La multiplicación de arrays también se realiza elemento a elemento:

In [None]:
mult_array = x_array * z_array
print(mult_array)

También podemos dividir arrays, pero debes tener cuidado de no dividir por cero. Esta operación dará como resultado **`nan`** que significa *Not a Number* (No un Número). Python todavía realizará la división, pero nos contará sobre el problema.

Veamos cómo se vería esa situación:

In [None]:
x_array / y_array

## Arrays multidimensionales

### Arrays 2D

NumPy puede crear arrays de N dimensiones. Por ejemplo, un array 2D es como una matriz de Matemática, y se crea a partir de una lista anidada de la siguiente manera:

In [None]:
array_2d = numpy.array([[1, 2], [3, 4]])
print(array_2d)

Los arrays 2D se pueden sumar, restar y multiplicar:

In [None]:
X = numpy.array([[1, 2], [3, 4]])
Y = numpy.array([[1, -1], [0, 1]])

La adición de estos dos arrays funciona exactamente como era de esperar:

In [None]:
X + Y

¿Qué pasa si tratamos de multiplicar arrays utilizando el operador `'*'`?

In [None]:
X * Y

La multiplicación usando el operador `'*'` es elemento a elemento. Si queremos hacer una multiplicación matricial usamos el operador `'@'`:

In [None]:
X @ Y

O de manera equivalente, podemos usar `numpy.dot ()`:

In [None]:
numpy.dot(X, Y)

### Arrays 3D

Vamos a crear un array 3D a partir de un array 1D. Podemos usar [`numpy.reshape()`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.reshape.html), donde pasamos el array que queremos reacomodar y la forma queremos obtener, es decir, la cantidad de elementos en cada dimensión.

*Sintaxis*
 
`numpy.reshape(array, newshape)`

Por ejemplo:

In [None]:
a = numpy.arange(24)
print(a)

In [None]:
a_3D = numpy.reshape(a, (2, 3, 4))
print(a_3D)

Podemos verificar la forma de un array de NumPy usando la función `numpy.shape ()`:

In [None]:
numpy.shape(a_3D)

Visualizar las dimensiones del array `a_3D` puede ser complicado, así que proporcionamos un diagrama que lo ayudará a comprender cómo se asignan las dimensiones. Cada dimensión se muestra como un eje de coordenadas. Para un array 3D, en el "eje x", tenemos los sub-array que son bidimensionales. Tenemos dos de estos sub-array 2D, en este caso; cada uno tiene 3 filas y 4 columnas. Estudie este boceto cuidadosamente, mientras compara con la forma en que se imprime el array `a_3D`.

<img src = "../images/3d_array_sketch.png" style = "width: 400px;" />

Cuando tenemos arrays multidimensionales, podemos acceder a secciones de sus elementos realizando slicing en cada dimensión. Esta es una de las ventajas del uso de arrays; no podemos hacer esto con listas.

Accedamos a algunos elementos del array 2D que llamamos `X`.

In [None]:
X

In [None]:
# Tomar el primer elemento en la primera fila y la primera columna
X[0, 0]

In [None]:
# Tomar el elemento de la primera fila y segunda columna
X[0, 1]

##### Ejercicios:

Del array X:

1. Coge el segundo elemento en la primera columna.
2. Coge el segundo elemento en la segunda columna.

Juega con algunos cortes (slicing) de este array:

In [None]:
# Tomar la primera columna
X[:, 0]

Cuando no especificamos el punto inicial y/o final en el slicing, el símbolo `':'` significa "todo". En el ejemplo anterior, le estamos diciendo a NumPy que queremos todos los elementos del índice 0 en la segunda dimensión (la primera columna).

In [None]:
# Tomar la primera fila
X[0, :]

##### Ejercicios:

Del array X:

1. Coge la segunda columna.
2. Coge la segunda fila.

Practiquemos con el array 3D.

In [None]:
a_3D

Si queremos tomar la primera columna de los arrays bidimensionales de nuestro array `a_3D`, debemos hacer:

In [None]:
a_3D[:, :, 0]

La línea de arriba le está diciendo a NumPy:

* El primer `':'`: en la primera dimensión queremos tomar todos los elementos (2 arrays).
* El segundo `':'`: desde la segunda dimensión queremos tomar todos los elementos (todas las filas).
* El `'0'`: desde la tercera dimensión queremos tomar el primer elemento (primera columna).

Si queremos los primeros 2 elementos de la primera columna de ambos arrays:

In [None]:
a_3D[:, 0:2, 0]

A continuación, desde el primer array bidimensional de nuestro array `a_3D`, tomaremos los dos elementos intermedios de la segunda fila:

In [None]:
a_3D[0, 1, 1:3]

##### Ejercicios:

Del array llamada `a_3D`:

1. Toma los dos elementos del medio (es decir, 17 y 18) del segundo array.
2. Coge la última fila de ambos arrays.
3. Tome los elementos del primer array bidimensional que excluyen la primera fila y la primera columna.
4. Tome los elementos del segundo array bidimensional que excluyen la última fila y la última columna.

## NumPy es rápido y limpio

Cuando trabajamos con números, los arrays son la mejor opción porque la librería NumPy tiene funciones que están optimizadas y, por lo tanto, son más rápidas que las de Python. Esto es especialmente cierto si tenemos arrays grandes. Además, usar arrays de NumPy y sus propiedades hace que nuestro código sea más legible.

Por ejemplo, si quisiéramos sumar 2 listas de python elemento a elemento, necesitaríamos hacerlo con una declaración `for`. Si queremos agregar dos arrays de NumPy, simplemente usamos el símbolo de suma `'+'`.

Para ilustrar lo anterior, sumaremos dos listas y dos arrays (con elementos aleatorios) y compararemos el tiempo que requiere cada suma.

### Suma de elementos de una lista de Python

Usando la librería de Python [`random`](https://docs.python.org/3/library/random.html) generaremos dos listas con 100 elementos pseudoaleatorios en el rango [0,100), sin números repetido.

In [None]:
#Importar la librería random
import random

In [None]:
#Generar 2 listas de enteros con 100 elementos
lst_1 = random.sample(range(100), 100)
lst_2 = random.sample(range(100), 100)

In [None]:
#Imprimir los primeros 10 elementos
print(lst_1[0:10])
print(lst_2[0:10])

In [None]:
# Verificar el tipo de las variables
print(type(lst_1))
print(type(lst_2))

Necesitamos escribir una declaración `for`, añadiendo el resultado de la suma de elementos a una nueva lista que llamamos `result_lst`.

Para contabilizar el tiempo, podemos usar el comando "mágico" de  IPython `%% time`. Escribiendo al comienzo de la celda de código, el comando `%%time` nos dará el tiempo que lleva ejecutar todo el código en esa celda.

In [None]:
%%time
res_lst = []
for i in range(100):
    res_lst.append(lst_1[i] + lst_2[i])

In [None]:
print(res_lst[0:10])

### Suma de arrays en NumPy

En este caso, generamos arrays con enteros aleatorios usando una función especial de NumPy: [`numpy.random.randint ()`](https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy. random.randint.html). Los arrays que generamos con esta función no serán como las listas: en este caso, tendremos 100 elementos en el rango [0, 100) pero pueden repetirse.

Nuestro objetivo es comparar el tiempo que lleva calcular la suma de los elementos de una lista, de modo que todo lo que importa es que los arrays y las listas son de la misma longitud y tipo (enteros).

In [None]:
arr_1 = numpy.random.randint(0, 100, size=100)
arr_2 = numpy.random.randint(0, 100, size=100)

In [None]:
#print first 10 elements
print(arr_1[0:10])
print(arr_2[0:10])

In [None]:
# Verificar el tipo de las variables
print(type(arr_1))
print(type(arr_2))

Ahora podemos usar la magia de la celda `%% time`, nuevamente, para ver cuánto tarda NumPy en calcular la suma de elementos.

In [None]:
%%time
arr_res = arr_1 + arr_2

Ten en cuenta que en el caso de los arrays, el código no solo es más legible (sólo una línea de código), sino que también es más rápido que con las listas. Esta vez, la ventaja será mayor con arrays y listas más grandes.

Tus mediciones de tiempo pueden variar a los que mostramos en este notebook, porque estará calculándolos en una máquina diferente.

##### Ejercicio

1. Repite la comparación entre listas y arrays, usando arrays más grandes; por ejemplo de tamaño 10,000.
2. Repite el análisis, pero ahora en lugar de sumar realiza la operación que eleva cada elemento de un array/lista a la potencia dos. Usa arrays de 10,000 elementos.

## Tiempo de Graficar

¡Te encantará la librería **Matplotlib**! Aprenderás a continuación sobre el módulo `pyplot`, que hace gráficos de líneas.

Necesitamos algunos datos para graficar. Definiramos un array NumPy, para luego calcular su cuadrado, cubo y raíz cuadrada, elemento a elemento. Graficaremos estos valores con el array original en el eje x.

In [None]:
#Crear el array base
xarray = numpy.linspace(0, 2, 41)
print(xarray)

In [None]:
#Generar los arrays a graficar
pow2 = xarray**2
pow3 = xarray**3
pow_half = numpy.sqrt(xarray)

Para graficar los arrays resultantes como una función de la original (`xarray`) en el eje x, necesitamos importar el módulo `pyplot` de **Matplotlib**.

In [None]:
from matplotlib import pyplot
%matplotlib inline

El comando `%matplotlib inline` permite obtener nuestros gráficos dentro del notebook (en lugar de una ventana emergente, que es el comportamiento predeterminado de `pyplot` para jupyter).

Utilizaremos la función `pyplot.plot()`, especificando el color de línea (`'k'` para negro) y el estilo de línea (`' -'`, `'-'` y `':'` para línea continua, punteada y punteada), y dando a cada línea una etiqueta. Tenga en cuenta que los valores para `color` (color),` linestyle` (tipo de línea) y `label` (etiqueta) deben darse entre comillas.

In [None]:
#Plot x^2
pyplot.plot(xarray, pow2, color='k', linestyle='-', label='square')
#Plot x^3
pyplot.plot(xarray, pow3, color='k', linestyle='--', label='cube')
#Plot sqrt(x)
pyplot.plot(xarray, pow_half, color='k', linestyle=':', label='square root')
#Plot the legends in the best location
pyplot.legend(loc='best')

Para ilustrar otras características de Matplotlib, trazaremos los mismos datos, pero variando los colores en lugar del estilo de línea. También usaremos la sintaxis LaTeX para escribir fórmulas en las etiquetas. Si deseas obtener más información sobre la sintaxis de LaTeX, hay una [guía rápida de LaTeX, en inglés](https://users.dickinson.edu/~richesod/latex/latexcheatsheet.pdf) disponible en línea.

Agregar un punto y coma (`';'`) a la última línea del bloque de código de trazado evitar que se imprima `<matplotlib.legend.Legend at 0x7f8c83cc7898>` junto al gráfico.

In [None]:
#Plot x^2
pyplot.plot(xarray, pow2, color='red', linestyle='-', label='$x^2$')
#Plot x^3
pyplot.plot(xarray, pow3, color='green', linestyle='-', label='$x^3$')
#Plot sqrt(x)
pyplot.plot(xarray, pow_half, color='blue', linestyle='-', label='$\sqrt{x}$')
#Plot the legends in the best location
pyplot.legend(loc='best'); 

¿No es increíble? Esperamos que ahora estés imaginando todo lo que puedes hacer con los notebooks de Jupyter, Python y sus librerías científicas **NumPy** y **Matplotlib**. 

Acabamos de realizar una introducción a los gráficos, pero seguiremos aprendiendo sobre el poder de **Matplotlib** en la próxima lección.

Si tienes curiosidad, puedes explorar muchos gráficos increíbles en la [galería de ejemplos de Matplotlib](http://matplotlib.org/gallery.html).

##### Ejercicio:

Elige dos operaciones diferentes para aplicar a `xarray` y realiza la operación de manera directa en el mismo gráfico.

## Lo que hemos aprendido

* Cómo importar librerías
* Arrays multidimensionales usando NumPy
* Acceder a valores y slicing en arrays de NumPy
* Usar `%%time` para cronometrar la ejecución de la celda.
* Comparar rendimientos: listas versus arrays
* Grafico básico con `pyplot` de Matplotlib.

## Referencias

1. _Effective Computation in Physics: Field Guide to Research with Python_ (Computación efectiva en Física, Guía práctica para investigación con Python, 2015). Anthony Scopatz & Kathryn D. Huff. O'Reilly Media, Inc.

2. _Numerical Python: A Practical Techniques Approach for Industry_. (Python Numérico: Técnicas Prácticas para la Industria, 2015). Robert Johansson. Appress. 

2. ["The world of Jupyter"—a tutorial](https://github.com/barbagroup/jupyter-tutorial) (El mundo de Jupyter-un tutorial, 2016). Lorena A. Barba.

In [54]:
# Ejecuta esta celda para cargar el notebook con estilo, 
# pero puedes ignorar su contenido.
from IPython.core.display import HTML
css_file = '../style/custom.css'
HTML(open(css_file, "r").read())