# Características de los arrays de NumPy

_En este notebook veremos las principales características de los arrays de **NumPy** y cómo mejorar la eficiencia de nuestro código._

El objeto tipo array que proporciona **NumPy** (Python ya dispone de un tipo array que sirve para almacenar elementos de igual tipo pero no proporciona todas las *herramientas matemáticas* necesarias como para hacer operaciones de manera rápida y eficiente) se caracteriza por:

## 1. Homogeneidad de tipo

Comencemos viendo que ocurre con las __listas__:

In [18]:
import numpy as np
import math as mt

In [4]:
lista = [ 1, 1+2j, True, 'aerodinamica', [1, 2, 3] ]
lista

[1, (1+2j), True, 'aerodinamica', [1, 2, 3]]

En el caso de los __arrays__:

In [6]:
array = np.array([ 1, 1+2j, False])
array

array([1.+0.j, 1.+2.j, 0.+0.j])

__Notamos lo siguiente:__ mientras que en la *lista* cada elemento conserva su tipo, en el *array* todos los elementos han de tener el mismo y NumPy ha considerado que todos van a ser string.

## 2. Tamaño fijo en el momento de la creación

Comencemos con la __lista__:

In [17]:
print(id(lista))
lista2=lista.append('fluidos')
print(lista)
print(id(lista2))

140598849636544
[1, (1+2j), True, 'aerodinamica', [1, 2, 3], 'fluidos', 'fluidos', 'fluidos']
94670505795440


A continuacion con el **array**:

In [16]:
print(id(array))
lista2=np.append(array,102.04)
print(array)
print(id(lista2))

140598849240720
[  1.  +0.j   1.  +2.j   0.  +0.j 102.04+0.j]
140598849288992


Si consultamos la ayuda de la función `np.append` escribiendo en una celda `help(np.append)` podemos leer:

    Returns
    -------
    append : ndarray
        A copy of `arr` with `values` appended to `axis`.  Note that `append` does not occur in-place: a new array is allocated and filled.  If `axis` is None, `out` is a flattened array.

## 3. Eficiencia

Hasta el momento los **arrays** han demostrado ser bastante menos flexibles que las **listas** ... entonces manejemos siempre listas, no? **Pues no!** Los arrays realizan una gestión de la memoria mucho más eficiente que mejora el rendimiento.

Prestemos atención ahora a la velocidad de ejecución gracias a la _función mágica_ `%%timeit`, la cual colocada al inicio de una celda nos indicará el tiempo que tarda en ejecutarse. 

In [19]:
lista = list(range(0,100000))
type(lista)

list

In [20]:
%%timeit
sum(lista)

1.41 ms ± 251 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [21]:
array = np.arange(0, 100000)

In [22]:
%%timeit
np.sum(array)

113 µs ± 14.5 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


Como vemos, la mejora en este caso es de 1 orden de magnitud. __NumPy nos ofrece funciones que se ejecutan prácticamente en tiempos de lenguaje compilado (Fortran, C, C++) y optimizado, pero escribiendo mucho menos código y con un nivel de abstracción mayor__. Conociendo una serie de buenas prácticas, podremos competir en velocidad con nuestros códigos en Python. Para casos en los que no sea posible, existen herramientas que nos permiten ejecutar desde Python nuestros códigos en otros lengujes como [f2py](https://numpy.org/devdocs/f2py/usage.html). Para mayor detalle, podemos consultar este [artículo de pybonacci](https://pybonacci.org/2013/02/22/integrar-fortran-con-python-usando-f2py/).

##### Ejercicio

Vamos a implementar nuestra propia función `linspace` usando un bucle (estilo FORTRAN) y usando una _[list comprehension](http://www.pythonforbeginners.com/basics/list-comprehensions-in-python)_ (estilo PYTHONICO). Después compararemos el rendimiento con la funcion de NumPy.

In [10]:
def my_linspace_FORTRAN(start, stop, number=50):
    x = np.empty(number)
    step = (stop - start) / (number - 1)
    for ii in range(number):
        x[ii] = ii * step
    x += start
    return x

In [11]:
def my_linspace_PYTHONIC(start, stop, number=50):
    step = (stop - start) / (number - 1)
    x = np.array([ii * step  for ii in range(number)]) # esto es una list comprehension
    x += start
    return x

In [12]:
%%timeit
np.linspace(0,100,1000000)

2.22 ms ± 1.16 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [13]:
%%timeit
my_linspace_FORTRAN(0,100,1000000)

123 ms ± 3.21 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [14]:
%%timeit
my_linspace_PYTHONIC(0,100,1000000)

185 ms ± 21.1 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [4]:
# Esta celda da el estilo al notebook
from IPython.core.display import HTML
css_file = '../styles/aeropython.css'
HTML(open(css_file, "r").read())