# Características de los arrays de NumPy

_En este notebook veremos como las principales características de los arrays de NumPy y cómo mejoran la eficiencia de nuestro código._

El objeto tipo array que proporciona NumPy (Python ya dispone de un tipo array que sirve para almacenar elementos de igual tipo pero no proporciona toda la artillería matemática necesaria como para hacer operaciones de manera rápida y eficiente) se caracteriza por:

## 1) Homogeneidad de tipo:

Comencemos viendo que ocurre con las __listas__:

In [1]:
import numpy as np

In [2]:
lista = [ 1, 1+2j, True, 'aerodinamica', [1, 2, 3] ]
lista

[1, (1+2j), True, 'aerodinamica', [1, 2, 3]]

En el caso de los __arrays__:

In [3]:
array = np.array([ 1, 1+2j, True, 'aerodinamica'])
array

array(['1', '(1+2j)', 'True', 'aerodinamica'], dtype='<U64')

__¿Todo bien? Pues no__. Mientras que en la lista cada elemento conserva su tipo, en el array, todos han de tener el mismo y NumPy ha considerado que todos van a ser string.

## 2) Tamaño fijo en el momento de la creación:

__¡Tranquilo!__ los __allocate__ son automáticos...

Igual que en el caso anterior, comencemos con la __lista__:

In [4]:
lista

[1, (1+2j), True, 'aerodinamica', [1, 2, 3]]

In [5]:
print(id(lista)) #Tarea Averiguar qué significa este número

2852137446080


In [6]:
lista.append('fluidos')
print(lista)

[1, (1+2j), True, 'aerodinamica', [1, 2, 3], 'fluidos']


In [7]:
print(id(lista))

2852137446080


In [8]:
array

array(['1', '(1+2j)', 'True', 'aerodinamica'], dtype='<U64')

In [9]:
print(id(array))
array = np.append(array, 'fluidos')
print(array)
print(id(array))

2852132860112
['1' '(1+2j)' 'True' 'aerodinamica' 'fluidos']
2852137655872


Si consultamos la ayuda de la función `np.append` escribiendo en una celda `help(np.append)` podemos leer:

    Returns
    -------
    append : ndarray
        A copy of `arr` with `values` appended to `axis`.  Note that `append` does not occur in-place: a new array is allocated and filled.  If `axis` is None, `out` is a flattened array.

## 3) Eficiencia

Hasta el momento los arrays han demostrado ser bastante menos flexibles que las listas, luego olvidemos estos últimos 10 minutos y manejemos siempre listas... ¿no? ¡Pues no! Los arrays realizan una gestión de la memoria mucho más eficiente que mejora el rendimiento.

Prestemos atención ahora a la velocidad de ejecución gracias a la _función mágica_ `%%timeit`, que colocada al inicio de una celda nos indicará el tiempo que tarda en ejecutarse. 

In [10]:
lista = list(range(0,100000))
type(lista)

list

In [11]:
%%timeit
sum(lista)

2.91 ms ± 1.27 ms per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [12]:
sum(lista)

4999950000

In [13]:
array = np.arange(0, 100000)

In [14]:
%%timeit
np.sum(array)

132 µs ± 2.03 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


Como ves, las mejoras en este caso son de 2 órdenes de magnitud. __NumPy nos ofrece funciones que se ejecutan prácticamente en tiempos de lenguaje compilado (Fortran, C, C++) y optimizado, pero escribiendo mucho menos código y con un nivel de abstracción mayor__. Conociendo una serie de buenas prácticas, podremos competir en velocidad con nuestros códigos en Python. Para casos en los que no sea posible, existen herramientas que nos permiten ejecutar desde Python nuestros códigos en otros lengujes como [f2py](http://docs.scipy.org/doc/numpy-dev/f2py/). Este tema puede resultarte algo avanzado a estas alturas, pero bastante útil; puedes consultar este [artículo de pybonacci](http://pybonacci.org/2013/02/22/integrar-fortran-con-python-usando-f2py/9) si lo necesitas.

##### Ejercicio

Para recordar los primeras lecciones vamos a implementar nuestra propia función `linspace` usando un bucle (estilo FORTRAN) y usando una _[list comprehension](http://www.pythonforbeginners.com/basics/list-comprehensions-in-python)_ (estilo pythonico). Después compararemos el rendimiento comparado con la de NumPy.

In [15]:
def my_linspace_FORTRAN(start, stop, number=50):
    x = np.empty(number)
    step = (stop - start) / (number - 1)
    for ii in range(number):
        x[ii] = ii * step
    x += start
    return x

In [16]:
def my_linspace_PYTHONIC(start, stop, number=50):
    step = (stop - start) / (number - 1)
    x = np.array([ii * step  for ii in range(number)]) #esto es una list comprehension
    x += start
    return x

In [17]:
%%timeit
np.linspace(0,100,1000000)

7.86 ms ± 232 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [18]:
%%timeit
my_linspace_FORTRAN(0,100,1000000)

346 ms ± 9.88 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [19]:
%%timeit
my_linspace_PYTHONIC(0,100,1000000)

375 ms ± 10.6 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


---

___Hemos aprendido:___

* Las características de los arrays de NumPy:
    - Homogeneidad de tipo.
    - Tamaño fijo en el momento de la creación.

_En definitiva:_
* __Ingenieros y científicos $\heartsuit$ arrays.__
* __Ingenieros y científicos necesitan NumPy.__

__¡Quiero más!__Algunos enlaces:


Algunos enlaces en otros sitios:

* [100 numpy exercises](http://www.labri.fr/perso/nrougier/teaching/numpy.100/index.html). Es posible que de momento sólo sepas hacer los primeros, pero tranquilo, pronto sabrás más...
* [NumPy and IPython SciPy 2013 Tutorial](http://conference.scipy.org/scipy2013/tutorial_detail.php?id=100).
* [NumPy and SciPy documentation](http://docs.scipy.org/doc/).