# Arrays

Como te mencioné en la lección anterior, además de brindarnos herramientas de algoritmos matemáticos muy poderosas (y que vamos a ir conociendo en las próximas lecciones), **NumPy** nos brinda un **nuevo tipo de datos** que es una estructura de datos, en realidad, y que se llama **array**.

Como a mí me gusta explicar las cosas visualmente, primero vamos a crear nuestro primer array, y luego te lo explico mejor:

In [10]:
import numpy as np
import time

In [11]:
mi_array = np.array([1, 2, 3, 4, 5])
mi_array

array([1, 2, 3, 4, 5])

Puede que en este momento estés pensando "*Fede, eso es una lista*". Bueno, la verdad que es muy parecido, pero el array de NumPy es **mucho más rápido** y **más poderoso**, y a esto lo vamos a comprobar en un instante. Pero antes, para despejar toda duda…

In [3]:
type(mi_array)

numpy.ndarray

Para comparar la *velocidad* de un **array** versus una **lista**, tenemos que trabajar con objetos más grandes y pesados, donde la velocidad va a ser más evidente.

Para eso voy a crear dos objetos nuevos (una lista y un array) que contengan **un millón de elementos**:

In [12]:
lista_grande = list(range(1000000))
array_grande = np.array(lista_grande)

In [5]:
type(lista_grande)

list

In [6]:
type(array_grande)

numpy.ndarray

Para medir el tiempo, he tenido que importar en la primera celda de este cuaderno, una librería de python llamada `time`, que nos brinda algunas herramientas para medir el tiempo que toma en ejecutarse un determinado código.

Imaginemos que quiero obtener el **cuadrado** de cada número que hay en mis nuevos objetos. Estamos hablando de multiplicar al cuadrado un millón de números en cada uno de ellos. El objetivo de hacer esto, es para medir cuánto tiempo tarda la *lista*, y cuánto tarda el *array*, para ver **cuál es más eficiente**.

Para lograr eso, `time` me va a permitir crear marcas de tiempo antes y después de ejecutar mi código, y así poder ver cuánto ha durado su ejecución:

In [13]:
inicio_lista = time.time()
for i in lista_grande:
    i ** 2
fin_lista = time.time()
print("Tiempo lista: ", fin_lista - inicio_lista)

Tiempo lista:  0.23846125602722168


Ahora voy a hacer lo mismo pero en vez de trabajar con `lista_grande`, voy a trabajar con `array_grande`:

In [14]:
inicio_array = time.time()
array_grande ** 2
fin_array = time.time()
print("Tiempo array: ", fin_array - inicio_array)

Tiempo array:  0.003989458084106445


Observa la eficiencia con la que ha trabajado NumPy a través del array, para comenzar a comprender el poder de trabajar con este recurso.

NumPy es una herramienta esencial en el mundo del Data Science por su **eficiencia**, por su **facilidad de uso** y por su **amplia adopción** en la comunidad científica y analítica.

En las siguientes lecciones nos va a quedar bien clara su capacidad para realizar operaciones complejas y para manejar grandes conjuntos de datos, lo cual lo hace insustituible en el análisis de datos.