# Seccion 1 - Introducción

## Lección 2 - Conociendo Numpy

Numpy es una de las librerías más usadas en el mundo de la ciencia del dato. Una de las principales ventajas de Numpy es que nos permite trabajar con vectores y matrices. Por ejemplo, un fichero CSV se puede representar fácilmente en forma de matriz, de manera que cada fila de la matriz hace referencia a cada fila del fichero, y cada columna de la matriz hace referencia a un atributo del fichero.

Las principales características de Numpy son:
- Está escrito en C
- Incluye funciones para operaciones matemáticas, lógicas, ordenación, I/O, estadísticas, etc.
- El objeto ***ndarray*** es el tipo de dato más importante.
- Realmente rápido
- Muy usado en el mundo del Data Science

Veamos un ejemplo en el que Numpy nos hace la vida más fácil

In [1]:
lista_python = [1,2,3,4]
valor = 2
type(lista_python)

list

In [2]:
lista_python * 2

[1, 2, 3, 4, 1, 2, 3, 4]

Como véis, si multiplico una lista Python * 2, lo que obtengo es la misma lista dos veces, cosa que habitualmente no buscamos. ¿Cómo implementaría en python la multiplicación de los elementos de una lista por un valor?

In [3]:
res = []
valor = 2
for v in lista_python:
    res.append(v * valor)
res

[2, 4, 6, 8]

Con Numpy, esto es tan simple como realizar la multiplicación

In [4]:
import numpy as np

valores_numpy = np.array([1,2,3,4])
valores_numpy * 2

array([2, 4, 6, 8])

¿Y qué ocurre si queremos multiplicar dos listas? Con Python, sería algo tal que así:

In [5]:
lista_python2 = [4,3,2,1]

res = []
for i in range(len(lista_python)):
    res.append(lista_python[i] * lista_python2[i])
res

[4, 6, 6, 4]

En cambio, en Numpy... 

In [6]:
valores_numpy2 = np.array([4,3,2,1])
res = valores_numpy * valores_numpy2
res

array([4, 6, 6, 4])

Como podéis ver, Numpy nos hace la vida más facil a la hora de trabajar con listas (o arrays). ¡¡Imaginaos con matrices!!

Además, hemos dicho Numpy es realmente rápido. Vamos a realizar un par de pruebas comparándolo con Python

In [7]:
%%timeit

res = []
for i in range(len(lista_python)):
    res.append(lista_python[i] * lista_python2[i])
res

328 ns ± 2.91 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)


In [8]:
%%timeit
res = valores_numpy * valores_numpy2
res

391 ns ± 4.78 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)


¡Podéis ver como el tiempo invertido en realizar la operación es casi la mitad! 

## Leccion 3 - Preparación del entorno

Para la preparación del entorno os recomiendo que uséis directamente un terminal, tanto para la creación del enviroment, como para la instalación de la librería. Igualmente, debéis saber que desde jupyter podéis lanzar comandos de sistema, añadiendo delante el carácter **!** .

In [None]:
!conda install -c conda-forge numpy