# Numpy
> David Quintanar Pérez

https://numpy.org/

In [None]:
import sys
import numpy as np

## Creación de numpy arrays

In [None]:
numpy_array = np.array([0, 1, 2])
type(numpy_array)

In [None]:
numpy_array.shape

In [None]:
numpy_array.ndim

In [None]:
matriz = np.array([
    [0, 1, 2],
    [3, 4, 5]
])

matriz

In [None]:
matriz.shape

In [None]:
matriz.ndim

## Matriz identidad

In [None]:
np.eye(3)

## Matriz de 0's

In [None]:
np.zeros((3,2))

## Array con todos los valores 1

In [None]:
np.ones(3)

## Array con valores aleatorios en el intervalo [0, 1)

In [None]:
np.random.random((2,3))

podemos leer tambien texto y convertirlo en un np.array

In [None]:
!cat ./CSV/numpy.txt

In [None]:
np_txt = np.genfromtxt("./CSV/numpy.txt", delimiter=",")
np_txt

## Ventajas de np.array versus lists

In [None]:
lista_2d = [[1222,2222,2223], [5,23,40004]]

array_2d = np.array([[1222,2222,2223], [5,23,40004]])

print("Tamaño de la lista en memoria:     {} bytes".format(sys.getsizeof(lista_2d)))
print("Tamaño del numpy array en memoria: {} bytes".format(sys.getsizeof(array_2d)))

No obstante, cuando trabajamos con cantidades grandes, numpy empieza a funcionar mejor

`%%timeit` es un magic de jupyter que evalua el tiempo que tarda una celda en computar, al pasarle el parámetro -n=10 le decimos que queremos que  mida el tiempo corriendo el código 10 veces

In [None]:
%%timeit -n 10
sum(range(10000000))

In [None]:
%%timeit -n 10
np.sum(np.arange(10000000))

Para poder utilizar todo el potencial de utilizacion numerica de numpy, **todos los elementos del numpy array tienen que ser del mismo tipo**, si no lo son, numpy intenta convertir los elementos a un sólo tipo. Numpy hace eso para poder hacer operaciones vectorizadas.

## Tipo de datos que almacena el array

In [None]:
np.array([1, 3.9]).dtype

In [None]:
np.array([1, "1"])

In [None]:
from datetime import datetime

# Si no puede optimizar un array, numpy lo creara con el tipo object, en el que trabajara simplemente con objetos de python.
np.array([1, datetime.utcnow()])

# Seleccion por secciones y por indices (slicing e indexing)
[inicio_fila:final_fila,inicio_columna:final_columna]

In [None]:
matriz_34 = np.array([
    [1,2,3,4],
    [5,6,7,8],
    [9,10,11,12]
])
matriz_34

In [None]:
matriz_34.shape

In [None]:
matriz_34[0]

In [None]:
matriz_34[:2]

In [None]:
matriz_34[:,1]

## Referencia a un elemento vs múltiples elementos

In [None]:
seccion = matriz_34[:2,:]
seccion

In [None]:
print(matriz_34[0,1])
seccion[0, 0] = 0
matriz_34

In [None]:
seleccion = matriz_34[1,3]
print(seleccion)
seleccion = 100
matriz_34

## Filtrado

In [None]:
matriz_32 = np.array([
    [1, 2],
    [3, 4],
    [5, 6]
])
matriz_32

In [None]:
indice_fitrado = (matriz_32 >= 4)
indice_fitrado

In [None]:
matriz_32[indice_fitrado]

## Aritmetica con numpy arrays

In [None]:
array1 = np.array([
    [0,1],
    [2,3]
])
array2 = np.array([
    [4,5],
    [6,7]
])

print(array1)
print(array2)

In [None]:
# suma elemento a elemento
array1 + array2

In [None]:
# multiplicación elemento a elemento
array1 * array2

In [None]:
# Desde python 3.5, podemos usar el simbolo @ para indicar una multiplicación de matrices (para versiones anteriores se usa la funcion dot
array1 @ array2

In [None]:
array1.dot(array2)