<img src="https://user-images.githubusercontent.com/7065401/39118381-910eb0c2-46e9-11e8-81f1-a5b897401c23.jpeg"
    style="width:300px; float: right; margin: 0 30px 30px 30px;"></img>

NumPy es una biblioteca muy utilizada en Python para
trabajar con vectores multidimensionales (arreglos, matrices,
etc.) que ofrece también una gran colección de funciones matemáticas de alto nivel para operar con ellos.

![purple-divider](https://user-images.githubusercontent.com/7065401/52071927-c1cd7100-2562-11e9-908a-dde91ba14e59.png)

## 1.1 Release

In [1]:
import numpy as np

print(f"La version de numpy es: {np.__version__}")

La version de numpy es: 1.26.4


## 1.2 NumPy Arrays

El punto de entrada a NumPy es la estructura array, que
nos permite manejar matrices de cualquier dimensión (incluso
de una). Estos arreglos, a diferencia de las listas integradas en
el lenguaje python, son homogéneos: todos sus elementos deben ser
del mismo tipo (lo cual es clave en la eficiencia y potencia de
cálculo de esta biblioteca).

In [None]:
vector = np.array([0, 1, 2, 3, 4, 5])

In [None]:
numeros = [0, 7, 8]
vector1 = np.array(numeros)
vector1

In [None]:
vector

NumPy nos ofrece formas rápidas de crear arreglos de distintos tamaños, por ejemplo con los
números secuenciales como el conocido range, pero también inicializados con ceros y con unos
(lo cual es muy normal, ya que son la identidad aditiva y multiplicativa respectivamente):

In [None]:
list(range(0,10,2))

In [None]:
np.arange(0.5, 15.5, 0.5)

In [None]:
np.ones(4)

In [None]:
np.zeros(10)

Vemos que por defecto NumPy crea todos los arreglos como floats. Como decíamos antes,
todos los elementos tienen que ser del mismo tipo, pero tenemos control sobre cual tipo es ese;
por ejemplo, si vamos a trabajar con enteros:

In [None]:
vector = np.ones(5)

In [None]:
vector

In [None]:
vector[0]

In [None]:
type(vector[0])

In [None]:
vector = np.ones(5, dtype=np.int64)

In [None]:
vector

In [None]:
print(type(vector))
print(type(vector[0]))

⁉️ -- Preguntas??

Hagamos una comparación entre las listas integradas y este nuevo tipo de dato, para empezar
a notar las diferencias. Supongamos que queremos trabajar sobre un millón de números al mismo
tiempo (pero por simplificación, usemos sólo 10… para el caso es lo mismo). Entonces
tenemos nuestro millón de números:

In [None]:
clasica = list(range(10))
clasica

Esto, en numpy sería:

In [None]:
nueva = np.arange(10)
nueva

Ahora, supongamos que queremos los cuadrados de esos números.Podemos hacer una list comprehension.

Ingenuamente, intentamos lo mismo para ambas estructuras.

Clasica

In [None]:
lista_clasica = [x ** 2 for x in clasica]

In [None]:
lista_clasica

In [None]:
lista_clasica ** 2

In [None]:
type(lista_clasica)

numpy - 1 version

In [None]:
np.array([x ** 2 for x in nueva])

In [None]:
x = 2
x ** 2

numpy - version final

Y acá es donde descubrimos el inmenso poder de NumPy: nos permite procesar los arreglos directamente, manejando simultaneamente todos sus elementos internos.

En el ejemplo que acabamos de mostrar, Python tiene que recorrer el iterable, ir recibiendo uno por uno los elementos, elevar ese elemento al cuadrado, e irlo agregando a una lista. Con diez elementos no pasa nada, pero recordemos, nuestro ejemplo imaginario tiene un millón de
números.

In [None]:
# numpy array
nueva

In [None]:
type(nueva)

In [None]:
# exponenciacion
nueva ** 2

In [None]:
# suma un valor entero
nueva += 100

In [None]:
nueva = nueva + 100

In [None]:
nueva

Acá tenemos en Python solamente una llamada a una función que estará implementada en
C, Fortran o algún lenguaje de bajo nivel, y fuertemente optimizada. Y se realiza todo el procesamiento necesario solamente con esa llamada a función, obteniendo efectivamente performances
comparables con esos lenguajes de más bajo nivel. De cualquier manera, la idea de usar NumPy
es justamente despreocuparnos sobre cómo está implementada y optimizada, y enfocarnos en
usar la biblioteca correctamente, de la misma manera que al usar Python en sí por ejemplo nos
despreocupamos sobre la administración dinámica que hace de la memoria.

⁉️ -- Preguntas??

Como ejercicio, comparemos las performances de los dos casos de nuestro ejemplo anterior

In [None]:
def f():
  clasica = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
  cuads = [x ** 2 for x in clasica]

def g():
  nueva = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
  cuads = nueva ** 2

print("Método clásico:")
%timeit f()

print("Usando numpy:")
%timeit g()

¡Epa! Vemos que es más lento en NumPy, ¿cómo puede ser eso?

Veamos un ejemplo más real, haciendo lo mismo pero con un millón de números:

In [None]:
def f():
  clasica = range(1_000_000)
  cuads = [x ** 2 for x in clasica]

def g():
  nueva = np.arange(1_000_000)
  cuads = nueva ** 2

print("Método clásico:")
%timeit f()

print("Usando numpy:")
%timeit g()

Y encontramos que para este caso más real, NumPy es más de cien veces más rápido.

Entonces, es responsabilidad nuestra saber cuando utilizar esta biblioteca. Por un lado, no vale la pena para algunos pocos datos, pero especialmente tenemos que tener el cuidado de NO caer en la tentación de procesar los arreglos “a mano en Python”, sino siempre utilizar las herramientas correctas de NumPy.

⁉️ -- Preguntas??

¿Tenemos que sumar los números usando el sum de Python? No. ¿Sacar el máximo usando max? Tampoco. ¿Y si queremos aplicar alguna función matemática? De nuevo, usar las herramientas de NumPy:

In [None]:
arr = np.arange(10)
arr

In [None]:
# calculamos el max
arr.max()

In [None]:
# la suma de todos los elementos del array
arr.sum()

In [None]:
np.sin(arr)

⁉️ -- Preguntas??

## 1.3 Multidimensionalidad

Hasta ahora sólo armamos un arreglo de una sola dimensión, pero como decíamos arriba, NumPy permite que sean de varias dimensiones.
Incluso esas dimensiones pueden no ser iguales. Armemos por ejemplo una matriz de dos dimensiones que nos quede como una “tabla rectangular”:

In [None]:
# array de 2 filas y 5 columnas
np.ones((2, 5))

Para acceder a un elemento de la matriz

In [None]:
x = np.array([[1, 2, 3], [4, 5, 6]], np.int32)

# [fila, columna]
print(x[1,0])
print(type(x[1,0]))

También, podemos cambiarle la forma. Armemos la misma matriz pero con números secuenciales:

In [None]:
lineal = np.arange(20)
lineal

In [None]:
# ver dimensiones
lineal.shape

In [None]:
#  cambia la forma/dimensiones
matriz = lineal.reshape(2,10)
matriz

In [None]:
matriz.shape

También podemos preguntar la cantidad de dimensiones, y el tamaño del arreglo

In [None]:
lineal.ndim

In [None]:
matriz.ndim

In [None]:
lineal.size

In [None]:
matriz.size

In [None]:
matriz.dtype

In [None]:
matriz.nbytes

In [None]:
matriz = matriz.astype(np.int32)

In [None]:
matriz.nbytes

⁉️ -- Preguntas??

## 1. 4 Indexacion y Slicing

Cuando hacemos slicing de arreglos de Numpy tenemos que tener un gran detalle en cuenta: a diferencia del mismo procedimiento en las listas integradas de Python, donde efectivamente tenemos una copia de la lista original, en el caso de NumPy lo que obtenemos es una “vista” del
arreglo original.
Esta vista es afectada si modificamos el arreglo original, y viceversa. Esto es algo que hace NumPy en pos de la velocidad de procesamiento, ya que evita estar copiando objetos en memoria todo el tiempo.

In [None]:
l1 = [1,2,3,4]
l2 = l1[:2]
l2

In [None]:
l1[0] = 0
print(l2)
print(l1)

In [None]:
l2[1] = 9
l1

Y ahora el caso de los arreglos de NumPy, con el comportamiento de las vistas:

In [None]:
a1 = np.array([0,1,2,3,4])
a2 = a1[:2]
a2

In [None]:
a1[0] = 7
print(a1)
print(a2)

In [None]:
a2[1] = 9
print(a1)
print(a2)

⁉️ -- Preguntas??

### 1.5 Indexacion avanzada

NumPy ofrece una funcionalidad interesante, ¡podemos también indexar usando otros arreglos! Esto explota en distintas funcionalidades que vemos en esta sección.
Si el arreglo-índice tiene números, esos números indicarán la posición de los elementos que queremos del arreglo que estamos indizando.
En el siguiente ejemplo usamos esta funcionalidad para sacar los cuadrados de las posiciones
2, 3, 15 y 7:

In [None]:
cuadrados = np.arange(20) ** 2
cuadrados

In [None]:
indice = [2, 3, 15, 7]
cuadrados[indice]

Los indices, pueden ser repetidos

In [None]:
vec = cuadrados[[0, 1, 2, 3, 2, 1, 0]]

In [None]:
vec

Por otro lado, si el arreglo-índice está compuesto por booleanos, los mismos indicarán qué elementos elegimos del arreglo que estamos indexando (en este caso el índice tiene que tener el mismo largo que el arreglo indexado).

In [None]:
nros = np.array([0, 1, 2, 3, 4])
indice = [True, False, False, True, False]
nros[indice]

Esto es muy útil para elegir elementos de un arreglo en función de si cumplen alguna condición (lo cual en muchos contextos se denomina máscara).

Veamos un ejemplo donde tenemos muchos números y queremos calcular el logaritmo sólo de los positivos (claro que lo podríamos hacer con una list comprehension eliminando a los negativos y luego calculando el logaritmo de cada uno, pero recordemos que la idea es siempre quedarnos
adentro de NumPy, para aprovechar al máximo la potencia de esta biblioteca).


In [None]:
numeros = np.random.randint(-10, 10, 20)
numeros

In [None]:
positivos = numeros > 0
positivos

In [None]:
numeros_positivos = numeros[positivos]
numeros_positivos

In [None]:
np.log(numeros_positivos)

⁉️ -- Preguntas??

NumPy también nos da mecanismos para trabajar con arreglos correlacionados (esto es, dos o más arreglos donde cada elemento de un arreglo tiene una relación con el elemento de la misma posición en los otros arreglos).
Por ejemplo, podemos tener unas mediciones para graficar, con los valores del eje x en un arreglo y los correspondientes del eje y en otro. Por algún motivo necesitamos ordenar los puntos del eje x, pero obviamente debemos mantener la relación con los valores correspondientes del eje y.
Para ello usaremos la función np.argsort, que nos devuelve un arreglo-índice que ordenaría el arreglo indicado, y luego usamos ese índice con ambos arreglos x e y:

In [None]:
x = np.array([7, 3, 5, 9, 0, 6, 4, 1, 2, 8])
y = np.array([-8, 1, -3, -2, 3, 6, 5, -3, 2, 9])
indice = np.argsort(x)
print(f"indice: {indice}")
sorted_x = x[indice]
sorted_y = y[indice]

print(sorted_x)
print(sorted_y)

⁉️ -- Preguntas??

### 1.6 Vectores y Matrices

1.6.1 Multiplicar elementos entre si

In [None]:
numeros = np.array([0, 1, 2, 3, 4])
numeros * 3

**Broadcasting**

Broadcasting es la capacidad de NumPy para realizar operaciones matemáticas entre arrays de diferentes formas (shape), sin necesidad de copiarlos o expandirlos manualmente.

 Sumar un escalar a un array

In [None]:
a = np.array([1, 2, 3])
b = 2
resultado = a + b
print(resultado)

Sumar un vector columna a una matriz

In [None]:
A = np.array([[1, 2, 3], [4, 5, 6]])  # Matriz 2x3
B = np.array([[10], [20]])            # Vector columna 2x1

resultado = A + B  # Broadcasting extiende B para que coincida con A
print(resultado)

Multiplicación entre un vector fila y un vector columna

In [None]:
fila = np.array([1, 2, 3])     # 1x3
columna = np.array([[1], [2]]) # 2x1

resultado = columna * fila  # Broadcasting expande ambos
print(resultado)

1.6.2 Multiplicacion de matrices

Si multiplicamos una matriz por un vector, la regla es que el largo del vector tiene que coincidir con la cantidad de columnas de la matriz, y el resultado será un vector de largo igual a la
cantidad de filas de la matriz, y en cada posición la suma del producto los escalares del vector y
esa fila de la matriz.

M x Y<br>
    Y x N

El resultado es una matriz de M x N

In [None]:
A

In [None]:
B

In [None]:
# fila x columna
A.dot(B)

In [None]:
A @ B

In [None]:
B

In [None]:
# transpuesta
B.T

1.6.3 Estadisticas

In [None]:
# datos
a = np.array([1, 2, 3, 4])

In [None]:
# la suma de todos los valores
a.sum()

In [None]:
np.sum(a)

In [None]:
# promedio
a.mean()

In [None]:
# varianza
a.var()

In [None]:
# desvio estandar
a.std()

In [None]:
# mediana
np.median(a)

In [None]:
A = np.array([
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9]
])

In [None]:
A.sum()

In [None]:
# suma columna
C=A.sum(axis=0)
C

In [None]:
C.shape

In [None]:
# suma filas
D = A.sum(axis=1)
D

In [None]:
D.shape

In [None]:
A.mean()

In [None]:
A.std()

In [None]:
A.sum(axis=0)

In [None]:
A.mean(axis=0)

In [None]:
A

In [None]:
A.sum(axis=1)

In [None]:
A.mean(axis=1)

In [None]:
A > 5

In [None]:
A[A > 5]

## Uso de Memoria

<img src="https://docs.google.com/drawings/d/e/2PACX-1vTkDtKYMUVdpfVb3TTpr_8rrVtpal2dOknUUEOu85wJ1RitzHHf5nsJqz1O0SnTt8BwgJjxXMYXyIqs/pub?w=726&h=396" />

In [None]:
import sys

### int, floats

In [None]:
# Un entero en Python es > 24bytes
sys.getsizeof(1)

In [None]:
# Un float en Python
sys.getsizeof(1.2)

In [None]:
# En NumPy el tamaño es menor
np.dtype(int).itemsize

In [None]:
# En NumPy el tamaño es menor
np.dtype(np.int8).itemsize

![purple-divider](https://user-images.githubusercontent.com/7065401/52071927-c1cd7100-2562-11e9-908a-dde91ba14e59.png)