<a href="https://colab.research.google.com/github/BubuDavid/-Zombies-Proyecto-Final-de-Programacion-Basica/blob/master/M%C3%B3dulo%202%20-%20NumPy/2.3%20-%20Completo%20-%20Operaciones%20b%C3%A1sicas%20y%20UFuncs.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Operaciones básicas y UFuncs

Hasta ahora, hemos estado discutiendo algunos de los aspectos básicos de NumPy; en esta y las siguientes secciones, profundizaremos en las razones por las que NumPy es tan importante en el mundo de la ciencia de datos con Python. Principalmente, porque ofrece una interfaz fácil y flexible para realizar cálculos optimizados con arreglos de datos.

Los cálculos en arreglos de NumPy pueden ser muy rápidos o muy lentos, y la clave para hacerlos rápidos es utilizar operaciones vectorizadas, generalmente implementadas a través de las funciones universales (ufuncs) de NumPy. Esta sección explora la necesidad de las ufuncs de NumPy, que pueden usarse para hacer cálculos repetidos sobre elementos de un arreglo de manera mucho más eficiente. También se presentan algunas de las ufuncs aritméticas más comunes y útiles disponibles en el paquete de NumPy.

# Comparativa Python loops vs. UFuncs de NumPy

## Python for loop

Vamos a ver un ejemplo, imagina que tenemos un arreglo de valores y necesitamos por alguna razón, calcular el recíproco (es decir, uno dividido entre cada uno de los elementos del arreglo), una manera muy natural de resolver el problema es el siguiente programa.

In [None]:
import numpy as np

In [None]:
def compute_reciprocals(values):
    reciprocals = np.zeros(values.shape)
    for i in range(len(values)):
        reciprocals[i] = 1.0 / values[i]

    return reciprocals

In [None]:
# Testeando la función
og_values = np.random.randint(1, 10, size = 10)
compute_reciprocals(og_values)

Esta implementación puede parecer muy lógica y sencilla y cualquier persona que programara un poco podría llegar a ella, sin embargo, ¿qué pasa cuando agregamos muchos más datos?

In [None]:
big_array = np.random.randint(1, 100, size = 1_000_000)
%timeit compute_reciprocals(big_array) # Este comando mágico prueba nuestra función unas cuantas veces y nos regresa cuál fue el mejor tiempo.

Este comando mágico prueba nuestra función unas cuantas veces y nos regresa cuál fue el mejor tiempo. ¡Tarda 2 segundos en calcular para 1 Millón de datos! Podrás pensar que eso no es mucho pero 2 segundos usando las computadoras de Google???? Eso es un montón, además 1 Millón de datos en realidad no es tan grande...

## UFunc de NumPy

Ahora, hagamos el mismo ejercicio pero con una UFunc

In [None]:
# Primero veamos que es lo mismo para saber que estamos haciendo las cosas bien
og_values = np.random.randint(1, 10, size = 4)
print(compute_reciprocals(og_values))
print(1.0 / og_values)

In [None]:
# Ahora probemos esa misma lógica con el arreglo grandote
%timeit (1.0 / big_array)

Las operaciones vectorizadas en NumPy se implementan a través de las *ufuncs*, cuyo principal propósito es ejecutar rápidamente operaciones repetidas en los valores de los arreglos de NumPy. Las *ufuncs* son extremadamente flexibles: anteriormente vimos con la operación de división, pero realmente pueden hacerlo con todas las operaciones veamos:

In [None]:
og_values # Veamos que hay dentro de og_values

In [None]:
# ¿Qué pasa si sumamos?
og_values + 10

In [None]:
# Restamos
og_values - 12

In [None]:
# Sacamos el módulo
og_values % 2

Pero hay más que eso, se pueden hacer operaciones con otros arreglos

In [None]:
other_values = np.random.randint(1, 100, size = 4) # Definamos y veamos qué hay aquí
other_values

In [None]:
# Sumemos este entre el otro
og_values + other_values

También funcionan con operaciones más complejas y arreglos de diferentes dimensiones, por ejemplo.

In [None]:
# Definir una matriz de 3x3 de números del 1 al 9
x = np.arange(9).reshape((3, 3))

# Elevar 2 a la cada uno de los números de esas matrices
2 ** x

Los cálculos usando vectorización a través de *ufuncs* son casi siempre más eficientes que sus equivalentes implementados con bucles en Python, especialmente a medida que los arreglos crecen en tamaño. Cada vez que veas un bucle de este tipo en un script de Python, deberías considerar si puede ser reemplazado por una expresión vectorizada.

# Explorando Ufuncs

Vamos a explorar todas las UFuncs básicas y otras no tan básicas, aunque ya lo hicimos un poco anteriormente.

In [None]:
x = np.arange(4)
print("x      =", x)
print("x + 5  =", x + 5)
print("x - 5  =", x - 5)
print("x * 2  =", x * 2)
print("x / 2  =", x / 2)
print("x // 2 =", x // 2)  # División piso o floor division
print("-x     =", -x)
print("x ** 2 =", x ** 2)
print("x % 2  =", x % 2)

In [None]:
# Incluso podemos mezclarlas y prácticamente hacer matemáticas más complejas como:
-(0.5 * x + 1) ** 2

## Ufuncs propias de numpy

Pero no solo podemos usar las operaciones básicas, NumPy viene bien cargada de operaciones más intersantes y detalladas para casos más complejos, como:

In [None]:
# Operaciones trigonométricas
print("x      = ", x)
print("sin(x) = ", np.sin(x))
print("cos(x) = ", np.cos(x))
print("tan(x) = ", np.tan(x))

# Exponenciales
print("e^x   =", np.exp(x))
print("2^x   =", np.exp2(x))
print("3^x   =", np.power(3, x))

# Logarítmicas
print("ln(x)    =", np.log(x  + 1))
print("log2(x)  =", np.log2(x  + 1))
print("log10(x) =", np.log10(x + 1))

## Funciones especializadas (*ufuncs*)  

NumPy ofrece muchas más *ufuncs* especializadas, que incluyen funciones trigonométricas hiperbólicas, operaciones bit a bit, operadores de comparación, conversiones de radianes a grados, redondeos, restos y mucho más. Un vistazo a la documentación de NumPy revela una gran cantidad de funcionalidades interesantes.

Otra excelente fuente de *ufuncs* más especializadas y específicas es el submódulo `scipy.special`. Si necesitas calcular alguna función matemática poco común en tus datos, es probable que esté implementada en `scipy.special`. Son tantas las funciones disponibles que es difícil listarlas todas, pero el siguiente ejemplo muestra algunas que podrían ser útiles en un contexto estadístico:

In [None]:
from scipy import special

In [None]:
# Funciones Gamma (o generalizaciones de factoriales) y otras funciones raras
x = [1, 5, 10]
print("gamma(x)     =", special.gamma(x))
print("ln|gamma(x)| =", special.gammaln(x))
print("beta(x, 2)   =", special.beta(x, 2))