### 1) Universal Functions (ufunc)

Una función universal (o ufunc para abreviar) es una función que opera en ndarrays elemento por elemento, admitiendo la transmisión de matrices, la conversión de tipos y varias otras características estándar. Es decir, un ufunc es un contenedor "vectorizado" para una función que toma un número fijo de entradas específicas y produce un número fijo de salidas específicas.

###### Ufuncs unarios

In [None]:
import numpy as np
import matplotlib.pyplot as plt

In [None]:
arr = np.arange(10)
arr

###### Ufuncs binarios

In [None]:
x = np.random.randn(8)
y = np.random.randn(8)

print(x, y, sep = "\n")

In [None]:
np._______(x, y)

Ufuncs acepta un argumento de salida opcional que les permite reemplazar diréctamente el vector:

### 2) Vectorización

El tiempo de ejecución se vuelve una variable sustancial en el manejo de datos y crucial para decidir si una aplicación es confiable o no. Nuestro objetivo siempre se enfocará en ejecutar un algoritmo de gran tamaño en el menor tiempo posible cuando hablamos buscar resultados en tiempo real.

In [None]:
np.random.seed(0)

def compute_reciprocals(values):
    output = np.______(len(values))
    for i in range(len(values)):
        output[i] = 1.0 / values[i]
    return output

values = np.random.randint(1, 10, size=5)
values

In [None]:
big_array = np.random.______(1, 100, size=1000000)
%______ compute_reciprocals(big_array)

In [None]:
print(compute_reciprocals(values))
print(1.0 / ______)

In [None]:
%______ (1.0 / ______)

### Ejercicio realizado por el profesor

Supongamos que deseamos evaluar la función:

$$\sqrt{x^2 + y^2}$$ 

a través de una cuadrícula regular de valores. La función np.meshgrid toma dos matrices 1D y produce dos matrices 2D correspondientes a todos los pares de (x, y) en las dos matrices:

### Ejercicio realizado por el alumno

Evaluar la función:

$$\sin(x)^{10} + \cos(10 + yx) \cos(x)$$

Empleando las mismas coordenadas de x y y; adicionalmente, aplique una barra de color diferente para el plot.

In [None]:
# Solución 

### Condicionales en la vectorización


In [None]:
xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])
yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])
cond = np.array([True, False, True, True, False])

Supongamos que quisiéramos tomar un valor de xarr siempre que el valor correspondiente en cond sea True y, de lo contrario, tomar el valor de yarr. Realizando este procedimiento en una lista podría verse así:

Un uso típico de where en el análisis de datos es producir una nueva matriz de valores basada en otra matriz. Suponga que tiene una matriz de datos generados aleatoriamente y desea reemplazar todos los valores positivos con 2 y todos los valores negativos con -2. _¿Cómo lo haría?_

In [None]:
arr = np.random.randn(4, 4)
arr

Puede combinar escalares y matrices al usar np.where. Por ejemplo, puedo reemplazar todos los valores positivos en arr con la constante 2 así:

### Ejercicios para estudiantes

1) Dada la matriz arr generada en el punto anterior, reemplace todos aquellos valores negativos por su valor absoluto utilizando la función where:

2) Genere un vectór aleatorio de 100 datos que sigan la distribución normal. Calcule el número de valores positivos generados.

3) A continuación, se presenta un proceso de caminata aleatoria simulado. En primer lugar, comente cada línea de código con un breve resúmen de lo que hace (si desconoce alguna función en específico, procure identificar su funcionalidad de forma autónoma, sin recurrir al profesor o a internet); tras entender cada línea, proceda a resolver los siguientes ejercicios en orden:

+ Realice el mismo proceso de caminata aleatoria sin utilizar el ciclo for y empleando únicamente vectóres y funciones de numpy.
+ ¿Cuál es el valor mínimo y máximo alcanzado por la serie entre los pasos 100 y 300?
+ ¿Cuánto tiempo le tomó a la caminata aleatoria alejarse al menos 10 pasos del origen 0 en cualquier dirección?

In [None]:
np.random.seed(104)

position = 0
walk = [position]
steps = 1000

for i in range(steps):
    step = 1 if np.random.randint(0,2) else -1 
    position += step
    walk.append(position)
    
plt.plot(walk[:100]);

In [None]:
# 1 

In [None]:
# 2 


In [None]:
# 3 


### 3) Pandas

In [None]:
import pandas as pd

#### Series

La representación de cadena de una serie que se muestra de forma interactiva muestra el índice a la izquierda y los valores a la derecha. Dado que no especificamos un índice para los datos, se crea uno predeterminado que consta de los números enteros de 0 a N - 1 (donde N es la longitud de los datos).

In [None]:
obj = pd.Series([4, 7, -5, 3])
obj

In [None]:
obj2 = pd.Series([4, 7, -5, 3], ______ =["d", "b", "a", "c"])
obj2

En comparación con las matrices de NumPy, en Pandas se pueden usar etiquetas en el índice al seleccionar valores únicos o un conjunto de valores:

In [None]:
population_dict = {"California": 38332521,
 "Texas": 26448193,
 "New York": 19651127,
 "Florida": 19552860,
 "Illinois": 12882135}

population = pd.______(population_dict)
population

#### DataFrames

Si una Serie es un análogo de una matriz unidimensional con índices flexibles, un DataFrame es un análogo de una matriz bidimensional con índices de fila flexibles y nombres de columna flexibles.

In [None]:
area_dict = {"California": 423967, "Texas": 695662, "New York": 141297,
             "Florida": 170312, "Illinois": 149995}

area = pd.______(area_dict)
area

Ahora que tenemos esto junto con la serie de población de antes, podemos usar un
diccionario para construir un solo objeto bidimensional que contenga esta información:

In [None]:
states = pd.______({"Población": ______,"Área": ______}) 
states