## Ejemplo 3: Funciones vectorizadas y agregaciones con `DataFrames`

### 1. Objetivos:
    - Aprender cómo usar Funciones vectorizadas y agregaciones aplicadas a `DataFrames` completos
 
### 2. Desarrollo:

In [None]:
import pandas as pd

Tenemos los siguientes datos y su correspondiente DataFrame:

In [None]:
datos = {
    'precio': [34, 54, 223, 78, 56, 12, 34],
    'cantidad_en_stock': [3, 6, 10, 2, 5, 45, 2],
    'productos_vendidos': [3, 45, 23, 76, 24, 6, 2]
}

df = pd.DataFrame(datos,
    index=["Pokemaster", "Cegatron", "Pikame Mucho",
           "Lazarillo de Tormes", "Stevie Wonder",
           "Needle", "El AyMeDuele"])

In [None]:
df

Si aplicamos operaciones aritméticas a nuestro `DataFrame` la operación se aplicará elemento por elemento a nuestro `DataFrame` completo, por ejemplo multiplica por 100 todos los valores del DataFrame:

In [None]:
...

Ahora suma 100 y divide por 2:

In [None]:
...

Eleva al cuadrado todos los valores del DataFrame

In [None]:
...

También podemos aplicar funciones vectorizadas con el mismo resultado:

In [None]:
import numpy as np

Eleva al cuadrado usando la función vectorizadas de NumPy `np.power(-dataframe-,-potencia-)`:

In [None]:
...

O se puede obtener la raíz cuadrada usando la función vectorizadas de NumPy `np.sqrt(-dataframe-)`:

In [None]:
...

También se puede aplicar la siguiente fórmula a todos los elementos `sen(x) + 100`:

In [None]:
...

Si usamos agregaciones, las agregaciones se hacen de manera automática por columna, por ejemplo `dataframe.sum()`:

In [None]:
...

Ahora guardemos el resultado en la variable `suma_columnas`:

In [None]:
suma_columnas = ...

Y si aplicamos nuevamente la suma al resultado anterior que es una Serie de Pandas:

In [None]:
suma_columnas...

O se podría aplicar de forma secuencial `dataframe.sum().sum()`:

In [None]:
...

Aunque podemos cambiar ese comportamiento usando `dataframe.sum(axis=1)` para hacerlo por filas:

In [None]:
...

Todas las demás agregaciones funcionan también. El default (o `axis=0`) es hacerlo por columna, pero todas pueden funcionar por fila usando `axis=1`, por ejemplo se puede obtener el mínimo de cada columna usando:

    dataframe.min(axis=0)
    
o por filas haciendo:

    dataframe.min(axis=1)


In [None]:
...

In [None]:
...

---
---

## Reto 3: Agregaciones con `DataFrames`

### 1. Objetivos:
    - Aplicar agregaciones a `DataFrames` completos para obtener un análisis estadístico
 
### 2. Desarrollo:

#### a) Análisis estadístico con agregaciones

Eres el Analista de Datos de EyePoker Inc. Te han pedido que realices ciertas agregaciones con un conjunto de datos para poder realizar un análisis estadístico básico de los datos que hay dentro.

El conjunto de datos es el siguiente:

In [None]:
import pandas as pd

In [None]:
datos = {
    'producto': ["Pokemaster", "Cegatron", "Pikame Mucho", "Lazarillo de Tormes", "Stevie Wonder", "Needle", "El AyMeDuele", "El Desretinador", "Sacamel Ojocles", "Desojado", "Maribel Buenas Noches", "Cíclope", "El Cuatro Ojos"],
    'precio': [12000, 5500, 2350, 4800, 8900, 6640, 1280, 1040, 23100, 16700, 15000, 13400, 19600],
    'cantidad_en_stock': [34, 54, 36, 78, 56, 12, 34, 4, 0, 18, 45, 23, 5],
    'cantidad_vendidos': [120, 34, 59, 9, 15, 51, 103, 72, 39, 23, 10, 62, 59]
}

df = pd.DataFrame(datos)

In [None]:
df

Tu tarea es muy simple. Usando métodos de agregación, asigna las variables de la siguiente celda con los resultados de agregar nuestro `DataFrame` **por columna** usando cada una de las medidas estadísticas. Algunas de los métodos ya los conoces. Los que no, [puedes encontrarlos en este link](https://www.interactivechaos.com/manual/tutorial-de-pandas/dataframes-metodos-de-agregacion-y-estadistica). Lo que queremos obtener es una `Serie` con los nombres de las columnas como índice y las agregaciones por columna como valores. Una de las columnas que tenemos en el `DataFrame` no se presta para realizar análisis numéricos, elimínala antes de realizar tu análisis y asigna el resultado a la variable `df_droppped`.

**Sólo** utiliza funciones de agregación para tu análisis. En este caso no requieres hacer ninguna operación aritmética.

In [None]:
# Eliminando columna
df_dropped = ...

df_dropped

In [None]:
# El valor mínimo de cada columna
...

mins

In [None]:
# El valor máximo de cada columna
...

maxs

In [None]:
# El promedio por columna
...

media

In [None]:
# La mediana por columna (El valor que se encuentra a la mitad de la secuencia ordenada de valores)
...

mediana

In [None]:
# La desviación estándar por columna
...

stds

Y la celda de verificación ...

In [None]:
def resumen_estadistico(df, df_dropped, mins, maxs, means, medians, stds):
    
    import pandas as pd
    f = lambda x: "".join([chr(int(x[i:i+2], 16)) for i in range(0, len(x), 2)])
    datos_1 = ["64662E64726F7028636F6C756D6E733D5B2770726F647563746F275D29", "64665F64726F707065642E6D696E28617869733D3029", "64665F64726F707065642E6D617828617869733D3029", "64665F64726F707065642E6D65616E28617869733D3029", "64665F64726F707065642E6D656469616E28617869733D3029", "64665F64726F707065642E73746428617869733D3029"]
    error = False
    
    df_eva = eval(f(datos_1[0]))
    if not df_eva.equals(df_dropped):
        print(f'La columna no-numérica no fue eliminada correctamente... Por favor inténtalo de nuevo')
        error = True
        
    df_eva = eval(f(datos_1[1]))
    if not df_eva.equals(mins):
        print(f'El valor mínimo no fue computado adecuadamente... Por favor inténtalo de nuevo')
        error = True
        
    df_eva = eval(f(datos_1[2]))
    if not df_eva.equals(maxs):
        print(f'El valor máximo no fue computado adecuadamente... Por favor inténtalo de nuevo')
        error = True
        
    df_eva = eval(f(datos_1[3]))
    if not df_eva.equals(means):
        print(f'El promedio no fue computado adecuadamente... Por favor inténtalo de nuevo')
        error = True
    
    df_eva = eval(f(datos_1[4]))
    if not df_eva.equals(medians):
        print(f'La mediana no fue computada adecuadamente... Por favor inténtalo de nuevo')
        error = True
        
    df_eva = eval(f(datos_1[5]))
    if not df_eva.equals(stds):
        print(f'La desviación estándar no fue computada adecuadamente... Por favor inténtalo de nuevo')
        error = True
    
    if not error:
        rango = maxs - mins
        mins.name = 'Min'
        maxs.name = 'Max'
        rango.name = 'Rango'
        means.name = 'Promedio'
        medians.name = 'Mediana'
        stds.name = 'Std'
        
        resumen = pd.concat([mins, maxs, rango, means, medians, stds], axis=1)
        print(resumen)
        
resumen_estadistico(df, df_dropped, mins, maxs, media, mediana, stds)