## Reto 2: Agregaciones

### 1. Objetivos:
    - Usar funciones vectorizadas y agregaciones para computar la desviación estándar de un conjunto de datos
 
---
    
### 2. Desarrollo:

#### a) Desviación Estándar

La desviación estándar es una medida que nos dice qué tan dispersos están los datos con respecto a la media. Es una de las medidas estadísticas más comunes e importantes. En este reto vamos a calcular la desviación estándar de un conjunto de datos usando funciones vectorizadas y agregaciones

Imagina que has realizado un censo en la H. Universidad de las Américas Unidas. Quieres saber qué tanta dispersión de edades hay en la universidad. Dada la naturaleza de la universidad, hay tanto alumnos extremadamente jóvenes (el más joven tiene 15 años) hasta alumnos bastante mayores (el alumno de más edad tiene 52 años). Para saber qué tan dispersas están las edades de los alumnos, vas a usar la desviación estándar.

El algoritmo para sacar la desviación estándar es el siguiente:

1. Saca el promedio de tu `Serie`. Esto se hace sumando todos tus datos y luego dividiéndolos entre la cantidad de datos (`n`)
2. Después toma tu `Serie` y réstale a cada elemento el promedio. De esta manera obtenemos una nueva `Serie` que contiene las diferencias entre cada dato y el promedio.
3. Después eleva tu `Serie` al cuadrado. Esto sirve para acentuar a los datos que están más alejados de tu promedio.
4. Ahora suma todos los elementos de tu `Serie` y divídelos entre la cantidad de datos de la `Serie` original menos 1 (`n - 1`).
5. Por último, saca la raíz cuadrada del valor obtenido: Ésta es tu desviación estándar.

Utiliza aritmética con `Series`, funciones vectorizadas y agregaciones para calcular esta estadística.

Asigna tu resultado final a la variable `std`.

In [1]:
## Realiza aquí los imports que necesites
import pandas as pd
import numpy as np

In [2]:
edades = pd.Series([23, 24, 23, 34, 30, 17, 18, 24, 35, 28, 27, 27, 34, 32, 29, 16, 16, 17, 19, 34, 45, 46, 43, 45, 43, 32, 25, 29, 28, 38, 30, 37, 38, 24, 26, 25, 24, 19, 19, 18, 17, 18, 21, 20, 23, 24, 25, 25, 26, 24, 23, 32, 24, 25, 24, 36, 35, 36, 38, 39, 45, 46, 43, 48, 42, 41, 41, 26, 19, 19, 19, 20, 39, 38, 43, 28, 27, 39, 43, 52, 50, 38, 15, 17, 23, 25, 19, 32, 34, 35, 19, 19, 20, 26, 25, 43, 45, 46, 34, 33, 30, 30, 34, 45, 50, 50, 47, 25, 34, 37, 38, 19, 19, 20, 25, 28, 34, 32, 36, 39, 39, 28, 34, 33, 22, 25, 17, 17, 22, 24, 25, 45, 46, 43, 34, 35, 32, 23]) 

In [12]:
## Realiza aquí tus cálculos
##
## ...
## ...

std = edades.sum()/edades.count()
std

30.492753623188406

In [13]:
serie_b = np.subtract(edades, std)
serie_b

0      -7.492754
1      -6.492754
2      -7.492754
3       3.507246
4      -0.492754
         ...    
133    12.507246
134     3.507246
135     4.507246
136     1.507246
137    -7.492754
Length: 138, dtype: float64

In [14]:
serie_b = np.square(serie_b)
serie_b

0       56.141357
1       42.155850
2       56.141357
3       12.300777
4        0.242806
          ...    
133    156.431212
134     12.300777
135     20.315270
136      2.271792
137     56.141357
Length: 138, dtype: float64

In [15]:
desv = serie_b.sum()/(edades.count()-1)
desv

91.33206389505976

In [16]:
std = np.sqrt(desv)
std

9.55678104254041

Pídele a tu experta la función de verificación `comparar_std` (encontrada en el archivo `helpers.py` de la carpeta donde se encuentra este Reto), pégala debajo y corre la celda para verificar tu resultado:

In [17]:
# Pega aquí la función de verificación
def comparar_std(edades, std):
    std = np.round(std, 6)
    espereada =  np.round(edades.std(), 6)
    print(f'== Comparación Desviaciones Estándares ==\n')
    print(f'Esperada: {espereada} - Recibida: {std}')
    print(f'Cálculo {"Correcto... Felicidades!" if espereada == std else "Incorrecto... Intenta de nuevo"}')

comparar_std(edades, std)

== Comparación Desviaciones Estándares ==

Esperada: 9.556781 - Recibida: 9.556781
Cálculo Correcto... Felicidades!
