## Reto 2: Estimados de locación

### 1. Objetivos:
    - Implementar los algoritmos para obtener estimados de locación sin utilizar los métodos builtin de pandas
 
---
    
### 2. Desarrollo:

#### a) Implementando estimados de locación

Este Reto va a consistir en implementar el promedio y la mediana sin utilizar los métodos `mean` y `median` que vienen incluidos en `pandas`. Implementar algoritmos desde 0 es una excelente práctica que nos ayuda a entenderlos mejor y recordarlos con más precisión.

Puedes utilizar `pandas` y otras funciones vectorizadas o de reducción. Las únicas funciones que no están permitidas son `mean` y `median`. Las dos funciones que vas a crear deben recibir una serie de `pandas` y regresar un solo número.

In [1]:
def promedio_custom(serie):
  return sum(serie)/len(serie)

In [29]:
def mediana_custom(serie):
  serie = sorted(serie)
  n = len(serie)
  if n%2 == 0:
    aux = int (n/2)
    mediana = (serie[aux]+serie[aux-1])/2
  else:
    aux = int ( (n-1)/2 )
    mediana = serie[aux]
  return mediana

#### b) Estimados de locación de diámetros de meteoritos

Ahora vamos a utilizar nuestras funciones custom para obtener estimados de locación de un conjunto de datos que contiene información acerca de objetos que orbitaron cerca de la Tierra durante el periodo de enero y febrero de 1995.

El dataset se llama 'near_earth_objects-jan_feb_1995-clean.csv' y la columna que vamos a analizar se llama 'estimated_diameter.meters.estimated_diameter_max'. Esta columna contiene el diámetro máximo estimado de cada objeto.

El reto es el siguiente:

1. Lee el dataset usando `pandas`.
2. Obtén el promedio y la mediana usando tus funciones custom y asígnalas a `promedio_diametro` y `mediana_diametro`.
3. Corre la celda que contiene el código para verificar tus resultados.
4. Responde la pregunta que te regresa la función de verificación.

In [21]:
import pandas as pd
import os

In [23]:
# Lee el dataset y asígnalo a esta variable
mainpath = "https://raw.githubusercontent.com/EduHdzVillasana/B2-Analisis-de-Datos-con-Python-2020-Santander/main/Datasets"
filepath = 'near_earth_objects-jan_feb_1995-clean.csv'
df_meteoritos = pd.read_csv(os.path.join(mainpath, filepath))
df_meteoritos.sample(5)

Unnamed: 0.1,Unnamed: 0,id,name,is_potentially_hazardous_asteroid,estimated_diameter.meters.estimated_diameter_min,estimated_diameter.meters.estimated_diameter_max,close_approach_date,epoch_date_close_approach,orbiting_body,relative_velocity.kilometers_per_second,relative_velocity.kilometers_per_hour
200,200,3780805,(2017 QN16),False,127.219879,284.472297,1995-02-01,791672820000,Earth,7.707831,27748.1899
59,59,3678562,(2014 OE338),False,167.708462,375.007522,1995-01-12,789913560000,Earth,18.236464,65651.270573
290,290,3766034,(2016 XQ23),False,581.50704,1300.28927,1995-02-24,793642200000,Earth,10.671826,38418.574911
158,158,3742340,(2016 CJ136),False,127.219879,284.472297,1995-01-26,791127840000,Earth,16.128108,58061.18892
155,155,3746215,(2016 ED85),False,766.575574,1714.115092,1995-01-26,791136480000,Earth,17.568099,63245.155298


In [24]:
promedio_diametro = promedio_custom(df_meteoritos["estimated_diameter.meters.estimated_diameter_max"])
promedio_diametro

410.0860422397653

In [30]:
mediana_diametro = mediana_custom(df_meteoritos["estimated_diameter.meters.estimated_diameter_max"])
mediana_diametro

215.7943048444

In [31]:
# Pídele al experto la función `verificar_resultados` para que puedas correr la siguiente verificación

def verificar_resultados(df_meteoritos, promedio_diametro, mediana_diametro):
    promedio = df_meteoritos['estimated_diameter.meters.estimated_diameter_max'].mean()
    if promedio_diametro != promedio:
        print(f'El promedio no fue calculado correctamente.')
        print(f'Promedio esperado: {promedio}; Promedio recibido: {promedio_diametro}')
        return
        

    mediana = df_meteoritos['estimated_diameter.meters.estimated_diameter_max'].median()
    if mediana_diametro != mediana:
        print(f'La mediana no fue calculada correctamente.')
        print(f'Mediana esperada: {mediana}; Mediana recibida: {mediana_diametro}')
        return
        
    print(f'Los estimados fueron calcualados correctamente.\n')
    print(f'El promedio calculado fue de {promedio_diametro} mientras que la mediana fue de {mediana_diametro}.')
    print(f'¿A qué le atribuyes tú la diferencia?')
verificar_resultados(df_meteoritos, promedio_diametro, mediana_diametro)

Los estimados fueron calcualados correctamente.

El promedio calculado fue de 410.0860422397653 mientras que la mediana fue de 215.7943048444.
¿A qué le atribuyes tú la diferencia?


<details><summary>Solución</summary>

```python
def promedio_custom(serie):
    return serie.sum() / serie.count()
    
def mediana_custom(serie):
    import numpy as np
    
    serie_ordenada = serie.sort_values(ascending=True)
    length_of_series = serie.count()
    
    if length_of_series % 2 == 0:
        bottom =int(length_of_series / 2)
        top = int(bottom + 1)
        return (serie_ordenada.iloc[bottom] + serie_ordenada.iloc[top]) / 2
    else:
        index = int(np.ceil(length_of_series / 2))
        return serie_ordenada.iloc[index]
    
import pandas as pd
df_meteoritos = pd.read_csv('../../Datasets/near_earth_objects-jan_feb_1995-clean.csv', index_col=0)
promedio_diametro = promedio_custom(df_meteoritos['estimated_diameter.meters.estimated_diameter_max'])
mediana_diametro = mediana_custom(df_meteoritos['estimated_diameter.meters.estimated_diameter_max'])
```
    
</details>