Ejercicios estadística inferencial
1. Igual que en los ejercicios de la clase invertida, evalúa si las siguientes afirmaciones corresponden a una distribución exponencial o poisson => Exponencial
- ¿El tiempo que transcurre entre la llegada de autobuses a una parada sigue una distribución exponencial o de Poisson? => Exponencial
- ¿El tiempo que transcurre entre la llegada de solicitudes de servicio en un restaurante sigue una distribución exponencial o de Poisson? => Exponencial
- ¿El tiempo que transcurre entre la llegada de taxis en una parada sigue una distribución exponencial o de Poisson? => Exponencial
- ¿El número de errores de ortografía en un libro de texto sigue una distribución exponencial o de Poisson? => Poisson

Ejercicios intervalo de confianza. 

2. Al igual que en el caso del ejercicio de la clase invertida, piensa un motivo por el que sería interesante calcular estos intervalos de confianza para la extracción de insights.
- Intervalo de Confianza para la Esperanza de Vida
Contexto: Trabajas en una organización de salud global y deseas estimar el intervalo de confianza al 95% para la esperanza de vida promedio de cada continente.
Nota: Cuidado porque puede que os salgan algunos nulos, genera un código para que no salgan nulos en los intervalos de confianza.
- Intervalo de Confianza para el PIB
Contexto: Eres una economista y quieres calcular el intervalo de confianza al 90% para el Producto Interno Bruto (PIB) de los continentes.

Calcular intervalos de confianza en estos contextos es crucial porque nos permite obtener una estimación más precisa y con un nivel de certeza conocido sobre el valor medio de variables clave, como la esperanza de vida o el PIB, basándonos en datos muestrales.

Intervalo de Confianza para la Esperanza de Vida:
Motivo: Estimar la esperanza de vida promedio con un intervalo de confianza nos permite evaluar la calidad de vida y las condiciones de salud de diferentes continentes. Este análisis es útil para priorizar intervenciones de salud pública y asignar recursos de manera más efectiva.
Insight: Un intervalo de confianza estrecho indicaría que tenemos una estimación precisa de la esperanza de vida, mientras que un intervalo amplio podría señalar la necesidad de más datos o indicar una gran variabilidad dentro del continente.

Intervalo de Confianza para el PIB:
Motivo: Calcular un intervalo de confianza para el PIB de los continentes proporciona una estimación sobre el desempeño económico medio con un cierto grado de certeza. Este análisis es útil para entender el potencial económico y la estabilidad de diferentes regiones, lo cual puede influir en decisiones de inversión y políticas económicas.
Insight: Un intervalo de confianza que excluye ciertos valores podría dar información crucial sobre la posible estabilidad económica de un continente, ayudando a mitigar riesgos económicos y planificar estrategias de desarrollo.

In [1]:
import pandas as pd
import numpy as np
import scipy.stats as stats

# Supongamos que tienes un DataFrame `df` con las columnas 'Continente', 'Esperanza de Vida' y 'PIB'

# Filtramos los datos por continente y calculamos el intervalo de confianza para cada uno

# Lista para almacenar los resultados
resultados_vida = []
resultados_pib = []

# Iteramos por cada continente
for continente in df['Continente'].unique():
    
    # Filtrar los datos por continente
    datos_vida = df[df['Continente'] == continente]['Esperanza de Vida'].dropna()
    datos_pib = df[df['Continente'] == continente]['PIB'].dropna()
    
    # Cálculo del intervalo de confianza para la esperanza de vida
    n_vida = len(datos_vida)
    media_vida = np.mean(datos_vida)
    se_vida = stats.sem(datos_vida)
    margen_error_vida = se_vida * stats.t.ppf((1 + 0.95) / 2., n_vida-1)
    intervalo_vida = (media_vida, media_vida - margen_error_vida, media_vida + margen_error_vida)
    resultados_vida.append([continente, intervalo_vida[0], intervalo_vida[1], intervalo_vida[2]])
    
    # Cálculo del intervalo de confianza para el PIB
    n_pib = len(datos_pib)
    media_pib = np.mean(datos_pib)
    se_pib = stats.sem(datos_pib)
    margen_error_pib = se_pib * stats.t.ppf((1 + 0.90) / 2., n_pib-1)
    intervalo_pib = (media_pib, media_pib - margen_error_pib, media_pib + margen_error_pib)
    resultados_pib.append([continente, intervalo_pib[0], intervalo_pib[1], intervalo_pib[2]])

# Convertir los resultados en DataFrames para una presentación clara
df_resultados_vida = pd.DataFrame(resultados_vida, columns=['Continente', 'Media', 'IC_Inf', 'IC_Sup'])
df_resultados_pib = pd.DataFrame(resultados_pib, columns=['Continente', 'Media', 'IC_Inf', 'IC_Sup'])

# Mostrar los resultados
print("Intervalo de Confianza para la Esperanza de Vida:")
print(df_resultados_vida)

print("\nIntervalo de Confianza para el PIB:")
print(df_resultados_pib)


NameError: name 'df' is not defined