# Lab | Hypothesis Testing

**Objective**

Welcome to the Hypothesis Testing Lab, where we embark on an enlightening journey through the realm of statistical decision-making! In this laboratory, we delve into various scenarios, applying the powerful tools of hypothesis testing to scrutinize and interpret data.

From testing the mean of a single sample (One Sample T-Test), to investigating differences between independent groups (Two Sample T-Test), and exploring relationships within dependent samples (Paired Sample T-Test), our exploration knows no bounds. Furthermore, we'll venture into the realm of Analysis of Variance (ANOVA), unraveling the complexities of comparing means across multiple groups.

So, grab your statistical tools, prepare your hypotheses, and let's embark on this fascinating journey of exploration and discovery in the world of hypothesis testing!

**Challenge 1**

In this challenge, we will be working with pokemon data. The data can be found here:

- https://raw.githubusercontent.com/data-bootcamp-v4/data/main/pokemon.csv

In [1]:
#libraries
import pandas as pd
import scipy.stats as st
import numpy as np



In [2]:
df = pd.read_csv("https://raw.githubusercontent.com/data-bootcamp-v4/data/main/pokemon.csv")
df

Unnamed: 0,Name,Type 1,Type 2,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
0,Bulbasaur,Grass,Poison,45,49,49,65,65,45,1,False
1,Ivysaur,Grass,Poison,60,62,63,80,80,60,1,False
2,Venusaur,Grass,Poison,80,82,83,100,100,80,1,False
3,Mega Venusaur,Grass,Poison,80,100,123,122,120,80,1,False
4,Charmander,Fire,,39,52,43,60,50,65,1,False
...,...,...,...,...,...,...,...,...,...,...,...
795,Diancie,Rock,Fairy,50,100,150,100,150,50,6,True
796,Mega Diancie,Rock,Fairy,50,160,110,160,110,110,6,True
797,Hoopa Confined,Psychic,Ghost,80,110,60,150,130,70,6,True
798,Hoopa Unbound,Psychic,Dark,80,160,60,170,130,80,6,True


- We posit that Pokemons of type Dragon have, on average, more HP stats than Grass. Choose the propper test and, with 5% significance, comment your findings.

In [None]:
# Suponemos que los Pokémon de tipo Dragón tienen, de media, más HP que los de tipo Hierba. Elige la prueba más adecuada y, con una significación del 5%, comenta tus conclusiones.

In [None]:
""" 
1. Planteamiento del problema:
    Hipótesis nula (H₀): No hay diferencia en los HP promedio entre los Pokémon de tipo Dragón y los de tipo Hierba.
    Hipótesis alternativa (H₁): Los Pokémon de tipo Dragón tienen un HP promedio mayor que los de tipo Hierba.

2. Elección de la prueba:
Dado que estamos comparando dos medias de dos grupos independientes (Dragón vs. Hierba), la prueba más adecuada es la prueba t de Student para dos muestras independientes. Sin embargo, antes de realizar la prueba, debemos verificar dos supuestos:

Normalidad: Las distribuciones de los valores de HP para ambos tipos de Pokémon deben ser aproximadamente normales.
Homogeneidad de varianzas: Las varianzas de los dos grupos deben ser similares.
Si estos supuestos se cumplen, podemos proceder con la prueba t. Si no se cumplen, podemos considerar usar una prueba no paramétrica como la prueba de Mann-Whitney U.
"""

In [3]:
# Filtramos los Pokémon de tipo Dragón y Hierba
dragon_pokemon = df[df['Type 1'] == 'Dragon']['HP'].dropna()  # Eliminamos los NaN
grass_pokemon = df[df['Type 1'] == 'Grass']['HP'].dropna()

# 1. Prueba de normalidad con el test de Shapiro (Shapiro-Wilk)
shapiro_dragon = st.shapiro(dragon_pokemon)
shapiro_grass = st.shapiro(grass_pokemon)

print(f"Prueba de normalidad para Dragón: Estadístico = {shapiro_dragon[0]}, p-valor = {shapiro_dragon[1]}")
print(f"Prueba de normalidad para Hierba: Estadístico = {shapiro_grass[0]}, p-valor = {shapiro_grass[1]}")

# 2. Si ambos p-valores son mayores que 0.05, se asume normalidad.
# Si ambos grupos cumplen con la normalidad, realizamos la prueba t de Student

# 3. Prueba t de Student para comparar las medias
t_stat, p_value = st.ttest_ind(dragon_pokemon, grass_pokemon, alternative='greater')

print(f"Estadístico t: {t_stat}")
print(f"p-valor: {p_value}")

# Conclusión
alpha = 0.05
if p_value < alpha:
    print("Rechazamos la hipótesis nula: Los Pokémon de tipo Dragón tienen más HP de media que los de tipo Hierba.")
else:
    print("No rechazamos la hipótesis nula: No hay suficiente evidencia para afirmar que los Pokémon de tipo Dragón tienen más HP que los de tipo Hierba.")

Prueba de normalidad para Dragón: Estadístico = 0.9635281236696637, p-valor = 0.3419890019248819
Prueba de normalidad para Hierba: Estadístico = 0.9715915656401263, p-valor = 0.11214356726520774
Estadístico t: 3.590444254130357
p-valor: 0.0002567969150153481
Rechazamos la hipótesis nula: Los Pokémon de tipo Dragón tienen más HP de media que los de tipo Hierba.


In [None]:
""" 
4. Explicación de los pasos:
    Filtrado de datos: Seleccionamos los Pokémon de tipo Dragón y Hierba y extraemos sus valores de HP.
    Prueba de normalidad (Shapiro-Wilk): Utilizamos la prueba de Shapiro-Wilk para verificar si los datos de HP para ambos tipos siguen una distribución normal. Si ambos p-valores son mayores a 0.05, podemos asumir que los datos son normales.
    Prueba t de Student: Realizamos una prueba t de Student de una cola (ya que la hipótesis alternativa es que los Dragones tienen más HP que los Pokémon de tipo Hierba).
    Conclusiones: Si el p-valor de la prueba t es menor que 0.05, rechazamos la hipótesis nula, lo que significa que los Pokémon de tipo Dragón tienen más HP de media que los de tipo Hierba.
5. Posibles resultados y conclusiones:
    Si la prueba t da un p-valor < 0.05: Esto indicaría que existe una diferencia significativa entre los HP promedio de los Pokémon de tipo Dragón y Hierba, y que, en promedio, los Pokémon de tipo Dragón tienen más HP.
    Si la prueba t da un p-valor > 0.05: No hay suficiente evidencia para rechazar la hipótesis nula, lo que sugiere que no hay diferencia significativa en los HP promedio entre los Pokémon de tipo Dragón y Hierba.
"""

- We posit that Legendary Pokemons have different stats (HP, Attack, Defense, Sp.Atk, Sp.Def, Speed) when comparing with Non-Legendary. Choose the propper test and, with 5% significance, comment your findings.


In [None]:
# Suponemos que los Pokemons Legendarios tienen estadísticas diferentes (HP, Ataque, Defensa, Sp.Atk, Sp.Def, Velocidad) cuando se comparan con los No-Legendarios. Elige la prueba más adecuada y, con una significación del 5%, comenta tus conclusiones.

In [None]:
""" 
Para responder a esta pregunta, tenemos que comparar las estadísticas de los Pokémon Legendarios y No-Legendarios en cuanto a varias características numéricas, como HP, Ataque, Defensa, Sp. Atk, Sp. Def y Velocidad. El objetivo es determinar si hay diferencias significativas entre estas dos categorías de Pokémon en estas estadísticas.

1. Hipótesis
Primero, establecemos las hipótesis:

Hipótesis nula (H₀): No hay diferencias significativas en las estadísticas entre los Pokémon Legendarios y No-Legendarios. Las medias de las estadísticas son iguales.

Hipótesis alternativa (H₁): Existen diferencias significativas en las estadísticas entre los Pokémon Legendarios y No-Legendarios.

2. Elección de la prueba adecuada
Dado que tenemos más de una estadística (HP, Ataque, Defensa, etc.) y queremos compararlas entre los dos grupos (Legendarios vs. No-Legendarios), una opción sería realizar pruebas univariantes (una por una para cada estadística), como la prueba t de Student para muestras independientes.

Al ser varias comparaciones, es importante ajustar el valor p para controlar el error tipo I (falsos positivos). Esto se puede hacer mediante el ajuste de Bonferroni.

Sin embargo, hay que tener en cuenta que, antes de aplicar la prueba t de Student, necesitamos asegurarnos de que:

Las distribuciones sean normales (podemos usar la prueba de Shapiro-Wilk).
Las varianzas sean homogéneas (esto se puede comprobar con la prueba de Levene).
Si alguno de los supuestos no se cumple, usamos una prueba no paramétrica como Mann-Whitney U.

3. Implementación en Python
Vamos a comparar las estadísticas entre los Pokémon Legendarios y No-Legendarios. Haremos lo siguiente:

Dividir los datos en dos grupos: Legendarios y No-Legendarios.
Verificar si las distribuciones de las estadísticas son normales para cada grupo.
Si la normalidad se cumple, realizaremos la prueba t de Student.
Si la normalidad no se cumple, usaremos la prueba no paramétrica de Mann-Whitney U.
"""

In [4]:
# Filtrar los Pokémon Legendarios y No-Legendarios
legendary_pokemon = df[df['Legendary'] == True]
non_legendary_pokemon = df[df['Legendary'] == False]

# Lista de estadísticas a comparar
stat_columns = ['HP', 'Attack', 'Defense', 'Sp. Atk', 'Sp. Def', 'Speed']

# Comprobamos la normalidad para cada estadística
for stat in stat_columns:
    legendary_stat = legendary_pokemon[stat].dropna()
    non_legendary_stat = non_legendary_pokemon[stat].dropna()
    
    # Prueba de normalidad (Shapiro-Wilk)
    shapiro_legendary = st.shapiro(legendary_stat)
    shapiro_non_legendary = st.shapiro(non_legendary_stat)
    
    print(f"Prueba de normalidad para {stat}:")
    print(f"  Legendarios: p-valor = {shapiro_legendary[1]}")
    print(f"  No-Legendarios: p-valor = {shapiro_non_legendary[1]}")

    # Comprobamos si ambos p-valores son mayores que 0.05 (es decir, no rechazamos H0 de normalidad)
    if shapiro_legendary[1] > 0.05 and shapiro_non_legendary[1] > 0.05:
        # Si ambos son normales, realizamos la prueba t de Student
        t_stat, p_value = st.ttest_ind(legendary_stat, non_legendary_stat)
        print(f"  Prueba t de Student: Estadístico = {t_stat}, p-valor = {p_value}")
    else:
        # Si alguno de los grupos no es normal, usamos la prueba Mann-Whitney U
        u_stat, p_value_u = st.mannwhitneyu(legendary_stat, non_legendary_stat)
        print(f"  Prueba Mann-Whitney U: Estadístico = {u_stat}, p-valor = {p_value_u}")
    
    print()

# Ajuste de Bonferroni para múltiples comparaciones (si usamos la prueba t de Student)
alpha_bonferroni = 0.05 / len(stat_columns)
print(f"Nivel de significación ajustado de Bonferroni: {alpha_bonferroni}")

Prueba de normalidad para HP:
  Legendarios: p-valor = 0.008645211266956951
  No-Legendarios: p-valor = 6.930385498829385e-22
  Prueba Mann-Whitney U: Estadístico = 38778.0, p-valor = 6.93110816444599e-17

Prueba de normalidad para Attack:
  Legendarios: p-valor = 0.03771789634848271
  No-Legendarios: p-valor = 3.1843612080590274e-08
  Prueba Mann-Whitney U: Estadístico = 39868.0, p-valor = 3.4625666210159153e-19

Prueba de normalidad para Defense:
  Legendarios: p-valor = 0.00430961213067538
  No-Legendarios: p-valor = 1.8918446076661715e-18
  Prueba Mann-Whitney U: Estadístico = 37418.5, p-valor = 3.390882856434108e-14

Prueba de normalidad para Sp. Atk:
  Legendarios: p-valor = 0.6240339399453302
  No-Legendarios: p-valor = 1.0736763014225767e-11
  Prueba Mann-Whitney U: Estadístico = 42680.0, p-valor = 6.287374046693629e-26

Prueba de normalidad para Sp. Def:
  Legendarios: p-valor = 0.008238834358460644
  No-Legendarios: p-valor = 8.430313884525228e-13
  Prueba Mann-Whitney U: Est

In [None]:
""" 
5. Conclusiones:
    Si el p-valor de una prueba t es menor que el nivel de significación ajustado (0.05 dividido por el número de pruebas), podemos rechazar la hipótesis nula y concluir que hay una diferencia significativa entre los Pokémon Legendarios y No-Legendarios en esa estadística particular.
    Si el p-valor de la prueba Mann-Whitney U es menor que 0.05, también podemos concluir que hay diferencias significativas entre los dos grupos.
    Si el p-valor es mayor que 0.05, no hay suficiente evidencia para rechazar la hipótesis nula, lo que indica que las medias de las estadísticas no son significativamente diferentes entre los Pokémon Legendarios y No-Legendarios.
Posibles resultados:
    Si encontramos diferencias significativas en varias estadísticas (por ejemplo, HP y Ataque), podemos concluir que los Pokémon Legendarios tienen características diferentes a los No-Legendarios en esas áreas.
    Si no encontramos diferencias significativas, la conclusión sería que las estadísticas de los Pokémon Legendarios y No-Legendarios no son significativamente diferentes.
"""

**Challenge 2**

In this challenge, we will be working with california-housing data. The data can be found here:
- https://raw.githubusercontent.com/data-bootcamp-v4/data/main/california_housing.csv

In [6]:
df = pd.read_csv("https://raw.githubusercontent.com/data-bootcamp-v4/data/main/california_housing.csv")
df.head()

Unnamed: 0,longitude,latitude,housing_median_age,total_rooms,total_bedrooms,population,households,median_income,median_house_value
0,-114.31,34.19,15.0,5612.0,1283.0,1015.0,472.0,1.4936,66900.0
1,-114.47,34.4,19.0,7650.0,1901.0,1129.0,463.0,1.82,80100.0
2,-114.56,33.69,17.0,720.0,174.0,333.0,117.0,1.6509,85700.0
3,-114.57,33.64,14.0,1501.0,337.0,515.0,226.0,3.1917,73400.0
4,-114.57,33.57,20.0,1454.0,326.0,624.0,262.0,1.925,65500.0


**We posit that houses close to either a school or a hospital are more expensive.**

- School coordinates (-118, 37)
- Hospital coordinates (-122, 34)

We consider a house (neighborhood) to be close to a school or hospital if the distance is lower than 0.50.

Hint:
- Write a function to calculate euclidean distance from each house (neighborhood) to the school and to the hospital.
- Divide your dataset into houses close and far from either a hospital or school.
- Choose the propper test and, with 5% significance, comment your findings.
 

In [None]:
""" 
Consideramos que las casas cercanas a un colegio o a un hospital son más caras.

- Coordenadas de la escuela (-118, 37)
- Coordenadas del hospital (-122, 34)

Consideramos que una casa (barrio) está cerca de un colegio o de un hospital si la distancia es inferior a 0,50.

Sugerencia:
- Escribe una función para calcular la distancia euclídea de cada casa (barrio) al colegio y al hospital.
- Divide tu conjunto de datos en casas cercanas y lejanas al hospital o al colegio.
- Elige la prueba adecuada y, con una significación del 5%, comenta tus conclusiones.

"""

In [7]:
from scipy.spatial.distance import euclidean

# Coordenadas del colegio y del hospital
school_coords = (-118, 37)
hospital_coords = (-122, 34)

# Función para calcular la distancia euclidiana
def calc_distance(x1, y1, x2, y2):
    return np.sqrt((x2 - x1)**2 + (y2 - y1)**2)

# Cargar el dataframe (supongamos que ya lo tienes cargado como `df`)

# Calcular la distancia a la escuela y al hospital para cada casa
df['distance_to_school'] = df.apply(lambda row: calc_distance(row['longitude'], row['latitude'], school_coords[0], school_coords[1]), axis=1)
df['distance_to_hospital'] = df.apply(lambda row: calc_distance(row['longitude'], row['latitude'], hospital_coords[0], hospital_coords[1]), axis=1)

# Crear una nueva columna para indicar si la casa está cerca de un colegio o hospital (distancia < 0.50)
df['near_school_or_hospital'] = ((df['distance_to_school'] < 0.50) | (df['distance_to_hospital'] < 0.50))

# Dividir el dataframe en dos grupos: casas cercanas y lejanas
houses_near = df[df['near_school_or_hospital'] == True]
houses_far = df[df['near_school_or_hospital'] == False]

# Ver las medias de los valores de la casa en cada grupo
print("Media del valor de la casa (cerca de colegio/hospital):", houses_near['median_house_value'].mean())
print("Media del valor de la casa (lejos de colegio/hospital):", houses_far['median_house_value'].mean())

# Realizamos la prueba t para comparar las medias
t_stat, p_value = st.ttest_ind(houses_near['median_house_value'], houses_far['median_house_value'])

# Imprimir el resultado de la prueba t
print(f"Estadístico t: {t_stat}")
print(f"p-valor: {p_value}")

# Conclusiones
if p_value < 0.05:
    print("Rechazamos la hipótesis nula: Existen diferencias significativas en el valor de las casas cercanas y lejanas a un colegio o hospital.")
else:
    print("No rechazamos la hipótesis nula: No hay evidencia suficiente para afirmar que el valor de las casas cercanas a un colegio o hospital es significativamente diferente.")

Media del valor de la casa (cerca de colegio/hospital): 92460.0
Media del valor de la casa (lejos de colegio/hospital): 207334.6990291262
Estadístico t: -2.2146147257665834
p-valor: 0.026799733071128685
Rechazamos la hipótesis nula: Existen diferencias significativas en el valor de las casas cercanas y lejanas a un colegio o hospital.


In [None]:
""" 
Paso 4: Conclusiones
Si el p-valor es menor que 0.05, rechazamos la hipótesis nula y concluimos que hay diferencias significativas entre los valores de las casas cercanas a un colegio o hospital y las casas lejanas. Es decir, las casas cercanas a estos lugares tienden a ser más caras.

Si el p-valor es mayor que 0.05, no rechazamos la hipótesis nula, lo que sugiere que no hay evidencia suficiente para afirmar que la proximidad a un colegio o hospital afecta significativamente al valor de las viviendas.

¿Qué hacer si los datos no son normales?
Si el valor p de la prueba t es mayor que 0.05 pero sospechamos que los datos no siguen una distribución normal, podemos hacer un análisis adicional utilizando pruebas no paramétricas como el Mann-Whitney U.
"""