# Realizar una Prueba t para Muestras Independientes en Python

Este tutorial explica cómo realizar una prueba t para muestras independientes en Python, utilizando una base de datos en Excel. Dependiendo de los supuestos que se cumplan, se utilizará la prueba t de Student, la prueba t de Welch o la prueba U de Mann-Whitney.

## Pre-requisitos

Asegúrate de tener instaladas las siguientes bibliotecas en Python:

- pandas
- scipy
- openpyxl

Instálalas usando pip si es necesario:

```bash
pip install pandas scipy openpyxl


## Paso 1: Cargar los Datos desde Excel

Carga tus datos desde un archivo Excel, asegurándote de que tu archivo tenga dos columnas de datos, una para cada grupo.

In [None]:
import pandas as pd

# Cargar datos desde Excel
archivo_excel = 'ruta/a/tu/archivo.xlsx'
datos = pd.read_excel(archivo_excel)

## Paso 2: Verificar Supuestos

Para decidir qué prueba utilizar, verifica los siguientes supuestos:

### Supuesto de Normalidad

Comprueba la normalidad en ambos grupos usando, por ejemplo, el test de Shapiro-Wilk.

In [None]:
from scipy.stats import shapiro

stat, p = shapiro(datos['grupo1'])
print('Grupo 1 - Shapiro-Wilk:', stat, p)

stat, p = shapiro(datos['grupo2'])
print('Grupo 2 - Shapiro-Wilk:', stat, p)

### Supuesto de Homogeneidad de Varianzas

Comprueba si las varianzas de los grupos son similares usando el test de Levene.

In [None]:
from scipy.stats import levene

stat, p = levene(datos['grupo1'], datos['grupo2'])
print('Levene:', stat, p)

## Paso 3: Elegir y Realizar la Prueba Apropiada

### Prueba t de Student

Si ambos grupos son normales y tienen varianzas homogéneas.



In [None]:
from scipy.stats import ttest_ind

t_stat, p_valor = ttest_ind(datos['grupo1'], datos['grupo2'], equal_var=True)
print('t de Student:', t_stat, p_valor)

# Prueba para H0: mu1 <= mu2 (la media de grupo1 es menor o igual que la de grupo2)
if t_stat < 0:
    # Ajusta el valor p para una prueba de una cola cuando t_stat es negativo
    p_valor_una_cola_menor = p_valor / 2
else:
    # Si t_stat es positivo, usa el valor p de dos colas tal cual
    p_valor_una_cola_menor = 1 - (p_valor / 2)

# Prueba para H0: mu1 >= mu2 (la media de grupo1 es mayor o igual que la de grupo2)
if t_stat > 0:
    # Ajusta el valor p para una prueba de una cola cuando t_stat es positivo
    p_valor_una_cola_mayor = p_valor / 2
else:
    # Si t_stat es negativo, usa el valor p de dos colas tal cual
    p_valor_una_cola_mayor = 1 - (p_valor / 2)

print(f"Prueba para H0: mu1 <= mu2, t-stat: {t_stat}, p-valor: {p_valor_una_cola_menor}")
print(f"Prueba para H0: mu1 >= mu2, t-stat: {t_stat}, p-valor: {p_valor_una_cola_mayor}")

### Prueba t de Welch

Si ambos grupos son normales pero tienen varianzas heterogéneas.

In [None]:
t_stat, p_valor = ttest_ind(datos['grupo1'], datos['grupo2'], equal_var=False)
print('t de Welch:', t_stat, p_valor)

### Prueba U de Mann-Whitney

Si uno o ambos grupos no son normales.

In [None]:
from scipy.stats import mannwhitneyu

u_stat, p_valor = mannwhitneyu(datos['grupo1'], datos['grupo2'])
print('U de Mann-Whitney:', u_stat, p_valor)


## Interpretación de los Resultados

La interpretación del p-valor en cada caso te indicará si hay una diferencia significativa entre los grupos:

    Si el p-valor es menor que 0.05, hay una diferencia significativa.
    Si el p-valor es mayor que 0.05, no hay una diferencia significativa.