# Realizar una Prueba t de una Muestra en Python

Este tutorial proporciona una guía paso a paso para realizar una prueba t de una muestra en Python, utilizando una base de datos en Excel. La prueba t de una muestra se utiliza para determinar si la media de una muestra difiere significativamente de una media poblacional conocida.

## Pre-requisitos

Antes de comenzar, asegúrate de tener instaladas las siguientes bibliotecas en Python:

- pandas
- scipy
- openpyxl

Puedes instalarlas usando pip:

```bash
pip install pandas scipy openpyxl


## Paso 1: Cargar los Datos desde Excel

Primero, necesitas cargar tus datos desde un archivo Excel. Asegúrate de que tu archivo Excel solo tenga una columna de datos para la variable que estás analizando.

In [None]:
import pandas as pd

# Cargar datos desde Excel
archivo_excel = 'ruta/a/tu/archivo.xlsx'
datos = pd.read_excel(archivo_excel)

## Paso 2: Verificar Supuestos

Antes de realizar la prueba t, debes verificar algunos supuestos:
Supuesto de Normalidad

El principal supuesto para una prueba t es que los datos deben distribuirse normalmente. Puedes verificar esto con un test de normalidad como el test de Shapiro-Wilk.

In [None]:
from scipy.stats import shapiro

stat, p = shapiro(datos['tu_columna'])
print('Estadístico de Shapiro-Wilk:', stat)
print('P-valor:', p)

# Interpretar el p-valor
if p > 0.05:
    print('La distribución parece normal.')
else:
    print('La distribución no parece normal.')

## Paso 3: Realizar la Prueba respectica

Una vez verificados y cumplidos los supuestos, puedes proceder con la prueba t.

In [None]:
from scipy.stats import ttest_1samp

# Media poblacional conocida
media_poblacional = valor_conocido

# Realizar prueba t
t_stat, p_valor = ttest_1samp(datos['tu_columna'], media_poblacional)
print('Estadístico t:', t_stat)
print('P-valor:', p_valor)

# Interpretar el p-valor
if p_valor > 0.05:
    print('No hay suficiente evidencia para rechazar la hipótesis nula.')
else:
    print('Hay suficiente evidencia para rechazar la hipótesis nula.')


## Alternativa Paramétrica

Si tus datos no cumplen con el supuesto de normalidad, puedes considerar usar una alternativa paramétrica como la prueba de Wilcoxon.

In [None]:
from scipy.stats import wilcoxon

# Realizar prueba de Wilcoxon
w_stat, p_valor_w = wilcoxon(datos['tu_columna'] - media_poblacional)
print('Estadístico Wilcoxon:', w_stat)
print('P-valor:', p_valor_w)

# Interpretar el p-valor
if p_valor_w > 0.05:
    print('No hay suficiente evidencia para rechazar la hipótesis nula.')
else:
    print('Hay suficiente evidencia para rechazar la hipótesis nula.')


In [2]:
from scipy.stats import t, norm
import numpy as np

# Parámetros dados
n = 10  # tamaño de la muestra
alpha = 0.05  # nivel de significancia
mean_difference = 0  # diferencia media esperada
population_std = 1  # desviación estándar de la población

# Cálculo del tamaño del efecto (Cohen's d)
effect_size = mean_difference / population_std

# Cálculo de los valores críticos
t_critical = t.ppf(1 - alpha, df=n-1)
z_critical = norm.ppf(1 - alpha)

# Cálculo del poder estadístico
power = norm.cdf((np.sqrt(n) * effect_size) - (t_critical - z_critical))
power 