# Prueba de hipotesis
- La prueba de hipotesis o prueba de significacion ayuda a juzgar si existe una diferencia significativa entre el tamaño de la muestra y el parametro general
- Es una herramienta comúnmente utilizada en el análisis de datos para determinar si hay evidencia suficiente para rechazar o no una hipótesis nula.
- La prueba de hipótesis generalmente involucra dos hipótesis: 
    - La hipótesis nula (H0) 
        La hipótesis nula es la afirmación que se supone como verdadera o se quiere probar,
     - la hipótesis alternativa (H1). 
        La hipótesis alternativa es una afirmación contraria a la hipótesis nula.

## Pasos a seguir
1. Establecer una **hipotesis nula (H0)** y una **hipotesis alternativa**
2. Seleccionar el **nivel de significancia**
3. Seleccionar el **estadistico de prueba**
4. Formular la regla de decision
5. Interpretar los resultados y tomar una decision

## Ejemplo
Aquí tienes un ejemplo para ilustrar la prueba de hipótesis:

Supongamos que un fabricante de bombillas afirma que sus bombillas tienen una vida útil promedio de 1000 horas. Sin embargo, un grupo de consumidores cree que la vida útil promedio es menor y desea probarlo. En este caso, la hipótesis nula (H0) sería que la vida útil promedio de las bombillas es igual a 1000 horas, mientras que la hipótesis alternativa (H1) sería que la vida útil promedio es menor a 1000 horas.

Para probar la hipótesis, se toma una muestra aleatoria de bombillas y se registra la vida útil de cada una. Luego, se realiza un análisis estadístico para determinar si los datos proporcionan suficiente evidencia para rechazar la hipótesis nula.

Supongamos que, en la muestra, la vida útil promedio resulta ser 950 horas, con una desviación estándar de 50 horas. Al realizar el análisis estadístico correspondiente, se calcula un valor de prueba y se compara con un valor crítico establecido según el nivel de significancia deseado (por ejemplo, un nivel de confianza del 95%). Si el valor de prueba es menor que el valor crítico, se rechaza la hipótesis nula, lo que indica que hay evidencia suficiente para apoyar la afirmación de que la vida útil promedio es menor a 1000 horas.

# Tipos de pruebas de hipotesis
<hr>

## Distribucion t de Student
Se usa para estimar una **media de poblacion** normalmente distribuida a partir de una muestra pequeña que sigue una distribucion normal y de la que **desconocemos la desviacion estandar**
$$t=\frac{(x_1-x_2)}{\sqrt{\frac{(S_1^2)}{n_1} + \frac{(S_2^2)}{n_2} }}$$

<img src="https://upload.wikimedia.org/wikipedia/commons/c/cf/Student_densite_best.JPG">

En la prueba t de Student, se calcula un valor de t que representa **la diferencia entre las medias de las dos muestras en relación con la variabilidad dentro de las muestras**. <u>**Cuanto mayor sea el valor de t, mayor será la evidencia en contra de la hipótesis nula**</u>.

La H0 se considera falsa cuando el valor de p-value obtenido es mucho menor que el nivel de significancia típicamente utilizado (como 0.05 o 0.01).

<hr>

## Coeficiente de Pearson
Se usa para medir la dependencia lineal (correlacion) entre dos **variables aleatorias cuantitativas**

$$p_{xy} = \frac{Cov(X,Y)}{\sqrt{\sigma_x*\sigma_y}} = \frac{n*\sum(x_i-\overline{x}) -\sum(y_i-\overline{y}) }{ \sqrt{ \sum (x_i-\overline{x})^2 * \sum(y_i-\overline{y})^2 } }$$


El coeficiente de correlación de Pearson es una medida estadística que indica la fuerza y la dirección de la relación lineal entre dos variables continuas. El coeficiente de correlación de Pearson varía entre -1 y 1, donde:
- Un valor de -1 indica una correlación negativa perfecta
- Un valor de 1 indica una correlación positiva perfecta 
- Un valor de 0 indica una falta de correlación lineal.

Tabla de interpretacion de resultados
|||
|---|---|
|r=1|correlacion perfecta|
|0´8<r<1|correlacion muy alta|
|0´6<r<0´8|correlacion alta|
|0´4<r<0´6|correlacion moderada|
|0´2<r<0´4|correlacion baja|
|0<r<0´2|correlacion muy baja|
|r=0|correlacion nula|



<hr>

## Analisis de la varianza (ANOVA)
Se usa para comparar las varianzas entre las medias (o el promedio) de diferentes grupos

En el análisis de varianza, el estadístico F se utiliza para comparar la variabilidad entre grupos con la variabilidad dentro de los grupos. Si la hipótesis nula (H0) es cierta y las distribuciones son muy similares, esperamos que la variabilidad entre grupos sea similar a la variabilidad dentro de los grupos, lo que resultaría en un valor bajo para el estadístico F.

<img src="https://estamatica.net/wp-content/uploads/2020/04/tabla-anova-spss.jpg">

# Tipos de Errores
## Contexto
Las conclusiones a las que llegamos se basan en una muestra, por lo que podemos equivocarnos

|Decisiones **correctas**|Decisiones **incorrectas**|
|--|--|
|Rechazar $H_0$ cuando es falsa|Rechazar $H_0$ cuando es verdadera|
|No rechazar $H_0$ cuando es verdadera|No rechazar $H_0$ cuando es falsa|

<br>

||$H_0$ Verdadera|$H_0$ falsa|
|--|--|--|
|Rechazamos $H_0$|Error tipo I → P(Error Tipo I)=$\alpha$|Decision correcta|
|No rechazamos $H_0$|Decision correcta|Error tipo II → P(Error Tipo II)=$\beta$|

## Ejemplo
#### Hipotesis
- Hipotesis nula $(H_0): \mu_1 = \mu_2$
    Los dos medicamentos tienen la misma eficacia.

- Hipotesis alternativa $(H_1): \mu_1 \not= \mu_2$
    Los dos medicamentos no tienen la misma eficacia.

**ERROR TIPO I:** Concluir que los dos medicamentos son muy diferentes cuando no lo son
**ERROR TIPO II:** Concluir que no hay una diferencia significativa entre ambos medicamentos. Muy Peligroso

<img src="https://static.platzi.com/media/user_upload/imagen-19cdabbb-1d3f-4ac6-a8b2-a8103780e719.jpg">