In [1]:
import numpy as np
from scipy import stats
import plotly.express as px
from plotly.subplots import make_subplots
import plotly.graph_objects as go
import scikit_posthocs as sp

# Pruebas de Hip√≥tesis

La presente gu√≠a aborda el uso de pruebas de hip√≥tesis mediante herramientas estad√≠sticas y la programaci√≥n en Python. El objetivo central es evaluar la validez de distintas afirmaciones utilizando evidencia cuantitativa. A lo largo de esta gu√≠a, se detallar√° el proceso y se ofrecer√°n ejemplos pr√°cticos acompa√±ados de explicaciones minuciosas. Antes de profundizar en los ejemplos, es esencial entender la estructura y el fundamento de las pruebas de hip√≥tesis.

## Definici√≥n de hip√≥tesis

Antes de realizar una prueba de hip√≥tesis, es importante entender qu√© pregunta cient√≠fica se busca responder, y esta pregunta debe ser formulada en forma de hip√≥tesis nula ($H‚ÇÄ$) y hip√≥tesis alternativa ($H‚ÇÅ$). Es importante recordar que $H‚ÇÄ$ y $H‚ÇÅ$ deben ser mutuamente excluyentes, y $H‚ÇÅ$ no debe contener igualdad.

La hip√≥tesis nula ($H‚ÇÄ$) es la afirmaci√≥n que se asume como verdadera hasta que se demuestre lo contrario. Por otro lado, la hip√≥tesis alternativa ($H‚ÇÅ$) es la afirmaci√≥n que se quiere probar, y se utiliza la evidencia estad√≠stica para aceptar o rechazar esta afirmaci√≥n.

Para construir las hip√≥tesis nula y alternativa, se pueden utilizar operadores matem√°ticos, como el signo de igualdad ($=$), mayor que ($>$), menor que ($<$), mayor o igual que ($‚â•$), y menor o igual que ($‚â§$). A continuaci√≥n se presentan algunos ejemplos de hip√≥tesis:

- $H‚ÇÄ: Œº = x, H‚ÇÅ: Œº ‚â† x$

Se puede utilizar esta hip√≥tesis para probar si la media de una poblaci√≥n es igual a un valor espec√≠fico $x$. La hip√≥tesis nula establece que la media es igual a $x$, mientras que la hip√≥tesis alternativa establece que la media no es igual a $x$.

- $H‚ÇÄ: Œº ‚â§ x, H‚ÇÅ: Œº > x$

Esta hip√≥tesis se utiliza para probar si la media de una poblaci√≥n es menor o igual a un valor espec√≠fico $x$. La hip√≥tesis nula establece que la media es menor o igual a $x$, mientras que la hip√≥tesis alternativa establece que la media es mayor que $x$.

- $H‚ÇÄ: Œº ‚â• x, H‚ÇÅ: Œº < x$

Se utiliza esta hip√≥tesis para probar si la media de una poblaci√≥n es mayor o igual a un valor espec√≠fico $x$. La hip√≥tesis nula establece que la media es mayor o igual a $x$, mientras que la hip√≥tesis alternativa establece que la media es menor que $x$.

## Verificaci√≥n de supuestos

Antes de realizar una prueba estad√≠stica, es importante verificar si se cumplen ciertos supuestos, lo que nos permitir√° determinar si se deben utilizar pruebas param√©tricas o no param√©tricas.

A continuaci√≥n, se enumeran los supuestos que se deben verificar antes de utilizar una prueba param√©trica:

1. Las observaciones en cada muestra son independientes e id√©nticamente distribuidas (IID, por sus siglas en ingl√©s).
2. Las observaciones en cada muestra siguen una distribuci√≥n normal.
3. Las observaciones en cada muestra tienen la misma varianza.

Si los supuestos anteriores se cumplen, entonces se puede utilizar una prueba param√©trica para analizar los datos. De lo contrario, se debe considerar el uso de una prueba no param√©trica.

Es importante tener en cuenta que la verificaci√≥n de supuestos no garantiza que la prueba sea adecuada para los datos, pero ayuda a tomar una decisi√≥n informada sobre qu√© prueba utilizar.

## Selecci√≥n de la prueba adecuada

Una vez que se han verificado los supuestos y se han identificado las variables relevantes, el siguiente paso es seleccionar la prueba adecuada para el an√°lisis. Al elegir la prueba adecuada, es esencial analizar cu√°ntos grupos se est√°n comparando y si los datos est√°n emparejados o no. Para determinar si los datos est√°n emparejados, es necesario considerar si los datos se recopilaron de los mismos individuos. Podr√°s elegir la prueba adecuada seg√∫n corresponda, haciendo uso de la informaci√≥n presentada en el cuadro que se encuentra a continuaci√≥n.

In [2]:
from IPython.display import display, HTML

svg_code = '''
<svg width="1400" height="500" xmlns="http://www.w3.org/2000/svg">
  <g>
    <!-- Nodes -->
    <rect x="20" y="200" width="180" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="55" y="230" font-family="Verdana" font-size="15">Datos Continuos</text>

    <rect x="220" y="200" width="180" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="255" y="230" font-family="Verdana" font-size="15">No Pareados</text>

    <rect x="420" y="100" width="180" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="465" y="130" font-family="Verdana" font-size="15">2 Grupos</text>

    <rect x="420" y="300" width="180" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="455" y="330" font-family="Verdana" font-size="15">M√°s de 2 Grupos</text>

    <rect x="620" y="60" width="420" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="675" y="90" font-family="Verdana" font-size="15">Param√©trica > Prueba T Independiente</text>

    <rect x="620" y="140" width="420" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="675" y="170" font-family="Verdana" font-size="15">No Param√©trica > Prueba U de Mann-Whitney</text>

    <rect x="620" y="260" width="420" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="675" y="290" font-family="Verdana" font-size="15">Param√©trica > An√°lisis de Varianza</text>

    <rect x="620" y="340" width="420" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="675" y="370" font-family="Verdana" font-size="15">No Param√©trica > Prueba de Kruskal-Wallis</text>

    <!-- Edges -->
    <line x1="200" y1="225" x2="220" y2="225" style="stroke:black;stroke-width:2" />
    <line x1="400" y1="125" x2="420" y2="125" style="stroke:black;stroke-width:2" />
    <line x1="400" y1="225" x2="420" y2="225" style="stroke:black;stroke-width:2" />
    <line x1="400" y1="325" x2="420" y2="325" style="stroke:black;stroke-width:2" />

    <line x1="600" y1="85" x2="620" y2="85" style="stroke:black;stroke-width:2" />
    <line x1="600" y1="165" x2="620" y2="165" style="stroke:black;stroke-width:2" />
    <line x1="600" y1="285" x2="620" y2="285" style="stroke:black;stroke-width:2" />
    <line x1="600" y1="365" x2="620" y2="365" style="stroke:black;stroke-width:2" />
  </g>
</svg>
'''

display(HTML(svg_code))

In [3]:
from IPython.display import display, HTML

svg_code = '''
<svg width="1400" height="500" xmlns="http://www.w3.org/2000/svg">
  <g>
    <!-- Nodes -->
    <rect x="20" y="200" width="180" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="55" y="230" font-family="Verdana" font-size="15">Datos Continuos</text>

    <rect x="220" y="200" width="180" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="255" y="230" font-family="Verdana" font-size="15">Pareados</text>

    <rect x="420" y="100" width="180" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="465" y="130" font-family="Verdana" font-size="15">2 Grupos</text>

    <rect x="420" y="300" width="180" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="455" y="330" font-family="Verdana" font-size="15">M√°s de 2 Grupos</text>

    <rect x="620" y="60" width="520" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="675" y="90" font-family="Verdana" font-size="15">Param√©trica > Prueba T Pareada</text>

    <rect x="620" y="140" width="520" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="675" y="170" font-family="Verdana" font-size="15">No Param√©trica > Prueba de Wilcoxon de Rangos con Signo</text>

    <rect x="620" y="260" width="520" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="675" y="290" font-family="Verdana" font-size="15">Param√©trica > An√°lisis de Varianza</text>

    <rect x="620" y="340" width="520" height="50" style="fill:lightblue;stroke:black;stroke-width:1;" />
    <text x="675" y="370" font-family="Verdana" font-size="15">No Param√©trica > Prueba de Friedman</text>

    <!-- Edges -->
    <line x1="200" y1="225" x2="220" y2="225" style="stroke:black;stroke-width:2" />
    <line x1="400" y1="125" x2="420" y2="125" style="stroke:black;stroke-width:2" />
    <line x1="400" y1="225" x2="420" y2="225" style="stroke:black;stroke-width:2" />
    <line x1="400" y1="325" x2="420" y2="325" style="stroke:black;stroke-width:2" />

    <line x1="600" y1="85" x2="620" y2="85" style="stroke:black;stroke-width:2" />
    <line x1="600" y1="165" x2="620" y2="165" style="stroke:black;stroke-width:2" />
    <line x1="600" y1="285" x2="620" y2="285" style="stroke:black;stroke-width:2" />
    <line x1="600" y1="365" x2="620" y2="365" style="stroke:black;stroke-width:2" />
  </g>
</svg>
'''

display(HTML(svg_code))

## Nivel de significancia $\alpha$

El nivel de significancia ($\alpha$) es un valor num√©rico que se utiliza en las pruebas de hip√≥tesis estad√≠sticas para determinar si una diferencia o relaci√≥n entre dos o m√°s grupos o variables es estad√≠sticamente significativa o simplemente se debe al azar.

Se establece previamente antes de realizar la prueba y generalmente se fija en un valor com√∫n de $0.05$ ($5$%), lo que significa que existe un $5$% de probabilidad de que los resultados observados se deban al azar.

## Decisi√≥n y Conclusi√≥n

La toma de decisiones y conclusiones es una etapa fundamental en el proceso de prueba de hip√≥tesis. Despu√©s de realizar la prueba, se obtiene un valor $p$ que muestra la significancia de la prueba.

Si el valor $p$ es menor que el nivel de significancia ($\alpha$), es decir, hay suficiente evidencia para demostrar que $H‚ÇÄ$ no es v√°lida, se puede rechazar $H‚ÇÄ$. De lo contrario, no se puede rechazar $H‚ÇÄ$. Es importante recordar que al rechazar $H‚ÇÄ$ se est√° validando $H‚ÇÅ$. Sin embargo, al no rechazar $H‚ÇÄ$, no significa que $H‚ÇÄ$ sea v√°lida, ni que $H‚ÇÅ$ sea incorrecta.

In [4]:
import plotly.graph_objs as go
import numpy as np
from scipy.stats import norm

# Crear una secuencia de valores para el eje x
x = np.linspace(-4, 4, 500)

# Crear una figura de la distribuci√≥n normal
fig = go.Figure()

# Agregar la distribuci√≥n normal
fig.add_trace(go.Scatter(x=x, y=norm.pdf(x), mode='lines', name='Distribuci√≥n normal'))

# Encontrar el valor cr√≠tico correspondiente al nivel de significancia alfa
alpha = 0.05
z_critico = norm.ppf(1 - alpha)

# Calcular la probabilidad de los valores mayores al valor cr√≠tico
prob = norm.sf(z_critico)

# Agregar el √°rea sombreada correspondiente a los valores mayores al 95% de los datos
fig.add_trace(go.Scatter(x=np.arange(z_critico, 4, 0.01), y=norm.pdf(np.arange(z_critico, 4, 0.01)),
                         mode='lines', line=dict(color='#636EFA'), fill='tozeroy', fillcolor='rgba(99, 110, 250, 0.3)',
                         name='√Årea sombreada'))

# Agregar una l√≠nea vertical en el 85% de los datos
x_85 = norm.ppf(0.85)
fig.add_shape(type='line', x0=x_85, y0=0, x1=x_85, y1=norm.pdf(x_85),
              line=dict(color='#EF553B', width=2, dash='dash'))

fig.add_annotation(x=1.1, y=norm.pdf(x_85), text='S√≠ el valor p > ùõº : Fallas en rechazar H‚ÇÄ', showarrow=True,
                   arrowhead=1, ax=110, ay=-30, font=dict(color='#EF553B', size=14))

x_97 = norm.ppf(0.97)
fig.add_shape(type='line', x0=x_97, y0=0, x1=x_97, y1=norm.pdf(x_97),
              line=dict(color='#167322', width=2, dash='dash'))

fig.add_annotation(x=1.9, y=norm.pdf(x_97), text='S√≠ el valor p < ùõº : Rechazas H‚ÇÄ', showarrow=True,
                   arrowhead=1, ax=50, ay=-70, font=dict(color='#167322', size=14))

fig.add_annotation(x=2.2, y=0.05, text='ùõº = 0.05', showarrow=True,
                   arrowhead=1, ax=30, ay=-30, font=dict(color='#636EFA', size=14))

fig.add_annotation(x=3.2, y=0.05, text='Regi√≥n de rechazo', showarrow=False,
                   font=dict(color='#636EFA', size=14))


# Establecer el t√≠tulo de la figura y los nombres de los ejes
fig.update_layout(title='Pruebas de hip√≥tesis',
                   xaxis_title='Valores', yaxis_title='Densidad',showlegend=False)

# Mostrar la figura
fig.show()

## Prueba T de muestras independientes

Un profesor de universidad dio clases en l√≠nea debido a la pandemia del Covid-19 en lugar de hacerlas de forma presencial. Posteriormente, subi√≥ grabaciones de las clases a la nube para los estudiantes que las segu√≠an de manera asincr√≥nica, es decir, aquellos que no asist√≠an a las clases en vivo, pero que ve√≠an las grabaciones posteriormente. El profesor cree que los estudiantes que asisten a las clases en vivo y participan activamente en el proceso de aprendizaje tienen un mejor desempe√±o acad√©mico. Con el fin de comprobar su hip√≥tesis, registr√≥ las calificaciones promedio de los estudiantes al final del semestre.

In [5]:
sincrona=np.array([94.,84.9,82.6,80.1,79.6,81.4,77.8,81.7,
                  78.8,73.2,87.9,87.9,93.5,82.3,79.3,78.3,71.6,
                  88.6,74.6,74.1,80.6])
asincrona=np.array([77.1,71.7,91.,72.2,74.8,85.1,67.6,69.9,75.3,
                    71.7,65.7,72.6,71.5,78.2])

Se debe realizar una prueba de hip√≥tesis para verificar la creencia del profesor sobre si los estudiantes que asisten a las clases en persona son m√°s exitosos que aquellos que ven las grabaciones posteriormente. Se utilizar√° un nivel de significancia del 0,05 para evaluar las hip√≥tesis nula y alternativa. Antes de realizar la prueba, se deben verificar los supuestos relevantes.

In [6]:
fig=make_subplots(rows=1,cols=2,
                 subplot_titles=(
                 'Sincronos','Asincronos'))
fig.add_trace(go.Histogram(x=sincrona,
                          name='Sincronos'),
              row=1,col=1)
fig.add_trace(go.Histogram(x=asincrona,
                          name='Asincronos'),
              row=1,col=2)
fig.update_xaxes(title_text='Calificacion',
                range=[50,100])
fig.update_yaxes(range=[0,10])
fig.show()

In [7]:
fig=go.Figure()
fig.add_trace(go.Box(y=sincrona,
              name='Sincrona'))
fig.add_trace(go.Box(y=asincrona,
              name='Asincrona'))
fig.show()

### 1. Definici√≥n de Hip√≥tesis

Dado que las calificaciones son obtenidas de personas diferentes, los datos no est√°n emparejados.

* $H‚ÇÄ$: La media de las calificaciones de los estudiantes que siguieron la clase de manera sincr√≥nica es menor o igual que la media de las calificaciones de los estudiantes que siguieron la clase de manera asincr√≥nica.

* $H‚ÇÅ$: La media de las calificaciones de los estudiantes que siguieron la clase de manera sincr√≥nica es mayor que la media de las calificaciones de los estudiantes que siguieron la clase de manera asincr√≥nica.

### 2. Comprobaci√≥n de supuestos

* $H‚ÇÄ$: Los datos tienen una distribuci√≥n normal.
* $H‚ÇÅ$: Los datos no tienen una distribuci√≥n normal.

Se asume que $Œ± = 0.05$. Si el valor $p > 0.05$, se puede afirmar que los datos tienen una distribuci√≥n normal.
Para verificar la normalidad, se utiliz√≥ el test W de Shapiro-Wilk, que generalmente se prefiere para muestras m√°s peque√±as, aunque existen otras opciones como el test de Kolmogorov-Smirnov y el test de D'Agostino y Pearson

### Prueba de Shapiro-Wilk

El test de Shapiro-Wilk es una prueba estad√≠stica utilizada para verificar si un conjunto de datos sigue una distribuci√≥n normal o no. Se utiliza com√∫nmente en an√°lisis de datos para verificar la normalidad de los datos antes de realizar pruebas estad√≠sticas param√©tricas.

El test de Shapiro-Wilk se basa en el c√°lculo del estad√≠stico $W$, que se compara con una tabla de valores cr√≠ticos para determinar si el conjunto de datos es normalmente distribuido. El valor $p$ obtenido a partir del test indica la probabilidad de que el conjunto de datos se distribuya normalmente.

El test de Shapiro-Wilk es una prueba de bondad de ajuste que compara los datos observados con una distribuci√≥n normal te√≥rica. La hip√≥tesis nula es que los datos se distribuyen normalmente, mientras que la hip√≥tesis alternativa es que los datos no se distribuyen normalmente.

In [9]:
def probar_normalidad(datos):
    test,valor_p=stats.shapiro(datos)
    print('p = %.6f' % valor_p)
    if valor_p<0.05:
        print('Rechaza la H0 >> Los datos no estan normalmente distribuidos')
    else:
        print('No se rechaza la H0 >> Los datos estan normalmente distribuidos')

In [10]:
probar_normalidad(sincrona)

p = 0.418745
No se rechaza la H0 >> Los datos estan normalmente distribuidos


In [11]:
probar_normalidad(asincrona)

p = 0.080302
No se rechaza la H0 >> Los datos estan normalmente distribuidos


Siguiente comprobaci√≥n de supuestos

* $H‚ÇÄ$: Las varianzas de las muestras son iguales.
* $H‚ÇÅ$: Las varianzas de las muestras son diferentes.

In [None]:
def probar_varianzas(*grupos):
    test,valor_p=stats.levene(*grupos)
    print('p = %.6f' % valor_p)
    if valor_p<0.05:
        print('Rechaza la H0 >> Las varianzas son diferentes')
    else:
        print('No se rechaza la H0 >> Las varianzas son iguales')

Este test eval√∫a la hip√≥tesis nula de que las varianzas poblacionales son iguales (llamado homogeneidad de varianza). Suponga que el valor $p$ resultante del test de Levene es menor que el nivel de significancia (t√≠picamente 0,05). En ese caso, es poco probable que las diferencias obtenidas en las varianzas de las muestras hayan ocurrido por muestreo aleatorio de una poblaci√≥n con varianzas iguales.

### Prueba de Levene

El test de Levene es un test estad√≠stico utilizado para verificar si las varianzas de dos o m√°s grupos son estad√≠sticamente iguales. El objetivo de este test es determinar si las varianzas son homog√©neas (homocedasticidad) o si son diferentes (heterocedasticidad).

El test de Levene se basa en la comparaci√≥n de la varianza observada de cada grupo con la varianza esperada. La varianza esperada se calcula a partir de la media de las varianzas de los grupos, es decir, se supone que los grupos tienen varianzas iguales. Si la varianza observada es significativamente diferente de la varianza esperada, se rechaza la hip√≥tesis nula de igualdad de varianzas.

In [None]:
probar_varianzas(sincrona,asincrona)

### 3. Seleccionando la Prueba Adecuada

Dado que se cumplen las suposiciones, podemos realizar la versi√≥n param√©trica de la prueba para 2 grupos y datos no pareados: Prueba T de muestras independientes.

Recordemos nuestras hip√≥tesis:

* $H‚ÇÄ$: media_sincronos <= media_asincronos
* $H‚ÇÅ$: media_sincronos > media_asincronos

$H‚ÇÅ$ nunca debe estar relacionada con una igualdad.

In [None]:
test,valor_p=stats.ttest_ind(sincrona, asincrona)
print('p = %.6f' % valor_p)
print('Dado que la hipotesis nula es "one sided"')
print('Usar p/2')
print('Valor p one sided = %.6f' % (valor_p/2))
if valor_p/2<0.05:
    print('Rechaza la H0')
else:
    print('No se rechaza la H0')

### One-sided vs Two-sided

La diferencia entre las pruebas de hip√≥tesis one-sided y two-sided (o de una y dos colas) radica en la direcci√≥n de la hip√≥tesis alternativa.

En una prueba de hip√≥tesis one-sided, la hip√≥tesis alternativa se enfoca en una direcci√≥n espec√≠fica. Por ejemplo, si estamos probando una hip√≥tesis sobre la media de una poblaci√≥n, una hip√≥tesis alternativa one-sided podr√≠a afirmar que la media es mayor que un cierto valor. En este caso, el resultado de la prueba se considerar√≠a significativo si la media de la muestra es significativamente mayor que el valor de referencia.

Por otro lado, en una prueba de hip√≥tesis two-sided, la hip√≥tesis alternativa se enfoca en ambas direcciones. En nuestro ejemplo, una hip√≥tesis alternativa two-sided afirmar√≠a simplemente que la media no es igual a un cierto valor. En este caso, el resultado de la prueba se considerar√≠a significativo si la media de la muestra difiere significativamente del valor de referencia, ya sea porque es mayor o menor que el valor de referencia.

### 4. Decisi√≥n y conclusi√≥n

En este nivel de significancia, hay suficiente evidencia para concluir que la nota promedio de los estudiantes que siguen el curso de manera sincr√≥nica es m√°s alta que la de los estudiantes que siguen el curso de manera as√≠ncrona.

## ANOVA

Un pediatra quiere observar el efecto del consumo de f√≥rmula en la ganancia de peso mensual promedio (en gramos) de los beb√©s. Por esta raz√≥n, recolect√≥ datos de tres grupos diferentes. El primer grupo son ni√±os amamantados exclusivamente (reciben solo leche materna), el segundo grupo son ni√±os que son alimentados solo con f√≥rmula y el √∫ltimo grupo son ni√±os alimentados con ambos, f√≥rmula y leche materna. Estos datos son los siguientes:

In [None]:
leche_materna=np.array([794.1, 716.9, 993. , 724.7, 760.9, 908.2, 659.3 , 690.8, 768.7, 717.3 , 630.7, 729.5, 714.1, 810.3, 583.5, 679.9, 865.1])
leche_formula=np.array([898.8, 881.2, 940.2, 966.2, 957.5, 1061.7, 1046.2, 980.4, 895.6, 919.7, 1074.1, 952.5, 796.3, 859.6, 871.1 , 1047.5, 919.1 , 1160.5, 996.9])
leche_ambos=np.array([976.4, 656.4, 861.2, 706.8, 718.5, 717.1, 759.8, 894.6, 867.6, 805.6, 765.4, 800.3, 789.9, 875.3, 740. , 799.4, 790.3, 795.2 , 823.6, 818.7, 926.8, 791.7, 948.3])

Seg√∫n esta informaci√≥n, se debe realizar una prueba de hip√≥tesis para verificar si hay una diferencia entre la ganancia mensual promedio de estos tres grupos utilizando un nivel de significancia de 0,05. Si hay una diferencia significativa, se debe realizar un an√°lisis adicional para determinar qu√© caus√≥ la diferencia. Antes de realizar la prueba de hip√≥tesis, es importante verificar los supuestos relacionados.

In [None]:
fig=go.Figure()
fig.add_trace(go.Box(y=leche_materna,name='Materna'))
fig.add_trace(go.Box(y=leche_formula,name='Formula'))
fig.add_trace(go.Box(y=leche_ambos,name='Ambos'))
fig.show()

### 1. Definici√≥n de Hip√≥tesis

* $H‚ÇÄ$: Establece que las medias de los tres grupos (amamantados exclusivamente, alimentados con f√≥rmula y alimentados con ambos) son iguales

* $H‚ÇÅ$: Afirma que al menos una de las medias es diferente

### 2. Comprobaci√≥n de supuestos

* $H‚ÇÄ$: Los datos tienen una distribuci√≥n normal.
* $H‚ÇÅ$: Los datos no tienen una distribuci√≥n normal.
<br><br>
* $H‚ÇÄ$: Las varianzas de las muestras son iguales.
* $H‚ÇÅ$: Las varianzas de las muestras son diferentes.

In [None]:
probar_normalidad(leche_materna)

In [None]:
probar_normalidad(leche_formula)

In [None]:
probar_normalidad(leche_ambos)

In [None]:
probar_varianzas(leche_materna,leche_formula,leche_ambos)

### 3. Seleccionando la Prueba Adecuada
Dado que se cumplen los supuestos, podemos realizar la versi√≥n param√©trica de la prueba para m√°s de 2 grupos y datos no pareados.

In [None]:
test,valor_p=stats.f_oneway(leche_materna,leche_formula,leche_ambos)
print('Valor p:%.10f' % valor_p)
if valor_p<0.05:
    print('Se rechaza la hipotesis nula')
else:
    print('La hipotesis nula se mantiene')

### 4. Decisi√≥n y conclusi√≥n
En este nivel de significancia, se puede concluir que al menos uno de los grupos tiene una ganancia de peso mensual promedio diferente. Para encontrar cu√°l o cu√°les grupos causan la diferencia, necesitamos realizar una prueba post-hoc/comparaci√≥n por pares como se muestra a continuaci√≥n.

In [None]:
df_posthoc=sp.posthoc_ttest([leche_materna,leche_formula,leche_ambos],
                equal_var=True,p_adjust='bonferroni')
# t-test con posthoc bonferroni
df_posthoc.columns=['leche_materna','leche_formula','leche_ambos']
df_posthoc.index=['leche_materna','leche_formula','leche_ambos']
df_posthoc.style.applymap(
    lambda x:'background-color:violet' if x<0.05 else 'background-color:white')

En este nivel de significancia, se puede concluir que:

* "Exclusivamente amamantados" es diferente a "Solo f√≥rmula"
* "Solo f√≥rmula" es diferente tanto a "Exclusivamente amamantados" como a "Ambos"
* "Ambos" es diferente a "Solo f√≥rmula".

## Prueba U de Mann-Whitney

Un especialista en recursos humanos que trabaja en una empresa de tecnolog√≠a est√° interesado en el tiempo de trabajo extra de diferentes equipos. Para investigar si hay una diferencia entre el tiempo extra del equipo de desarrollo de software y el equipo de pruebas, seleccion√≥ aleatoriamente a 17 empleados de cada uno de los dos equipos y registr√≥ su tiempo promedio semanal de trabajo extra en t√©rminos de horas. Los datos se presentan a continuaci√≥n.

In [None]:
equipo_desarrolladores=np.array([2.3, 2.1, 1.4, 2.0, 8.7, 2.2, 3.1, 4.2, 3.6, 2.5, 3.1, 6.2, 12.1, 3.9, 2.2, 1.2 ,3.4])
equipo_pruebas=np.array([6.2, 7.1, 1.5, 2,3 , 2, 1.5, 6.1, 2.4, 2.3, 12.4, 1.8, 5.3, 3.1, 9.4, 2.3, 4.1])

In [None]:
fig = go.Figure()
fig.add_trace(go.Box(y=equipo_desarrolladores,name='desarrolladores'))
fig.add_trace(go.Box(y=equipo_pruebas,name='pruebas'))
fig.show()

De acuerdo con esta informaci√≥n, se debe realizar una prueba de hip√≥tesis para verificar si hay una diferencia entre el tiempo extra de trabajo de dos equipos utilizando un nivel de significancia de 0,05. Antes de realizar la prueba de hip√≥tesis, es importante verificar los supuestos relacionados.

### 1. Definici√≥n de Hip√≥tesis

* $H‚ÇÄ$: El promedio de tiempo extra de trabajo del equipo de desarrollo de software es menor o igual que el promedio de tiempo extra de trabajo del equipo de pruebas.

* $H‚ÇÅ$: El promedio de tiempo extra de trabajo del equipo de desarrollo de software es mayor que el promedio de tiempo extra de trabajo del equipo de pruebas.

### 2. Comprobaci√≥n de supuestos

* $H‚ÇÄ$: Los datos tienen una distribuci√≥n normal.
* $H‚ÇÅ$: Los datos no tienen una distribuci√≥n normal.
<br><br>
* $H‚ÇÄ$: Las varianzas de las muestras son iguales.
* $H‚ÇÅ$: Las varianzas de las muestras son diferentes.

In [None]:
probar_normalidad(equipo_desarrolladores)
probar_normalidad(equipo_pruebas)
probar_varianzas(equipo_desarrolladores,equipo_pruebas)

### 3. Selecci√≥n de la Prueba Adecuada
Hay dos grupos y los datos se recopilan de diferentes individuos, por lo que no est√°n emparejados. Sin embargo, no se cumple la suposici√≥n de normalidad; por lo tanto, necesitamos utilizar la versi√≥n no param√©trica de la comparaci√≥n de 2 grupos para datos no pareados: la Prueba U de Mann-Whitney.

In [None]:
test,valor_p=stats.mannwhitneyu(equipo_desarrolladores,
                                equipo_pruebas)
print('Valor p one sided:%.4f' % (valor_p/2))
if valor_p/2<0.05:
    print('Se rechaza la H0')
else:
    print('Se mantiene la H0')

### 4. Decisi√≥n y conclusi√≥n

En este nivel de significancia, se puede decir que no hay una diferencia estad√≠sticamente significativa entre el tiempo promedio de trabajo extra de los dos equipos.

##  Kruskal-Wallis
Una empresa de comercio electr√≥nico publica regularmente sus campa√±as en YouTube, Instagram y Facebook. Sin embargo, el nuevo gerente estaba curioso por saber si hab√≠a alguna diferencia en la cantidad de clientes atra√≠dos por estas plataformas. Por lo tanto, comenz√≥ a utilizar Adjust, una aplicaci√≥n que permite saber de d√≥nde provienen los usuarios. Los n√∫meros diarios reportados por Adjust para cada plataforma son los siguientes.

In [None]:
youtube=np.array([1913, 1879, 1939, 2146, 2040, 2127, 2122, 2156, 2036, 1974, 1956, 2146, 2151, 1943, 2125])
instagram=np.array([2305., 2355., 2203., 2231., 2185., 2420., 2386., 2410., 2340., 2349., 2241., 2396., 2244., 2267., 2281.])
facebook=np.array([2133., 2522., 2124., 2551., 2293., 2367., 2460., 2311., 2178., 2113., 2048., 2443., 2265., 2095., 2528.])

In [None]:
fig = go.Figure()
fig.add_trace(go.Box(y=youtube,name='youtube'))
fig.add_trace(go.Box(y=instagram,name='instagram'))
fig.add_trace(go.Box(y=facebook,name='facebook'))
fig.show()

De acuerdo con esta informaci√≥n, realice la prueba de hip√≥tesis para verificar si existe una diferencia entre la adquisici√≥n promedio de clientes de estas tres plataformas utilizando un nivel de significancia de 0.05. Si hay una diferencia significativa, realice un an√°lisis adicional para encontrar qu√© caus√≥ la diferencia. Antes de realizar la prueba de hip√≥tesis, verifique las suposiciones relacionadas.

### 1. Definici√≥n de Hip√≥tesis
* $H‚ÇÄ$: La media de las muestras de cada plataforma es la misma.
* $H‚ÇÅ$: Al menos una de las medias de las muestras es diferente de las dem√°s.

### 2. Comprobaci√≥n de supuestos

* $H‚ÇÄ$: Los datos tienen una distribuci√≥n normal.
* $H‚ÇÅ$: Los datos no tienen una distribuci√≥n normal.
<br><br>
* $H‚ÇÄ$: Las varianzas de las muestras son iguales.
* $H‚ÇÅ$: Las varianzas de las muestras son diferentes.

In [None]:
probar_normalidad(youtube)
probar_normalidad(instagram)
probar_normalidad(facebook)
probar_varianzas(youtube,instagram,facebook)

### 3. Selecci√≥n de la Prueba Adecuada
Las suposiciones de normalidad y homogeneidad de varianzas no se cumplen, por lo tanto, necesitamos utilizar la versi√≥n no param√©trica del ANOVA para datos no pareados (los datos se recolectan de diferentes fuentes).

In [None]:
test,valor_p=stats.kruskal(youtube,instagram,facebook)
print('Valor p:%.6f' % valor_p)
if valor_p<0.05:
    print('Se rechaza la H0')
else:
    print('No se rechaza la H0')

### 4. Decisi√≥n y conclusi√≥n
En este nivel de significancia, al menos uno de los n√∫meros promedio de adquisici√≥n de clientes es diferente. Dado que los datos no son normales, se utiliza la versi√≥n no param√©trica de la prueba post hoc.

In [None]:
df_posthoc=sp.posthoc_mannwhitney([youtube,instagram,facebook],
                                  p_adjust='bonferroni')
df_posthoc.columns=['youtube','instagram','facebook']
df_posthoc.index=['youtube','instagram','facebook']
df_posthoc.style.applymap(lambda x:'background-color:violet' if x<0.05 else 'background-color:white')

El n√∫mero promedio de clientes provenientes de YouTube es diferente de los dem√°s (en realidad, es m√°s peque√±o que los dem√°s).

## Prueba T pareada

El Centro de Salud Universitario diagnostic√≥ a dieciocho estudiantes con colesterol alto en el semestre anterior. El personal m√©dico les inform√≥ a estos pacientes sobre los peligros del colesterol alto y les prescribi√≥ un programa de dieta. Un mes despu√©s, los pacientes regresaron para un control y se volvi√≥ a examinar su nivel de colesterol. Pruebe si hay una diferencia en los niveles de colesterol de los pacientes.

De acuerdo con esta informaci√≥n, realice la prueba de hip√≥tesis para verificar si hay una disminuci√≥n en los niveles de colesterol de los pacientes despu√©s de la dieta utilizando un nivel de significancia de 0,05. Antes de realizar la prueba de hip√≥tesis, verifique las suposiciones relacionadas. Comente los resultados.

In [None]:
antes_dieta=[224, 235, 223, 253, 253, 224, 244, 225, 259, 220, 242, 240, 239, 229, 276, 254, 237, 227]
despues_dieta=[198, 195, 213, 190, 246, 206, 225, 199, 214, 210, 188, 205, 200, 220, 190, 199, 191, 218]

In [None]:
fig = go.Figure()
fig.add_trace(go.Box(y=antes_dieta,name='Antes'))
fig.add_trace(go.Box(y=despues_dieta,name='Despues'))
fig.show()

### 1. Definici√≥n de Hip√≥tesis
* $H‚ÇÄ$: El nivel de colesterol promedio de los estudiantes es igual o mayor despu√©s de seguir la dieta recomendada por la Universidad.
* $H‚ÇÅ$: El nivel de colesterol promedio de los estudiantes disminuye despu√©s de seguir la dieta recomendada por la Universidad.

### 2. Comprobaci√≥n de supuestos

* $H‚ÇÄ$: Los datos tienen una distribuci√≥n normal.
* $H‚ÇÅ$: Los datos no tienen una distribuci√≥n normal.
<br><br>
* $H‚ÇÄ$: Las varianzas de las muestras son iguales.
* $H‚ÇÅ$: Las varianzas de las muestras son diferentes.

In [None]:
probar_normalidad(antes_dieta)
probar_normalidad(despues_dieta)
probar_varianzas(antes_dieta,despues_dieta)

### 3. Selecci√≥n de la Prueba Adecuada
El conjunto de datos es pareado ya que se recopila informaci√≥n de los mismos individuos y las suposiciones se cumplen, por lo tanto podemos utilizar la Prueba T pareada.

In [None]:
test,valor_p=stats.ttest_rel(antes_dieta,despues_dieta)
print('Valor p one sided: %0.6f' % (valor_p/2))
if valor_p/2<0.05:
    print('Se rechaza la H0')
else:
    print('Se mantiene la H0')

### 4. Decisi√≥n y conclusi√≥n
En este nivel de significancia, hay suficiente evidencia para concluir que el nivel promedio de colesterol de los pacientes ha disminuido despu√©s de la dieta.

## Prueba de Wilcoxon de Rangos con Signo
Un inversor de capital de riesgo quer√≠a invertir en una startup que proporciona compresi√≥n de datos sin p√©rdida de calidad, pero hay dos competidores: DataCompress y FastZip. Inicialmente, el cre√≠a que el rendimiento de DataCompress podr√≠a ser mejor, pero a√∫n as√≠ quer√≠a probarlo antes de invertir. Luego, dio los mismos archivos a cada compa√±√≠a para comprimir y registr√≥ sus puntajes de rendimiento. Los datos est√°n abajo.

In [None]:
empresa1 = [4.57, 4.55, 5.47, 4.67, 5.41, 5.55, 5.53, 5.63, 3.86, 3.97, 5.44, 3.93, 5.31, 5.17, 4.39, 4.28, 5.25]
empresa2 = [4.27, 3.93, 4.01, 4.07, 3.87, 4. , 4. , 3.72, 4.16, 4.1 , 3.9 , 3.97, 4.08, 3.96, 3.96, 3.77, 4.09]

In [None]:
fig = go.Figure()
fig.add_trace(go.Box(y=empresa1,name='DataCompress'))
fig.add_trace(go.Box(y=empresa2,name='FastZip'))
fig.show()

De acuerdo a esta informaci√≥n, lleva a cabo la prueba de hip√≥tesis relacionada utilizando un nivel de significancia del 0.05. Antes de realizar la prueba, verifica las suposiciones relacionadas. Comenta sobre los resultados obtenidos.

### 1. Definici√≥n de Hip√≥tesis
Dado que las puntuaciones de rendimiento se obtienen de los mismos archivos, los datos est√°n emparejados.

* $H‚ÇÄ$: El puntaje de rendimiento de DataCompress es menor o igual al de FastZip
* $H‚ÇÅ$: El puntaje de rendimiento de DataCompress es mayor al de FastZip

### 2. Comprobaci√≥n de supuestos

* $H‚ÇÄ$: Los datos tienen una distribuci√≥n normal.
* $H‚ÇÅ$: Los datos no tienen una distribuci√≥n normal.
<br><br>
* $H‚ÇÄ$: Las varianzas de las muestras son iguales.
* $H‚ÇÅ$: Las varianzas de las muestras son diferentes.

In [None]:
probar_normalidad(empresa1)
probar_normalidad(empresa2)
probar_varianzas(empresa1,empresa2)

### 3. Selecci√≥n de la Prueba Adecuada
El supuesto de normalidad no se cumple; por lo tanto, necesitamos usar la versi√≥n no param√©trica de la prueba pareada, es decir, la prueba de rangos con signo de Wilcoxon.

In [None]:
test,valor_p=stats.wilcoxon(empresa1,empresa2)
print('Valor p one sided: %0.6f' % (valor_p/2))
if valor_p/2<0.05:
    print('Se rechaza la H0')
else:
    print('Se mantiene la H0')

### 4. Decisi√≥n y conclusi√≥n
En este nivel de significancia, hay suficiente evidencia para concluir que el rendimiento de FastZip es menor que el de DataCompress.

## Prueba de Friedman
Una investigadora estaba interesada en saber si existe una diferencia en t√©rminos de rendimiento entre la metodolog√≠a que ella desarroll√≥, C, y los m√©todos base A y B. Por lo tanto, decidi√≥ dise√±ar diferentes experimentos y registr√≥ la precisi√≥n alcanzada por cada m√©todo. La tabla a continuaci√≥n muestra la precisi√≥n alcanzada en los conjuntos de prueba por cada m√©todo. Tenga en cuenta que se utilizaron los mismos conjuntos de entrenamiento y prueba para cada m√©todo.

In [None]:
metodo_A = np.array([89.8, 89.9, 88.6, 88.7, 89.6, 89.7, 89.2, 89.3])
metodo_B = np.array([90.0, 90.1, 88.8, 88.9, 89.9, 90.0, 89.0, 89.2])
metodo_C = np.array([91.5, 90.7, 90.3, 90.4, 90.2, 90.3, 90.2, 90.3])

In [None]:
fig = go.Figure()
fig.add_trace(go.Box(y=metodo_A,name='A'))
fig.add_trace(go.Box(y=metodo_B,name='B'))
fig.add_trace(go.Box(y=metodo_C,name='C'))
fig.show()

Seg√∫n esta informaci√≥n, realiza la prueba de hip√≥tesis para verificar si hay una diferencia entre el rendimiento de los m√©todos utilizando un nivel de significancia del 0,05. Si hay una diferencia significativa, realiza un an√°lisis adicional para determinar cu√°l de los m√©todos caus√≥ la diferencia. Antes de realizar la prueba de hip√≥tesis, verifica las suposiciones relacionadas. Comenta los resultados.

### 1. Definici√≥n de Hip√≥tesis
* $H‚ÇÄ$: El desempe√±o promedio de los m√©todos A, B y C es el mismo.
* $H‚ÇÅ$: El desempe√±o promedio de al menos uno de los m√©todos A, B y C es diferente.

### 2. Comprobaci√≥n de supuestos

* $H‚ÇÄ$: Los datos tienen una distribuci√≥n normal.
* $H‚ÇÅ$: Los datos no tienen una distribuci√≥n normal.
<br><br>
* $H‚ÇÄ$: Las varianzas de las muestras son iguales.
* $H‚ÇÅ$: Las varianzas de las muestras son diferentes.

In [None]:
probar_normalidad(metodo_A)
probar_normalidad(metodo_B)
probar_normalidad(metodo_C)
probar_varianzas(metodo_A,metodo_B,metodo_C)

### 3. Selecci√≥n de la Prueba Adecuada
Hay tres grupos, pero la asunci√≥n de normalidad no se cumple. Por lo tanto, necesitamos usar la versi√≥n no param√©trica del ANOVA para datos pareados (Prueba de Friedman), ya que los puntajes de precisi√≥n se obtienen de los mismos conjuntos de prueba.

In [None]:
test,valor_p=stats.friedmanchisquare(metodo_A,metodo_B,metodo_C)
print('Valor p: %0.6f' % (valor_p))
if valor_p<0.05:
    print('Se rechaza la H0')
else:
    print('Se mantiene la H0')

### 4. Decisi√≥n y conclusi√≥n
A este nivel de significancia, al menos uno de los m√©todos tiene un rendimiento diferente. Dado que los datos no son normales, se utiliza la versi√≥n no param√©trica de la prueba post-hoc.

In [None]:
datos=np.array([metodo_A,metodo_B,metodo_C])
df_posthoc=sp.posthoc_wilcoxon(datos,p_adjust='holm')
df_posthoc.columns=['metodo_A','metodo_B','metodo_C']
df_posthoc.index=['metodo_A','metodo_B','metodo_C']
df_posthoc.style.applymap(lambda x:'background-color:violet' if x<0.05 else 'background-color:white')

El m√©todo C super√≥ a los dem√°s y logr√≥ mejores puntajes de precisi√≥n que los dem√°s.

## Ejercicios

En cada uno de los ejercicios siguientes realice la prueba de hip√≥tesis solicitada, siempre use estad√≠stica no param√©trica y s√≥lo si se cumplen los supuestos use estad√≠stica param√©trica. Grafique los datos para dar su impresi√≥n a "oj√≠metro" antes de realizar sus pruebas. Siga cuidadosamente los 4 pasos explicados en la libreta y no olvide registrar sus conclusiones. Si es necesario realizar un an√°lisis poshoc, h√°galo.

### Problema 1
Un neur√≥logo est√° investigando la eficacia de tres intervenciones diferentes en la mejora de la memoria a corto plazo en pacientes con deterioro cognitivo leve. Para ello, seleccion√≥ aleatoriamente a 18 pacientes y los asign√≥ a tres grupos diferentes (6 pacientes por grupo). Cada grupo recibi√≥ una de las intervenciones durante tres meses. Al final del estudio, el neur√≥logo registr√≥ la mejora en la memoria a corto plazo de los pacientes, medida a trav√©s del aumento en la puntuaci√≥n en una prueba de memoria. Los datos se presentan a continuaci√≥n:

In [None]:
intervencion_A = np.array([8, 6, 10, 7, 12, 9])
intervencion_B = np.array([14, 15, 18, 16, 13, 17])
intervencion_C = np.array([5, 3, 4, 6, 2, 7])

¬øHay alguna diferencia significativa en la mejora de la memoria a corto plazo entre los pacientes que recibieron las tres intervenciones diferentes? S√≠ la hay ¬øEntre que grupos espec√≠ficamente?

### Problema 2
Un endocrin√≥logo est√° estudiando el efecto de un nuevo medicamento para el control de la diabetes en pacientes con diabetes tipo 2. Reclut√≥ a 10 pacientes y registr√≥ sus niveles de az√∫car en sangre en ayunas antes y despu√©s de 8 semanas de tratamiento con el medicamento. Los datos se presentan a continuaci√≥n:

In [None]:
nivel_antes = np.array([180, 210, 190, 220, 170, 205, 230, 200, 215, 240])
nivel_despues = np.array([150, 180, 165, 185, 155, 175, 200, 170, 185, 210])

¬øHay una diferencia significativa en los niveles de az√∫car en sangre en ayunas de los pacientes antes y despu√©s del tratamiento con el nuevo medicamento?

### Problema 3
Un gastroenter√≥logo est√° evaluando la efectividad de tres diferentes tratamientos para reducir los s√≠ntomas del s√≠ndrome del intestino irritable (SII). Reuni√≥ a 21 pacientes y los asign√≥ aleatoriamente a tres grupos (7 pacientes por grupo). Al final del estudio, los pacientes calificaron la mejor√≠a de sus s√≠ntomas en una escala del 1 al 10, donde 1 es sin mejor√≠a y 10 es la mejor√≠a m√°xima. Los datos se presentan a continuaci√≥n:

In [None]:
tratamiento_X = np.array([6, 5, 8, 7, 6, 7, 9])
tratamiento_Y = np.array([3, 4, 2, 3, 5, 3, 4])
tratamiento_Z = np.array([8, 9, 7, 9, 8, 7, 10])

¬øExiste una diferencia significativa en la mejor√≠a de los s√≠ntomas del SII entre los pacientes que recibieron los tres diferentes tratamientos? S√≠ la hay ¬øEntre que grupos espec√≠ficamente?