<a href="https://colab.research.google.com/github/emiliagyr/EstadisticaExperimental/blob/main/Colab/ANOVA.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!pip install pingouin
!pip install pyreadstat

In [None]:
import pandas as pd
import seaborn as sns
import pingouin as pg
from scipy.stats import kstest
import matplotlib.pyplot as plt

In [None]:
# Opcional: si el contenido de las columnas no se muestra completo
pd.set_option("display.max_columns", None)

#1. Leer los datos del documento .sav (SPSS) o .csv (Excel)

In [None]:
df = pd.read_spss("SPSS.sav")
df

#2. Estadisticos descriptivos

In [None]:
df.describe()

#DISEÑOS INTERSUJETOS

##3. Análisis de varianzas de 1 vía

In [None]:
pg.anova(dv="dependent variable", between="independent variable", data=df)

Homogeneidad de varianzas

In [None]:
# Homogeneidad de varianzas: Sólo para contrastes paramétricos de muestras independientes
pg.homoscedasticity(data=df, dv="VD", group="independent variable")

Post-hoc Tukey

In [None]:
pg.pairwise_tukey(data=df, dv="dependent variable", between="independent variable")

Post-hoc Games Howell

In [None]:
pg.pairwise_gameshowell(
    data=df, dv="dependent variable", between="independent variable"
)

In [None]:
# Para anova de dos vías solo se coloca una lista dentro de between
pg.anova(dv="rt", between=["iv1", "iv2"], data=df_2way)

##4. Prueba de Kruskal Wallis



In [None]:
pg.kruskal(dv="dependent variable", between="independent variable", data=df)

En caso quieras analizar una variable independiente en solo un grupo de otra variable independiente:

In [None]:
#Ejemplo, solo se desea analizar mujeres
datos_mujeres = df[df["Sexo"] == "Femenino"]

# Filtrar datos de mujeres para cada Situacion
rv_situacion1 = datos_mujeres[datos_mujeres["Situacion"] == "1"]["VD"]
rv_situacion2 = datos_mujeres[datos_mujeres["Situacion"] == "2"]["VD"]

# Realizar el test de Kruskal-Wallis usando pingouin
resultado_kruskal = pg.kruskal(dv="VD", between="Situacion", data=datos_mujeres)

#DISEÑOS INTRASUJETOS

##5. Análisis de medias repetidas

In [None]:
pg.rm_anova(dv="dependent variable", within="cond", subject="Sub_id", data=df_repeated)

##6. Prueba de Friedman

In [None]:
pg.friedman(dv="dependent variable", within="cond", subject="Sub_id", data=df_repeated)

#ANOVA 2 VÍAS

Prueba de esfericidad de Mauchly
(Homogeneidad de varianzas para intrasujeto)

In [None]:
pg.sphericity(data=melt_df, dv='VD, subject='Sujeto', within='vi')

Prueba de igualdad de Levene (Homogeneidad de varianzas para intersujeto)

In [None]:
pg.homoscedasticity(data=melt_df, dv='VD', group='vi')

Se realizan 3 hipótesis globales:
1. VI 1
2. vI 2
3. Interacción

In [None]:
pg.anova(dv="VD", between=["iv1", "iv2"], data=df_2way)

##Es posible que necesario crear una columna de las mediciones x VI para tener todos los puntajes de VD juntos

In [None]:
melt_df = pd.melt(
    df, value_name="VD", var_name="iv1", id_vars=["A", "B", "C"] #A, B, C ... son columnas que no queremos incluir en la nueva columna de VI, quermeos que se amntengan como están.
)
melt_df

#Graficar datos

In [None]:
sns.set(style="whitegrid")
plt.figure(figsize=(10, 6))
sns.pointplot(data=melt_df, x='VI1', y='VD', hue='VI2', markers=['o', 's', 'D'], linestyles=['-', '--', '-.'])
plt.title('Interaction Plot: VI1 and VI2 on VD)
plt.xlabel('VI1')
plt.ylabel('VD')
plt.legend(title='VI2')
plt.show()
