# Intervenciones web de psicología positiva

Como parte de tu trabajo en la división de salud mental de la OMS, te han encargado examinar la evidencia disponible acerca de intervenciones web breves para mejorar el bienestar y reducir la depresión. Durante tu revisión, un colega te compartió la siguiente referencia:

>Woodworth, R. J., O'Brien-Malone, A., Diamond, M. R., & Schüz, B. (2018). Data from, ‘Web-based Positive Psychology Interventions: A Reexamination of Effectiveness’. Journal of Open Psychology Data, 6(1), 1. DOI: http://doi.org/10.5334/jopd.35

El estudio en cuestión tiene resultados alentadores. Sin embargo, algo dentro de ti te dice que puede ser demasiado bueno para ser cierto. Decides escuchar tu intuición y revisas los datos para re-hacer el análisis y extraer tus propias conclusiones. 

Primero, cargas los datos y das un vistazo general.

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as stats
import seaborn as sns
import statsmodels.formula.api as smf
from statsmodels.stats.multicomp import pairwise_tukeyhsd

df = pd.read_csv(
    "https://raw.githubusercontent.com/renatoparedes/IntroPythonInvestigacionPsicologia/master/AnalisisdeDatosCuantitativos/ahi-cesd.csv"
)

In [2]:
df.head()

Unnamed: 0,id,occasion,elapsed.days,intervention,ahi01,ahi02,ahi03,ahi04,ahi05,ahi06,...,cesd13,cesd14,cesd15,cesd16,cesd17,cesd18,cesd19,cesd20,ahiTotal,cesdTotal
0,1,0,0.0,4,2,3,2,3,3,2,...,2,3,1,2,1,1,2,2,63,14
1,1,1,11.772731,4,3,3,4,3,3,4,...,1,2,1,3,1,1,1,1,73,6
2,2,0,0.0,1,3,4,3,4,2,3,...,1,1,1,4,1,1,1,1,73,7
3,2,1,8.017523,1,3,4,4,4,3,3,...,1,1,1,3,1,1,1,1,89,10
4,2,2,14.304086,1,3,4,4,4,3,3,...,3,1,1,1,1,1,1,1,89,13


# Antes y después

La base de datos tiene muchas variables. Para enfocar tu trabajo, decides fijarte únicamente en las siguientes variables:

- `ahiTotal` : Puntaje total del Authentic Happiness Inventory (AHI)
- `cesdTotal` : Puntaje total del Center for Epidemiological Studies Depression (CES-D) scale
- `occasion`: Momento de medición (0:Pretest, 1:Posttest, 2: Seguimiento a la 1era semana, 3: Seguimiento al 1er mes, 4: Seguimiento a los 3 meses, 5: Seguimiento a los 6 meses).
- `intervention`: Intervención recibida (1:Usar fortalezas distintivas, 2:Tres cosas buenas, 3:Visita de gratitud, 4:Registro de recuerdos tempranos -condición de control- )

## A partir de estas variables:

- Genera un DataFrame que solo contenga los datos de Pretest y Posttest.

- Genera una visualización que permita comparar los puntajes de la escala AHI según las intervenciones y los momentos de medición (pretest y posttest). ¿Observas alguna diferencia potencialmente significativa?

>Sugerencia: utiliza las funciones boxpot o violinplot del paquete seaborn.

- Genera una visualización que permita comparar los puntajes de la escala CES-D según las intervenciones y los momentos de medición (pretest y posttest). ¿Observas alguna diferencia potencialmente significativa?

>Sugerencia: utiliza las funciones boxpot o violinplot del paquete seaborn.

- Utiliza un ANOVA mixto (1 factor intrasujeto y 1 factor intersujeto) para examinar si existen efectos principales de las intervenciones (`Intervention`) y el momento de medición (`Occasion`) en los puntajes de la escala AHI (`ahiTotal`). ¿Qué puedes concluir?

>Sugerencia: Utiliza la función `mixedlm` disponible en el paquete [statsmodel](https://www.statsmodels.org/stable/mixed_linear.html). Puede que necesites leer un poco sobre el [lenguaje de fórmulas](https://patsy.readthedocs.io/en/latest/formulas.html) para aplicarla correctamente. 

- Utiliza un ANOVA mixto (1 factor intrasujeto y 1 factor intersujeto) para examinar si existen efectos principales de las intervenciones (`Intervention`) y el momento de medición (`Occasion`) en los puntajes de la escala CES-D (`cesdTotal`). ¿Qué puedes concluir?

>Sugerencia: Utiliza la función `mixedlm` disponible en el paquete [statsmodel](https://www.statsmodels.org/stable/mixed_linear.html). Puede que necesites leer un poco sobre el [lenguaje de fórmulas](https://patsy.readthedocs.io/en/latest/formulas.html) para aplicarla correctamente. 

# Follow-up

Ahora te propones trabajar con todas los momentos de medición para verificar si existe algún cambio en tus conclusiones preliminares. 

- Genera una visualización que permita comparar los puntajes de la escala AHI según las 4 intervenciones y los 6 momentos de medición. ¿Observas alguna diferencia potencialmente significativa?

>Sugerencia: Utiliza la función `lineplot` del paquete seaborn. 

- Genera una visualización que permita comparar los puntajes de la escala CES-D según las 4 intervenciones y los 6 momentos de medición. ¿Observas alguna diferencia potencialmente significativa?

>Sugerencia: Utiliza la función `lineplot` del paquete seaborn. 

- Utiliza un ANOVA mixto 4x6 para examinar si existen efectos principales de las intervenciones (Intervention) y el momento de medición (Occasion) en los puntajes de la escala AHI (`ahiTotal`). ¿Qué puedes concluir?


- De ser pertinente, realiza el cálculo de comparaciones múltiples con la prueba de Tukey. ¿Qué puedes concluir?
> Sugerencia: utiliza la función `pairwise_tukeyhsd` del paquete stats.model

- Utiliza un ANOVA mixto 4x6 para examinar si existen efectos principales de las intervenciones (Intervention) y el momento de medición (Occasion) en los puntajes de la escala CES-D (`cesdTotal`). ¿Qué puedes concluir?