### Tarea Semana 3: Análisis de la Aceptación de Tecnologías Emergentes en el Aula de Clases

**Introducción:**
En el marco de la investigación sobre la aceptación de tecnologías emergentes en el ámbito educativo, se llevó a cabo una encuesta para investigar los factores que influyen en la percepción de los docentes. Los factores considerados fueron Effort Expectancy (EE), Performance Expectancy (PEX), Social Influence (SI) y Facilitating Conditions (FC). Cada factor fue evaluado mediante una escala Likert de 1 a 5, donde 1 indica una baja percepción y 5 una alta percepción.

**Objetivo de la Tarea:**
Realizar un análisis de varianza (ANOVA) para determinar si existen diferencias significativas en la respuesta (answer) entre los diferentes factores considerados en la encuesta. Además, llevar a cabo análisis post hoc para identificar qué factores específicos difieren entre sí.

**Datos Disponibles:**
- Respuesta (answer) en escala Likert de 1 a 5.
- Factores: Effort Expectancy (EE), Performance Expectancy (PEX), Social Influence (SI) y Facilitating Conditions (FC).

**Instrucciones:**
1. Realiza un análisis exploratorio de los datos para familiarizarte con la distribución de las respuestas y los diferentes factores.
2. Utiliza un análisis de varianza (ANOVA) para investigar si hay diferencias significativas en la respuesta entre los factores considerados.
3. Si el ANOVA muestra diferencias significativas, realiza un análisis post hoc utilizando la prueba de Tukey HSD para identificar qué factores específicos difieren entre sí.
4. Además, realiza una prueba Kruskal-Wallis como análisis no paramétrico de ANOVA y, si es necesario, realiza un análisis post hoc utilizando la prueba de Dunn para identificar diferencias entre grupos específicos.
5. Interpreta los resultados de los análisis realizados y discute las implicaciones para la aceptación de tecnologías emergentes en el aula de clases.
6. Elabora un informe que incluya todos los análisis realizados, los resultados obtenidos y las conclusiones alcanzadas.


### OPCIÓN 1: LOW-CODE Y RÉPLICA DE NOTEBOOK


1. Cargue los datos:

```Python
import pandas as pd

data = pd.read_csv("https://raw.githubusercontent.com/marsgr6/estadistica-ux/main/data/internal_factors.csv").iloc[:,:9]

data.head()
```

|    | Sexo   |   Edad |   cluster | Q1   | Q2   | Q3   | question   |   answer | factor   |
|---:|:-------|-------:|----------:|:-----|:-----|:-----|:-----------|---------:|:---------|
|  0 | Male   |     18 |         1 | Si   | Si   | No   | Q12        |        4 | EE       |
|  1 | Male   |     18 |         1 | Si   | Si   | Si   | Q12        |        4 | EE       |
|  2 | Male   |     18 |         0 | Si   | Si   | Si   | Q12        |        3 | EE       |
|  3 | Male   |     18 |         1 | Si   | Si   | Si   | Q12        |        3 | EE       |
|  4 | Male   |     18 |         1 | Si   | Si   | No   | Q12        |        5 | EE       |

2. Realice una descripción de la variable answer agrupada por factor.

```Python
data.groupby("columna_categorica").describe()["columna_numerica"]
```

| factor   |   count |    mean |      std |   min |   25% |   50% |   75% |   max |
|:---------|--------:|--------:|---------:|------:|------:|------:|------:|------:|
| EE       |     240 | 3.44583 | 1.00895  |     1 |     3 |     3 |     4 |     5 |
| FC       |     240 | 3.375   | 1.01092  |     1 |     3 |     3 |     4 |     5 |
| PEX      |     240 | 3.65833 | 0.946218 |     1 |     3 |     4 |     4 |     5 |
| SI       |     240 | 2.97917 | 1.11456  |     1 |     2 |     3 |     4 |     5 |

3. LLeve a cavo un análisis de varianza `answer ~ factor`. 
  - Discuta el resultado de la prueba.
  

```Python
import statsmodels.api as sm
from statsmodels.formula.api import ols

model = ols('formula',  # Model formula
            data = data).fit()
                
anova_result = sm.stats.anova_lm(model, typ=2)
print(anova_result)
```

- Resultado esperado:

```
              sum_sq     df          F        PR(>F)
factor     57.970833    3.0  18.502514  1.130939e-11
Residual  998.425000  956.0        NaN           NaN
```

4. Realize un análisis post hoc
  - Discuta el resultado del `Multiple Comparison of Means - Tukey HSD, FWER=0.05`.
  - Discuta la figura correspondiente a los intervalos de confianza de los grupos: `tukey.plot_simultaneous()`.
  - Para que grupos observa diferencias.
  
```Python
from statsmodels.stats.multicomp import pairwise_tukeyhsd

tukey = pairwise_tukeyhsd(endog=data.columna_numerica,     # Data
                          groups=data.columna_factor,   # Groups
                          alpha=0.05)          # Significance level

tukey.plot_simultaneous()    # Plot group confidence intervals

tukey.summary()
```

- Resultado esperado:

|    | 0      | 1      | 2        | 3      | 4       | 5       | 6      |
|---:|:-------|:-------|:---------|:-------|:--------|:--------|:-------|
|  0 | group1 | group2 | meandiff | p-adj  | lower   | upper   | reject |
|  1 | EE     | FC     | -0.0708  | 0.8727 | -0.3109 | 0.1693  | False  |
|  2 | EE     | PEX    | 0.2125   | 0.1039 | -0.0276 | 0.4526  | False  |
|  3 | EE     | SI     | -0.4667  | 0.0    | -0.7068 | -0.2266 | True   |
|  4 | FC     | PEX    | 0.2833   | 0.0131 | 0.0432  | 0.5234  | True   |
|  5 | FC     | SI     | -0.3958  | 0.0001 | -0.6359 | -0.1557 | True   |
|  6 | PEX    | SI     | -0.6792  | 0.0    | -0.9193 | -0.4391 | True   |

5. Lleve a cabo una prueba de normalidad y discuta su resultado. 

```Python
import scipy.stats as stats

stats.shapiro(residuos)
```

- Resultado esperado
```
ShapiroResult(statistic=0.9745869636535645, pvalue=6.5741032409527556e-12)
```

6. Realice una prueba Kruskal-Wallis acompañado de un análisis post hoc usando la prueba de Dunn.
  - Discuta los resultados, para que grupos observa diferencias.

```Python
stats.kruskal(data['columna_numerica'][data['columna_factor'] == 'Factor1'],
              data['columna_numerica'][data['columna_factor'] == 'Factor2'],
              data['columna_numerica'][data['columna_factor'] == 'Factor3'],
              data['columna_numerica'][data['columna_factor'] == 'Factor4'])
```

- Resultado esperado:

```
KruskalResult(statistic=55.58904531427492, pvalue=5.140895536654877e-12)
```

- Post-hoc (requisito `!pip install scikit_posthocs`)

```Python
import scikit_posthocs as sp

data_ph = [data['columna_numerica'][data['columna_factor'] == 'Factor1'],
           data['columna_numerica'][data['columna_factor'] == 'Factor2'],
           data['columna_numerica'][data['columna_factor'] == 'Factor3'],
           data['columna_numerica'][data['columna_factor'] == 'Factor4']]
            
dunn_result = sp.posthoc_dunn(data_ph, p_adjust = 'bonferroni')
dunn_result.columns = ['Factor1', 'Factor2', 'Factor3', 'Factor4']
dunn_result.index = ['Factor1', 'Factor2', 'Factor3', 'Factor4']
dunn_result
```

- Resultado esperado:

|     |          EE |         PEX |          SI |          FC |
|:----|------------:|------------:|------------:|------------:|
| EE  | 1           | 0.0839149   | 6.87951e-06 | 1           |
| PEX | 0.0839149   | 1           | 1.46276e-12 | 0.0119045   |
| SI  | 6.87951e-06 | 1.46276e-12 | 1           | 0.000140418 |
| FC  | 1           | 0.0119045   | 0.000140418 | 1           |

- Revise: https://www.mdpi.com/2227-7102/14/1/10

### OPCIÓN 2: REPORTE EJECUTIVO PARA GERENCIA

- **Elabore un informe ejecutivo** discutiendo las figuras y resultados anteriores, puntos 1 a 6 de la Opción Low Code.

El reporte ejecutivo debe tener una extensión máxima de 3 páginas. Crea un documento en word que incluya lo siguiente:
  1. Descripción general del problema: explica el contexto o problema empresarial y el enfoque de análisis. 
  2. Diccionario de variables o base de datos: describe los datos utilizados para el análisis. 
  3. Análisis descriptivo de datos agrupados.
  4. Interpretación de las técnicas de inferencia estadística: explica por qué las pruebas de análsis de varianza usadas son adecuadas para este problema. También incluye una interpretación de los resultados de dichas técnicas con detalle. **Los resultados están disponibles en las secciones 1 a 6 de la Opción Low Code.** 
  5. Conclusión y Recomendaciones: ofrece recomendaciones gerenciales y sugerencias estratégicas que permita a la empresa tomar decisiones.
  
La explicación en todas las secciones del reporte ejecutivo debe ser detallado, justificado y relacionado al contexto o problema.