# Análisis del Cuestionario USE – Subescalas Usefulness y Satisfaction
Este notebook muestra cómo transformar una batería de ítems en métricas agregadas por subescala en el cuestionario USE. Nos enfocaremos en **Usefulness (U1–U8)** y **Satisfaction (S1–S6)**.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.stats import ttest_ind, pearsonr
from sklearn.linear_model import LinearRegression

sns.set(style="whitegrid")


In [None]:
# Cargar archivo Excel desde GitHub
url = "https://raw.githubusercontent.com/ClaudixoPG/ESI_2025_S1/main/datasets/dataset_USE_30items_Likert.xlsx"
df = pd.read_excel(url)
df.head()


## Cálculo de Subescalas
Cada subescala se construye como el **promedio de sus ítems individuales**. Ejemplo:
- Usefulness (U1 a U8)
- Satisfaction (S1 a S6)


In [None]:
# Promedios por subescala
df["usefulness"] = df[[f"U{i}" for i in range(1, 9)]].mean(axis=1)
df["satisfaction"] = df[[f"S{i}" for i in range(1, 7)]].mean(axis=1)

df[["usefulness", "satisfaction"]].head()


In [None]:
# Correlación
corr, p = pearsonr(df["usefulness"], df["satisfaction"])
print(f"Correlación entre Usefulness y Satisfaction: r = {corr:.2f}, p = {p:.4f}")


In [None]:
# Scatterplot
plt.figure(figsize=(8, 6))
sns.regplot(x="usefulness", y="satisfaction", data=df, ci=95, line_kws={"color": "red"})
plt.title("Relación entre Usefulness y Satisfaction")
plt.xlabel("Usefulness (promedio U1–U8)")
plt.ylabel("Satisfaction (promedio S1–S6)")
plt.tight_layout()
plt.show()


## Actividad
Realiza los mismos pasos para las subescalas:
- **Ease of Use** (`EOU1` a `EOU12`)
- **Ease of Learning** (`EOL1` a `EOL4`)

Luego, analiza cómo se relacionan con `satisfaction`.

### Interpretación de la Correlación
- El coeficiente de Pearson indica **qué tan fuerte y en qué dirección** se relacionan las variables.
- Un valor cercano a +1 indica una relación positiva fuerte.
- El valor *p* indica si esa relación es estadísticamente significativa.

**Ejemplo:** Si r = 0.65 y p < 0.05, hay una correlación positiva y significativa entre percepción de utilidad y satisfacción.

### Análisis Complementario: ¿Los expertos y no expertos difieren en satisfacción?

In [None]:
# T-Test para comparar satisfacción entre expertos y no expertos
expertos = df[df["audience_type"] == "Experto"]["satisfaction"]
no_expertos = df[df["audience_type"] == "No experto"]["satisfaction"]
t_stat, p_val = ttest_ind(expertos, no_expertos)

print(f"T-Test: diferencia en satisfacción
T = {t_stat:.2f}, p = {p_val:.4f}")


### Interpretación del T-Test
- Compara las medias de satisfacción entre usuarios expertos y no expertos.
- Si *p* < 0.05, la diferencia es significativa.
- Este análisis permite detectar si el tipo de público afecta la experiencia reportada.