# Inferencia Estadística
## Proyecto: Factores que influyen en los hábitos de vida saludable en jóvenes universitarios

**Unidad Solicitante:** Área de Salud Universitaria  
**Objetivo:** Desarrollar una investigación estadística basada en el método científico para orientar políticas de bienestar estudiantil.

---

## Lección 1: Método Científico y Estadística

### 1. Definición del Problema a Investigar

La transición a la educación superior conlleva cambios significativos en el estilo de vida de los jóvenes. La presión académica, la gestión autónoma del tiempo y las limitaciones económicas suelen derivar en una degradación de los hábitos saludables. El Área de Salud Universitaria ha detectado cualitativamente problemas de fatiga y sedentarismo, pero carece de un respaldo estadístico que cuantifique estas tendencias.

**Pregunta de investigación:**  
¿En qué medida el tiempo dedicado al estudio y la carga académica influyen en el **déficit** de sueño (menos de 7 horas diarias, límite inferior de las recomendaciones internacionales de 7-9 horas) y en la insuficiente actividad física (menos de 150 minutos semanales) en los estudiantes de la institución?

---

### 2. Formulación de Hipótesis (Nula y Alternativa)

Para realizar inferencia estadística, traducimos nuestras sospechas en afirmaciones matemáticas. La **Hipótesis Nula ($H_0$)** representa el estado de "normalidad" o cumplimiento de estándares, mientras que la **Hipótesis Alternativa ($H_1$)** es la que buscamos probar con evidencia.

#### A. Hipótesis sobre el Descanso (Horas de Sueño)
Buscamos determinar si los estudiantes están durmiendo menos de lo recomendado por la OMS (7 horas).

* **$H_0$ (Hipótesis Nula):** El promedio de horas de sueño de los estudiantes es igual o mayor a 7 horas diarias.  
    $$H_0: \mu \geq 7$$
* **$H_1$ (Hipótesis Alternativa):** El promedio de horas de sueño de los estudiantes es significativamente menor a 7 horas diarias.  
    $$H_1: \mu < 7$$

#### B. Hipótesis sobre Actividad Física (Sedentarismo)
Queremos verificar si la media de actividad física semanal alcanza el mínimo saludable de 150 minutos recomendados por la OMS.

* **$H_0$ (Hipótesis Nula):** Los estudiantes realizan, en promedio, al menos 150 minutos de actividad física a la semana.  
    $$H_0: \mu \geq 150$$
* **$H_1$ (Hipótesis Alternativa):** El promedio de actividad física semanal es inferior a los 150 minutos recomendados.  
    $$H_1: \mu < 150$$

#### C. Hipótesis sobre Alimentación (Proporción de riesgo)
Evaluaremos si la mayoría de la población universitaria tiene hábitos alimenticios de riesgo, definidos como el consumo de ultraprocesados más de 3 veces por semana.

* **$H_0$ (Hipótesis Nula):** La proporción de estudiantes con consumo frecuente de ultraprocesados (>3 veces/semana) es igual o menor al 50%.  
    $$H_0: p \leq 0.50$$
* **$H_1$ (Hipótesis Alternativa):** La proporción de estudiantes con consumo frecuente de ultraprocesados (>3 veces/semana) es mayor al 50% de la población.  
    $$H_1: p > 0.50$$

---

### Justificación del Nivel de Significancia ($\alpha$)
Para todas las pruebas de hipótesis planteadas, utilizaremos un **nivel de significancia $\alpha = 0.05$** (5%). Esto implica que estamos dispuestos a aceptar un 5% de probabilidad de rechazar la hipótesis nula siendo esta verdadera (Error Tipo I). Este es el estándar en investigaciones de ciencias sociales y salud pública para asegurar resultados confiables.

---

### 3. Identificación de Variables Relevantes

Para que el estudio permita realizar inferencias válidas, se han seleccionado variables que cubren los tres pilares de la investigación (sueño, alimentación y actividad física), junto con variables sociodemográficas para segmentar los datos.

| Variable | Tipo de Variable | Escala de Medición | Definición Operacional |
| :--- | :--- | :--- | :--- |
| **Horas de sueño** | Cuantitativa Continua | Razón | Cantidad de horas promedio de descanso nocturno en los últimos 7 días. |
| **Actividad física semanal** | Cuantitativa Continua | Razón | Minutos totales dedicados a ejercicio de intensidad moderada o alta por semana. |
| **Frecuencia de consumo de ultraprocesados** | Cuantitativa Discreta | Razón | Cantidad de veces a la semana en las que el estudiante consume comida rápida o snacks procesados (umbral de riesgo: >3 veces/semana). |
| **Carga académica** | Cuantitativa Continua | Razón | Horas semanales dedicadas exclusivamente al estudio (clases + estudio autónomo). |
| **Facultad** | Cualitativa Nominal | Nominal | Unidad académica a la que pertenece el estudiante (ej. Salud, Ingeniería, Artes). |
| **Nivel de estrés percibido** | Cualitativa Ordinal | Ordinal | Valoración subjetiva del estrés en escala: Bajo, Medio, Alto. |
| **Consumo de agua** | Cuantitativa Continua | Razón | Litros de agua ingeridos diariamente en promedio. |
| **Año de carrera** | Cualitativa Ordinal | Ordinal | Nivel académico actual (1.º año, 2.º año, etc.). |

---

### Justificación Metodológica

1. **Uso de Variables de Razón:** Se priorizan las variables cuantitativas de razón (como horas y minutos) porque permiten el cálculo robusto de la media aritmética ($\mu$) y la desviación estándar ($\sigma$). Esto facilita la aplicación del **Teorema del Límite Central** (que opera sobre el tamaño muestral, n ≥ 30) al garantizar estimaciones precisas de los parámetros poblacionales, y habilita **estimaciones por intervalos de confianza** en las etapas posteriores del módulo.
2. **Inclusión de Carga Académica:** Esta variable es central en la pregunta de investigación, ya que permite estudiar su relación con el sueño y la actividad física mediante análisis de correlación y pruebas de hipótesis para dos muestras en lecciones posteriores.
3. **Segmentación por Facultad:** La variable nominal "Facultad" permite realizar **pruebas de hipótesis para dos muestras**, comparando si, por ejemplo, los estudiantes de carreras de Salud tienen mejores hábitos que los de otras áreas.
4. **Control de Sesgo:** Al usar variables cualitativas ordinales para el estrés, podemos identificar patrones de comportamiento sin forzar al estudiante a dar un número exacto sobre algo subjetivo, lo que mejora la calidad de la respuesta en la encuesta.

---

### 4. Enfoque del Método Científico Elegido

Para este proyecto, utilizaremos un enfoque **cuantitativo y deductivo**, basado en el método científico empírico-analítico. Este enfoque es el más adecuado para el área de salud, ya que permite transformar comportamientos humanos (como el sueño o la dieta) en datos numéricos que pueden ser contrastados con teorías preexistentes.

#### Fases de la Metodología Aplicada:

1.  **Observación y Reconocimiento:** Identificación de la problemática de salud y bienestar dentro del campus universitario mediante la observación de patrones de fatiga y hábitos alimentarios en las áreas comunes.
2.  **Planteamiento:** Traducción de las observaciones en una pregunta de investigación concreta que busca entender la brecha entre el estado actual y las recomendaciones de salud ideales.
3.  **Hipótesis:** Propuesta de explicaciones tentativas (definidas en la Sección 2) que serán sometidas a prueba estadística formal.
4.  **Recolección de Datos (Experimentación Observacional):** Obtención de información a través de una muestra representativa. Aunque no se manipulan las variables en un laboratorio, el rigor en la captura de datos garantiza la calidad de la información.
5.  **Análisis e Inferencia:** Es el núcleo del módulo. Aquí los datos dejan de ser simples números para convertirse en evidencia. Usaremos la estadística para determinar si nuestros hallazgos son fruto del azar o si representan una realidad poblacional.
6.  **Conclusión:** Evaluación de los resultados para aceptar o rechazar las hipótesis y generar recomendaciones de políticas de bienestar basadas en evidencia.

#### Justificación del Carácter Inferencial
Dado que la población universitaria es extensa, el enfoque científico elegido se apoya en la **Inferencia Estadística**. Esto nos permite realizar afirmaciones sobre miles de estudiantes analizando solo un subgrupo (muestra). Sin este enfoque, cualquier recomendación del área de salud sería meramente anecdótica y carecería de validez para justificar una inversión en programas de bienestar.

---

### 5. Diseño Preliminar del Estudio

Para que los resultados de esta investigación tengan validez y puedan ser utilizados por el Área de Salud Universitaria, el estudio se ha estructurado bajo el siguiente diseño técnico:

#### A. Tipo de Estudio
Se trata de un estudio **observacional, descriptivo y transversal**.
* **Observacional:** No se intervendrá en la rutina de los sujetos.
* **Descriptivo:** Busca caracterizar el estado actual de los hábitos.
* **Transversal:** La recolección de datos se realizará en un único punto en el tiempo (una "fotografía" del momento actual).

#### B. Población y Muestra
* **Población:** Todos los estudiantes regulares activos de la institución.
* **Muestreo:** Aleatorio simple.
* **Tamaño muestral estimado:** Para una población grande, se apunta a una muestra de **n = 385** sujetos (considerando un nivel de confianza del 95%, un error muestral del 5% y una variabilidad p=q=0.5). Esto asegura que los resultados sean representativos.

#### C. Instrumento de Recolección
Se utilizará una encuesta digital estructurada, dividida en cuatro dimensiones:
1.  **Datos Sociodemográficos:** Facultad, año de ingreso, jornada y carga académica semanal.
2.  **Dimensión Sueño:** Escala de Pittsburgh simplificada para horas y calidad de descanso.
3.  **Dimensión Actividad Física:** Cuestionario Internacional de Actividad Física (IPAQ) versión corta — reporta minutos semanales de actividad moderada e intensa.
4.  **Dimensión Alimentación:** Frecuencia de Consumo de Alimentos (CFA), incluyendo ítems específicos sobre ultraprocesados (>3 veces/semana como umbral de riesgo).

#### D. Procedimiento y Cronograma
1.  **Semana 1:** Validación del instrumento y prueba piloto con 10 estudiantes.
2.  **Semanas 2-3:** Difusión masiva de la encuesta vía correo institucional y redes sociales del campus.
3.  **Semana 4:** Limpieza de la base de datos (eliminación de respuestas incompletas o atípicas) y preparación para el análisis inferencial.

#### E. Consideraciones Éticas
La participación será voluntaria y anónima. Se incluirá un **Consentimiento Informado** al inicio de la encuesta, aclarando que los datos se tratarán de forma agregada exclusivamente para fines de mejora en las políticas de bienestar estudiantil, cumpliendo con la normativa de protección de datos personales.

---