
# Análisis de Regresión Lineal: Uso de Laboratorios

## 1. Hipótesis

- **Hipótesis nula (H0)**: No existe una relación significativa entre las variables predictoras (género, uso de laboratorio) y la frecuencia de uso de los laboratorios.
- **Hipótesis alternativa (HA)**: Existe una relación significativa entre estas variables y la frecuencia de uso de los laboratorios.

## 2. Modelo de Regresión Lineal

La fórmula de regresión lineal es:

$$
Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \ldots + \beta_n X_n + \epsilon
$$

Donde:
- \(Y\) es la variable dependiente (frecuencia de uso de los laboratorios).
- \(X_1, X_2\) son las variables independientes (género, uso de laboratorio).
- \( \beta_0 \) es el intercepto.
- \( \beta_1, \beta_2\) son los coeficientes de regresión.
- \( \epsilon \) es el error.


In [None]:

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import r2_score

# Codificar variables categóricas
le_genero = LabelEncoder()
le_uso_lab = LabelEncoder()
le_frecuencia = LabelEncoder()

data_clean['Genero'] = le_genero.fit_transform(data_clean['2. Género'])
data_clean['UsaLab'] = le_uso_lab.fit_transform(data_clean['3. Utiliza los laboratorios de la Universidad'])
data_clean['Frecuencia'] = le_frecuencia.fit_transform(data_clean['4.  ¿Con qué frecuencia utiliza los laboratorios de la universidad por semestre?'])

# Selección de variables predictoras e independiente
X = data_clean[['Genero', 'UsaLab']]
y = data_clean['Frecuencia']

# División de los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Creación del modelo de regresión lineal
reg_model = LinearRegression()
reg_model.fit(X_train, y_train)

# Predicción y evaluación del modelo
y_pred = reg_model.predict(X_test)
r2 = r2_score(y_test, y_pred)

# Coeficientes del modelo
intercept = reg_model.intercept_
coefficients = reg_model.coef_

intercept, coefficients, r2
