
# Modelo de Regresión Lineal con las variables actuales

Este modelo incluye las siguientes variables predictoras:
- Género
- Usa laboratorio
- Semestre
- Dificultad de acceso por capacidad
- Dificultad de acceso por disponibilidad
- Acceso a visualización gráfica
- Opinión sobre sistema de reservas

### Resultados del modelo:

El modelo ajustado tiene los siguientes coeficientes:

- **Intercepto**: 2.03
- **Coeficientes**:
   - **Género**: 0.52
   - **Usa laboratorio**: -0.53
   - **Semestre**: -0.09
   - **Dificultad de acceso por capacidad**: -0.91
   - **Dificultad de acceso por disponibilidad**: 0.55
   - **Visualización gráfica**: -0.44
   - **Sistema de reservas**: -0.25

El valor \(R^2\) del modelo es: -0.336

El modelo no explica adecuadamente la variabilidad de los datos, pero sirve como un punto de partida para entender cómo diferentes factores afectan el uso de los laboratorios.


In [None]:

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import r2_score
import pandas as pd

# Cargar el dataset procesado
data_clean = pd.read_csv('/mnt/data/PercepcionMantenimientoEquipos.csv')

# Codificación de las variables predictoras
le_frecuencia = LabelEncoder()
data_clean['Genero'] = le_frecuencia.fit_transform(data_clean['2. Género'])
data_clean['UsaLab'] = le_frecuencia.fit_transform(data_clean['3. Utiliza los laboratorios de la Universidad'])
data_clean['Frecuencia'] = le_frecuencia.fit_transform(data_clean['4.  ¿Con qué frecuencia utiliza los laboratorios de la universidad por semestre?'])

# Definición de las variables adicionales (dificultades y percepción)
data_clean['DificultadCapacidad'] = le_frecuencia.fit_transform(data_clean['6. ¿Ha presentado dificultades para acceder a una sala de laboratorio debido a la capacidad máxima? '].fillna('No'))
data_clean['DificultadDisponibilidad'] = le_frecuencia.fit_transform(data_clean['7. ¿Ha presentado dificultades para acceder a una sala de laboratorio debido a la falta de disponibilidad?'].fillna('No'))
data_clean['VisualizacionGrafica'] = le_frecuencia.fit_transform(data_clean['8. ¿Cuándo realiza prácticas de laboratorio, tiene acceso a una visualización gráfica que le muestra la disponibilidad de las salas de laboratorio para agendarlas?'].fillna('No'))
data_clean['SistemaReservaBeneficioso'] = le_frecuencia.fit_transform(data_clean['9. ¿Considera que sería beneficioso contar con un sistema web que permita reservar salas de laboratorio en tiempo real para mejorar la experiencia como estudiante?'].fillna('Neutral'))

# Limpieza de la columna Semestre
data_clean['Semestre'] = pd.to_numeric(data_clean['Semestre'], errors='coerce').fillna(0)

# Redefinir las variables predictoras y dependiente
X_new_clean = data_clean[['Genero', 'UsaLab', 'Semestre', 'DificultadCapacidad', 'DificultadDisponibilidad', 'VisualizacionGrafica', 'SistemaReservaBeneficioso']]
y_new_clean = data_clean['Frecuencia']

# División de datos en entrenamiento y prueba
X_train_new_clean, X_test_new_clean, y_train_new_clean, y_test_new_clean = train_test_split(X_new_clean, y_new_clean, test_size=0.2, random_state=42)

# Creación del modelo
reg_model_new_clean = LinearRegression()
reg_model_new_clean.fit(X_train_new_clean, y_train_new_clean)

# Predicción y evaluación del modelo
y_pred_new_clean = reg_model_new_clean.predict(X_test_new_clean)
r2_new_clean = r2_score(y_test_new_clean, y_pred_new_clean)

# Mostrar los resultados
intercept_new_clean = reg_model_new_clean.intercept_
coefficients_new_clean = reg_model_new_clean.coef_
intercept_new_clean, coefficients_new_clean, r2_new_clean
