**REGRESIÓN LINEAL MÚLTIPLE**

La regresión lineal múltiple es una técnica estadística utilizada para modelar la relación entre una variable dependiente (también conocida como variable de respuesta) y dos o más variables independientes (también conocidas como variables predictoras o explicativas). A continuación, se presenta una explicación básica del concepto, la fórmula y un ejemplo de cómo implementarla.

Supongamos que queremos predecir el precio de una casa en función de su tamaño en pies cuadrados, el número de habitaciones y el número de baños. Para ello, usaremos una regresión lineal múltiple. Para comenzar, necesitamos importar las bibliotecas necesarias y cargar los datos en un DataFrame de Pandas:

In [5]:
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
# Crear datos de ejemplo
datos = {
    'Habitaciones': [3, 4, 2, 5, 4, 1, 2, 3, 4, 5, 6, 1, 3, 2, 4, 6, 5, 2, 1, 3, 4, 5, 6, 3, 2, 1, 4, 5, 6, 4, 3, 2, 1, 5, 6],
    'Tamaño_terreno': [150, 200, 120, 250, 180, 81, 115, 282, 153, 269, 191, 299, 172, 206, 276, 145, 235, 252, 223, 214, 244, 102, 289, 187, 161, 292, 132, 128, 228, 230, 154, 267,50, 200, 120],
    'Baños': [1, 2, 1, 3, 2, 1, 3, 2, 4, 2, 1, 4, 3, 1, 2, 3, 4, 4, 2, 1, 3, 2, 4, 1, 3, 4, 2, 1, 4, 3, 2, 3, 1,1, 2],
    'Precio_casa': [30000, 400000, 250000, 500000, 350000, 100110, 142781, 253122, 282349, 313015, 330340, 336310, 348989, 371114, 372234, 386310, 394498, 412345, 422345, 431114, 448989, 451114, 452234, 466310, 471114, 472234, 486310, 494498, 500000,30000, 400000, 250000, 500000, 350000, 100110]
}
for clave,valor in datos.items():
 print(clave," ",len(valor))

Habitaciones   35
Tamaño_terreno   35
Baños   35
Precio_casa   35


In [6]:
# Convertir el diccionario a un DataFrame de pandas
df = pd.DataFrame(datos)
# Guardar los datos en un archivo CSV
df.to_csv('casas.csv', index=False)
# cargar los datos
datos = pd.read_csv('casas.csv')
datos.head()

Unnamed: 0,Habitaciones,Tamaño_terreno,Baños,Precio_casa
0,3,150,1,30000
1,4,200,2,400000
2,2,120,1,250000
3,5,250,3,500000
4,4,180,2,350000


In [7]:
# separar las variables independientes y la variable dependiente
X = datos.iloc[:, :-1].values
y = datos.iloc[:, 3].values

In [8]:
X

array([[  3, 150,   1],
       [  4, 200,   2],
       [  2, 120,   1],
       [  5, 250,   3],
       [  4, 180,   2],
       [  1,  81,   1],
       [  2, 115,   3],
       [  3, 282,   2],
       [  4, 153,   4],
       [  5, 269,   2],
       [  6, 191,   1],
       [  1, 299,   4],
       [  3, 172,   3],
       [  2, 206,   1],
       [  4, 276,   2],
       [  6, 145,   3],
       [  5, 235,   4],
       [  2, 252,   4],
       [  1, 223,   2],
       [  3, 214,   1],
       [  4, 244,   3],
       [  5, 102,   2],
       [  6, 289,   4],
       [  3, 187,   1],
       [  2, 161,   3],
       [  1, 292,   4],
       [  4, 132,   2],
       [  5, 128,   1],
       [  6, 228,   4],
       [  4, 230,   3],
       [  3, 154,   2],
       [  2, 267,   3],
       [  1,  50,   1],
       [  5, 200,   1],
       [  6, 120,   2]])

In [9]:
y

array([ 30000, 400000, 250000, 500000, 350000, 100110, 142781, 253122,
       282349, 313015, 330340, 336310, 348989, 371114, 372234, 386310,
       394498, 412345, 422345, 431114, 448989, 451114, 452234, 466310,
       471114, 472234, 486310, 494498, 500000,  30000, 400000, 250000,
       500000, 350000, 100110])

A continuación, ajustamos el modelo de regresión lineal múltiple utilizando la

*   Elemento de la lista
*   Elemento de la lista

clase LinearRegression de Scikit-learn:

In [10]:
# ajustar el modelo
regressor = LinearRegression()
regressor.fit(X, y)

Podemos ver los coeficientes de regresión y la intersección mediante los siguientes comandos:

In [11]:
# imprimir los coeficientes y la intersección
print('Coeficientes:', regressor.coef_)
print('Intersección:', regressor.intercept_)

Coeficientes: [7585.26727795  253.86410714 9323.75021911]
Intersección: 253623.9791595871


Esto indica que el modelo de regresión lineal múltiple se ajustó a la ecuación:

Por lo tanto, para predecir el precio de una casa con un tamaño de 600 pies cuadrados, 3 habitaciones y 2 baños, podemos hacer lo siguiente:

In [12]:
# hacer una predicción
prediccion = regressor.predict([[3, 600, 2]])
print('Precio de la casa:', prediccion)

Precio de la casa: [447345.74571826]


Por lo tanto, el modelo predice que el precio de la casa sería de $300000 con estas características.

Por último, podemos evaluar el modelo utilizando diferentes métricas como el error cuadrático medio (MSE) o el coeficiente de determinación (R2), como se mencionó en las practicas anteriores.

**EJERCICIOS A DESARROLLAR**


***Ejemplo 1: Predicción del Precio de Autos***
Supongamos que queremos predecir el precio de autos en función de varias características como el año de fabricación, el kilometraje y la potencia del motor.

In [13]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

In [14]:
# Crear un DataFrame de ejemplo con características ficticias y precios
data = {
    'Año': [2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019],
    'Kilometraje': [150000, 140000, 130000, 120000, 110000, 100000, 90000, 80000, 70000, 60000],
    'Potencia': [130, 140, 150, 160, 170, 180, 190, 200, 210, 220],
    'Precio': [5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500]
}
df = pd.DataFrame(data)

In [15]:
X = df[['Año', 'Kilometraje', 'Potencia']]
y = df['Precio']

In [16]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [17]:
model = LinearRegression()
model.fit(X_train, y_train)

In [18]:
y_pred = model.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'Error Cuadrático Medio (MSE): {mse}')
print(f'Coeficiente de Determinación (R^2): {r2}')

Error Cuadrático Medio (MSE): 1.6543612251060553e-24
Coeficiente de Determinación (R^2): 1.0


In [19]:
nuevo_auto = pd.DataFrame({'Año': [2020], 'Kilometraje': [50000], 'Potencia': [230]})
precio_predicho = model.predict(nuevo_auto)
print(f'El precio predicho para el nuevo auto es: {precio_predicho[0]}')

El precio predicho para el nuevo auto es: 10000.0


***Ejemplo 2: Predicción de Salarios***

Queremos predecir el salario de empleados en función de sus años de experiencia, nivel de educación y número de proyectos completados.


In [20]:
# Crear un DataFrame de ejemplo con características ficticias y salarios
data = {
    'Experiencia': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
    'Nivel_Educacion': [1, 1, 2, 2, 3, 3, 4, 4, 5, 5],  # 1: Bachiller, 2: Licenciatura, 3: Maestría, 4: Doctorado, 5: Postdoctorado
    'Proyectos_Completados': [1, 3, 2, 4, 5, 6, 5, 7, 8, 9],
    'Salario': [30000, 35000, 40000, 45000, 50000, 55000, 60000, 65000, 70000, 75000]
}
df = pd.DataFrame(data)

In [21]:
X = df[['Experiencia', 'Nivel_Educacion', 'Proyectos_Completados']]
y = df['Salario']

In [22]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [23]:
model = LinearRegression()
model.fit(X_train, y_train)

In [24]:
y_pred = model.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'Error Cuadrático Medio (MSE): {mse}')
print(f'Coeficiente de Determinación (R^2): {r2}')

Error Cuadrático Medio (MSE): 0.0
Coeficiente de Determinación (R^2): 1.0


In [25]:
nuevo_empleado = pd.DataFrame({'Experiencia': [5], 'Nivel_Educacion': [3], 'Proyectos_Completados': [6]})
salario_predicho = model.predict(nuevo_empleado)
print(f'El salario predicho para el nuevo empleado es: {salario_predicho[0]}')

El salario predicho para el nuevo empleado es: 50000.0


***Ejemplo 3: Predicción de Rendimiento Académico***

Queremos predecir el rendimiento académico de los estudiantes en función de las horas de estudio, asistencia a clases y participación en actividades extracurriculares.

In [26]:
# Crear un DataFrame de ejemplo con características ficticias y rendimiento académico
data = {
    'Horas_Estudio': [10, 15, 20, 25, 30, 35, 40, 45, 50, 55],
    'Asistencia': [80, 85, 90, 85, 95, 90, 100, 95, 90, 100],
    'Participacion_Actividades': [2, 3, 4, 2, 5, 4, 5, 3, 4, 5],
    'Rendimiento': [60, 65, 70, 75, 80, 85, 90, 85, 80, 95]
}
df = pd.DataFrame(data)

In [27]:
X = df[['Horas_Estudio', 'Asistencia', 'Participacion_Actividades']]
y = df['Rendimiento']

In [28]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [29]:
model = LinearRegression()
model.fit(X_train, y_train)

In [30]:
y_pred = model.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'Error Cuadrático Medio (MSE): {mse}')
print(f'Coeficiente de Determinación (R^2): {r2}')

Error Cuadrático Medio (MSE): 85.69560309837716
Coeficiente de Determinación (R^2): -0.5234773884155941


In [31]:
nuevo_estudiante = pd.DataFrame({'Horas_Estudio': [35], 'Asistencia': [95], 'Participacion_Actividades': [4]})
rendimiento_predicho = model.predict(nuevo_estudiante)
print(f'El rendimiento académico predicho para el nuevo estudiante es: {rendimiento_predicho[0]}')

El rendimiento académico predicho para el nuevo estudiante es: 81.91948658109685


***Ejemplo 4: Predicción del Consumo de Energía***

Queremos predecir el consumo de energía de una vivienda en función de la temperatura, la humedad y el número de habitantes.

In [32]:
# Crear un DataFrame de ejemplo con características ficticias y consumo de energía
data = {
    'Temperatura': [20, 22, 24, 26, 28, 30, 32, 34, 36, 38],
    'Humedad': [30, 35, 40, 45, 50, 55, 60, 65, 70, 75],
    'Numero_Habitantes': [2, 2, 3, 3, 4, 4, 5, 5, 6, 6],
    'Consumo_Energia': [200, 210, 220, 230, 240, 250, 260, 270, 280, 290]
}
df = pd.DataFrame(data)

In [33]:
X = df[['Temperatura', 'Humedad', 'Numero_Habitantes']]
y = df['Consumo_Energia']

In [34]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [35]:
model = LinearRegression()
model.fit(X_train, y_train)

In [36]:
y_pred = model.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'Error Cuadrático Medio (MSE): {mse}')
print(f'Coeficiente de Determinación (R^2): {r2}')

Error Cuadrático Medio (MSE): 0.0
Coeficiente de Determinación (R^2): 1.0


In [37]:
nueva_vivienda = pd.DataFrame({'Temperatura': [33], 'Humedad': [60], 'Numero_Habitantes': [4]})
consumo_predicho = model.predict(nueva_vivienda)
print(f'El consumo de energía predicho para la nueva vivienda es: {consumo_predicho[0]}')

El consumo de energía predicho para la nueva vivienda es: 260.68965517241384


***Ejemplo 5: Predicción de Ventas de Tienda***

Queremos predecir las ventas de una tienda en función del gasto en publicidad en televisión, radio y prensa.

In [38]:
# Crear un DataFrame de ejemplo con características ficticias y ventas
data = {
    'TV': [230.1, 44.5, 17.2, 151.5, 180.8, 8.7, 57.5, 120.2, 8.6, 199.8],
    'Radio': [37.8, 39.3, 45.9, 41.3, 10.8, 48.9, 32.8, 19.6, 2.1, 2.6],
    'Prensa': [69.2, 45.1, 69.3, 58.5, 58.4, 75.0, 23.5, 11.6, 1.0, 21.2],
    'Ventas': [22.1, 10.4, 9.3, 18.5, 12.9, 7.2, 11.8, 13.2, 4.8, 10.6]
}
df = pd.DataFrame(data)

In [39]:
X = df[['TV', 'Radio', 'Prensa']]
y = df['Ventas']

In [40]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [41]:
model = LinearRegression()
model.fit(X_train, y_train)

In [42]:
y_pred = model.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'Error Cuadrático Medio (MSE): {mse}')
print(f'Coeficiente de Determinación (R^2): {r2}')

Error Cuadrático Medio (MSE): 13.201451790963423
Coeficiente de Determinación (R^2): -0.6838586468065588


In [43]:
nueva_publicidad = pd.DataFrame({'TV': [150.0], 'Radio': [30.0], 'Prensa': [20.0]})
ventas_predichas = model.predict(nueva_publicidad)
print(f'Las ventas predichas para la nueva campaña publicitaria son: {ventas_predichas[0]}')

Las ventas predichas para la nueva campaña publicitaria son: 17.36037494670307


***Ejemplo 6: Predicción del Precio de Productos Agrícolas***

Queremos predecir el precio de productos agrícolas en función de la cantidad producida, la demanda y el costo de producción.

In [44]:
# Crear un DataFrame de ejemplo con características ficticias y precios de productos agrícolas
data = {
    'Cantidad_Producida': [100, 150, 200, 250, 300, 350, 400, 450, 500, 550],
    'Demanda': [120, 180, 210, 260, 300, 350, 400, 420, 450, 480],
    'Costo_Produccion': [50, 60, 70, 80, 90, 100, 110, 120, 130, 140],
    'Precio': [20, 25, 30, 35, 40, 45, 50, 55, 60, 65]
}
df = pd.DataFrame(data)

In [45]:
X = df[['Cantidad_Producida', 'Demanda', 'Costo_Produccion']]
y = df['Precio']

In [46]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [47]:
model = LinearRegression()
model.fit(X_train, y_train)

In [48]:
y_pred = model.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'Error Cuadrático Medio (MSE): {mse}')
print(f'Coeficiente de Determinación (R^2): {r2}')

Error Cuadrático Medio (MSE): 2.524354896707238e-29
Coeficiente de Determinación (R^2): 1.0


In [49]:
nuevo_producto = pd.DataFrame({'Cantidad_Producida': [350], 'Demanda': [370], 'Costo_Produccion': [105]})
precio_predicho = model.predict(nuevo_producto)
print(f'El precio predicho para el nuevo producto agrícola es: {precio_predicho[0]}')

El precio predicho para el nuevo producto agrícola es: 45.096153846153854


***Ejemplo 7: Predicción del Peso Corporal***

Queremos predecir el peso corporal de una persona en función de su altura, edad y nivel de actividad física.

In [50]:
# Crear un DataFrame de ejemplo con características ficticias y peso corporal
data = {
    'Altura_cm': [160, 165, 170, 175, 180, 185, 190, 195, 200, 205],
    'Edad_anios': [25, 30, 35, 40, 45, 50, 55, 60, 65, 70],
    'Nivel_Actividad': [3, 2, 4, 3, 5, 2, 4, 3, 5, 1],  # 1: Bajo, 2: Moderado, 3: Alto, 4: Muy alto, 5: Extremadamente alto
    'Peso_kg': [60, 65, 70, 75, 80, 85, 90, 95, 100, 105]
}
df = pd.DataFrame(data)

In [51]:
X = df[['Altura_cm', 'Edad_anios', 'Nivel_Actividad']]
y = df['Peso_kg']

In [52]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [53]:
model = LinearRegression()
model.fit(X_train, y_train)


In [54]:
y_pred = model.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'Error Cuadrático Medio (MSE): {mse}')
print(f'Coeficiente de Determinación (R^2): {r2}')

Error Cuadrático Medio (MSE): 1.0097419586828951e-28
Coeficiente de Determinación (R^2): 1.0


In [55]:
nueva_persona = pd.DataFrame({'Altura_cm': [175], 'Edad_anios': [40], 'Nivel_Actividad': [3]})
peso_predicho = model.predict(nueva_persona)
print(f'El peso corporal predicho para la nueva persona es: {peso_predicho[0]} kg')

El peso corporal predicho para la nueva persona es: 75.0 kg


***Ejemplo 8: Predicción de la Productividad Laboral***

Queremos predecir la productividad laboral de los empleados en función de las horas de trabajo, la capacitación y el entorno de trabajo.

In [56]:
# Crear un DataFrame de ejemplo con características ficticias y productividad laboral
data = {
    'Horas_Trabajo': [40, 45, 50, 55, 60, 35, 48, 52, 54, 50],
    'Capacitacion': [3, 4, 5, 6, 7, 3, 4, 5, 6, 5],  # en horas de capacitación por semana
    'Entorno_Trabajo': [7, 8, 9, 7, 6, 8, 9, 8, 7, 9],  # en una escala del 1 al 10
    'Productividad': [70, 75, 80, 85, 90, 65, 78, 82, 84, 80]  # en una escala del 1 al 100
}
df = pd.DataFrame(data)

In [57]:
X = df[['Horas_Trabajo', 'Capacitacion', 'Entorno_Trabajo']]
y = df['Productividad']

In [58]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [59]:
model = LinearRegression()
model.fit(X_train, y_train)

In [60]:
y_pred = model.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'Error Cuadrático Medio (MSE): {mse}')
print(f'Coeficiente de Determinación (R^2): {r2}')

Error Cuadrático Medio (MSE): 0.0
Coeficiente de Determinación (R^2): 1.0


In [61]:
nuevo_empleado = pd.DataFrame({'Horas_Trabajo': [50], 'Capacitacion': [5], 'Entorno_Trabajo': [8]})
productividad_predicha = model.predict(nuevo_empleado)
print(f'La productividad laboral predicha para el nuevo empleado es: {productividad_predicha[0]}')

La productividad laboral predicha para el nuevo empleado es: 80.0


***Ejemplo 9: Predicción del Precio de Alquiler***

Queremos predecir el precio de alquiler de apartamentos en función de la superficie, el número de habitaciones y la ubicación.

In [62]:
from sklearn.preprocessing import OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline

In [63]:
# Crear un DataFrame de ejemplo con características ficticias y precios de alquiler
data = {
    'Superficie_m2': [50, 60, 70, 80, 90, 100, 110, 120, 130, 140],
    'Num_Habitaciones': [1, 2, 2, 3, 3, 4, 4, 5, 5, 6],
    'Ubicacion': ['Centro', 'Centro', 'Suburbio', 'Suburbio', 'Centro', 'Periferia', 'Centro', 'Suburbio', 'Periferia', 'Centro'],
    'Precio_Alquiler': [600, 750, 800, 950, 1100, 1200, 1300, 1400, 1500, 1600]  # en euros
}
df = pd.DataFrame(data)

In [64]:
# Definir las características y la etiqueta
X = df[['Superficie_m2', 'Num_Habitaciones', 'Ubicacion']]
y = df['Precio_Alquiler']

# Crear un preprocesador que maneje la codificación de la ubicación
preprocessor = ColumnTransformer(
    transformers=[
        ('cat', OneHotEncoder(), ['Ubicacion'])
    ],
    remainder='passthrough'
)

# Crear el pipeline con el preprocesador y el modelo de regresión lineal
pipeline = Pipeline(steps=[
    ('preprocessor', preprocessor),
    ('model', LinearRegression())
])

In [65]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [66]:
pipeline.fit(X_train, y_train)


In [67]:
y_pred = pipeline.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'Error Cuadrático Medio (MSE): {mse}')
print(f'Coeficiente de Determinación (R^2): {r2}')

Error Cuadrático Medio (MSE): 1582.417403746093
Coeficiente de Determinación (R^2): 0.9887472540178056


In [68]:
nuevo_apartamento = pd.DataFrame({'Superficie_m2': [85], 'Num_Habitaciones': [3], 'Ubicacion': ['Centro']})
precio_predicho = pipeline.predict(nuevo_apartamento)
print(f'El precio de alquiler predicho para el nuevo apartamento es: {precio_predicho[0]} euros')

El precio de alquiler predicho para el nuevo apartamento es: 1006.4516129032257 euros


***Ejemplo 10: Predicción de la Calidad del Aire***

Queremos predecir la calidad del aire en función de la concentración de varios contaminantes: dióxido de nitrógeno (NO2), partículas en suspensión (PM10) y ozono (O3).

In [69]:
# Crear un DataFrame de ejemplo con características ficticias y calidad del aire
data = {
    'NO2_mcg_m3': [30, 40, 50, 60, 70, 80, 90, 100, 110, 120],  # concentración de NO2 en microgramos por metro cúbico
    'PM10_mcg_m3': [20, 25, 30, 35, 40, 45, 50, 55, 60, 65],     # concentración de PM10 en microgramos por metro cúbico
    'O3_mcg_m3': [15, 20, 25, 30, 35, 40, 45, 50, 55, 60],      # concentración de O3 en microgramos por metro cúbico
    'Calidad_Aire': [40, 45, 50, 55, 60, 65, 70, 75, 80, 85]    # calidad del aire en una escala del 1 al 100
}
df = pd.DataFrame(data)

In [70]:
X = df[['NO2_mcg_m3', 'PM10_mcg_m3', 'O3_mcg_m3']]
y = df['Calidad_Aire']

In [71]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [72]:
model = LinearRegression()
model.fit(X_train, y_train)

In [73]:
y_pred = model.predict(X_test)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'Error Cuadrático Medio (MSE): {mse}')
print(f'Coeficiente de Determinación (R^2): {r2}')

Error Cuadrático Medio (MSE): 1.0097419586828951e-28
Coeficiente de Determinación (R^2): 1.0


In [74]:
nueva_concentracion = pd.DataFrame({'NO2_mcg_m3': [65], 'PM10_mcg_m3': [50], 'O3_mcg_m3': [40]})
calidad_aire_predicha = model.predict(nueva_concentracion)
print(f'La calidad del aire predicha es: {calidad_aire_predicha[0]}')

La calidad del aire predicha es: 60.83333333333333
