<a href="https://colab.research.google.com/github/Carlos404dlc/Graficas-2B/blob/main/Untitled9.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import r2_score, mean_squared_error

# Configuración para mostrar resultados con 3 decimales y sin notación científica
np.set_printoptions(precision=3, suppress=True)

def preparar_datos():
    """
    Prepara la matriz de variables independientes (X) y el vector de la variable dependiente (y).
    Returns:
    tuple: Matriz X (sin columna de 1s) y vector y.
    """
    data = {
        "Volume": [1000, 1200, 1000, 900, 1500, 1000, 1400, 1500, 1500, 1600, 1100, 1300, 1000, 1600, 1600, 1600, 1600, 2200, 1600, 2000, 1600, 2000, 2100, 1600, 2000, 1500, 2000, 2000, 1600, 2000, 2100, 2000, 1600, 1600, 1600, 2500],
        "Weight": [790, 1160, 929, 865, 1140, 929, 1109, 1365, 1112, 1150, 980, 990, 1112, 1252, 1326, 1330, 1365, 1280, 1119, 1328, 1584, 1428, 1365, 1415, 1415, 1465, 1490, 1725, 1523, 1705, 1605, 1746, 1235, 1390, 1405, 1395],
        "CO2": [99, 95, 95, 90, 105, 105, 90, 92, 98, 99, 99, 101, 99, 94, 97, 97, 99, 104, 104, 105, 94, 99, 99, 99, 99, 102, 104, 114, 109, 114, 115, 117, 104, 108, 109, 120]
    }
    df = pd.DataFrame(data)
    X = df[["Volume", "Weight"]]
    y = df["CO2"]
    return X, y

def entrenar_modelo_regresion(X, y):
    """
    Entrena un modelo de regresión lineal múltiple usando scikit-learn.
    Returns:
    LinearRegression: Modelo entrenado.
    """
    modelo = LinearRegression()
    modelo.fit(X, y)
    return modelo

def obtener_coeficientes(modelo):
    """
    Extrae los coeficientes del modelo entrenado: intercepto y pendientes.
    Returns:
    tuple: Intercepto (β0) y vector de coeficientes (β1, β2).
    """
    intercepto = modelo.intercept_
    coeficientes = modelo.coef_
    return intercepto, coeficientes

def realizar_predicciones(modelo, X):
    """
    Genera predicciones usando el modelo entrenado.
    Returns:
    np.ndarray: Vector de predicciones.
    """
    return modelo.predict(X)

def evaluar_modelo(valores_reales, valores_predichos):
    """
    Evalúa el modelo calculando el R2 y el error cuadrático medio (MSE).
    Returns:
    tuple: R2 y MSE.
    """
    r2 = r2_score(valores_reales, valores_predichos)
    mse = mean_squared_error(valores_reales, valores_predichos)
    return r2, mse

def imprimir_resultados(intercepto, coeficientes, predicciones, valores_reales, r2, mse):
    """
    Imprime los resultados del modelo, incluyendo ecuación, predicciones y métricas de evaluación.
    """
    print("=== Resultados de la Regresión Múltiple ===")
    print(f"Ecuación: y = {intercepto:.3f} + {coeficientes[0]:.3f}*Volume + {coeficientes[1]:.3f}*Weight")
    print("\nInterpretación:")
    print(f"Intercepto (β0): {intercepto:.3f} g/km (CO2 base cuando Volume y Weight son 0)")
    print(f"Coeficiente Volume (β1): {coeficientes[0]:.3f} g/km por unidad de volumen")
    print(f"Coeficiente Weight (β2): {coeficientes[1]:.3f} g/km por unidad de peso")
    print("\nMétricas de evaluación:")
    print(f"R2 (coeficiente de determinación): {r2:.3f}")
    print(f"Error cuadrático medio (MSE): {mse:.3f}")

def principal():
    """Función principal que ejecuta el análisis de regresión paso a paso."""
    X, y = preparar_datos()
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
    modelo = entrenar_modelo_regresion(X_train, y_train)
    intercepto, coeficientes = obtener_coeficientes(modelo)
    predicciones = realizar_predicciones(modelo, X_test)
    r2, mse = evaluar_modelo(y_test, predicciones)
    imprimir_resultados(intercepto, coeficientes, predicciones, y_test, r2, mse)
    prediccion_nueva = modelo.predict([[1800, 1400]])
    print(f"\nPredicción para Volume=1800 y Weight=1400: {prediccion_nueva[0]:.2f} g/km")

if __name__ == "__main__":
    principal()


=== Resultados de la Regresión Múltiple ===
Ecuación: y = 84.588 + 0.005*Volume + 0.007*Weight

Interpretación:
Intercepto (β0): 84.588 g/km (CO2 base cuando Volume y Weight son 0)
Coeficiente Volume (β1): 0.005 g/km por unidad de volumen
Coeficiente Weight (β2): 0.007 g/km por unidad de peso

Métricas de evaluación:
R2 (coeficiente de determinación): 0.410
Error cuadrático medio (MSE): 41.859

Predicción para Volume=1800 y Weight=1400: 103.35 g/km




#Regresión Múltiple para Predicción de Emisiones de CO₂
##1. Descripción del Proceso

En este proyecto, aplicamos un modelo de regresión múltiple para predecir las emisiones de CO₂ en función del volumen del motor y el peso del automóvil.

##Pasos seguidos:

Carga y exploración de datos: Se analizó la estructura del dataset y se identificaron posibles valores atípicos o datos faltantes.

Preparación de datos: Se seleccionaron las variables relevantes y se dividió el dataset en conjuntos de entrenamiento (70%) y prueba (30%).

Entrenamiento del modelo: Se construyó un modelo de regresión lineal múltiple.

Evaluación del modelo: Se calcularon métricas como R² y el error cuadrático medio (MSE).

Interpretación de resultados y predicción: Se analizaron los coeficientes y se realizó una predicción para un automóvil con volumen = 1800 y peso = 1400.



##3. Interpretación y Predicción

Ecuación obtenida:

𝐶𝑂2=𝛽0+𝛽1×Volume+𝛽2×Weight

##Donde:

β₀ (intercepto): Valor base cuando el volumen y el peso son 0.

β₁ (coeficiente Volume): Variación esperada del CO₂ por cada unidad de volumen.

β₂ (coeficiente Weight): Variación esperada del CO₂ por cada unidad de peso.

Significado de R² y MSE:

R² mide qué tan bien se ajusta el modelo a los datos. Un valor cercano a 1 indica un buen ajuste.

MSE es el error medio cuadrático; cuanto menor sea, mejor es el modelo.

Predicción para Volume = 1800 y Weight = 1400:

