<a href="https://colab.research.google.com/github/Carlos404dlc/Graficas-2B/blob/main/Untitled9.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import r2_score, mean_squared_error

# Configuraci√≥n para mostrar resultados con 3 decimales y sin notaci√≥n cient√≠fica
np.set_printoptions(precision=3, suppress=True)

def preparar_datos():
    """
    Prepara la matriz de variables independientes (X) y el vector de la variable dependiente (y).
    Returns:
    tuple: Matriz X (sin columna de 1s) y vector y.
    """
    data = {
        "Volume": [1000, 1200, 1000, 900, 1500, 1000, 1400, 1500, 1500, 1600, 1100, 1300, 1000, 1600, 1600, 1600, 1600, 2200, 1600, 2000, 1600, 2000, 2100, 1600, 2000, 1500, 2000, 2000, 1600, 2000, 2100, 2000, 1600, 1600, 1600, 2500],
        "Weight": [790, 1160, 929, 865, 1140, 929, 1109, 1365, 1112, 1150, 980, 990, 1112, 1252, 1326, 1330, 1365, 1280, 1119, 1328, 1584, 1428, 1365, 1415, 1415, 1465, 1490, 1725, 1523, 1705, 1605, 1746, 1235, 1390, 1405, 1395],
        "CO2": [99, 95, 95, 90, 105, 105, 90, 92, 98, 99, 99, 101, 99, 94, 97, 97, 99, 104, 104, 105, 94, 99, 99, 99, 99, 102, 104, 114, 109, 114, 115, 117, 104, 108, 109, 120]
    }
    df = pd.DataFrame(data)
    X = df[["Volume", "Weight"]]
    y = df["CO2"]
    return X, y

def entrenar_modelo_regresion(X, y):
    """
    Entrena un modelo de regresi√≥n lineal m√∫ltiple usando scikit-learn.
    Returns:
    LinearRegression: Modelo entrenado.
    """
    modelo = LinearRegression()
    modelo.fit(X, y)
    return modelo

def obtener_coeficientes(modelo):
    """
    Extrae los coeficientes del modelo entrenado: intercepto y pendientes.
    Returns:
    tuple: Intercepto (Œ≤0) y vector de coeficientes (Œ≤1, Œ≤2).
    """
    intercepto = modelo.intercept_
    coeficientes = modelo.coef_
    return intercepto, coeficientes

def realizar_predicciones(modelo, X):
    """
    Genera predicciones usando el modelo entrenado.
    Returns:
    np.ndarray: Vector de predicciones.
    """
    return modelo.predict(X)

def evaluar_modelo(valores_reales, valores_predichos):
    """
    Eval√∫a el modelo calculando el R2 y el error cuadr√°tico medio (MSE).
    Returns:
    tuple: R2 y MSE.
    """
    r2 = r2_score(valores_reales, valores_predichos)
    mse = mean_squared_error(valores_reales, valores_predichos)
    return r2, mse

def imprimir_resultados(intercepto, coeficientes, predicciones, valores_reales, r2, mse):
    """
    Imprime los resultados del modelo, incluyendo ecuaci√≥n, predicciones y m√©tricas de evaluaci√≥n.
    """
    print("=== Resultados de la Regresi√≥n M√∫ltiple ===")
    print(f"Ecuaci√≥n: y = {intercepto:.3f} + {coeficientes[0]:.3f}*Volume + {coeficientes[1]:.3f}*Weight")
    print("\nInterpretaci√≥n:")
    print(f"Intercepto (Œ≤0): {intercepto:.3f} g/km (CO2 base cuando Volume y Weight son 0)")
    print(f"Coeficiente Volume (Œ≤1): {coeficientes[0]:.3f} g/km por unidad de volumen")
    print(f"Coeficiente Weight (Œ≤2): {coeficientes[1]:.3f} g/km por unidad de peso")
    print("\nM√©tricas de evaluaci√≥n:")
    print(f"R2 (coeficiente de determinaci√≥n): {r2:.3f}")
    print(f"Error cuadr√°tico medio (MSE): {mse:.3f}")

def principal():
    """Funci√≥n principal que ejecuta el an√°lisis de regresi√≥n paso a paso."""
    X, y = preparar_datos()
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
    modelo = entrenar_modelo_regresion(X_train, y_train)
    intercepto, coeficientes = obtener_coeficientes(modelo)
    predicciones = realizar_predicciones(modelo, X_test)
    r2, mse = evaluar_modelo(y_test, predicciones)
    imprimir_resultados(intercepto, coeficientes, predicciones, y_test, r2, mse)
    prediccion_nueva = modelo.predict([[1800, 1400]])
    print(f"\nPredicci√≥n para Volume=1800 y Weight=1400: {prediccion_nueva[0]:.2f} g/km")

if __name__ == "__main__":
    principal()


=== Resultados de la Regresi√≥n M√∫ltiple ===
Ecuaci√≥n: y = 84.588 + 0.005*Volume + 0.007*Weight

Interpretaci√≥n:
Intercepto (Œ≤0): 84.588 g/km (CO2 base cuando Volume y Weight son 0)
Coeficiente Volume (Œ≤1): 0.005 g/km por unidad de volumen
Coeficiente Weight (Œ≤2): 0.007 g/km por unidad de peso

M√©tricas de evaluaci√≥n:
R2 (coeficiente de determinaci√≥n): 0.410
Error cuadr√°tico medio (MSE): 41.859

Predicci√≥n para Volume=1800 y Weight=1400: 103.35 g/km




#Regresi√≥n M√∫ltiple para Predicci√≥n de Emisiones de CO‚ÇÇ
##1. Descripci√≥n del Proceso

En este proyecto, aplicamos un modelo de regresi√≥n m√∫ltiple para predecir las emisiones de CO‚ÇÇ en funci√≥n del volumen del motor y el peso del autom√≥vil.

##Pasos seguidos:

Carga y exploraci√≥n de datos: Se analiz√≥ la estructura del dataset y se identificaron posibles valores at√≠picos o datos faltantes.

Preparaci√≥n de datos: Se seleccionaron las variables relevantes y se dividi√≥ el dataset en conjuntos de entrenamiento (70%) y prueba (30%).

Entrenamiento del modelo: Se construy√≥ un modelo de regresi√≥n lineal m√∫ltiple.

Evaluaci√≥n del modelo: Se calcularon m√©tricas como R¬≤ y el error cuadr√°tico medio (MSE).

Interpretaci√≥n de resultados y predicci√≥n: Se analizaron los coeficientes y se realiz√≥ una predicci√≥n para un autom√≥vil con volumen = 1800 y peso = 1400.



##3. Interpretaci√≥n y Predicci√≥n

Ecuaci√≥n obtenida:

ùê∂ùëÇ2=ùõΩ0+ùõΩ1√óVolume+ùõΩ2√óWeight

##Donde:

Œ≤‚ÇÄ (intercepto): Valor base cuando el volumen y el peso son 0.

Œ≤‚ÇÅ (coeficiente Volume): Variaci√≥n esperada del CO‚ÇÇ por cada unidad de volumen.

Œ≤‚ÇÇ (coeficiente Weight): Variaci√≥n esperada del CO‚ÇÇ por cada unidad de peso.

Significado de R¬≤ y MSE:

R¬≤ mide qu√© tan bien se ajusta el modelo a los datos. Un valor cercano a 1 indica un buen ajuste.

MSE es el error medio cuadr√°tico; cuanto menor sea, mejor es el modelo.

Predicci√≥n para Volume = 1800 y Weight = 1400:

