Método Random Forest

In [None]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.metrics import mean_absolute_error
from sklearn.preprocessing import LabelEncoder

# Ruta del archivo Excel
file_path = "C:/Users/tommo/OneDrive/Documentos/Datos final tesis python.xlsx"

# Cargar los datos desde el archivo Excel
df = pd.read_excel(file_path)

# Convertir las columnas categóricas en numéricas
# 'Barrio' utilizando Label Encoding
label_encoder_barrio = LabelEncoder()
df['Barrio'] = label_encoder_barrio.fit_transform(df['Barrio'])

# 'Antigüedad' con un mapeo personalizado
df['Antigüedad'] = df['Antigüedad'].map({'1 a 8 años': 1, '9 a 15 años': 2})

# Separar las variables independientes (X) y la variable dependiente (y)
X = df.drop('Precio Total', axis=1)  
y = df['Precio Total']

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear y entrenar el modelo de Random Forest
rf_model = RandomForestRegressor(n_estimators=1000, random_state=42)
rf_model.fit(X_train, y_train)

# Hacer predicciones en el conjunto de prueba
y_pred = rf_model.predict(X_test)

# Calcular y mostrar las métricas de rendimiento

r2 = r2_score(y_test, y_pred)

print("R^2 Score:", r2)

# Calcular el Mean Absolute Error (MAE)
mae = mean_absolute_error(y_test, y_pred)

# Calcular el Root Mean Squared Error (RMSE)
rmse = np.sqrt(mean_squared_error(y_test, y_pred))

# Calcular el Mean Absolute Percentage Error (MAPE)
mape = np.mean(np.abs((y_test - y_pred) / y_test)) * 100

# Imprimir todas las métricas
print("Mean Absolute Error (MAE):", mae)
print("Root Mean Squared Error (RMSE):", rmse)
print("Mean Absolute Percentage Error (MAPE):", mape, "%")

Método Regresión Lineal Múltiple

In [None]:
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import r2_score, mean_absolute_error
from sklearn.preprocessing import LabelEncoder
import pandas as pd
import numpy as np

# Ruta del archivo Excel
file_path = "C:/Users/tommo/OneDrive/Documentos/Datos final tesis python.xlsx"

# Cargar los datos desde el archivo Excel
df = pd.read_excel(file_path)

# Preparar los datos
label_encoder = LabelEncoder()
df['Barrio'] = label_encoder.fit_transform(df['Barrio'])
df['Antigüedad'] = df['Antigüedad'].map({'1 a 8 años': 1, '9 a 15 años': 2})

# Separar las variables independientes (X) y la variable dependiente (y)
X = df.drop('Precio Total', axis=1)  
y = df['Precio Total']

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear y entrenar el modelo de regresión lineal múltiple
lr_model = LinearRegression()
lr_model.fit(X_train, y_train)

# Hacer predicciones en el conjunto de prueba
y_pred_lr = lr_model.predict(X_test)

# Calcular y mostrar las métricas de rendimiento para la regresión lineal múltiple
r2_lr = r2_score(y_test, y_pred_lr)
mae_lr = mean_absolute_error(y_test, y_pred_lr)
rmse_lr = np.sqrt(mse_lr)
mape_lr = np.mean(np.abs((y_test - y_pred_lr) / y_test)) * 100


print("Linear Regression - R^2 Score:", r2_lr)
print("Linear Regression - Mean Absolute Error (MAE):", mae_lr)
print("Linear Regression - Root Mean Squared Error (RMSE):", rmse_lr)
print("Linear Regression - Mean Absolute Percentage Error (MAPE):", mape_lr, "%")

Método Redes Neuronales

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPRegressor
from sklearn.metrics import mean_squared_error, r2_score, mean_absolute_error
from sklearn.preprocessing import StandardScaler, LabelEncoder
import pandas as pd
import numpy as np

# Ruta del archivo Excel
file_path = "C:/Users/tommo/OneDrive/Documentos/Datos final tesis python.xlsx"

# Cargar los datos desde el archivo Excel
df = pd.read_excel(file_path)

# Convertir las columnas categóricas en numéricas
# 'Barrio' utilizando Label Encoding
label_encoder_barrio = LabelEncoder()
df['Barrio'] = label_encoder_barrio.fit_transform(df['Barrio'])

# 'Antigüedad' con un mapeo personalizado
df['Antigüedad'] = df['Antigüedad'].map({'1 a 8 años': 1, '9 a 15 años': 2})

# Separar las variables independientes (X) y la variable dependiente (y)
X = df.drop('Precio Total', axis=1)  
y = df['Precio Total']

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Escalar las características
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Crear y entrenar el modelo de redes neuronales (ACÁ SE UTLIZARON ESTAS VARIABLES PARA INTENTAR MEJORAR LOS RESULTADOS)
nn_model = MLPRegressor(hidden_layer_sizes=(100,100),
                        activation='relu',
                        solver='adam',
                        max_iter= 5000,
                        learning_rate_init=0.1,
                        alpha=0.005, 
                        early_stopping=True,
                        validation_fraction=0.1,
                        n_iter_no_change=10,
                        random_state=42)
nn_model.fit(X_train_scaled, y_train)
# Hacer predicciones en el conjunto de prueba
y_pred_nn = nn_model.predict(X_test_scaled)

# Calcular y mostrar las métricas de rendimiento
mse_nn = mean_squared_error(y_test, y_pred_nn)
r2_nn = r2_score(y_test, y_pred_nn)
mae_nn = mean_absolute_error(y_test, y_pred_nn)
rmse_nn = np.sqrt(mse_nn)
mape_nn = np.mean(np.abs((y_test - y_pred_nn) / y_test)) * 100


print("Neural Network - R^2 Score:", r2_nn)
print("Neural Network - Mean Absolute Error (MAE):", mae_nn)
print("Neural Network - Root Mean Squared Error (RMSE):", rmse_nn)
print("Neural Network - Mean Absolute Percentage Error (MAPE):", mape_nn, "%")
