In [1]:
import numpy as np

In [14]:
# Predicciones de los árboles (3 árboles, 1 muestra) incluyendo un outlier
predictions = np.array([10, 10, 10, 120])

# Pesos iniciales asociados a los árboles (estos podrían provenir del OOB MSE, por ejemplo)
weights = np.array([0.3, 0.3, 0.2, 0.2])

In [15]:
# Vamos a simular el cálculo del IQR para descartar outliers
Q1 = np.percentile(predictions, 25)  # Primer cuartil
Q3 = np.percentile(predictions, 75)  # Tercer cuartil
IQR = Q3 - Q1  # Rango intercuartílico

# Limites para descartar valores fuera del rango IQR
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR

# Mostrar los límites
print(f"Q1: {Q1}, Q3: {Q3}, IQR: {IQR}")
print(f"Lower Bound: {lower_bound}, Upper Bound: {upper_bound}")

Q1: 10.0, Q3: 37.5, IQR: 27.5
Lower Bound: -31.25, Upper Bound: 78.75


In [16]:
# Filtrar las predicciones fuera del rango IQR
valid_predictions = np.where((predictions >= lower_bound) & (predictions <= upper_bound), predictions, np.nan)
valid_weights = np.where(np.isnan(valid_predictions), np.nan, weights)  # Asignar NaN a los pesos de predicciones inválidas

# Mostrar predicciones válidas y pesos correspondientes
print(f"Valid Predictions: {valid_predictions}")
print(f"Valid Weights: {valid_weights}")

Valid Predictions: [10. 10. 10. nan]
Valid Weights: [0.3 0.3 0.2 nan]


In [17]:
# Calcular la suma de los pesos válidos (evitar NaN con nansum)
weight_sums = np.nansum(valid_weights)

# Normalizar los pesos válidos
normalized_weights = np.nan_to_num(valid_weights / weight_sums)

# Mostrar los pesos normalizados
print(f"Normalized Weights: {normalized_weights}")

# Calcular la predicción ponderada
final_prediction = np.nansum(valid_predictions * normalized_weights)

# Mostrar la predicción final
print(f"Final Prediction: {final_prediction}")


Normalized Weights: [0.375 0.375 0.25  0.   ]
Final Prediction: 10.0
