In [2]:
import numpy as np

# Simulação de valores reais e previstos
y_true = np.array([3.0, -0.5, 2.0, 7.0])
y_pred = np.array([2.5, 0.0, 2.0, 8.0])

# Calculando os erros
mae = np.mean(np.abs(y_true - y_pred))  # Mean Absolute Error
mse = np.mean((y_true - y_pred)**2)     # Mean Squared Error
rmse = np.sqrt(mse)                     # Root Mean Squared Error

# Mostrando resultados
print(f"Valores Reais: {y_true}")
print(f"Valores Previstos: {y_pred}\n")

print(f"MAE: {mae:.2f} - Indica o erro médio absoluto entre os valores previstos e reais.")
print(f"MSE: {mse:.2f} - Penaliza mais fortemente os grandes erros ao elevar os erros ao quadrado.")
print(f"RMSE: {rmse:.2f} - É a raiz quadrada do MSE, mantendo as unidades no mesmo domínio dos valores originais.\n")

# Quando usar?
print("Quando usar:")
print("- MAE: É mais interpretável e útil se você quer minimizar o erro absoluto, sem considerar grandes outliers.")
print("- MSE: Priorize quando você deseja penalizar grandes erros de forma mais significativa.")
print("- RMSE: Use quando quer uma métrica fácil de interpretar no mesmo domínio dos valores reais, mas ainda sensível a outliers.")


Valores Reais: [ 3.  -0.5  2.   7. ]
Valores Previstos: [2.5 0.  2.  8. ]

MAE: 0.50 - Indica o erro médio absoluto entre os valores previstos e reais.
MSE: 0.38 - Penaliza mais fortemente os grandes erros ao elevar os erros ao quadrado.
RMSE: 0.61 - É a raiz quadrada do MSE, mantendo as unidades no mesmo domínio dos valores originais.

Quando usar:
- MAE: É mais interpretável e útil se você quer minimizar o erro absoluto, sem considerar grandes outliers.
- MSE: Priorize quando você deseja penalizar grandes erros de forma mais significativa.
- RMSE: Use quando quer uma métrica fácil de interpretar no mesmo domínio dos valores reais, mas ainda sensível a outliers.


Explicação das Métricas:

    MAE:
        Prós: Intuitivo, robusto a outliers pequenos.
        Contras: Não penaliza suficientemente grandes desvios.
        Quando usar: Dados com outliers controlados ou quando o erro médio é suficiente para interpretação.

    MSE:
        Prós: Penaliza grandes erros fortemente.
        Contras: Difícil de interpretar diretamente por elevar ao quadrado.
        Quando usar: Modelos onde grandes erros precisam ser minimizados.

    RMSE:
        Prós: Mesmas unidades dos dados reais, fácil interpretação.
        Contras: Sensível a outliers.
        Quando usar: Cenários onde a escala dos erros e sua magnitude relativa são importantes.

In [8]:
import numpy as np
from sklearn.metrics import r2_score

# Simulando valores reais e previstos
y_true = np.array([3.0, -0.5, 2.0, 7.0])  # Valores reais
y_pred = np.array([2.5, 0.0, 2.0, 8.0])   # Valores previstos

# Calculando R² com sklearn
r2 = r2_score(y_true, y_pred)

# Cálculo manual do R² para fins de explicação
mean_y = np.mean(y_true)  # Média dos valores reais
sst = np.sum((y_true - mean_y)**2)  # Soma total dos quadrados (variância total)
sse = np.sum((y_true - y_pred)**2)  # Soma dos erros ao quadrado (variância explicada pelos erros)
r2_manual = 1 - (sse / sst)  # Fórmula do R²

# Explicação do R²
print("O que é R²?")
print("- É uma métrica que mede o quanto da variância dos dados reais é explicada pelo modelo.")
print("- Ele varia entre:")
print("  * 1.0: O modelo explica 100% da variância.")
print("  * 0.0: O modelo não explica nada, equivalente a prever a média.")
print("  * Valores negativos: O modelo é pior do que prever sempre a média.\n")

# Mostrando os cálculos e interpretação
print("Cálculos:")
print(f"- Valores reais: {y_true}")
print(f"- Valores previstos: {y_pred}")
print(f"- Média dos valores reais: {mean_y:.2f}")
print(f"- SST (Soma total dos quadrados): {sst:.2f}")
print(f"- SSE (Soma dos erros ao quadrado): {sse:.2f}")
print(f"- R² calculado manualmente: {r2_manual:.2f}")
print(f"- R² calculado com sklearn: {r2:.2f}\n")

# Interpretando o valor do R²
print("Interpretação do R²:")
if r2 > 0.8:
    print(f"- R² = {r2:.2f}: O modelo explica muito bem a variância dos dados.")
elif 0.5 <= r2 <= 0.8:
    print(f"- R² = {r2:.2f}: O modelo explica razoavelmente a variância dos dados.")
else:
    print(f"- R² = {r2:.2f}: O modelo não explica bem a variância. Pode precisar de melhorias.")


O que é R²?
- É uma métrica que mede o quanto da variância dos dados reais é explicada pelo modelo.
- Ele varia entre:
  * 1.0: O modelo explica 100% da variância.
  * 0.0: O modelo não explica nada, equivalente a prever a média.
  * Valores negativos: O modelo é pior do que prever sempre a média.

Cálculos:
- Valores reais: [ 3.  -0.5  2.   7. ]
- Valores previstos: [2.5 0.  2.  8. ]
- Média dos valores reais: 2.88
- SST (Soma total dos quadrados): 29.19
- SSE (Soma dos erros ao quadrado): 1.50
- R² calculado manualmente: 0.95
- R² calculado com sklearn: 0.95

Interpretação do R²:
- R² = 0.95: O modelo explica muito bem a variância dos dados.
