Métricas de Avaliação de Modelos:

      MSE = Erro Quadrático Médio (Mean Squared Error)
            1. Calcula a média dos quadrados das diferenças entre os valores reais e previstos.
            2. Quanto menor o MSE, melhor o modelo. Ou seja, previsões mais próximas da realidade.
            3. É sensível a outliers (valores discrepantes), pois eleva ao quadrado as diferenças.
            4. (12−10)^2=4 ou (10−50)²=1600
            5. **Exemplo de utilização**: Avaliar a performance de um modelo de regressão que prevê o preço de imóveis, onde grandes discrepâncias nos preços (outliers) podem ser mais prejudiciais para o desempenho do modelo.

      RMSE = Raiz do Erro Quadrático Médio (Root Mean Squared Error)
            1. É a raiz quadrada do MSE.
            2. Tem a mesma unidade de medida dos dados originais, facilitando a interpretação.
            3. Assim como o MSE, é sensível a outliers.
            4. √4=2 ou √1600=40
            5. **Exemplo de utilização**: Utilizar para medir a precisão de um modelo de previsão de demanda de vendas em uma empresa, onde a unidade de medida (quantidade de produtos) deve ser interpretada diretamente.

      MAE = Erro Médio Absoluto (Mean Absolute Error)
            1. Calcula a média dos valores absolutos das diferenças entre os valores reais e previstos.
            2. Menos sensível a outliers em comparação com o MSE.
            3. A interpretação é direta: quanto menor o MAE, melhor o modelo.
            4. |12−10|=2 ou |50−10|=40
            5. **Exemplo de utilização**: Avaliar um modelo de previsão de temperatura média diária, onde as pequenas variações nas previsões são mais relevantes do que grandes erros ocasionais.

      MAPE = Erro Médio Percentual Absoluto (Mean Absolute Percentage Error)
            1. Calcula o erro médio em termos percentuais, expressando a diferença entre os valores reais e previstos como uma porcentagem.
            2. Fácil de interpretar e comparar entre diferentes modelos.
            3. Não funciona bem quando os valores reais estão próximos de zero, pois o erro percentual pode se tornar infinito.
            4. ((12−10)/10)×100=20% ou ((50−10)/10)×100=400%
            5. **Exemplo de utilização**: Comparar modelos de previsão de vendas de um produto, já que o MAPE fornece uma medida intuitiva de erro percentual, facilitando a comparação entre diferentes regiões ou períodos de tempo.

      R² = Coeficiente de Determinação (R Squared)
            1. Mede a proporção da variabilidade dos dados que é explicada pelo modelo.
            2. Varia de 0 a 1, sendo 1 um modelo perfeito e 0 um modelo sem poder explicativo.
            3. Pode ser negativo se o modelo for pior que a simples média dos dados.
            4. R² = 0.8 significa que 80% da variabilidade é explicada pelo modelo.
            5. **Exemplo de utilização**: Avaliar a qualidade de um modelo de regressão linear que tenta prever o valor de ações financeiras, verificando quanto da variação nos preços é explicada pelo modelo.

      Adjusted R² = Coeficiente de Determinação Ajustado (Adjusted R Squared)
            1. Versão ajustada do R², levando em conta o número de variáveis independentes no modelo.
            2. Útil para modelos com múltiplas variáveis, já que penaliza a inclusão de variáveis irrelevantes.
            3. Permite a comparação de modelos com diferentes números de variáveis.
            4. O valor ajustado pode ser menor que o R², especialmente quando o modelo possui variáveis desnecessárias.
            5. **Exemplo de utilização**: Comparar modelos de previsão de vendas com diferentes números de variáveis explicativas, como preço, localização e características do produto.

      AIC = Critério de Informação de Akaike (Akaike Information Criterion)
            1. Mede a qualidade do modelo, penalizando modelos mais complexos (com mais parâmetros).
            2. Quanto menor o AIC, melhor o modelo, balanceando a **qualidade do ajuste** e a **complexidade do modelo**.
            3. Útil para **seleção de modelos**, ajudando a escolher entre modelos concorrentes.
            4. AIC = -2 log(verossimilhança) + 2k, onde "k" é o número de parâmetros no modelo.
            5. **Exemplo de utilização**: Comparar diferentes modelos de previsão de tráfego em uma cidade, onde modelos mais simples são preferíveis, a menos que a complexidade extra traga uma melhoria substancial no desempenho.

      BIC = Critério de Informação Bayesiano (Bayesian Information Criterion)
            1. Similar ao AIC, mas com penalização maior para o número de parâmetros no modelo.
            2. Considera a probabilidade do modelo, levando em conta tanto a **verossimilhança** quanto a **complexidade**.
            3. Quanto menor o BIC, melhor o modelo.
            4. BIC = -2 log(verossimilhança) + k log(n), onde "n" é o número de observações.
            5. **Exemplo de utilização**: Utilizar para selecionar o melhor modelo para prever o risco de crédito de clientes em uma instituição financeira, onde a simplicidade do modelo é preferida, mas sem sacrificar a precisão.

In [None]:
from sklearn.metrics import mean_squared_error
from sklearn.tree import DecisionTreeRegressor
from sklearn.linear_model import LinearRegression

In [None]:
# Valores reais
true = [3,-0.5, 2, 7]

# Valores preditos
pred = [2.5, 0.0, 2, 8]

# Calculando o MSE ()
mse = mean_squared_error(true, pred)
print(mse)

72.5


In [None]:
# MSE de Treino x MSE de Teste
'''
De Treino = calculado usando dados que foram usados pré estabelecidos
De Teste = calculado usando dados nunca antes vistos pelo modelo
'''

# Overfitting
'''
Ocorre quando o modelo se ajusta aos dados de treino bem, mas não tem um resultado tão bom nos dados de teste.
Importante que seja baixo para melhor desempenho durante os testes.
'''

# Underfitting
'''
Ocorre quando o modelo NÃO consegue se ajustar aos dados de treino e NEM aos dados de teste. Ou modelo é complexo, ou há poucos dados de treino.
'''




In [None]:
            #### EXEMPLO DE OVERFITTING
import random


# Dados de treino
X_train = [[0,0],[2,2], [1,2], [2,3]]     # dados de entrada pro treino
y_train = [0,1,2,3]                       # saída almejada (target)

# Dados de teste
X_test = [[round(random.uniform(1.0, 4.0), 2), round(random.uniform(1.0, 4.0), 2)] for _ in range(4)]   #  novo valor para ser previsto
y_test = [round(random.uniform(1.0, 4.0), 2) for _ in range(4)]                                         #  valor esperado para este ponto

print("X_test:", X_test)
print("y_test:", y_test)

# Modelo de Árvore de Decisão
tree = DecisionTreeRegressor()            # modelo de árvore de decisão para regressão

#Treinamento do modelo
tree.fit(X_train, y_train)                # aprendizado com dados de treino

# Predição
y_pred_train = tree.predict(X_train)      # previsão do modelo com dados do treino (já conhecido)
y_pred_test = tree.predict(X_test)        # previsão do modelo com teste (desconhecido)

print(f'Predição de Treino: {y_pred_train}')
print(f'Predição de Teste: {y_pred_test}')

# MSE de treino
mse_train = mean_squared_error(y_train, y_pred_train)           # MSE entre treino X treino
mse_test = mean_squared_error(y_test, y_pred_test)              # MSE entre treino X teste (confere se foi decoreba ou assertivo)

print(f'MSE de treino: {mse_train}')
print(f'MSE de teste: {mse_test}')



In [None]:
import matplotlib.pyplot as plt
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import mean_squared_error

# Dados de treino
X_train = [[0,0],[2,2], [1,2], [2,3]]
y_train = [0,1,2,3]

# Treinar o modelo
tree = DecisionTreeRegressor()
tree.fit(X_train, y_train)

# Pontos para previsão e avaliação
x_valores = [[x, x] for x in range(0, 3)]

# Valores verdadeiros (exemplo simples: soma das features)
y_true = [sum(x) for x in x_valores]  # [0, 2, 4]

# Previsão do modelo
y_valores = tree.predict(x_valores)

# Calcular MSE
mse = mean_squared_error(y_true, y_valores)
print(f'MSE: {mse}')

# Plotagem
plt.scatter([0, 2], [0, 2], color='blue', label='Treino')
plt.scatter(1, 1, color='green', label='Teste', marker='x', s=100)
plt.plot([x[0] for x in x_valores], y_valores, color='red', label='Modelo')

plt.legend()
plt.title("Exemplo de Overfitting com Árvore de Decisão")
plt.xlabel('Feature (X, input)')
plt.ylabel('Target (y, output)')
plt.grid(True)
plt.show()


In [None]:
        #### EXEMPLO VISUAL DE OVERFITTING

import matplotlib.pyplot as plt
import numpy as np
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import mean_squared_error

# Dados de treino
X_train = [[0, 0], [2, 2]]
y_train = [0, 2]

# Dados de teste
X_test = [[1, 1]]

# Modelo de Árvore de Decisão
tree_model = DecisionTreeRegressor()

# Treinamento do modelo
tree_model.fit(X_train, y_train)

# Predição
y_pred_train = tree_model.predict(X_train)
y_pred_test = tree_model.predict(X_test)

# MSE de treino
mse_train = mean_squared_error(y_train, y_pred_train)
mse_test = mean_squared_error([1], y_pred_test)

print('MSE de treino:', mse_train)
print('MSE de teste:', mse_test)

# Visualização da Árvore de Decisão
plt.figure(figsize=(10, 6))

# Plotando os pontos de treino
plt.scatter([point[0] for point in X_train], y_train, color='blue', label='Pontos de Treinamento')

# Plotando a predição do modelo nos pontos de treino
plt.scatter([point[0] for point in X_train], y_pred_train, color='red', marker='x', label='Predições de Treinamento')

# Plotando os pontos de teste
plt.scatter([point[0] for point in X_test], [1], color='green', marker='s', label='Pontos de Teste')

# Ajuste da linha para o gráfico (para fins de visualização, estamos projetando uma linha simples)
# Criar uma grade de pontos para o gráfico com 2 características
X_range = np.linspace(-1, 3, 100).reshape(-1, 1)
X_range_full = np.column_stack([X_range, X_range])  # Criando um grid de 2D, pois o modelo foi treinado com 2 características

# Predição para o grid 2D
y_range = tree_model.predict(X_range_full)

# Linha de decisão do modelo
plt.plot(X_range, y_range, color='black', linestyle='--', label='Linha de Decisão')

plt.title('Árvore de Decisão - Previsões de Treinamento e Teste')
plt.xlabel('Feature (X, input)')
plt.ylabel('Target (y, output)')
plt.legend(loc='upper left')

# Exibir a árvore
plt.show()

# Exibir MSE
print(f"MSE de treino: {mse_train}")
print(f"MSE de teste: {mse_test}")


In [None]:
      #### EXEMPLO DE UNDERFITTING

# Dados não-lineares
import numpy as np

X_train = np.array([[0], [1], [2], [3], [4], [5]])
y_train = np.array([0, 1, 4, 9, 16, 25])  # y = x²

# Modelo de Regressão Linear (vai tentar fazer uma reta)
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

model = LinearRegression()
model.fit(X_train, y_train)

y_pred_train = model.predict(X_train)
train_error = mean_squared_error(y_train, y_pred_train)

print("MSE de Treino", train_error)


Erro de treino: 6.222222222222224


In [None]:
      #### EXEMPLO VISUAL DE UNDERFITTING


import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# Dados quadráticos (não-lineares)
X_train = np.array([[0], [1], [2], [3], [4], [5]])
y_train = np.array([0, 1, 4, 9, 16, 25])  # y = x²

# Treinando um modelo de regressão linear
model = LinearRegression()
model.fit(X_train, y_train)

# Fazendo predições
y_pred_train = model.predict(X_train)
y_pred_test = model.predict([[6]])  # Predição para um novo ponto

print (f'Predição do novo ponto {y_pred_test}')

# Erro de treino
train_error = mean_squared_error(y_train, y_pred_train)
print("Erro de treino:", train_error)

# Visualização
plt.scatter(X_train, y_train, color='blue', label='Dados reais')
plt.plot(X_train, y_pred_train, color='red', label='Regressão Linear')
plt.title("Exemplo de Underfitting")
plt.xlabel("X, Feature")
plt.ylabel("y, Target")
plt.legend()
plt.grid(True)
plt.show()
