# Relatório sobre Métricas

O objetivo deste relatório é implementar e analisar metricas tanto para classificação quanto para regressão. Começaremos por regressão e depois classificação.

Mean Absolute Error (MAE)

Essa métrica tem por objetivo calcular a média das diferenças em módulo entre cada par de predição e target. O objetivo do módulo é fazer com que os erros não se cancelem.
A seguir a fórmula e logo após o código:
$$MAE = \frac{1}{n}\sum_{1=1}^{n} |p_i - t_i| $$

In [None]:
import numpy as np

val_vdd = np.array([10,20,40,60])
val_previsto = np.array([30,10,40,23])

mae = np.mean(np.abs(val_vdd - val_previsto))
print(mae)


16.75


Mean Squared Error(MSE)

Essa métrica, talvez a mais usada, tem por objetivo calcular a média dos erros do modelo ao quadrado. Ou seja, diferenças menores têm menos importância, enquanto diferenças maiores recebem mais peso.
Por conta do expoente ao quadrado que o erro assume, essa métrica é bastante sensível a outliers (valores discrepantes) e, caso tenha muitos erros significativos em sua análise, essa métrica poderá ser extrapolada.

A métrica de MSE tem a vantagem de representar a quantidade de erros na mesma unidade que a coluna prevista, o que o torna fácil de interpretar.

A seguir está a fórmula e logo após o código:
$$ \text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - p_i)^2$$



In [None]:
import numpy as np

Y_true = [1,1,2,2,4]
Y_pred = [0.6,1.29,1.99,2.69,3.4]

MSE = np.square(np.subtract(Y_true,Y_pred)).mean()
print(MSE)


0.21606


Root Mean Square Error(RMSE)

Essa métrica tem por objetivo calcular a raiz quadrada do erro médio, onde o erro retorna à unidade de medida do modelo (no MSE, a unidade de medida é quadrática). Ela é frequentemente usada em séries temporais por ser mais sensível a erros maiores devido ao processo de quadratura que a produziu.

A seguir apresento a fórmula e logo após o código:
$$\text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (A_i - F_i)^2}$$

In [None]:
import math
import numpy as np

Y_true = [1,1,2,2,4]
Y_pred = [0.6,1.29,1.99,2.69,3.4]

MSE = np.square(np.subtract(Y_true,Y_pred)).mean()
RMSE = math.sqrt(MSE)
print(RMSE)



0.4648225467853297


Mean Absolute Percentage Error(MAPE)

Essa métrica tem por objetivo calcular a média percentual do desvio absoluto entre as previsões e a realidade. Ela é utilizada para avaliar sistemas de previsões de vendas e outros sistemas nos quais a diferença percentual seja mais interpretável, ou mais importante, do que os valores absolutos.
Embora o conceito de MAPE pareça simples e convincente, ele tem grandes desvantagens na aplicação prática, e há muitos estudos sobre deficiências e resultados enganosos do MAPE.


*   Não pode ser usado se houver valores zero ou próximos a zero (o que às vezes acontece, por exemplo, em dados de demanda), porque haveria uma divisão por zero ou valores de MAPE tendendo ao infinito.
* Para previsões que são muito baixas, o erro percentual não pode exceder 100%, mas para previsões que são muito altas não há limite superior para o erro percentual.



A seguir a fórmula e logo após o código: $$ \text{MAPE(y,p)} = \frac{1}{n} \sum_{i=1}^{n} \left| \frac{y_i - p_i}{y_i} \right| $$




In [None]:
import numpy as np
from sklearn.datasets import load_diabetes
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

def mape(y_test, pred):
    y_test, pred = np.array(y_test), np.array(pred)
    mape = np.mean(np.abs((y_test - pred) / y_test))
    return mape

data = load_diabetes()
X, y = data.data, data.target
X_train, X_test, y_train, y_test = train_test_split(X, y)

lnr = LinearRegression()
lnr.fit(X_train, y_train)
predictions = lnr.predict(X_test)

print(mape(y_test, predictions))

0.37763444471170166


No código acima, foi criado um modelo que preve alguns valores que foram colocados na variavel 'predictions' e que no final do código retorna a média percentual.

A partir de agora vamos passar para as métricas de classificação, começando pela **Matriz Confusão**.
Uma matriz confusão é uma tabela que mostra as frequências de classificação para cada classe do modelo. Ela mostra o número de previsões corretas e incorretas que o modelo fez para cada classe e a partir delas podem mostrar 4 tipos de frequências: true positive, false positive, true negative ou false negative.

Verdadeiro positivo (true positive - TP): ocorre quando no conjunto real, a classe que estamos buscando foi prevista corretamente.

Falso positivo (false positive — FP): ocorre quando no conjunto real, a classe que estamos buscando prever foi prevista incorretamente.

Falso verdadeiro (true negative — TN): ocorre quando no conjunto real, a classe que não estamos buscando prever foi prevista corretamente.

Falso negativo (false negative — FN): ocorre quando no conjunto real, a classe que não estamos buscando prever foi prevista incorretamente.


In [None]:
import numpy as np

def mcc(y_true, y_pred):

  # Calcula a matriz de confusão

  confusion_matrix = np.zeros((2, 2))
  for i in range(len(y_true)):
    confusion_matrix[y_true[i], y_pred[i]] += 1

  # Calcula o TP, FP, FN e TN

  TP = confusion_matrix[1, 1]
  FP = confusion_matrix[0, 1]
  FN = confusion_matrix[1, 0]
  TN = confusion_matrix[0, 0]

Acurácia

Acurácia é uma métrica de avaliação muito popular para descobrir a performance de um modelo de machine learning em uma tarefa de classificação. Ela é calculada dividindo o número de previsões corretas pelo número total de previsões.

A seguir apresento a fórmula e logo depois o código:
$$\text{Acurácia} = \frac{\text{Previsões corretas}}{\text{Total de observações}}$$




In [None]:
rótulos_reais = [0, 1, 1, 0, 1, 0, 1, 0, 1, 1]
previsões_modelo = [0, 1, 1, 0, 1, 0, 0, 1, 1, 0]

previsões_corretas = 0

for rótulo_real, previsão in zip(rótulos_reais, previsões_modelo):
    if rótulo_real == previsão:
        previsões_corretas += 1

acuracia = previsões_corretas / len(rótulos_reais)

print(f'Acurácia: {acuracia * 100:.2f}%')


Acurácia: 70.00%


Macro F1

A macro F1 pode ser interpretada como uma média harmônica de precisão e recall, onde uma pontuação F1 atinge seu melhor valor em 1 e pior pontuação em 0.

A está a fórmula e logo depois o código:

$$\text{Macro F1} = \frac{1}{N} \sum_{i=1}^{N} \frac{2 \cdot \text{Precisão}_i \cdot \text{Revocação}_i}{\text{Precisão}_i + \text{Revocação}_i}$$




In [None]:
import pandas as pd
import numpy as np

def macro_f1(df):

  precision = df.groupby("y_true")["y_pred"].apply(lambda x: np.mean(x == x.values))
  recall = df.groupby("y_true")["y_pred"].apply(lambda x: np.sum(x == 1) / (np.sum(x == 1) + np.sum(x == 0)))
  f1 = 2 * precision * recall / (precision + recall)



  macro_f1 = np.mean(f1)

  return macro_f1


if __name__ == "__main__":

  df = pd.DataFrame({
    "y_true": [0, 0, 1, 1],
    "y_pred": [0, 1, 1, 0]
  })

  macro_f1 = macro_f1(df)


  print(macro_f1)


0.6666666666666666


Precisão, Recall e F1 Score:

A **precisão** mede o quanto podemos confiar num modelo quando ele prevê que um exemplo pertence a uma determinada classe. É o número de exemplos que seu modelo previu como positivos e acertou dividido pelo número total de exemplos que ele previu como positivos. Na fórmula, TP são os valores verdadeiros positivos e FP os falsos positivos

Fórmula de precisão: $$\text{Precisão} = \frac{TP}{TP + FP}
$$


O **recall** é o número de pessoas que o modelo identificou corretamente como tendo a doença dividido pelo número total de pessoas que realmente têm a doença nos seus dados. Ou seja, de todas as pessoas que ele poderia classificar como positivas, quantas ele acertou.

Esta métrica também pode ser conhecida como taxa de detecção, ou seja, de todos os exemplos que o modelo poderia detectar, quantos ele realmente conseguiu.

Fórmula de Recall: $$\text{Revocação (Recall)} = \frac{TP}{TP + FN}
$$

Na fórmula acima, TP são os verdadeiros positivos e FN são os falsos negativos.

Agora, temos o **F1 score**, que basicamente é a média harmônica entre a precisão e o recall. Ela é uma fórmula bastante simples que inclui as duas métricas explicadas acima com a mesma importância: precisão e recall.

Fórmula de F1 Score: $$\text{F1 Score} = \frac{2 \cdot \text{Precisão} \cdot \text{Revocação}}{\text{Precisão} + \text{Revocação}}$$

Agora apresento o código das 3 métricas comentadas no texto:



In [None]:
def precision(true_positives, false_positives):
    return true_positives / (true_positives + false_positives)

# Exemplo de uso:
true_positives = 50
false_positives = 10
precisao = precision(true_positives, false_positives)
print("Precisão:", precisao)


def recall(true_positives, false_negatives):
    return true_positives / (true_positives + false_negatives)

# Exemplo de uso:
true_positives = 50
false_negatives = 5
revocacao = recall(true_positives, false_negatives)
print("Recall:", revocacao)


def f1_score(precision, recall):
    return 2 * (precision * recall) / (precision + recall)

# Exemplo de uso:
precision_value = 0.83
recall_value = 0.76
f1 = f1_score(precision_value, recall_value)
print("F1 Score:", f1)




Precisão: 0.8333333333333334
Recall: 0.9090909090909091
F1 Score: 0.7934591194968554


Matthews Correlation Coefficient (MCC)

O coeficiente de correlação de Matthew, também abreviado como MCC, foi inventado por Brian Matthews em 1975. MCC é uma ferramenta estatística usada para avaliação de modelos. Sua função é avaliar ou medir a diferença entre os valores previstos e os valores reais e é equivalente à estatística qui-quadrado para uma tabela de contingência 2 x 2.

A seguir está a fórmula e logo depois o código:

$$\text{MCC} = \frac{TP \cdot TN - FP \cdot FN}{\sqrt{(TP + FP)(TP + FN)(TN + FP)(TN + FN)}}$$

Nesta fórmula, TP são os verdadeiros positivos (true positives), TN são os verdadeiros negativos (true negatives), FP são os falsos positivos (false positives) e FN são os falsos negativos (false negatives).






In [None]:
def mcc(true_positives, true_negatives, false_positives, false_negatives):
    numerator = (true_positives * true_negatives) - (false_positives * false_negatives)
    denominator = ((true_positives + false_positives) * (true_positives + false_negatives) *
                   (true_negatives + false_positives) * (true_negatives + false_negatives))**0.5

    if denominator == 0:
        return 0

    return numerator / denominator

true_positives = 50
true_negatives = 30
false_positives = 10
false_negatives = 5

coeficiente_mcc = mcc(true_positives, true_negatives, false_positives, false_negatives)
print("MCC:", coeficiente_mcc)


MCC: 0.6746010525388914
