## Overlay

 que é?: O termo "overlay" pode se referir a uma técnica usada em diversos contextos, como na sobreposição de imagens, mapas ou camadas em gráficos, onde uma camada é colocada sobre outra para adicionar informações extras sem alterar a camada base. No contexto de aprendizado de máquina ou computação visual, overlays podem ser usados, por exemplo, para sobrepor informações de classificação em imagens ou para adicionar anotações.

Quando é usado?: Usado em visualizações para ajudar na interpretação dos dados, como sobrepor bounding boxes ou informações de classificação em imagens ou vídeos.

Para que é usado?: Para fornecer um meio visual de melhorar a compreensão ou destacar pontos relevantes em dados complexos, como no reconhecimento de objetos.

## SMOTE(Synthetic Minority Over-sampling Technique)

O que é?: SMOTE é uma técnica de oversampling que cria amostras sintéticas de uma classe minoritária, a fim de balancear os dados em um problema de classificação. Ao invés de simplesmente duplicar exemplos existentes da classe minoritária, o SMOTE gera novos exemplos interpolando entre exemplos vizinhos.

Quando é usado?: Usado quando há um desbalanceamento nas classes de um dataset, ou seja, quando uma classe tem muito menos exemplos do que outra.

Para que é usado?: Para melhorar o desempenho de modelos de classificação, pois um dataset desbalanceado pode resultar em modelos enviesados que favorecem a classe majoritária. O SMOTE ajuda a mitigar esse viés.

## 3. **Precision (Precisão)**
- **O que é?**  
  Precision é uma métrica de avaliação de modelos de classificação que mede a proporção de verdadeiros positivos entre todos os exemplos classificados como positivos. A fórmula é:  
  \[
  \text{Precision} = \frac{TP}{TP + FP}
  \]
  onde:  
  - TP = Verdadeiros positivos  
  - FP = Falsos positivos  

- **Quando é usado?**  
  Usado em contextos onde o custo de falsos positivos é alto, como em sistemas de detecção de fraudes, onde classificar algo como fraudulento quando não é (falso positivo) pode ser muito prejudicial.

- **Para que é usado?**  
  Para avaliar modelos de classificação, especialmente quando se quer garantir que as previsões positivas sejam de fato corretas.


## 4. **Recall (Sensibilidade)**
- **O que é?**  
  Recall é uma métrica de avaliação de modelos que mede a proporção de verdadeiros positivos entre todos os exemplos que realmente pertencem à classe positiva. A fórmula é:  
  \[
  \text{Recall} = \frac{TP}{TP + FN}
  \]
  onde:  
  - TP = Verdadeiros positivos  
  - FN = Falsos negativos  

- **Quando é usado?**  
  Usado quando é mais importante não perder nenhum exemplo positivo, como em sistemas de diagnóstico médico, onde é crucial identificar todos os casos positivos de uma doença.

- **Para que é usado?**  
  Para avaliar o desempenho de um modelo quando o foco é identificar o maior número possível de exemplos positivos, mesmo à custa de falsos positivos.


## 5. **F1-Score**
- **O que é?**  
  O F1-Score é a média harmônica entre a precisão (precision) e o recall, combinando as duas métricas em um único número. A fórmula é:  
  \[
  F1 = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}
  \]

- **Quando é usado?**  
  Usado quando é importante equilibrar precisão e recall, ou seja, quando tanto os falsos positivos quanto os falsos negativos são relevantes para o problema.

- **Para que é usado?**  
  Para avaliar o desempenho de um modelo de classificação quando se busca um equilíbrio entre precisão e recall, sem favorecer uma métrica em detrimento da outra.

---

## 6. Support

O que é?: Support refere-se ao número de ocorrências de uma classe em um dataset. Em outras palavras, é a quantidade de instâncias de cada classe no conjunto de dados.

Quando é usado?: Usado como uma métrica adicional para indicar o número de amostras de cada classe em um problema de classificação.

Para que é usado?: Para compreender a distribuição das classes no conjunto de dados e interpretar as métricas de avaliação (como precisão, recall, etc.) em contexto.

## 7. One-Hot Encoding
O que é?: One-hot encoding é uma técnica de transformação de dados categóricos em variáveis numéricas. Para cada valor único de uma variável categórica, cria-se uma nova coluna que indica com um 1 se a instância pertence àquela categoria ou com 0 caso contrário.

Quando é usado?: Usado quando se trabalha com dados categóricos em modelos de aprendizado de máquina, pois muitos algoritmos não podem processar variáveis não numéricas diretamente.

Para que é usado?: Para converter dados categóricos em um formato que pode ser utilizado por modelos de aprendizado de máquina, permitindo que o modelo compreenda relações entre as variáveis.

### 8. **Accuracy (Acurácia)**
- **O que é?**  
  Accuracy é uma métrica simples que mede a proporção de previsões corretas em relação ao total de previsões. A fórmula é:  
  \[
  \text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}
  \]
  onde:  
  - TP = Verdadeiros positivos  
  - TN = Verdadeiros negativos  
  - FP = Falsos positivos  
  - FN = Falsos negativos  

- **Quando é usado?**  
  Usado como uma métrica geral de desempenho, especialmente em problemas balanceados, onde as classes têm uma distribuição similar.

- **Para que é usado?**  
  Para avaliar a taxa de acerto de um modelo de classificação em termos absolutos.


## 9. Macro Average

O que é?: O "macro average" é uma média simples das métricas de precisão, recall ou F1 de todas as classes, sem levar em consideração o número de exemplos de cada classe.

Quando é usado?: Usado quando se deseja tratar todas as classes de maneira igual, independentemente do número de amostras em cada classe.

Para que é usado?: Para avaliar a performance de um modelo quando as classes têm importâncias iguais, independentemente da sua frequência.

## 10. Weighted Average

O que é?: O "weighted average" é uma média ponderada das métricas de precisão, recall ou F1, levando em consideração o número de exemplos de cada classe. Ou seja, classes com mais exemplos têm um peso maior na média.

Quando é usado?: Usado quando as classes possuem distribuições desbalanceadas e se deseja que as classes mais frequentes tenham mais influência na métrica global.

Para que é usado?: Para avaliar a performance do modelo em datasets desbalanceados, onde as classes minoritárias têm menos impacto nas métricas gerais.