# Naive Bayes
# O Naive Bayes é uma técnica de classificação baseada no teorema de Bayes, com uma suposição de independência entre os preditores. Simplificando, um modelo Naive Bayes assume que a presença de uma característica particular em uma classe é independente da presença de qualquer outra característica.

## Como Funciona o Naive Bayes
Baseado no Teorema de Bayes

O Naive Bayes é fundamentado no Teorema de Bayes, um princípio da teoria da probabilidade. O teorema descreve a probabilidade de um evento, baseado no conhecimento prévio de condições que podem estar relacionadas ao evento. A fórmula básica do teorema de Bayes é:

![image.png](image.png)

Onde:

    P(A∣B)P(A∣B) é a probabilidade posterior de A dado B.
    P(B∣A)P(B∣A) é a probabilidade de B dado A.
    P(A)P(A) e P(B)P(B) são as probabilidades marginais de A e B, respectivamente.

Suposição de Independência

O termo "Naive" (ingênuo) no Naive Bayes vem da suposição de que as características usadas para prever a variável de resposta são independentes umas das outras. Ou seja, a presença (ou ausência) de uma característica não está relacionada à presença (ou ausência) de outra característica.
Aplicação em Classificação

Naive Bayes é frequentemente usado em tarefas de classificação. Aqui, o objetivo é encontrar a probabilidade de uma etiqueta de classe dado um conjunto de características. Isso é feito calculando a probabilidade posterior de cada classe com base nas características de entrada e escolhendo a classe com a maior probabilidade posterior.
Variações do Naive Bayes

Existem diferentes tipos de modelos Naive Bayes, dependendo da distribuição dos dados:

    Gaussian Naive Bayes: Assume que as características seguem uma distribuição normal (gaussiana).
    Multinomial Naive Bayes: Usado geralmente em classificação de texto, onde as características são geralmente as contagens das palavras ou frequências dos termos.
    Bernoulli Naive Bayes: Usado em casos onde as características são binárias.

### Vantagens
* Simplicidade e Eficiência: É fácil de implementar e rápido em comparação com métodos mais sofisticados.
* Bom Desempenho com Datasets Pequenos: Funciona bem mesmo com uma pequena quantidade de dados de treinamento.
* Eficiente em Datasets de Alta Dimensão: Funciona bem com muitas características.

### Desvantagens
* Suposição de Independência: A suposição de independência entre os atributos raramente acontece na prática.
* Sensibilidade a Dados Não Representativos: O modelo pode ter um desempenho ruim se o dataset de treinamento não representar bem as reais distribuições dos dados.
* Limitações na Estimação de Probabilidade: Quando as probabilidades são zero para algumas características, isso pode afetar negativamente a performance do modelo.

### Exemplo de código

In [2]:
from sklearn.datasets import load_breast_cancer
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, classification_report
from sklearn.preprocessing import StandardScaler


In [3]:
cancer_data = load_breast_cancer()
X = cancer_data.data
y = cancer_data.target

In [4]:
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

In [5]:
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, random_state=42)

In [6]:
nb_model = GaussianNB()
nb_model.fit(X_train, y_train)

In [7]:
y_pred = nb_model.predict(X_test)

# Matriz de Confusão e Relatório de Classificação
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))

[[ 57   6]
 [  5 103]]
              precision    recall  f1-score   support

           0       0.92      0.90      0.91        63
           1       0.94      0.95      0.95       108

    accuracy                           0.94       171
   macro avg       0.93      0.93      0.93       171
weighted avg       0.94      0.94      0.94       171

