# Bernoulli Naive Bayes

O Bernoulli Naive Bayes é usado quando os atributos do conjunto de dados são binários, ou seja, podem assumir apenas dois valores como por exemplo `True`/`False` ou `0`/`1`.

**EXEMPLO**

Suponha que você esteja tentando prever se um paciente tem uma determinada doença com base em uma série de exames médicos. Cada exame pode ser representado como uma variável nominal binária que indica se o resultado do exame é positivo (1) ou negativo (0).

| Paciente | Exame_A | Exame_B | Exame_C | Exame_D | Exame_E | Tem_doença? |
|----------|---------|---------|---------|---------|---------|--------------|
| 1 | 0 | 1 | 0 | 1 | 0 | Não |
| 2 | 1 | 0 | 1 | 0 | 1 | Sim |
| 3 | 0 | 0 | 0 | 0 | 0 | Não |
| 4 | 1 | 1 | 1 | 1 | 1 | Sim |
| 5 | 0 | 0 | 1 | 0 | 1 | Sim |

## Considerações

A aplicação correta de um algoritmo de *Machine Learning* envolve várias considerações importantes relacionadas aos dados. Assim, aqui estão algumas ponderações que você deve considerar antes de aplicar esse algoritmo.

* Os atributos são binários? 

* As classes estão balanceadas?

* Os atributos incluídos no treinamento foram selecionados cuidadosamente?

* O problema da frequência zero foi considerado?

## O Algoritmo na Prática

**Bibliotecas**

In [1]:
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import BernoulliNB
from sklearn import metrics
import numpy as np

**Ingestão**

In [None]:
# O conjunto de dados dos exames poderia ser o seguinte
X = np.array([
    [0, 1, 0, 1, 0],
    [1, 0, 1, 0, 1],
    [0, 0, 0, 0, 0],
    [1, 1, 1, 1, 1],
    [0, 0, 1, 0, 1]
])

#  Essa poderia ser a classificação se um paciente possui ou não a doença
y = np.array([0, 1, 0, 1, 1])

**Preparação**

In [None]:
# Dividir os dados em conjuntos de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

**Treinamento**

In [None]:
# Criar e treinar o modelo
model = BernoulliNB()
model.fit(X_train, y_train)

**Testes**

In [None]:
# Fazer previsões no conjunto de teste
y_pred = model.predict(X_test)

# Avaliar o modelo
accuracy = metrics.accuracy_score(y_test, y_pred)
print(f"Acurácia: {accuracy*100}%")