## Naive Bayes Classifier

Naive Bayes es un tipo de clasificador probabilístico basado en el teorema de Bayes, con la suposición de que las características (o atributos) de los datos son independientes entre sí, dado el valor de la variable objetivo (etiqueta). A pesar de esta suposición simplificadora (de independencia), Naive Bayes puede ser muy efectivo en la práctica para muchos problemas de clasificación.

**Gaussian Naive Bayes:**

- Descripción: Asume que los datos continúan en cada clase tienen una distribución normal (gaussiana). Es adecuado para características continuas.
- Uso típico: Se utiliza cuando las características tienen una distribución aproximadamente normal. Por ejemplo, en problemas de clasificación de texto donde las características son frecuencias de palabras.

**Multinomial Naive Bayes:**

- Descripción: Se utiliza principalmente para datos categóricos o de conteo. Asume que las características siguen una distribución multinomial. Es especialmente útil para clasificar textos y otras características categóricas.
- Uso típico: Clasificación de texto (como en el análisis de sentimientos y filtros de spam), donde las características son recuentos de palabras o frecuencias.

**Bernoulli Naive Bayes:**

- Descripción: Es similar al Multinomial Naive Bayes, pero asume que cada característica es una variable binaria (0 o 1). Es útil cuando las características se presentan en formato binario.
- Uso típico: Problemas donde las características son binarios, como en la clasificación de documentos en presencia o ausencia de ciertas palabras (en lugar de contar la frecuencia de las palabras).

In [2]:
import numpy as np

In [3]:
X = np.array([[0, 1, 0, 1], #0
              [1, 0, 1, 1], #1
              [0, 0, 0, 1], #0
              [1, 0, 1, 0]]) #1
y = np.array([0, 1, 0, 1])

BernoulliNB suma los valores de cada clase, es decir, suma [0, 1, 0, 1] + [1, 0, 1, 0] = [0, 1, 0, 2] para los que se definen como clase 0. Haciedno lo correspondiente para la clase 1.

In [4]:
counts = {}
for label in np.unique(y):
    # iterate over each class
    # count (sum) entries of 1 per feature
    counts[label] = X[y == label].sum(axis=0)
print("Feature counts:\n", counts)

Feature counts:
 {0: array([0, 1, 0, 2]), 1: array([2, 0, 2, 1])}
