<a href="https://colab.research.google.com/github/gustavovazquez/ML/blob/main/ML_Naive_Bayes.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Naive Bayes: Teor√≠a

## 1. Concepto general

El **clasificador Naive Bayes** es un modelo de aprendizaje supervisado **probabil√≠stico**, basado en el **Teorema de Bayes**, que asume que las variables predictoras son **condicionalmente independientes** entre s√≠ dado el valor de la clase.

Se utiliza principalmente para **clasificaci√≥n**, especialmente en problemas de texto, diagn√≥stico o decisiones bajo incertidumbre.

---

##  2. Teorema de Bayes

El teorema de Bayes establece que:

$$
P(C_k \mid X) = \frac{P(X \mid C_k)\,P(C_k)}{P(X)}
$$

Donde:

- $C_k$ : una clase posible (por ejemplo, "Spam" o "No spam")
- $X = (x_1, x_2, \dots, x_n)$ : el conjunto de caracter√≠sticas observadas
- $P(C_k)$ : probabilidad previa de la clase
- $P(X \mid C_k)$ : probabilidad de observar $X$ si la clase es $C_k$
- $P(X)$ : probabilidad total de observar $X$ (constante para todas las clases)

---

## 3. Suposici√≥n ‚ÄúNaive‚Äù

El modelo **asume independencia condicional** entre los atributos:

$$
P(X \mid C_k) = \prod_{i=1}^{n} P(x_i \mid C_k)
$$

Entonces, la probabilidad posterior se simplifica como:

$$
P(C_k \mid X) \propto P(C_k) \prod_{i=1}^{n} P(x_i \mid C_k)
$$

El s√≠mbolo $\propto$ significa ‚Äú**proporcional a**‚Äù.  
Como $P(X)$ es igual para todas las clases, no se necesita para comparar.

---

## 4. Regla de decisi√≥n

El modelo elige la clase con la mayor probabilidad posterior:

$$
\hat{C} = \arg\max_{C_k} P(C_k) \prod_{i=1}^{n} P(x_i \mid C_k)
$$

---

## 5. Variantes del modelo

1. **Bernoulli Naive Bayes** ‚Üí para variables binarias (presencia/ausencia).  
2. **Multinomial Naive Bayes** ‚Üí para conteos (frecuencia de palabras, n-gramas, etc.).  
3. **Gaussian Naive Bayes** ‚Üí para variables continuas (asume distribuci√≥n normal).




---

## 6. Ejemplo: "Play Tennis"

Queremos predecir si se juega al tenis seg√∫n las condiciones clim√°ticas.

### Dataset

| D√≠a | Outlook  | Temperature | Humidity | Wind  | PlayTennis |
|:----|:----------|:------------|:----------|:------|:------------|
| D1  | Sunny     | Hot         | High      | Weak  | No          |
| D2  | Sunny     | Hot         | High      | Strong| No          |
| D3  | Overcast  | Hot         | High      | Weak  | Yes         |
| D4  | Rain      | Mild        | High      | Weak  | Yes         |
| D5  | Rain      | Cool        | Normal    | Weak  | Yes         |
| D6  | Rain      | Cool        | Normal    | Strong| No          |
| D7  | Overcast  | Cool        | Normal    | Strong| Yes         |
| D8  | Sunny     | Mild        | High      | Weak  | No          |
| D9  | Sunny     | Cool        | Normal    | Weak  | Yes         |
| D10 | Rain      | Mild        | Normal    | Weak  | Yes         |
| D11 | Sunny     | Mild        | Normal    | Strong| Yes         |
| D12 | Overcast  | Mild        | High      | Strong| Yes         |
| D13 | Overcast  | Hot         | Normal    | Weak  | Yes         |
| D14 | Rain      | Mild        | High      | Strong| No          |

---

## üîπ Paso 1: Probabilidades previas "Prior"

Hay 9 casos ‚ÄúYes‚Äù y 5 casos ‚ÄúNo‚Äù.

$$
P(Yes) = \frac{9}{14} = 0.642
$$

$$
P(No) = \frac{5}{14} = 0.358
$$

---

## Paso 2: Clasificaci√≥n de un nuevo ejemplo

Queremos clasificar:

 * Outlook=Sunny, Temperature=Cool, Humidity=High, Wind=Weak *

## Paso 3: Probabilidades condicionales

| Atributo | Valor | $P(\text{valor}|\text{Yes})$ | $P(\text{valor}|\text{No})$ |
|-----------|--------|----------------------------|----------------------------|
| Outlook   | Sunny  | $2/9$ | $3/5$ |
| Temperature | Cool | $3/9$ | $1/5$ |
| Humidity  | High  | $3/9$ | $4/5$ |
| Wind      | Weak  | $6/9$ | $2/5$ |

---



### Para Yes:

$$
P(Yes|X) \propto P(Yes)\,P(Sunny|Yes)\,P(Cool|Yes)\,P(High|Yes)\,P(Weak|Yes)
$$

$$
P(Yes|X) \propto 0.642 \times \frac{2}{9} \times \frac{3}{9} \times \frac{3}{9} \times \frac{6}{9} = 0.0105
$$

### Para No:

$$
P(No|X) \propto P(No)\,P(Sunny|No)\,P(Cool|No)\,P(High|No)\,P(Weak|No)
$$

$$
P(No|X) \propto 0.358 \times \frac{3}{5} \times \frac{1}{5} \times \frac{4}{5} \times \frac{2}{5} = 0.0138
$$

---

## Paso 4: Decisi√≥n final

Como $0.0138 > 0.0105$, el modelo clasifica el ejemplo como:

> **PlayTennis = No**

---

## 7. Interpretaci√≥n

El clasificador Naive Bayes no calcula probabilidades absolutas, sino valores **proporcionales**.  
El valor mayor determina la clase m√°s probable.  
La simplicidad y eficiencia del m√©todo hacen que sea ideal para grandes vol√∫menes de datos, incluso cuando la independencia entre variables no se cumple estrictamente.
