# Introducción a la probabilidad bayesiana y a Naive Bayes

## Probabilidad frecuentista

En el enfoque frecuentista, la probabilidad se asocia con la frecuencia de un evento a lo largo del tiempo. No se actualiza en función de nueva información, sino que se calcula únicamente en base a los resultados observados.

Comenzamos con un experimento simple: lanzar una moneda. La probabilidad frecuentista se basa en la proporción de veces que un evento ocurre después de repetir el experimento muchas veces.

In [27]:
import random

# Simulación de lanzamiento de moneda
def lanzar_moneda(n_lanzamientos):
    caras = 0
    for _ in range(n_lanzamientos):
        if random.choice(['cara', 'cruz']) == 'cara':
            caras += 1
    return caras / n_lanzamientos

# Lanzamos la moneda 1000 veces
probabilidad_frecuentista = lanzar_moneda(1000)
print(f"Probabilidad frecuentista de obtener cara: { probabilidad_frecuentista }")

Probabilidad frecuentista de obtener cara: 0.496


## Probabilidad Bayesiana

Este enfoque permite actualizar la probabilidad de un evento a medida que se obtiene nueva información (concepto de "creencia").

Los clasificadores bayesianos ingenuos se basan en métodos de clasificación bayesianos.

Estos se basan en el teorema de Bayes, que es una ecuación que describe la relación entre las probabilidades condicionales de las cantidades estadísticas.



Aquí simularemos un ejemplo donde actualizamos la probabilidad de que una persona tenga una enfermedad dada cierta información adicional (e.g., resultados de una prueba médica).

Suposiciones iniciales:

* 1% de la población tiene la enfermedad (probabilidad previa).
* La prueba tiene una precisión del 90% (sensibilidad y especificidad).

Usamos el teorema de Bayes para actualizar nuestras creencias.

In [30]:
# Probabilidades conocidas
p_enfermedad = 0.01   # 1% de la población tiene la enfermedad
p_no_enfermedad = 1 - p_enfermedad

p_prueba_positivo_dado_enfermedad = 0.90  # Sensibilidad: 90%
p_prueba_positivo_dado_no_enfermedad = 1 - p_prueba_positivo_dado_enfermedad  # Falsos positivos: 10%

***Teorema de Bayes***

 $$ P(A_i|B) = \frac{P(B|A_i)P(A_i)}{P(B)} $$

 $$ P(enfermedad|prueba\_positiva) = \frac{P(prueba\_positiva|enfermedad)P(enfermedad)}{P(prueba\_positiva)} $$

In [32]:
# P (Prueba positiva) = [P(Prueba positiva | Enfermedad) * P(Enfermedad)] + [P(Prueba positiva | no_Enfermedad) * P(no_Enfermedad)]
p_prueba_positivo = (p_prueba_positivo_dado_enfermedad * p_enfermedad) + (p_prueba_positivo_dado_no_enfermedad * p_no_enfermedad)
p_prueba_positivo

0.10799999999999998

In [34]:
# Teorema de Bayes
# P(Enfermedad | Prueba positiva) = [P(Prueba positiva | Enfermedad) * P(Enfermedad)] / P(Prueba positiva)
p_enfermedad_dado_prueba_positivo = (p_prueba_positivo_dado_enfermedad * p_enfermedad) / p_prueba_positivo

print(f"Probabilidad de tener la enfermedad dado un resultado positivo en la prueba: {p_enfermedad_dado_prueba_positivo:.4f}")

Probabilidad de tener la enfermedad dado un resultado positivo en la prueba: 0.0833



Todo lo que necesitamos ahora es algún modelo mediante el cual podamos calcular $P( B|A)$ para cada etiqueta.  
Este modelo se denomina *modelo generativo* porque especifica el proceso aleatorio hipotético que genera los datos.

Especificar este modelo generativo para cada etiqueta es la parte principal del entrenamiento de este clasificador bayesiano.  
La versión general de este paso de entrenamiento es una tarea muy difícil, pero podemos simplificarla mediante el uso de algunas suposiciones simplificadoras sobre la forma de este modelo.

Aquí es donde entra en juego el "ingenuo" en "Bayes ingenuo": si hacemos suposiciones muy ingenuas sobre el modelo generativo para cada etiqueta, podemos encontrar una aproximación aproximada del modelo generativo para cada clase y luego proceder con la clasificación bayesiana.  
Los diferentes tipos de clasificadores bayesianos ingenuos se basan en diferentes suposiciones ingenuas sobre los datos, y examinaremos algunas de ellas en las siguientes secciones.

# **Introducción a Naive Bayes: Simplicidad Poderosa en Aprendizaje Automático**



**Naive Bayes** es uno de los algoritmos de clasificación más populares en aprendizaje automático, conocido por su **eficiencia, facilidad de implementación y resultados sorprendentemente buenos** incluso en problemas complejos.  
A pesar de su "ingenuidad" (naive, en inglés), que hace referencia a una suposición simplificadora sobre los datos, este método es ampliamente utilizado en aplicaciones como:  

- **Filtrado de spam** (clasificar correos como spam/no spam).  
- **Análisis de sentimientos** (determinar si un texto es positivo o negativo).  
- **Diagnóstico médico** (predecir enfermedades basadas en síntomas).  

### **¿Cómo funciona Naive Bayes?**  

El algoritmo se basa en el **Teorema de Bayes**, una fórmula probabilística que relaciona las probabilidades condicionales *a priori*.

La idea clave es:  

> *Dadas ciertas características (ej: palabras en un correo), ¿cuál es la probabilidad de que pertenezcan a una clase (ej: spam)?*


#### **Fórmula clave del Teorema de Bayes:**  


$$ P(y|X) = \frac{P(X|y) \cdot P(y)}{P(X)} $$
- $P(y|X)$: Probabilidad de la clase \(y\) dado un conjunto de características $X$ (**nuestra predicción**).  
- $P(X|y)$: Probabilidad de observar \(X\) si la clase es \(y\).  
- $P(y)$: Probabilidad *a priori* de la clase \(y\) (ej: frecuencia de spam en los datos).  
- $P(X)$: Probabilidad marginal de las características (normalmente constante).  



#### **La "Ingenuidad" de Naive Bayes**  
El algoritmo asume que **las características son independientes entre sí** dada la clase.

Por ejemplo:
- En un filtro de spam, la aparición de la palabra "GRATIS" es independiente de "OFERTA".  
- Esto simplifica el cálculo:  
  $$ P(X|y) = P(x_1|y) \cdot P(x_2|y) \cdot ... \cdot P(x_n|y) $$
    
Aunque esta suposición rara vez es cierta en la realidad, Naive Bayes funciona bien en muchos casos prácticos.


---

### **Tipos de Naive Bayes**

Dependiendo del tipo de datos, usamos diferentes variantes:  

1. **Multinomial Naive Bayes**:  
   - Para **datos discretos** (ej: conteos de palabras en texto).  
   - Usado en clasificación de documentos.  

2. **Gaussian Naive Bayes**:  
   - Para **características continuas** (ej: altura, temperatura).  
   - Asume que los datos siguen una distribución normal.  

3. **Bernoulli Naive Bayes**:  
   - Para **datos binarios** (ej: "aparece/no aparece una palabra").  

---

### **Ventajas y Limitaciones**

✅ **Ventajas:**  
- **Rápido y escalable**: Ideal para conjuntos de datos grandes.  
- **Funciona bien con pocos datos**: Útil cuando el entrenamiento es limitado.  
- **Buen rendimiento en alta dimensionalidad**: Como en procesamiento de lenguaje natural (NLP).  

❌ **Limitaciones:**  
- **Supuesto de independencia**: Si las características están correlacionadas, el modelo puede fallar.  
- **Sensible a datos desbalanceados**: Si una clase es muy rara, puede ser ignorada.  


---

### **Ejemplo básico en código**  
Clasificación de texto con `scikit-learn` (Python):  



In [41]:
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import CountVectorizer

# Datos de ejemplo: frases y sus etiquetas (0: negativo, 1: positivo)
textos = ["me encanta este producto", "odio este servicio", "excelente atención"]
etiquetas = [1, 0, 1]

# Convertir texto a vectores de conteo
vectorizer = CountVectorizer()
X = vectorizer.fit_transform(textos)

# Entrenar el modelo
modelo = MultinomialNB()
modelo.fit(X, etiquetas)

# Predecir una nueva frase
frase_nueva = vectorizer.transform(["buen servicio"]) # "buen producto" (ok), "buen servicio" (mal)
print(modelo.predict(frase_nueva))                    # salida: [1] (positivo)

[0]




### **Conclusión**  
Naive Bayes es un **algoritmo fundamental** en aprendizaje automático, perfecto para introducir conceptos de clasificación probabilística.  
Su simplicidad lo hace ideal para proyectos donde la velocidad y la interpretabilidad son clave, aunque es importante entender sus limitaciones.  

**¿Por qué probarlo?**  
- Es fácil de implementar.  
- Requiere poco poder computacional.  
- ¡A menudo supera a modelos más complejos en problemas con datos bien comportados!  


## Recursos

Este artículo puede ayudarle a expandir más el concepto y seguir un ejemplo paso a paso

https://www.freecodecamp.org/espanol/news/como-funcionan-los-clasificadores-naive-bayes-con-ejemplos-de-codigo-de-python/

