**Explicación**
1. Definición del conjunto de datos: Se crean frases de ejemplo para cada categoría.

2. Conteo de palabras: Se cuenta la frecuencia de cada palabra en cada categoría y se calcula la frecuencia total de palabras en cada categoría.
3. Clasificación: Para clasificar una nueva frase, se calcula la probabilidad de que la frase pertenezca a cada categoría utilizando la fórmula de Naive Bayes. La categoría con la mayor probabilidad es la clasificación del algoritmo.

Esta implementación es muy básica y no utiliza técnicas avanzadas de NLP, pero sirve como una introducción práctica a cómo funciona el clasificador Naive Bayes en el contexto del conteo de palabras.

**Paso 1: Definir el conjunto de datos**
Primero, se define un conjunto de datos con ejemplos de cada categoría.

In [19]:
# Datos de entrenamiento
data = [
    ("Hola", "saludo"),
    ("Buenos días", "saludo"),
    ("Buenas tardes", "saludo"),
    ("¿Cómo estás?", "saludo"),
    ("Quisiera hacer una queja", "queja"),
    ("No estoy satisfecho con el servicio", "queja"),
    ("El producto llegó dañado", "queja"),
    ("Necesito reclamar por un error", "reclamo"),
    ("Quiero hacer un reclamo", "reclamo"),
    ("Esto es inaceptable, quiero una solución", "reclamo"),
    ("Me gustaría pedir información", "petición"),
    ("Necesito saber más detalles sobre el producto", "petición"),
    ("Por favor, envíenme más información", "petición"),
    ("Adiós", "despedida"),
    ("Hasta luego", "despedida"),
    ("Nos vemos", "despedida"),
    ("Chao", "despedida")
]

# Frases y etiquetas
phrases, labels = zip(*data)


**Paso 2: Crear un diccionario de palabras y calcular frecuencias**
A continuación, se crea un diccionario con las frecuencias de palabras por cada categoría.

In [22]:
from collections import defaultdict

# Crear un diccionario para contar palabras por categoría
word_freq = defaultdict(lambda: defaultdict(int))
category_freq = defaultdict(int)

for phrase, label in data:
    words = phrase.lower().split()
    category_freq[label] += 1
    for word in words:
        word_freq[label][word] += 1

# Calcular la frecuencia total de palabras en cada categoría
total_words = defaultdict(int)
for label in word_freq:
    total_words[label] = sum(word_freq[label].values())

# Número total de frases
total_phrases = len(data)


**Paso 3: Implementar el clasificador Naive Bayes**
Se implementa el algoritmo Naive Bayes para clasificar nuevas frases.

In [25]:
import math

def classify(phrase):
    words = phrase.lower().split()
    category_scores = {}

    for category in category_freq:
        # Iniciar el puntaje de la categoría con el logaritmo de la probabilidad de la categoría
        category_scores[category] = math.log(category_freq[category] / total_phrases)

        # Sumar el logaritmo de la probabilidad de cada palabra en la frase
        for word in words:
            word_probability = (word_freq[category][word] + 1) / (total_words[category] + len(word_freq[category]))
            category_scores[category] += math.log(word_probability)

    # Devolver la categoría con el puntaje más alto
    return max(category_scores, key=category_scores.get)

# Probar el clasificador con algunas frases nuevas
test_phrases = [
    "Hola, ¿cómo estás?",
    "Quisiera hacer una queja sobre el servicio",
    "Esto es inaceptable",
    "Necesito información sobre el producto",
    "Hasta luego, nos vemos"
]

for phrase in test_phrases:
    print(f"'{phrase}' se clasifica como: {classify(phrase)}")


'Hola, ¿cómo estás?' se clasifica como: saludo
'Quisiera hacer una queja sobre el servicio' se clasifica como: queja
'Esto es inaceptable' se clasifica como: saludo
'Necesito información sobre el producto' se clasifica como: petición
'Hasta luego, nos vemos' se clasifica como: despedida
