In [8]:
import pickle
import re
import string

# Función de limpieza
def limpiar_texto(texto):
    texto = texto.lower()
    texto = re.sub(f"[{re.escape(string.punctuation)}]", "", texto)
    texto = re.sub(r"\d+", "", texto)
    texto = re.sub(r"\s+", " ", texto).strip()
    return texto

# Cargar vectorizador y modelo entrenado
with open("Reviews_Seminario/vectorizador.pkl", "rb") as f:
    vectorizador = pickle.load(f)

with open("Reviews_Seminario/modelo_naive_bayes.pkl", "rb") as f:
    modelo = pickle.load(f)

# Función para clasificar una nueva reseña
def clasificar_resena(resena):
    texto_procesado = limpiar_texto(resena)
    vector = vectorizador.transform([texto_procesado])
    prediccion = modelo.predict(vector)[0]

    if prediccion == 1:
        print("✅ Reseña POSITIVA - Buen trabajo")
    else:
        print("⚠️ Reseña NEGATIVA - Atención al cliente")

# Ejemplo de uso real
resena_1 = "This product arrived late and it was damaged."
resena_2 = "Excellent customer service and fast delivery!"

clasificar_resena(resena_1)
clasificar_resena(resena_2)


⚠️ Reseña NEGATIVA - Atención al cliente
✅ Reseña POSITIVA - Buen trabajo


In [10]:
#Más ejemplos

clasificar_resena("This is the worst purchase I've ever made.")
clasificar_resena("Excellent customer service and fast delivery.")
clasificar_resena("La entrega fue tardía y el producto venía roto.")


⚠️ Reseña NEGATIVA - Atención al cliente
✅ Reseña POSITIVA - Buen trabajo
⚠️ Reseña NEGATIVA - Atención al cliente


📊 Parte 1: Script para Casos de Uso Reales para la Empresa
✅ Objetivo
Demostrar con ejemplos prácticos cómo un modelo de Machine Learning puede clasificar automáticamente reseñas de clientes como positivas o negativas, ayudando a una empresa a gestionar mejor sus opiniones y actuar sobre ellas de forma eficiente.

🛠️ Componentes Técnicos Utilizados
Lenguaje: Python

Librerías: sklearn, nltk, pickle, re

Modelo: Multinomial Naive Bayes

Vectorización: TfidfVectorizer

Entrenamiento: Hecho previamente sobre reseñas balanceadas.

Guardado: Se guardó el modelo y vectorizador en formato .pkl.

📁 Archivos Clave
modelo_naive_bayes.pkl: modelo entrenado de clasificación.

vectorizador.pkl: transformador TF-IDF ajustado al dataset.

Ambos archivos se encuentran en la carpeta Reviews_Seminario.

🧼 Limpieza y Procesamiento de Texto
Se aplicó una función de preprocesamiento que incluye:

Conversión a minúsculas.

Eliminación de puntuación y caracteres especiales.

Eliminación de stopwords en inglés.

Tokenización.

Lemmatización (opcional según configuración).

python
Copiar
Editar
def preprocesar_texto(texto):
    # Limpieza y preprocesamiento del texto (resumen)
    ...
    return texto_procesado
🧠 Clasificación de Nuevas Reseñas
Creamos una función llamada clasificar_resena() que:

Preprocesa el texto ingresado.

Lo vectoriza usando el TF-IDF entrenado.

Lo clasifica con el modelo Naive Bayes.

Devuelve si la reseña es positiva o negativa, y añade un mensaje empresarial interpretativo.

python
Copiar
Editar
clasificar_resena("The product arrived late and in bad condition.")
# ➤ ⚠️ Reseña NEGATIVA - Atención al cliente
🧪 Casos de Prueba Realizados
Se probaron distintos ejemplos que simulan reseñas reales:

Reseña Simulada	Clasificación
"This is the worst purchase I've ever made."	⚠️ Negativa
"Excellent customer service and fast delivery."	✅ Positiva
"La entrega fue tardía y el producto venía roto."	⚠️ Negativa
"Me cobraron de más y nadie respondió mis correos."	⚠️ Negativa
"El producto no es como se describe, muy baja calidad."	⚠️ Negativa

Esto demuestra cómo el modelo puede ser aplicado directamente para que una empresa:

Detecte automáticamente reseñas negativas.

Clasifique el tipo de problema recurrente (logística, producto, servicio).

Priorice la atención a clientes insatisfechos.

✅ Estado Final
Modelo y vectorizador funcionales y listos para usar.

Probados con frases reales y simuladas.

Preparado para integrarse en un dashboard interactivo.