# Sistema de Detecci√≥n de Quejas y Soporte Autom√°tico para E-commerce

## Importaci√≥n de librer√≠as

In [39]:
import pandas as pd
import gradio as gr

In [40]:
pd.set_option('display.max_colwidth', None)

In [41]:
from google.colab import userdata
import os

GOOGLE_API_KEY = userdata.get('GOOGLE_API_KEY')

In [42]:
from difflib import get_close_matches

In [43]:
from google import genai
from google.genai import types

cliente = genai.Client(api_key=GOOGLE_API_KEY)

In [44]:
MODEL_ID = "gemini-2.0-flash-lite" # @param ["gemini-2.0-flash-lite","gemini-2.0-flash","gemini-2.5-flash-preview-05-20","gemini-2.5-pro-preview-05-06"] {"allow-input":true, isTemplate: true}

## Dataset Simulado

In [45]:
# --- 1. Dataset simulado ---
tickets = [
    {"mensaje": "La cafetera lleg√≥ hecha pelota, una verg√ºenza. ¬øQui√©n embala estas cosas?", "sentimiento": "Negativo", "categoria": "Producto defectuoso"},
    {"mensaje": "Todo perfecto, la entrega fue rapid√≠sima. Gracias por la atenci√≥n.", "sentimiento": "Positivo", "categoria": "Elogio"},
    {"mensaje": "¬øTienen en stock el aire acondicionado BGH de 3000 frigor√≠as?", "sentimiento": "Neutro", "categoria": "Consulta de stock"},
    {"mensaje": "Che, ¬ød√≥nde est√° mi compra? Hace mil que la pagu√© y no aparece nada.", "sentimiento": "Negativo", "categoria": "Pedido no entregado"},
    {"mensaje": "Me cobraron dos veces el mismo pedido, arreglen eso urgente.", "sentimiento": "Negativo", "categoria": "Problema con pago"},
    {"mensaje": "El horno lleg√≥ justo a tiempo para el cumple, ¬°genios!", "sentimiento": "Positivo", "categoria": "Elogio"},
    {"mensaje": "No puedo entrar a mi cuenta desde ayer, me tira error 503.", "sentimiento": "Negativo", "categoria": "Problema de acceso"},
    {"mensaje": "Necesito la factura del pedido #90876. ¬øD√≥nde la encuentro?", "sentimiento": "Neutro", "categoria": "Consulta de facturaci√≥n"},
    {"mensaje": "Ped√≠ una tablet negra y me mandaron la blanca, ¬øc√≥mo lo soluciono?", "sentimiento": "Negativo", "categoria": "Error en el pedido"},
    {"mensaje": "No me contestan hace d√≠as, ¬øhay alguien del otro lado?", "sentimiento": "Negativo", "categoria": "Falta de atenci√≥n"},
    {"mensaje": "Gracias por el excelente servicio, volver√© a comprar.", "sentimiento": "Positivo", "categoria": "Elogio"},
    {"mensaje": "¬øCu√°ndo reponen el celular Motorola G200? Estoy esperando.", "sentimiento": "Neutro", "categoria": "Consulta de stock"},
    {"mensaje": "Ya pasaron 10 d√≠as y el paquete no llega, ¬øqu√© onda?", "sentimiento": "Negativo", "categoria": "Retraso en env√≠o"},
    {"mensaje": "Felicitaciones, el empaque estaba impecable y lleg√≥ antes de lo previsto.", "sentimiento": "Positivo", "categoria": "Elogio"},
    {"mensaje": "¬øC√≥mo hago para descargar la factura de mi √∫ltima compra?", "sentimiento": "Neutro", "categoria": "Consulta de facturaci√≥n"}
]

In [46]:
df_tickets = pd.DataFrame(tickets)

## Clasificaci√≥n Autom√°tica (Sentimiento + Categor√≠a)

In [47]:
# --- 2. Etiquetas para clasificaci√≥n de categor√≠a ---
etiquetas = [
    "Producto defectuoso",
    "Pedido no entregado",
    "Retraso en env√≠o",
    "Problema con pago",
    "Error en el pedido",
    "Problema de acceso",
    "Falta de atenci√≥n",
    "Consulta de stock",
    "Elogio",
    "Consulta de facturaci√≥n"
]

In [48]:
# --- 3. Funci√≥n para normalizar la salida del modelo para sentimiento ---
def normalizar_sentimiento(valor):
    valor = valor.lower().strip()
    if "positiv" in valor:
        return "Positivo"
    elif "negativ" in valor:
        return "Negativo"
    else:
        return "Neutro"

In [49]:
# --- 4. Funci√≥n para normalizar la salida del modelo para categor√≠a usando fuzzy match ---
def normalizar_categoria(valor, etiquetas):
    match = get_close_matches(valor.strip(), etiquetas, n=1, cutoff=0.6)
    return match[0] if match else "Categor√≠a desconocida"

In [50]:
# --- 5. Funci√≥n de clasificaci√≥n de sentimiento usando Gemini API (u otro LLM) ---
def clasificar_sentimiento(row):
    mensaje = row['mensaje']
    prompt = f"""
Clasific√° este mensaje del cliente en una sola palabra: Positivo, Negativo o Neutro.
Devolv√© solo la palabra, sin comillas ni explicaciones.

Mensaje: {mensaje}
"""
    respuesta = cliente.models.generate_content(
        model=MODEL_ID,
        contents=[prompt]
    )
    return normalizar_sentimiento(respuesta.text.strip())

In [51]:
# --- 6. Funci√≥n de clasificaci√≥n de categor√≠a usando Zero-Shot ---
def clasificar_categoria(row):
    mensaje = row['mensaje']
    prompt = f"""
Clasific√° el siguiente mensaje del cliente eligiendo solo una de estas categor√≠as exactas, sin explicar:
{', '.join(etiquetas)}.

Devolv√© √∫nicamente una de las categor√≠as anteriores, sin comillas ni texto adicional.

Mensaje: {mensaje}
"""
    respuesta = cliente.models.generate_content(
        model=MODEL_ID,
        contents=[prompt]
    )
    return normalizar_categoria(respuesta.text.strip(), etiquetas)

In [52]:
# --- 7. Aplicamos las funciones al DataFrame ---
df_tickets['sentimiento_pred'] = df_tickets.apply(clasificar_sentimiento, axis=1)
df_tickets['categoria_pred'] = df_tickets.apply(clasificar_categoria, axis=1)

In [None]:
# --- 8. Evaluaci√≥n: comparamos con etiquetas manuales ---
df_tickets['sentimiento_match'] = df_tickets['sentimiento'] == df_tickets['sentimiento_pred']
df_tickets['categoria_match'] = df_tickets['categoria'] == df_tickets['categoria_pred']

In [54]:
# --- 9. M√©tricas de precisi√≥n ---
print(" Accuracy sentimiento:", round(df_tickets['sentimiento_match'].mean()*100, 2), "%")
print(" Accuracy categor√≠a:", round(df_tickets['categoria_match'].mean()*100, 2), "%")

 Accuracy sentimiento: 100.0 %
 Accuracy categor√≠a: 93.33 %


In [55]:
# --- 10. Mostrar los errores para an√°lisis ---
errores = df_tickets[(~df_tickets['sentimiento_match']) | (~df_tickets['categoria_match'])]
print("\n Casos con discrepancias:\n")
print(errores[['mensaje', 'sentimiento', 'sentimiento_pred', 'categoria', 'categoria_pred']])


 Casos con discrepancias:

                                                 mensaje sentimiento  \
12  Ya pasaron 10 d√≠as y el paquete no llega, ¬øqu√© onda?    Negativo   

   sentimiento_pred         categoria       categoria_pred  
12         Negativo  Retraso en env√≠o  Pedido no entregado  


Tras aplicar un modelo de lenguaje grande (LLM) para la clasificaci√≥n autom√°tica de sentimiento y categor√≠a sobre un dataset simulado de 15 tickets de soporte al cliente, se obtuvieron los siguientes resultados:

* Precisi√≥n en sentimiento: 100%

* Precisi√≥n en categor√≠as: 93,33%

Estos resultados reflejan un desempe√±o muy positivo del modelo, especialmente en la detecci√≥n del tono emocional de los mensajes, incluso en presencia de jerga coloquial argentina (ej. "hecha pelota", "qu√© onda", "che").

### An√°lisis de la discrepancia detectada

El √∫nico caso de discordancia fue el siguiente:

* Mensaje: ‚ÄúYa pasaron 10 d√≠as y el paquete no llega, ¬øqu√© onda?‚Äù
* Etiqueta manual: Retraso en env√≠o
* Predicci√≥n del modelo: Pedido no entregado

Si bien ambas categor√≠as est√°n relacionadas, la elecci√≥n del modelo sugiere una interpretaci√≥n m√°s binaria (‚Äúno entregado‚Äù vs. ‚Äúretrasado‚Äù). Esta confusi√≥n es comprensible, ya que el l√≠mite entre ambas categor√≠as puede ser ambiguo desde el lenguaje natural, especialmente sin contexto adicional (por ejemplo, un historial del pedido).

### Algunas conclusiones

El modelo mostr√≥ alta capacidad de comprensi√≥n del lenguaje informal y fue consistente con las etiquetas manuales en casi todos los casos.

Las discrepancias detectadas son sem√°nticamente comprensibles y podr√≠an reducirse a√∫n m√°s con un refinamiento en la definici√≥n de las categor√≠as o ejemplos adicionales en los prompts.

Este tipo de sistema demuestra una buena viabilidad para automatizar la clasificaci√≥n inicial de tickets, especialmente como herramienta de triage para priorizar y derivar consultas.

### Limitaciones y desaf√≠os

La categor√≠a ‚ÄúRetraso en env√≠o‚Äù vs. ‚ÄúPedido no entregado‚Äù ilustra que algunas etiquetas requieren contexto temporal o log√≠stico que el modelo no tiene por defecto.

Podr√≠a evaluarse el uso de modelos fine-tuned si se busca precisi√≥n a√∫n mayor, o reformular la taxonom√≠a para agrupar categor√≠as similares.

## Extracci√≥n de Informaci√≥n Clave (NER o QA)

In [56]:
import time

MAX_RETRIES = 5  # M√°ximo intentos para reintentar despu√©s de error 429
BASE_DELAY = 2   # Segundos base para el backoff exponencial

In [57]:
# --- 1. Funci√≥n para el manejo del error 429 (RESOURCE_EXHAUSTED)---
def llamada_api_con_retry(prompt):
    for intento in range(1, MAX_RETRIES + 1):
        try:
            respuesta = cliente.models.generate_content(
                model=MODEL_ID,
                contents=[prompt]
            )
            time.sleep(1)  # Pausa para evitar saturar API
            return respuesta.text.strip()
        except Exception as e:
            # Detectamos error de cuota agotada (429)
            if 'RESOURCE_EXHAUSTED' in str(e) or '429' in str(e):
                delay = BASE_DELAY * (2 ** (intento - 1))  # Backoff exponencial
                print(f"Error 429 detectado. Reintentando en {delay} segundos... (Intento {intento}/{MAX_RETRIES})")
                time.sleep(delay)
                continue
            else:
                # Otro error, lo propagamos o retornamos mensaje
                print(f"Error inesperado: {e}")
                return f"Error al procesar el texto: {e}"
    return "Error: Se agotaron los intentos por error 429."


In [58]:
# --- 2. Funci√≥n para extraer entidades nombradas (NER simulado con prompt) ---
def analizar_entidades(row):
    mensaje = row['mensaje']
    prompt = f"""
Extra√© todas las entidades nombradas en el siguiente mensaje y clasific√°las:

CATEGOR√çAS:
- PERSONA: Nombres de personas
- LUGAR: Ciudades, pa√≠ses, barrios, direcciones, lugares espec√≠ficos
- ORGANIZACI√ìN: Empresas, universidades, instituciones
- MISCEL√ÅNEO: Otros nombres propios (productos, eventos, marcas)

FORMATO DE RESPUESTA:
[ENTIDAD] ‚Üí [CATEGOR√çA] ‚Üí [BREVE EXPLICACI√ìN]

Texto:
{mensaje}
"""
    return llamada_api_con_retry(prompt)

In [59]:
# --- 3. Funci√≥n para responder preguntas espec√≠ficas (QA) ---
def responder_preguntas(row):
    mensaje = row['mensaje']
    prompt = f"""Basado en el siguiente texto, respond√© las siguientes preguntas en formato de lista:
Texto: {mensaje}

Preguntas:
- ¬øQu√© producto menciona el cliente?
- ¬øCu√°l es el problema principal del cliente?
- ¬øD√≥nde ocurri√≥ el problema?
- ¬øSe menciona alg√∫n n√∫mero de pedido?

Formato de respuesta:
[Producto: <respuesta>, Problema: <respuesta>, Ubicaci√≥n: <respuesta>, Pedido: <respuesta>]
Si la informaci√≥n no est√° disponible, respond√© "No especificado".
"""
    return llamada_api_con_retry(prompt)

## Generaci√≥n de Respuesta Autom√°tica

In [60]:
# --- 1. Funci√≥n para generar respuesta de atenci√≥n al cliente ---
def respuesta_per(row):
    mensaje = row['mensaje']
    prompt = f"""Basado en el siguiente mensaje, redact√° una respuesta del servicio al cliente. La respuesta tiene que ser
emp√°tica, debe reconocer el problema y sugerir el siguiente paso. No debe tener m√°s de 4 l√≠neas.

Texto: {mensaje}
"""
    return llamada_api_con_retry(prompt)

In [62]:
# --- 2. Aplicamos las funciones al DataFrame ---
df_tickets['entidades'] = df_tickets.apply(analizar_entidades, axis=1)
df_tickets['respuestas_qa'] = df_tickets.apply(responder_preguntas, axis=1)
df_tickets['respuesta_llm'] = df_tickets.apply(respuesta_per, axis=1)

In [63]:
# --- 6. Visualizamos resultados para verificar ---
for i, fila in df_tickets.iterrows():
    print(f"Ticket #{i+1}:")
    print(f"Mensaje: {fila['mensaje']}")
    print(f"Entidades extra√≠das:\n{fila['entidades']}")
    print(f"Respuestas a preguntas:\n{fila['respuestas_qa']}")
    print(f"Respuesta generada por LLM:\n{fila['respuesta_llm']}")
    print("-" * 50)

Ticket #1:
Mensaje: La cafetera lleg√≥ hecha pelota, una verg√ºenza. ¬øQui√©n embala estas cosas?
Entidades extra√≠das:
Aqu√≠ est√°n las entidades nombradas y sus categor√≠as:

*   **Ninguna entidad nombrada identificada** ‚Üí **Ninguna categor√≠a** ‚Üí El texto no contiene nombres propios de personas, lugares, organizaciones o miscel√°neos.
Respuestas a preguntas:
[Producto: Cafetera, Problema: La cafetera lleg√≥ da√±ada, Ubicaci√≥n: No especificado, Pedido: No especificado]
Respuesta generada por LLM:
Lamentamos mucho que tu cafetera haya llegado da√±ada. Es una clara falta de cuidado.

Por favor, contacta a nuestro equipo de soporte t√©cnico con fotos del da√±o y el n√∫mero de pedido. 
Te asistiremos con la resoluci√≥n a la brevedad.
--------------------------------------------------
Ticket #2:
Mensaje: Todo perfecto, la entrega fue rapid√≠sima. Gracias por la atenci√≥n.
Entidades extra√≠das:
El mensaje no contiene ninguna entidad nombrada.
Respuestas a preguntas:
[Producto: No espe

### Conclusiones:

* Las entidades nombradas se extraen correctamente en casos donde hay marcas, c√≥digos o n√∫meros de pedido.
Por ejemplo: ‚ÄúBGH‚Äù como organizaci√≥n, ‚Äú#90876‚Äù como n√∫mero de pedido, ‚ÄúMotorola G200‚Äù como misc.

* Para textos m√°s informales o con lenguaje com√∫n (sin nombres propios), el modelo indica correctamente que no hay entidades nombradas.
Eso evita ruido en el an√°lisis.

* Las respuestas del LLM se ven emp√°ticas y contextuales, con reconocimiento del problema y sugerencias claras para el cliente.
El tono es adecuado y respetuoso, lo que mejora la experiencia.

* La extracci√≥n de info clave (producto, problema, ubicaci√≥n, pedido) es precisa y √∫til para automatizar tareas de clasificaci√≥n o asignaci√≥n.

* Se identifican bien casos sin datos espec√≠ficos, lo que permite pedir m√°s informaci√≥n cuando hace falta.

## Interfaz Interactiva con Gradio

In [64]:
# --- 1. Funci√≥n principal para interfaz ---

def procesar_ticket(mensaje):
    row = {"mensaje": mensaje}
    try:
        sentimiento = clasificar_sentimiento(row)
        categoria = clasificar_categoria(row)
        ner = analizar_entidades(row)
        qa = responder_preguntas(row)
        respuesta = respuesta_per(row)
    except Exception as e:
        error_msg = f"Error al procesar el mensaje: {str(e)}"
        return error_msg, error_msg, error_msg, error_msg, error_msg

    return sentimiento, categoria, ner, qa, respuesta

In [65]:
# --- 2. Ejemplos ---

ejemplos = [
    ["La cafetera lleg√≥ hecha pelota, una verg√ºenza. ¬øQui√©n embala estas cosas?"],
    ["¬øCu√°ndo reponen el celular Motorola G200? Estoy esperando."],
    ["Gracias, el paquete lleg√≥ a tiempo y perfecto."],
    ["No puedo entrar a mi cuenta desde ayer, me tira error 503."],
    ["Ped√≠ una tablet negra y me mandaron la blanca, ¬øc√≥mo lo soluciono?"],
]

In [66]:
# --- 3. Interfaz Gradio ---

iface = gr.Interface(
    fn=procesar_ticket,
    inputs=gr.Textbox(lines=4, label="üì® Mensaje del cliente"),
    outputs=[
        gr.Textbox(label="üé≠ Sentimiento"),
        gr.Textbox(label="üìÇ Categor√≠a"),
        gr.Textbox(label="üß† Entidades extra√≠das"),
        gr.Textbox(label="‚ùì Preguntas clave (QA)"),
        gr.Textbox(lines=4, label="ü§ñ Respuesta generada"),
    ],
    examples=ejemplos,
    title="ü§ù Asistente de Atenci√≥n al Cliente",
    description="Ingres√° un mensaje de cliente y el sistema analizar√° sentimiento, categor√≠a, entidades, preguntas clave y generar√° una respuesta emp√°tica.",
    theme="soft"
)

In [None]:
iface.launch(debug=True)

It looks like you are running Gradio on a hosted a Jupyter notebook. For the Gradio app to work, sharing must be enabled. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
* Running on public URL: https://87c031f05b5cb99b85.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


## Conclusiones

La implementaci√≥n del Asistente de Atenci√≥n al Cliente Inteligente ha demostrado ser exitosa y funcional, integrando an√°lisis automatizado de lenguaje natural con una interfaz intuitiva. El sistema es capaz de:

* Comprender e interpretar mensajes de clientes:

    - Detecta el sentimiento emocional del mensaje (positivo, negativo, neutro).

    - Clasifica autom√°ticamente el mensaje dentro de categor√≠as de atenci√≥n (reclamos, consultas, agradecimientos, etc.).

    - Extrae entidades clave como productos, marcas, n√∫meros de pedido o errores t√©cnicos.

    - Responde preguntas fundamentales con base en el texto.

    - Genera una respuesta emp√°tica, concisa y orientada a la acci√≥n, lista para ser enviada.

* Beneficios concretos:

    - Acelera el proceso de triage de tickets.

    - Mejora la consistencia en las respuestas al cliente.

    - Permite detectar autom√°ticamente casos urgentes o repetitivos.

    - Aporta estructura y comprensi√≥n sem√°ntica a mensajes no estructurados.

* Interfaz interactiva:

    - F√°cil de usar para operadores de atenci√≥n al cliente o supervisores.

    - Incluye ejemplos predefinidos y puede ser extendida con nuevos casos.

    - Corre localmente o puede ser desplegada en plataformas web.

Si bien este tipo de soluciones puede mejorar significativamente la eficiencia en la gesti√≥n de tickets, consideramos que es importante destacar que:

* No reemplaza completamente la intervenci√≥n humana.

* Los modelos pueden cometer errores de interpretaci√≥n, especialmente en textos ambiguos, ir√≥nicos o culturalmente espec√≠ficos.

* Los casos delicados o emocionales requieren empat√≠a real y toma de decisiones humanas.

* El sistema debe ser utilizado como una herramienta de apoyo, que agiliza el trabajo, pero no elimina la necesidad de criterio profesional.