# Sistema de Detección de Reclamos y Soporte Automático
### Desarrollamos un prototipo para gestionar tickets de soporte en e-commerce.

**1.	Simulación/Creación de Datos:**

•	Crear un dataset simulado de 10-15 "tickets de soporte" (textos cortos, de 2-5 oraciones cada uno) que contengan opiniones sobre productos o servicios.

•	Asegúrense de que haya una mezcla de sentimientos (positivos, negativos, neutrales) y que incluyan algunos casos con modismos o jerga argentina.

•	Etiquetar manualmente cada ticket con su sentimiento (Positivo, Negativo, Neutro) y al menos 3-5 categorías de queja/consulta (ej. "Problema de Envío", "Producto Defectuoso", "Consulta de Stock", "Elogio", "Consulta de Facturación").


In [2]:
import pandas as pd

In [3]:
tickets = [
    {
        "ticket_id": 1,
        "texto": "Me llamo José y quiero reclamar porque el producto llegó re tarde y encima estaba roto. Mucha bronca.",
        "sentimiento_manual": "Negativo",
    },
    {
        "ticket_id": 2,
        "texto": "Che, hace 5 días hice el pedido y no me mandaron ni un mail. ¿Qué onda?",
        "sentimiento_manual": "Negativo",
    },
    {
        "ticket_id": 3,
        "texto": "Hola Amigos, quería saber si tienen stock del parlante JBL que figura agotado.",
        "sentimiento_manual": "Neutro",
    },
    {
        "ticket_id": 4,
        "texto": "Me llegó todo perfecto y en tiempo récord. ¡Son unos genios! Gracias MercadoLibre.",
        "sentimiento_manual": "Positivo",
    },
    {
        "ticket_id": 5,
        "texto": "Quiero que me manden la factura A de la compra que hice ayer.",
        "sentimiento_manual": "Neutro",
    },
    {
        "ticket_id": 6,
        "texto": "El cargador no funciona. Lo probé en tres enchufes y nada. Devuelvan la plata.",
        "sentimiento_manual": "Negativo",
    },
    {
        "ticket_id": 7,
        "texto": "Tardaron un montón en enviarlo, pero llegó bien. Más o menos.",
        "sentimiento_manual": "Neutro",
    },
    {
        "ticket_id": 8,
        "texto": "Quiero ver el resumen de compra y la garantía del producto",
        "sentimiento_manual": "Neutro",
    },
    {
        "ticket_id": 9,
        "texto": "El servicio al cliente es impecable. Me resolvieron todo en dos minutos.",
        "sentimiento_manual": "Positivo",
    },
    {
        "ticket_id": 10,
        "texto": "Compré un celular y me llegó un modelo destrozado. ¡¿Qué están haciendo?! Quiero uno nuevo.",
        "sentimiento_manual": "Negativo",
    }
]

In [4]:
categoria_manual = ["Producto Defectuoso", "Elogio", "Consulta de Facturación", "Problema de Envío", "Consulta de Stock"]

In [5]:
# Asignamos una "caterogia_manual" para cada ticket_id
tickets_con_categoria_manual = [
    {
        "ticket_id": 1,
        "texto": "Me llamo José y quiero reclamar porque el producto llegó re tarde y encima estaba roto. Mucha bronca.",
        "sentimiento_manual": "Negativo",
        "categoría_manual": "Producto Defectuoso"
    },
    {
        "ticket_id": 2,
        "texto": "Che, hace 5 días hice el pedido y no me mandaron ni un mail. ¿Qué onda?",
        "sentimiento_manual": "Negativo",
        "categoría_manual": "Problema de Envío"
    },
    {
        "ticket_id": 3,
        "texto": "Hola Amigos, quería saber si tienen stock del parlante JBL que figura agotado.",
        "sentimiento_manual": "Neutro",
        "categoría_manual": "Consulta de Stock"
    },
    {
        "ticket_id": 4,
        "texto": "Me llegó todo perfecto y en tiempo récord. ¡Son unos genios!",
        "sentimiento_manual": "Positivo",
        "categoría_manual": "Elogio"
    },
    {
        "ticket_id": 5,
        "texto": "Necesito que me manden la factura A de la compra que hice ayer.",
        "sentimiento_manual": "Neutro",
        "categoría_manual": "Consulta de Facturación"
    },
    {
        "ticket_id": 6,
        "texto": "El cargador no funciona. Lo probé en tres enchufes y nada. Devuelvan la plata.",
        "sentimiento_manual": "Negativo",
        "categoría_manual": "Producto Defectuoso"
    },
    {
        "ticket_id": 7,
        "texto": "Tardaron un montón en enviarlo, pero llegó bien. Más o menos.",
        "sentimiento_manual": "Neutro",
        "categoría_manual": "Problema de Envío"
    },
    {
        "ticket_id": 8,
        "texto": "Quiero ver el resumen de compra y la garantía del producto",
        "sentimiento_manual": "Neutro",
        "categoría_manual": "Consulta de Facturación"
    },
    {
        "ticket_id": 9,
        "texto": "El servicio al cliente es impecable. Me resolvieron todo en dos minutos.",
        "sentimiento_manual": "Positivo",
        "categoría_manual": "Elogio"
    },
    {
        "ticket_id": 10,
        "texto": "Compré un celular y me llegó un modelo destrozado. ¡¿Qué están haciendo?! Quiero uno nuevo.",
        "sentimiento_manual": "Negativo",
        "categoría_manual": "Producto Defectuoso"
    }
]

In [6]:
# Visualizamos los tickets con "categoria_manual" en formato DF
df = pd.DataFrame(tickets_con_categoria_manual)
df

Unnamed: 0,ticket_id,texto,sentimiento_manual,categoría_manual
0,1,Me llamo José y quiero reclamar porque el prod...,Negativo,Producto Defectuoso
1,2,"Che, hace 5 días hice el pedido y no me mandar...",Negativo,Problema de Envío
2,3,"Hola Amigos, quería saber si tienen stock del ...",Neutro,Consulta de Stock
3,4,Me llegó todo perfecto y en tiempo récord. ¡So...,Positivo,Elogio
4,5,Necesito que me manden la factura A de la comp...,Neutro,Consulta de Facturación
5,6,El cargador no funciona. Lo probé en tres ench...,Negativo,Producto Defectuoso
6,7,"Tardaron un montón en enviarlo, pero llegó bie...",Neutro,Problema de Envío
7,8,Quiero ver el resumen de compra y la garantía ...,Neutro,Consulta de Facturación
8,9,El servicio al cliente es impecable. Me resolv...,Positivo,Elogio
9,10,Compré un celular y me llegó un modelo destroz...,Negativo,Producto Defectuoso


IMPORTAMOS LAS LIBRERÍAS Y MODELOS QUE VAMOS A UTILIZAR

In [7]:
# transformers: es el nombre del paquete de Python que se está instalando. Esta biblioteca, desarrollada por Hugging Face, proporciona modelos de aprendizaje automático
# de última generación, particularmente para tareas de procesamiento del lenguaje natural.
!pip install -q transformers

In [8]:
# Esta línea específica importa la función pipeline de la biblioteca transformers. La función pipeline es una función de ayuda de alto nivel proporcionada por Hugging Face
# que facilita enormemente el uso de diversos modelos pre-entrenados para tareas comunes sin necesidad de escribir mucho código complejo.
# Abstrae los detalles de la carga del modelo, la tokenización del texto de entrada y la ejecución del modelo para obtener predicciones.
from transformers import pipeline

**2.	Detección de Sentimiento y Clasificación Zero-Shot:**

•	Aplicar un modelo preentrenado de análisis de sentimiento (Hugging Face finiteautomata/beto-sentiment-analysis o Gemini API) para clasificar la polaridad de cada ticket.

•	Utilizar la clasificación zero-shot de Hugging Face (Recognai/bert-base-spanish-wwm-cased-xnli) o Gemini API para categorizar cada ticket en las categorías predefinidas manualmente (sin necesidad de entrenamiento del clasificador).

•	Comparar los resultados del sentimiento y la clasificación zero-shot del modelo con sus etiquetas manuales, comentando las discrepancias.


In [9]:
# Esta línea crea un pipeline configurado para "análisis de sentimiento" (sentiment analysis).
# "sentiment-analysis": Esto especifica la tarea: determinar el tono emocional del texto (por ejemplo, positivo, negativo, neutral).
# model="finiteautomata/beto-sentiment-analysis": Esto especifica el modelo pre-entrenado a utilizar para el análisis de sentimiento. El pipeline cargará el modelo finiteautomata/beto-sentiment-analysis, que es un modelo específicamente ajustado (fine-tuned) para el análisis de sentimiento en español. Una vez que esta línea se ejecuta, la variable sentiment_classifier contiene una herramienta lista para usar para analizar el sentimiento de texto en español. Luego, puedes pasar cadenas de texto a este objeto sentiment_classifier, y te devolverá un resultado que indica el sentimiento y su puntuación de confianza.
sentiment_classifier = pipeline("sentiment-analysis", model="finiteautomata/beto-sentiment-analysis")

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/841 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/440M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/439M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/528 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/242k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/481k [00:00<?, ?B/s]

added_tokens.json:   0%|          | 0.00/67.0 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

Device set to use cuda:0


In [10]:
for ticket in tickets:
  print(f"{ticket} → {sentiment_classifier(ticket['texto'])}")

{'ticket_id': 1, 'texto': 'Me llamo José y quiero reclamar porque el producto llegó re tarde y encima estaba roto. Mucha bronca.', 'sentimiento_manual': 'Negativo'} → [{'label': 'NEG', 'score': 0.9980230331420898}]
{'ticket_id': 2, 'texto': 'Che, hace 5 días hice el pedido y no me mandaron ni un mail. ¿Qué onda?', 'sentimiento_manual': 'Negativo'} → [{'label': 'NEG', 'score': 0.9973688125610352}]
{'ticket_id': 3, 'texto': 'Hola Amigos, quería saber si tienen stock del parlante JBL que figura agotado.', 'sentimiento_manual': 'Neutro'} → [{'label': 'NEU', 'score': 0.9981656670570374}]
{'ticket_id': 4, 'texto': 'Me llegó todo perfecto y en tiempo récord. ¡Son unos genios! Gracias MercadoLibre.', 'sentimiento_manual': 'Positivo'} → [{'label': 'POS', 'score': 0.9984877109527588}]
{'ticket_id': 5, 'texto': 'Quiero que me manden la factura A de la compra que hice ayer.', 'sentimiento_manual': 'Neutro'} → [{'label': 'NEU', 'score': 0.998803973197937}]
{'ticket_id': 6, 'texto': 'El cargador no 

In [11]:
# 1. Inicializar una lista para almacenar los resultados
resultados_sentimiento = []

# 2. Iterar sobre los tickets y almacenar los resultados
for ticket in tickets:
  prediccion_sentimiento = sentiment_classifier(ticket['texto'])[0] # Obtenemos el primer resultado
  resultados_sentimiento.append({
      'ticket_id': ticket['ticket_id'],
      'texto': ticket['texto'],
      'sentimiento_manual': ticket['sentimiento_manual'],
      'sentimiento_predicho_label': prediccion_sentimiento['label'],
      'sentimiento_predicho_score': prediccion_sentimiento['score']
  })

# 3. Crear un DataFrame a partir de la lista
df_sentimiento = pd.DataFrame(resultados_sentimiento)


# Puedes añadir una columna para comparar directamente
df_sentimiento['coincide'] = df_sentimiento['sentimiento_manual'] == df_sentimiento['sentimiento_predicho_label'].replace({'POS': 'Positivo', 'NEG': 'Negativo', 'NEU': 'Neutro'})

# Visualizar con la columna de coincidencia
display(df_sentimiento)

You seem to be using the pipelines sequentially on GPU. In order to maximize efficiency please use a dataset


Unnamed: 0,ticket_id,texto,sentimiento_manual,sentimiento_predicho_label,sentimiento_predicho_score,coincide
0,1,Me llamo José y quiero reclamar porque el prod...,Negativo,NEG,0.998023,True
1,2,"Che, hace 5 días hice el pedido y no me mandar...",Negativo,NEG,0.997369,True
2,3,"Hola Amigos, quería saber si tienen stock del ...",Neutro,NEU,0.998166,True
3,4,Me llegó todo perfecto y en tiempo récord. ¡So...,Positivo,POS,0.998488,True
4,5,Quiero que me manden la factura A de la compra...,Neutro,NEU,0.998804,True
5,6,El cargador no funciona. Lo probé en tres ench...,Negativo,NEG,0.99834,True
6,7,"Tardaron un montón en enviarlo, pero llegó bie...",Neutro,POS,0.990449,False
7,8,Quiero ver el resumen de compra y la garantía ...,Neutro,NEU,0.991872,True
8,9,El servicio al cliente es impecable. Me resolv...,Positivo,POS,0.997405,True
9,10,Compré un celular y me llegó un modelo destroz...,Negativo,NEG,0.99918,True


---

### Análisis de Resultados: Clasificación de Sentimiento

Se evaluó el rendimiento del modelo `pysentimiento/robertuito-sentiment-analysis` sobre un conjunto de 10 tickets de soporte previamente etiquetados de forma manual con una de las siguientes categorías de sentimiento: **Positivo**, **Negativo** o **Neutro**.

#### Resultados generales:

* **Total de tickets analizados:** 10
* **Predicciones correctas:** 9
* **Predicciones incorrectas:** 1
* **Exactitud (accuracy):** 90%

#### Análisis de casos:

| Ticket | Sentimiento Manual | Sentimiento Predicho | Coincidencia |
| ------ | ------------------ | -------------------- | ------------ |
| 0      | Negativo           | NEG                  | ✔ True       |
| 1      | Negativo           | NEG                  | ✔ True       |
| 2      | Neutro             | NEU                  | ✔ True       |
| 3      | Positivo           | POS                  | ✔ True       |
| 4      | Neutro             | NEU                  | ✔ True       |
| 5      | Negativo           | NEG                  | ✔ True       |
| 6      | Neutro             | POS                  | ✖ False      |
| 7      | Neutro             | NEU                  | ✔ True       |
| 8      | Positivo           | POS                  | ✔ True       |
| 9      | Negativo           | NEG                  | ✔ True       |

#### Observaciones:

* La mayoría de las predicciones muestran **altos niveles de confianza** (scores entre 0.98 y 0.99).
* El único error se produjo en el **ticket 6**, etiquetado como *Neutro* pero predicho como *Positivo*. Este tipo de confusión es frecuente en mensajes ambiguos o que combinan descripciones de hechos con alguna expresión de alivio o mejora (por ejemplo: “tardaron un montón en enviarlo, pero llegó bien”).
* El modelo demuestra una **muy buena capacidad para identificar sentimientos negativos**, lo cual es especialmente útil en el contexto de soporte al cliente.

#### Conclusión:

El modelo de análisis de sentimiento en español utilizado es altamente eficaz para distinguir entre mensajes positivos, negativos y neutros en el dominio de soporte e-commerce. No obstante, pueden producirse errores cuando los textos contienen información mixta o expresiones ambiguas. A futuro, podría incorporarse un ajuste de umbrales o procesamiento contextual adicional para mejorar la precisión en estos casos límite.

---


In [12]:
# Esta línea de código está creando una instancia de un modelo de clasificación de texto utilizando la función pipeline de la biblioteca transformers. Específicamente, está configurando un clasificador que puede realizar "clasificación de disparo cero" (zero-shot-classification).
# "zero-shot-classification": Este argumento especifica el tipo de tarea de procesamiento del lenguaje natural que realizará el pipeline. La clasificación de disparo cero significa que el modelo puede clasificar texto en categorías (etiquetas) incluso si no ha sido entrenado explícitamente en esas categorías específicas. Se le proporcionan las posibles categorías en el momento de la inferencia.
# model="Recognai/bert-base-spanish-wwm-cased-xnli": Este argumento especifica el modelo pre-entrenado que se utilizará para la tarea. En este caso, se está utilizando el modelo Recognai/bert-base-spanish-wwm-cased-xnli. Este es un modelo basado en BERT que ha sido entrenado para comprender el lenguaje español y es adecuado para tareas de clasificación. Al especificar este nombre, la función pipeline se encarga de descargar y cargar automáticamente los pesos y la configuración de este modelo si no están ya disponibles localmente.
zero_shot_classifier = pipeline("zero-shot-classification", model="Recognai/bert-base-spanish-wwm-cased-xnli")

config.json:   0%|          | 0.00/834 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/439M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/528 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/242k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

Device set to use cuda:0


In [13]:
for ticket in tickets:
  print(f"{ticket} → {zero_shot_classifier(ticket['texto'], candidate_labels=categoria_manual)}")

{'ticket_id': 1, 'texto': 'Me llamo José y quiero reclamar porque el producto llegó re tarde y encima estaba roto. Mucha bronca.', 'sentimiento_manual': 'Negativo'} → {'sequence': 'Me llamo José y quiero reclamar porque el producto llegó re tarde y encima estaba roto. Mucha bronca.', 'labels': ['Consulta de Stock', 'Elogio', 'Problema de Envío', 'Producto Defectuoso', 'Consulta de Facturación'], 'scores': [0.48223793506622314, 0.27605175971984863, 0.15145717561244965, 0.06837689131498337, 0.021876266226172447]}
{'ticket_id': 2, 'texto': 'Che, hace 5 días hice el pedido y no me mandaron ni un mail. ¿Qué onda?', 'sentimiento_manual': 'Negativo'} → {'sequence': 'Che, hace 5 días hice el pedido y no me mandaron ni un mail. ¿Qué onda?', 'labels': ['Elogio', 'Problema de Envío', 'Consulta de Stock', 'Consulta de Facturación', 'Producto Defectuoso'], 'scores': [0.2901150584220886, 0.27021175622940063, 0.21544449031352997, 0.16546235978603363, 0.05876632779836655]}
{'ticket_id': 3, 'texto': 'H

In [14]:
# Asegúrate de que la lista de categorías esté definida
# categoria_manual = ["Producto Defectuoso", "Elogio", "Consulta de Facturación", "Problema de Envío", "Consulta de Stock"]

# 1. Inicializar una lista para almacenar los resultados
resultados_zero_shot = []

# 2. Iterar sobre los tickets y obtener las predicciones zero-shot
for ticket in tickets_con_categoria_manual: # Usamos tickets_con_categoria_manual si tienes las categorías manuales en esa lista
  prediccion_zero_shot = zero_shot_classifier(ticket['texto'], candidate_labels=categoria_manual) # Aplicamos el clasificador

  # Obtenemos la etiqueta con el score más alto
  etiqueta_predicha = prediccion_zero_shot['labels'][0]
  score_predicho = prediccion_zero_shot['scores'][0]


  # 3. Almacenar los resultados
  resultados_zero_shot.append({
      'ticket_id': ticket['ticket_id'],
      'texto': ticket['texto'],
      'categoria_manual': ticket['categoría_manual'], # Usamos la categoría manual de la lista
      'categoria_predicha_label': etiqueta_predicha,
      'categoria_predicha_score': score_predicho
  })

# 4. Crear un DataFrame a partir de la lista
df_zero_shot = pd.DataFrame(resultados_zero_shot)

# 5. Comparar los resultados (Opcional)
df_zero_shot['coincide'] = df_zero_shot['categoria_manual'] == df_zero_shot['categoria_predicha_label']

# Visualizar el DataFrame
display(df_zero_shot)

Unnamed: 0,ticket_id,texto,categoria_manual,categoria_predicha_label,categoria_predicha_score,coincide
0,1,Me llamo José y quiero reclamar porque el prod...,Producto Defectuoso,Consulta de Stock,0.482238,False
1,2,"Che, hace 5 días hice el pedido y no me mandar...",Problema de Envío,Elogio,0.290115,False
2,3,"Hola Amigos, quería saber si tienen stock del ...",Consulta de Stock,Consulta de Stock,0.592894,True
3,4,Me llegó todo perfecto y en tiempo récord. ¡So...,Elogio,Elogio,0.967574,True
4,5,Necesito que me manden la factura A de la comp...,Consulta de Facturación,Consulta de Facturación,0.415121,True
5,6,El cargador no funciona. Lo probé en tres ench...,Producto Defectuoso,Consulta de Stock,0.342654,False
6,7,"Tardaron un montón en enviarlo, pero llegó bie...",Problema de Envío,Problema de Envío,0.530729,True
7,8,Quiero ver el resumen de compra y la garantía ...,Consulta de Facturación,Consulta de Stock,0.635158,False
8,9,El servicio al cliente es impecable. Me resolv...,Elogio,Elogio,0.348007,True
9,10,Compré un celular y me llegó un modelo destroz...,Producto Defectuoso,Producto Defectuoso,0.377156,True



## 📊 **Resumen general**

| Resultado     | Total | Tickets con error                    |
| ------------- | ----- | ------------------------------------ |
|  Correctos   | 6     | Tickets: 2, 3, 4, 5, 7, 9            |
|  Incorrectos | 4     | Tickets: 0, 1, 5, 7 (errores nuevos) |

* Los números referenciados corresponden con el index_id, no el ticket_id.
---

##  **Casos con errores de clasificación (False)**

###  Ticket 0

* **Manual:** Producto Defectuoso
* **Predicho:** Consulta de Stock
* **Score:** 0.48
* **Análisis:** El texto menciona “reclamar porque el producto…”, pero quizás no usa la palabra “defectuoso” o una que indique mal funcionamiento. El modelo interpreta mal la intención.

---

###  Ticket 1

* **Manual:** Problema de Envío
* **Predicho:** Elogio
* **Score:** 0.29
* **Análisis:** El score es muy bajo, lo que sugiere **alta incertidumbre del modelo**. Probablemente el tono del texto era neutral o ambiguo, como: “no me mandaron nada todavía”, sin expresar molestia directa.

---

###  Ticket 5

* **Manual:** Producto Defectuoso
* **Predicho:** Consulta de Stock
* **Score:** 0.34
* **Análisis:** El texto dice que “el cargador no funciona”, pero el modelo puede estar malinterpretando “producto” como una consulta y no un reclamo. La baja confianza lo confirma.

---

###  Ticket 7

* **Manual:** Consulta de Facturación
* **Predicho:** Consulta de Stock
* **Score:** 0.63
* **Análisis:** Esta es una falsa predicción con **score alto**. Probablemente porque el texto menciona productos o pedidos sin usar la palabra "factura". Esto genera confusión.

---

##  **Casos correctamente clasificados (True)**

* **Ticket 2 (Consulta de Stock)** y **Ticket 3 (Elogio)**: fueron bien interpretados con buena confianza.
* **Ticket 4 (Consulta de Facturación)**: predicción correcta con score medio (0.41).
* **Ticket 6 (Problema de Envío)**: predicción exacta con score 0.53.
* **Ticket 8 (Elogio)**: aunque el score fue bajo (0.34), la predicción fue acertada.
* **Ticket 9 (Producto Defectuoso)**: clasificado correctamente.

---

##  Observaciones clave

| Observación                                                            | Ejemplo         |
| ---------------------------------------------------------------------- | --------------- |
|  El modelo falla más con reclamos técnicos ambiguos                   | Tickets 0 y 5   |
|  El modelo **confunde stock con facturación**                         | Ticket 7        |
|  El modelo tiene **baja seguridad (< 0.5)** en la mayoría de errores | Tickets 0, 1, 5 |
|  Mejores aciertos son en elogios y consultas directas                 | Ticket 3, 4, 8  |

---


**3.	Extracción de Información Clave (NER/QA):**

•	Para cada ticket, identificar y extraer entidades relevantes (ej. nombres de productos, números de pedido simulados, nombres de clientes, ciudades). Pueden usar un pipeline de NER o intentar con Question Answering.

•	Formular una pregunta automática por ticket (ej. "¿Cuál es el problema principal?", "¿Qué producto menciona el cliente?") y usar un modelo de Question Answering (Hugging Face PlanTL-GOB-ES/roberta-large-bne-sqac o similar) para extraer la respuesta principal.


In [15]:
# ner_tagger: Este es el nombre de la variable que almacenará el pipeline de NER configurado. Podrás usar esta variable más adelante para procesar texto y extraer entidades nombradas.
# pipeline(...): Esta es la función de la biblioteca transformers utilizada para configurar rápidamente tareas de PLN listas para usar.
# "ner": Este argumento especifica el tipo de tarea que quieres que el pipeline realice, que es el Reconocimiento de Entidades Nombradas. NER es la tarea de identificar y clasificar entidades nombradas en el texto dentro de categorías predefinidas, como nombres de personas, organizaciones, ubicaciones, etc.
# model="mrm8488/bert-spanish-cased-finetuned-ner": Este argumento especifica el modelo pre-entrenado que el pipeline utilizará para la tarea de NER. En este caso, está utilizando un modelo llamado "mrm8488/bert-spanish-cased-finetuned-ner". Este modelo en particular es una versión del modelo BERT que ha sido fine-tuned (ajustado) específicamente para reconocer entidades nombradas en texto en español. La función pipeline se encarga de descargar y cargar este modelo automáticamente.
# aggregation_strategy="simple": Este argumento especifica cómo se manejan las entidades superpuestas o adyacentes. La estrategia "simple" es un enfoque común para agregar predicciones a nivel de token en predicciones a nivel de entidad.
ner_tagger = pipeline("ner", model="mrm8488/bert-spanish-cased-finetuned-ner", aggregation_strategy="simple")

config.json:   0%|          | 0.00/829 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/439M [00:00<?, ?B/s]

Some weights of the model checkpoint at mrm8488/bert-spanish-cased-finetuned-ner were not used when initializing BertForTokenClassification: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForTokenClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForTokenClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


tokenizer_config.json:   0%|          | 0.00/136 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/439M [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/242k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

Device set to use cuda:0


In [16]:
df = pd.DataFrame(tickets)
df

Unnamed: 0,ticket_id,texto,sentimiento_manual
0,1,Me llamo José y quiero reclamar porque el prod...,Negativo
1,2,"Che, hace 5 días hice el pedido y no me mandar...",Negativo
2,3,"Hola Amigos, quería saber si tienen stock del ...",Neutro
3,4,Me llegó todo perfecto y en tiempo récord. ¡So...,Positivo
4,5,Quiero que me manden la factura A de la compra...,Neutro
5,6,El cargador no funciona. Lo probé en tres ench...,Negativo
6,7,"Tardaron un montón en enviarlo, pero llegó bie...",Neutro
7,8,Quiero ver el resumen de compra y la garantía ...,Neutro
8,9,El servicio al cliente es impecable. Me resolv...,Positivo
9,10,Compré un celular y me llegó un modelo destroz...,Negativo


In [17]:
tickets_texto = [ticket["texto"] for ticket in tickets]
texto = str(tickets_texto)

In [18]:
outputs = ner_tagger(texto)
pd.DataFrame(outputs)

Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.


Unnamed: 0,entity_group,score,word,start,end
0,PER,0.997716,José,11,15
1,MISC,0.770845,JBL,237,240
2,ORG,0.910313,MercadoLibre,333,345


**4.	Generación de Respuesta Personalizada:**

•	Para cada ticket (especialmente los clasificados como negativos o de "problema"), generar una respuesta de atención al cliente utilizando un LLM (Hugging Face transformers como datificate/gpt2-small-spanish o Gemini API).

•	La respuesta debe ser empática, reconocer el problema y sugerir un siguiente paso (ej. "Derivaremos su caso al área técnica", "Le contactaremos para más detalles"). La respuesta debe tener un límite de longitud (ej. 2-4 líneas) y, si es posible, intentar un tono amable y local.


In [19]:
reader = pipeline("question-answering", model="PlanTL-GOB-ES/roberta-large-bne-sqac")

config.json:   0%|          | 0.00/665 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/1.42G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/1.07k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.42G [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/858k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/516k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.48M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/772 [00:00<?, ?B/s]

Device set to use cuda:0


In [20]:
question = "¿Que respuesta podemos brindarle al cliente?"
all_outputs = []

# Itera a través de cada ticket
for ticket in tickets:
    # Aplica reader al texto del ticket
    output = reader(question=question, context=ticket["texto"])
    # Agrega el ticket_id al output para mejor claridad
    output['ticket_id'] = ticket['ticket_id']
    all_outputs.append(output)

# Crea un DataFrame desde la lista de outputs
# Cada fila va a corresponder a la respuesta de un ticket específico
df_answers = pd.DataFrame(all_outputs)

# Mostrar df_answers
display(df_answers)

Unnamed: 0,score,start,end,answer,ticket_id
0,0.011709,39,86,el producto llegó re tarde y encima estaba roto,1
1,0.022103,34,59,no me mandaron ni un mail,2
2,0.0713,20,25,saber,3
3,0.042444,0,41,Me llegó todo perfecto y en tiempo récord,4
4,0.036647,14,61,manden la factura A de la compra que hice ayer.,5
5,0.012439,0,57,El cargador no funciona. Lo probé en tres ench...,6
6,0.111644,0,47,"Tardaron un montón en enviarlo, pero llegó bien",7
7,0.146179,11,58,el resumen de compra y la garantía del producto,8
8,0.457258,37,71,Me resolvieron todo en dos minutos,9
9,0.023124,90,91,.,10


In [21]:
# Modelo de generación de texto en español
# DeepESP/gpt2-spanish es un GPT-2 entrenado desde cero con texto y un tokenizer en español.
generator = pipeline("text-generation", model="DeepESP/gpt2-spanish")

config.json:   0%|          | 0.00/914 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/261M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/261M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/115 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/840k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/499k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/262 [00:00<?, ?B/s]

Device set to use cuda:0


In [22]:
tickets_texto[0:1]
texto1 = str(tickets_texto[0:1])

In [23]:
response = "Estimado Cliente: Hemos recibido su reclamo y procedemos a tratarlo"
prompt = texto1 + "\n\nRespuesta del servicio al cliente:\n" + response
outputs = generator(prompt, max_length=100, do_sample=True, temperature=0.1, repetition_penalty=1.2) # Añadir parámetros para mejor generación
print(outputs[0]['generated_text'])

Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Both `max_new_tokens` (=256) and `max_length`(=100) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


['Me llamo José y quiero reclamar porque el producto llegó re tarde y encima estaba roto. Mucha bronca.']

Respuesta del servicio al cliente:
Estimado Cliente: Hemos recibido su reclamo y procedemos a tratarlo con respeto, pero no hemos llegado a nada. 

El señor de la casa: 

¿Qué es lo que quiere? 

Es una carta de un amigo mío en Madrid, que me ha enviado para decirle que se trata de una carta de un amigo suyo. 

La respuesta es sí o no. 

No hay ninguna carta de un amigo mío en Madrid. 

Tampoco hay carta de un amigo mío en Madrid. 

En este caso, ¿qué es lo que desea? 

Que le den por escrito a mi amigo. 

¡Ah!, ¡sí!, ¡no!, ¡es una carta de un amigo mío! 

Si usted no está aquí, yo le envío una carta de un amigo suyo en Madrid. 

Le ruego que me diga si tiene alguna carta de él en Madrid. 

Por favor, no me haga esperar más. 

Acepto. 

De acuerdo, pues, que me llame a mí. 

Lo haré. 

Y ahora, dígame qué es lo que desea. 

Se llama José y dice que es muy importante para mí. 

Jos

In [24]:
# Modelo en español
generadorGPT2 = pipeline("text-generation", model="datificate/gpt2-small-spanish")

# Primer renglón de la respuesta
respuesta_inicial = "Estimado Cliente: Hemos recibido su reclamo y procedemos a tratarlo."

# Prompt claro, sin repetir encabezado
prompt = (
    "Generá una respuesta breve, amable y profesional como si fueras un agente de atención al cliente "
    "de una tienda online. El cliente envió este reclamo:\n"
    f"\"{texto1}\"\n\n"
    "Respuesta (máximo 4 líneas):"
)

# Generación
outputs = generadorGPT2(
    prompt,
    max_new_tokens=75,
    do_sample=True,
    temperature=1.0,
    top_k=50,
    top_p=0.9,
    repetition_penalty=1.3,
    eos_token_id=50256  # token de final en GPT-2
)

# Mostrar resultado
print(outputs[0]['generated_text'])

config.json:   0%|          | 0.00/817 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/510M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/510M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/620 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/850k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/508k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/387 [00:00<?, ?B/s]

Device set to use cuda:0


Generá una respuesta breve, amable y profesional como si fueras un agente de atención al cliente de una tienda online. El cliente envió este reclamo:
"['Me llamo José y quiero reclamar porque el producto llegó re tarde y encima estaba roto. Mucha bronca.']"

Respuesta (máximo 4 líneas): "El producto llegó a la sala del cine en menos tiempo para su distribución antes de que se completara'su versión'.'." 

Reportaje / Realización oficial ("Innovación") –> "No tengo nada contigo más allá ahora". <> "La demanda es irresistible cuando un cliente te da crédito o si le dio crédito no lo


In [25]:
%pip install -U -q google-genai

[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/206.4 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m [32m204.8/206.4 kB[0m [31m10.6 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m206.4/206.4 kB[0m [31m5.0 MB/s[0m eta [36m0:00:00[0m
[?25h

In [26]:
from google.colab import userdata
import os

GOOGLE_API_KEY = userdata.get('GOOGLE_API_KEY')

In [27]:
from google import genai
from google.genai import types

cliente = genai.Client(api_key=GOOGLE_API_KEY)

In [28]:
# Texto base que utilizaremos para todos los ejemplos.

text_to_process = "Compré un celular y me llegó un modelo viejo. Quiero uno nuevo."

print("\nTexto de entrada definido.")


Texto de entrada definido.


In [29]:
MODEL_ID = "gemini-2.0-flash" # @param ["gemini-2.0-flash-lite","gemini-2.0-flash","gemini-2.5-flash-preview-05-20","gemini-2.5-pro-preview-05-06"] {"allow-input":true, isTemplate: true}

In [30]:
tickets_texto

['Me llamo José y quiero reclamar porque el producto llegó re tarde y encima estaba roto. Mucha bronca.',
 'Che, hace 5 días hice el pedido y no me mandaron ni un mail. ¿Qué onda?',
 'Hola Amigos, quería saber si tienen stock del parlante JBL que figura agotado.',
 'Me llegó todo perfecto y en tiempo récord. ¡Son unos genios! Gracias MercadoLibre.',
 'Quiero que me manden la factura A de la compra que hice ayer.',
 'El cargador no funciona. Lo probé en tres enchufes y nada. Devuelvan la plata.',
 'Tardaron un montón en enviarlo, pero llegó bien. Más o menos.',
 'Quiero ver el resumen de compra y la garantía del producto',
 'El servicio al cliente es impecable. Me resolvieron todo en dos minutos.',
 'Compré un celular y me llegó un modelo destrozado. ¡¿Qué están haciendo?! Quiero uno nuevo.']

In [31]:
df_negativos = df[df['sentimiento_manual'] == 'Negativo']
print(df_negativos)

   ticket_id                                              texto  \
0          1  Me llamo José y quiero reclamar porque el prod...   
1          2  Che, hace 5 días hice el pedido y no me mandar...   
5          6  El cargador no funciona. Lo probé en tres ench...   
9         10  Compré un celular y me llegó un modelo destroz...   

  sentimiento_manual  
0           Negativo  
1           Negativo  
5           Negativo  
9           Negativo  


In [32]:
textos_negativos = df_negativos['texto']

In [33]:
respuesta_inicial = "Estimado cliente, lamentamos mucho lo ocurrido con su pedido. "

# Iterar sobre cada ticket en la lista
for ticket_texto in textos_negativos:

    # Construir el prompt para el ticket actual
    prompt = f"""{ticket_texto}

    Redactá una respuesta del servicio de atención al cliente que comience así:

    "{respuesta_inicial}"

    Cuya extension no supere las 4 lineas.
    """

    try:
        # Generar la respuesta para el ticket actual
        respuesta = cliente.models.generate_content(
            model=MODEL_ID,
            contents=[prompt]
        )
        # Imprimir el texto del ticket y la respuesta generada
        print(f"Ticket: {ticket_texto}")
        print(f"Respuesta: {respuesta.text}\n---")
    except Exception as e:
        # Manejar posibles errores durante la generación
        print(f"Error al procesar ticket '{ticket_texto}': {e}\n---")

Ticket: Me llamo José y quiero reclamar porque el producto llegó re tarde y encima estaba roto. Mucha bronca.
Respuesta: Estimado cliente, lamentamos mucho lo ocurrido con su pedido. Entendemos su frustración por la demora y el daño al producto. Para darle una solución, por favor envíenos fotos del producto roto y el número de pedido. Lo contactaremos a la brevedad para coordinar el reemplazo o reembolso.

---
Ticket: Che, hace 5 días hice el pedido y no me mandaron ni un mail. ¿Qué onda?
Respuesta: Estimado cliente, lamentamos mucho lo ocurrido con su pedido. Estamos investigando qué pasó y por qué no recibió ninguna comunicación. Por favor, indíquenos su número de pedido para que podamos darle una solución lo antes posible. Le pedimos disculpas por las molestias ocasionadas.

---
Ticket: El cargador no funciona. Lo probé en tres enchufes y nada. Devuelvan la plata.
Respuesta: Estimado cliente, lamentamos mucho lo ocurrido con su pedido. Entendemos su frustración con el cargador. Para

**5.	Interfaz Interactiva (Obligatoria):**

Desarrollar una interfaz en Gradio que permita al usuario introducir un nuevo "ticket de soporte" y ver en tiempo real:

•	El sentimiento predicho del ticket.

•	La categoría predicha (zero-shot).

•	Las entidades o la respuesta clave extraída.

•	La respuesta generada por el LLM.


---

In [34]:
# Instalación de dependencias (solo si es necesario en Colab)
!pip install -q transformers gradio

In [35]:
from transformers import pipeline
import gradio as gr

In [36]:
# 1. Clasificación de sentimiento
sentiment_classifier_robertuito = pipeline("sentiment-analysis", model="pysentimiento/robertuito-sentiment-analysis")

def clasificar_sentimiento_es(texto):
    resultado = sentiment_classifier_robertuito(texto)[0]
    etiquetas = {"POS": "Positivo", "NEG": "Negativo", "NEU": "Neutral"}
    return f"{etiquetas[resultado['label']]} ({round(resultado['score'], 2)})"

config.json:   0%|          | 0.00/925 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/435M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/384 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.31M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/167 [00:00<?, ?B/s]

Device set to use cuda:0


In [37]:
# 2. Clasificación zero-shot
zero_shot_classifier = pipeline("zero-shot-classification", model="Recognai/bert-base-spanish-wwm-cased-xnli")

categorias = [
    "Problema de Envio",
    "Producto Defectuoso",
    "Consulta de Stock",
    "Elogio",
    "Consulta de Facturacion"
]

def clasificar_categoria_es(texto):
    resultado = zero_shot_classifier(texto, candidate_labels=categorias)
    return f"{resultado['labels'][0]} ({round(resultado['scores'][0], 2)})"

Device set to use cuda:0


In [38]:
# 3. Extracción de entidades (NER)
ner_pipeline = pipeline("ner", model="mrm8488/bert-spanish-cased-finetuned-ner", aggregation_strategy="simple")

def extraer_entidades_es(texto):
    entidades = ner_pipeline(texto)
    if not entidades:
        return "No se encontraron entidades."
    return ", ".join(set(ent["word"] for ent in entidades))

Some weights of the model checkpoint at mrm8488/bert-spanish-cased-finetuned-ner were not used when initializing BertForTokenClassification: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForTokenClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForTokenClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Device set to use cuda:0


In [39]:
# 4. Generación de respuesta automática
generador = pipeline("text-generation", model="datificate/gpt2-small-spanish")

def generar_respuesta_es(texto):
    prompt =
    f"\"{texto}\"\n\n"
    "Respuesta (máximo 4 líneas):"
)
    resultado = generador(prompt, max_new_tokens=50, do_sample=True, temperature=0.7)[0]['generated_text']
    respuesta = resultado.split("Respuesta:")[-1].strip()
    return respuesta

Device set to use cuda:0


In [40]:
# 5. Función general para Gradio
def procesar_ticket(texto):
    sentimiento = clasificar_sentimiento_es(texto)
    categoria = clasificar_categoria_es(texto)
    entidades = extraer_entidades_es(texto)
    respuesta = generar_respuesta_es(texto)
    return sentimiento, categoria, entidades, respuesta

In [41]:
# 6. Interfaz Gradio
gr.Interface(
    fn=procesar_ticket,
    inputs=gr.Textbox(label="Texto del Ticket de Soporte", lines=4),
    outputs=[
        gr.Textbox(label="Sentimiento Analizado"),
        gr.Textbox(label="Categoría Sugerida"),
        gr.Textbox(label="Entidades Identificadas"),
        gr.Textbox(label="Respuesta Generada")
    ],
    title="🧠 Análisis de Ticket de Soporte en Español",
    description="Analiza automáticamente el sentimiento, extrae entidades clave y sugiere una respuesta para un ticket de soporte utilizando modelos de Machine Learning en español."
).launch()

It looks like you are running Gradio on a hosted a Jupyter notebook. For the Gradio app to work, sharing must be enabled. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://3c2415cb8e1b9c86e6.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




In [42]:
def generar_respuesta_gemini(texto):
    """
    Generates a customer service response using the Gemini API.
    """
    respuesta_inicial = "Estimado cliente, lamentamos mucho lo ocurrido con su pedido. "

    prompt = f"""{texto}

    Redactá una respuesta del servicio de atención al cliente que comience así:

    "{respuesta_inicial}"

    Cuya extension no supere las 4 lineas.
    """

    try:
        respuesta = cliente.models.generate_content(
            model=MODEL_ID,
            contents=[prompt]
        )
        return respuesta.text
    except Exception as e:
        return f"Error generating response: {e}"

In [43]:
def procesar_ticket(texto):
    sentimiento = clasificar_sentimiento_es(texto)
    categoria = clasificar_categoria_es(texto)
    entidades = extraer_entidades_es(texto)
    # Usa la nueva función de Gemini
    respuesta = generar_respuesta_gemini(texto)
    return sentimiento, categoria, entidades, respuesta

In [44]:
# 6. Interfaz Gradio
gr.Interface(
    fn=procesar_ticket,
    inputs=gr.Textbox(label="Texto del Ticket de Soporte", lines=4),
    outputs=[
        gr.Textbox(label="Sentimiento Analizado"),
        gr.Textbox(label="Categoría Sugerida"),
        gr.Textbox(label="Entidades Identificadas"),
        gr.Textbox(label="Respuesta Generada")
    ],
    title="🧠 Análisis de Ticket de Soporte en Español",
    description="Analiza automáticamente el sentimiento, extrae entidades clave y sugiere una respuesta para un ticket de soporte utilizando modelos de Machine Learning en español."
).launch()

It looks like you are running Gradio on a hosted a Jupyter notebook. For the Gradio app to work, sharing must be enabled. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://9031e246bdd14af4a9.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


