# Sistema de Detección de Quejas y Soporte Automático para E-commerce


---



🎯 **Objetivo**: Construir un sistema prototipo para una empresa de e-commerce que busca automatizar la gestión de quejas y la respuesta inicial a clientes. El sistema debe ser capaz de identificar quejas, extraer información clave y generar una respuesta de servicio al cliente.

🧰 Herramientas que implementaremos:
 *  Pandas
 * Transformers de Hugging Face
 * Pipeline de Hugging Face
 * Gemini API
 * Gradio


## 1. Simulación/Creación de Datos

In [None]:
# Importamos pandas para manipulación de datos
import pandas as pd

In [None]:
# Generamos un diccionario con los datos necesarios para simular nuestro dataset
datos = {
    'tickets': [ 'La compra salió bien, pero el envío fue problemático. Les avisé del timbre roto en comentarios y por mensaje privado, así y todo el envío falló tres veces y no tengo novedades de cuando vuelvan a pasar. Respondan!!',
               'Compré un mousepad pero nunca llegó. El del envío estaba supuestamente cerca pero no avisó nada y ahora me aparece “en distribución”. Ya es la sexta vez que les escribo para que por favor solucionen mi problema, espero respuestas a la brevedad',
                'Estaba contento con la compra, pero el envío fue un desastre. Demoraron y venían en horarios donde me encuentro trabajando. Estaria bueno que mejoren el sistema porque arruina la experiencia',
                'Lo compré hace una semana y me fascinó. Ahora quiero comprarle uno a mi mamá, pero está agotado. ¿Cuándo estará disponible de nuevo?Muchas gracias',
                'Buenas tardes. Tengo una duda sobre la garantía del termotanque modelo ALPHA01 que compré hace dos meses. ¿Cubre fallas del regulador de temperatura? Es para saber si tengo que llevarlo o si mandan un técnico',
                'Hola! Tengo una consulta sobre el service del calefón, ¿hasta cuando me cubre la garantía? Porque no encuentro el ticket y creo que está necesitando una revisión. Gracias',
                'Buenas tardes. Me gustaría comprar el combo pero quisiera saber si tienen que ser si o si los mismos modelos o si se pueden elegir diferentes. Muchas gracias',
                'Che, estoy viendo la descripción de la tablet Modelo TabLite y no me queda claro si viene con cargador incluido. Me parece que no lo especifica. ¿Podrían confirmarme ese detalle? Gracias',
                'Gran decepción, las reseñas eran prometedoras pero la próxima vez voy a invertir mi dinero en algo de mejor calidad. Se ve bonito por fotos pero es puro plástico barato y el volumen no se puede subir mucho porque satura todo. Malisimo',
                'No vale la pena, no entiendo el atractivo de este producto. Puro chamuyo de marketing, hay mil opciones mejores hechas por manos argentinas con materia prima de verdad. Esperaba más.',
                'Tiene un gran tamaño y cocina todo realmente muy bien. Al momento de comprar buscamos alguna freidora que sea bien grande para estar cocinando de una y no en tandas y cumple con los requisitos. Estéticamente es muy linda y hace poco ruido, en poco tiempo tenes lista la comida. Trae una “pinza” que es un gran extra!. Súper recomendable',
                'Les recomiendo que no se priven de probar esta maravilla!! Excelente producto, práctico y con un gran diseño, ya que por el tamaño que tiene se puede guardar fácilmente en cualquier lugar. Se los recomiendo',
                'La silla es un lujo, me sorprendió en realidad no pensé que iba a resultar tan cómoda. La tela se puede lavar fácil asi que eso también suma. Además, me hicieron descuento en unos auriculares que me vinieron de diez. Lo recomiendo 100%',
                'Entré por una cosa y terminé llevando varios accesorios para mejorar mi espacio de trabajo. Los precios son una locura y la calidad es tremenda. Otro plus la atención al cliente, me despejaron dudas al instante. Gran compra',
                'Hola! Me gustaría saber si tienen otros colores disponibles y si varía el precio para una medida de 60x40. También quiero saber si puedo pasar a retirar. Muchas gracias'
                ],
    'nombre_cliente' : ['Juan', 'Luz', 'Mateo', 'Guadalupe', 'Alejandro', 'Pedro', 'Sofía', 'Franco', 'Roman',' Victoria', 'Cristina',' Ariel', 'Joaquina', 'Axel', 'Valentina'],

    'localidad_cliente' : ['La Plata', 'Flores', 'Almagro', 'Quilmes', 'Saavedra', 'Barracas', 'Boulogne', 'Escobar', 'Boedo', 'Caballito', 'Parque Avellaneda,',  'Almagro', 'Lomas del Mirador', 'Congreso', 'Balvanera'],

    'metodo_pago' : ['tarjeta de crédito', 'tarjeta de crédito',  'tarjeta de débito',  'transferencia bancaria',  'billetera digital',  'billetera digital',  'transferencia bancaria',  'tarjeta de crédito', 'tarjeta de crédito', 'tarjeta de crédito', 'tarjeta de crédito', 'tarjeta de débito', 'billetera digital', 'billetera digital',  'billetera digital'],

    'nombre_producto' : ['caloventor', 'mousepad', 'sillón', 'masajeador',' termotanque', 'calefón', 'kit brochas y espejo led', 'tablet', 'parlante bluetooth', 'lampara inalámbrica','freidora de aire', 'aspiradora', 'silla de escritorio y auriculares', 'auriculares/mouse/teclado/webcam', 'cajonera' ],

    'cant_pedidos' : [0,0,2,3,2,1,3,1,1,1,4,1,2,1,2],

    'etiquetas' : ['negativo','negativo','negativo','positivo','neutro','neutro','neutro','neutro','negativo', 'negativo','positivo', 'positivo','positivo','positivo', 'neutro'],

    'categorias' : ['problema de envío','problema de envío', 'problema de envío', 'consulta de stock','consulta de garantía','consulta de garantía', 'consulta de producto','consulta de producto','producto defectuoso', 'producto defectuoso', 'elogio','elogio','elogio','elogio','consulta de producto']




}

In [None]:
# Creamos el dataframe
df = pd.DataFrame(datos, index=range(len(datos['tickets'])))
df.head()

Unnamed: 0,tickets,nombre_cliente,localidad_cliente,metodo_pago,nombre_producto,cant_pedidos,etiquetas,categorias
0,"La compra salió bien, pero el envío fue proble...",Juan,La Plata,tarjeta de crédito,caloventor,0,negativo,problema de envío
1,Compré un mousepad pero nunca llegó. El del en...,Luz,Flores,tarjeta de crédito,mousepad,0,negativo,problema de envío
2,"Estaba contento con la compra, pero el envío f...",Mateo,Almagro,tarjeta de débito,sillón,2,negativo,problema de envío
3,Lo compré hace una semana y me fascinó. Ahora ...,Guadalupe,Quilmes,transferencia bancaria,masajeador,3,positivo,consulta de stock
4,Buenas tardes. Tengo una duda sobre la garantí...,Alejandro,Saavedra,billetera digital,termotanque,2,neutro,consulta de garantía


## 2. Detección de Sentimiento y Clasificación Zero-Shot:

In [None]:
# Importamos pipeline de la librería Transformers
from transformers import pipeline

2.1 🤗 Utilizamos Transformers de Hugging Face

In [None]:
# Cargamos el pipeline de análisis de sentimientos con el modelo BETO, que es un modelo BERT entrenado con un gran corpus de español
clasificador = pipeline("sentiment-analysis", model="finiteautomata/beto-sentiment-analysis")

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/841 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/440M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/439M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/528 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/242k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/481k [00:00<?, ?B/s]

added_tokens.json:   0%|          | 0.00/67.0 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

Device set to use cpu


In [None]:
# Función para procesar los tickets y analizar sentimiendo usando Transformers
def analizar_sentimiento_transformers(texto):
  if not clasificador:
    return []

  sentimientos = clasificador(texto)

  try:
    # Formatear resultados
    resultados = []
    for sent in sentimientos:
      resultados.append({
            'etiqueta': sent['label'],
            'confianza': round(sent['score'], 2),
            'ticket': texto
                    })
    return resultados
  except Exception as e:
    return f"❌ Error: {e}"

if clasificador:
  # Aplicamos la función
  print(" 🔎 Analizando Sentimiento de los Tickets...")
  print(' ')
  sentimientos_list = []
  for ticket in df['tickets'].tolist():
    sentimientos_list.extend(analizar_sentimiento_transformers(ticket))

  for sent in sentimientos_list:
    print(f"  • Ticket:{sent['ticket']} → {sent['etiqueta']} (confianza: {sent['confianza']})")


 🔎 Analizando Sentimiento de los Tickets...
 
  • Ticket:La compra salió bien, pero el envío fue problemático. Les avisé del timbre roto en comentarios y por mensaje privado, así y todo el envío falló tres veces y no tengo novedades de cuando vuelvan a pasar. Respondan!! → NEU (confianza: 0.92)
  • Ticket:Compré un mousepad pero nunca llegó. El del envío estaba supuestamente cerca pero no avisó nada y ahora me aparece “en distribución”. Ya es la sexta vez que les escribo para que por favor solucionen mi problema, espero respuestas a la brevedad → NEU (confianza: 0.63)
  • Ticket:Estaba contento con la compra, pero el envío fue un desastre. Demoraron y venían en horarios donde me encuentro trabajando. Estaria bueno que mejoren el sistema porque arruina la experiencia → NEG (confianza: 1.0)
  • Ticket:Lo compré hace una semana y me fascinó. Ahora quiero comprarle uno a mi mamá, pero está agotado. ¿Cuándo estará disponible de nuevo?Muchas gracias → POS (confianza: 1.0)
  • Ticket:Buenas t

In [None]:
# Cargamos el pipeline de clasificación zero-shot con el modelo 'bert-base-spanish-wwm-cased-xnli'
zero_shot_clasificacion = pipeline("zero-shot-classification", model="Recognai/bert-base-spanish-wwm-cased-xnli")

In [None]:
# Función para categorizar los tickets usando Transformers
def analizar_categorias_transformers(texto, etiquetas_candidatas):
  if not zero_shot_clasificacion:
    return []

  categorias = zero_shot_clasificacion(texto, etiquetas_candidatas)
  try:
    # Formatear resultados
    resultados = []
    resultados.append({
          'categorias': categorias['labels'],
          'confianza': categorias['scores'],
          'ticket': texto
                  })
    return resultados

  except Exception as e:
    return f"❌ Error: {e}"

if zero_shot_clasificacion:
  print(" 🔎 Analizando categorías de los Tickets...")
  print(' ')
  categorias_list = []
  etiquetas_candidatas = df['categorias'].unique().tolist()
  for ticket in df['tickets'].tolist():
    categorias_list.extend(analizar_categorias_transformers(ticket, etiquetas_candidatas))

  for cat in categorias_list:
    print(f"  • Ticket:{cat['ticket'][:50]} → {cat['categorias'][0]} (confianza: {cat['confianza'][0]:.2f})")


 🔎 Analizando categorías de los Tickets...
 
  • Ticket:La compra salió bien, pero el envío fue problemáti → problema de envío (confianza: 0.89)
  • Ticket:Compré un mousepad pero nunca llegó. El del envío  → problema de envío (confianza: 0.52)
  • Ticket:Estaba contento con la compra, pero el envío fue u → problema de envío (confianza: 0.83)
  • Ticket:Lo compré hace una semana y me fascinó. Ahora quie → elogio (confianza: 0.65)
  • Ticket:Buenas tardes. Tengo una duda sobre la garantía de → consulta de garantía (confianza: 0.31)
  • Ticket:Hola! Tengo una consulta sobre el service del cale → consulta de garantía (confianza: 0.52)
  • Ticket:Buenas tardes. Me gustaría comprar el combo pero q → elogio (confianza: 0.54)
  • Ticket:Che, estoy viendo la descripción de la tablet Mode → consulta de producto (confianza: 0.24)
  • Ticket:Gran decepción, las reseñas eran prometedoras pero → producto defectuoso (confianza: 0.44)
  • Ticket:No vale la pena, no entiendo el atractivo de este  → co



---


🔎 **Comparando Resultados con Hugging Face**:


*   Análisis de Sentimientos: Para dos casos, las clasificaciones difieren de la que realizamos manualmente. Esto puede notarse en los primeros tickets que señalamos como **NEGATIVOS** y el modelo los calificó como **NEUTROS** con un puntaje mayor al 0.5.


*  Clasificación Zero-Shot: Observamos que los primeros tres casos coinciden con lo calificado manualmente. Al cuarto ticket, el modelo lo categoriza como "elogio", cuando lo hemos etiquetado como "consulta de stock". Para el quinto y sexto ticket las categorías vuelven a coincidir. En el séptimo encontramos otra diferencia, ya que lo califica como "elogio" y fue cargado como "consulta de producto". Los siguientes dos tickets coinciden con las etiquetas manuales pero el décimo se distingue de nuevo del modelo, siendo para éste un caso de "consulta de producto", pero identificado por nosotros como "producto defectuoso". Los siguientes tres tickets también se ajustan a nuestra categorización, ya que los detecta como "elogio". Pero para los últimos dos la clasificación es la inversa a la realizada manual. El ticket 14 lo señala como "consulta de producto" cuando lo cargamos como "elogio" y el ticket 15, lo opuesto. Es detectado por el modelo como "elogio", cuando fue cargado en nuestro dataset como "consulta de producto".
En total, tenemos **10 coincidencias y 5 diferencias** con las categorizaciones del modelo.


---





2.2 ✨ Utilizamos Gemini API

In [None]:
# Importamos las herramientas
from google.colab import userdata
from google import genai
from google.genai import types

# Obtener la clave secreta de Google
clave_google = userdata.get('GOOGLE_API_KEY')

In [None]:
# Conectamos con la IA de Google
cliente = genai.Client(api_key=clave_google)

# Seleccionamos el modelo de IA
modelo = "gemini-2.0-flash"

In [None]:
# Función para analizar sentimiento de los tickets con Gemini
def analizar_sentimiento_gemini(texto):
  if not cliente:
    return " ⚠ Cliente Gemini no disponible"

  pregunta = f"""Clasificá el siguiente corpus de tickets como positivo, negativo o neutral:

            Texto: {df['tickets'].tolist()}


            """
  try:
    respuesta_sentimiento = cliente.models.generate_content(
    model=modelo,
    contents=[pregunta]
    )
    return respuesta_sentimiento.text

  except Exception as e:
    return f"❌ Error: {e}"

if cliente: # Si el cliente está conectado
    print("🔎 Analizando con Gemini...")
    resultado_gemini = analizar_sentimiento_gemini(df['tickets'].tolist())
    print("\nAnálisis de Gemini:")
    print(resultado_gemini)
else:
    print("⏭️  Saltando análisis con Gemini (API Key no disponible)")

🔎 Analizando con Gemini...

Análisis de Gemini:
Aquí tienes la clasificación del corpus de tickets:

*   **Negativo:**
    *   'La compra salió bien, pero el envío fue problemático. Les avisé del timbre roto en comentarios y por mensaje privado, así y todo el envío falló tres veces y no tengo novedades de cuando vuelvan a pasar. Respondan!!'
    *   'Compré un mousepad pero nunca llegó. El del envío estaba supuestamente cerca pero no avisó nada y ahora me aparece “en distribución”. Ya es la sexta vez que les escribo para que por favor solucionen mi problema, espero respuestas a la brevedad'
    *   'Estaba contento con la compra, pero el envío fue un desastre. Demoraron y venían en horarios donde me encuentro trabajando. Estaria bueno que mejoren el sistema porque arruina la experiencia'
    *   'Gran decepción, las reseñas eran prometedoras pero la próxima vez voy a invertir mi dinero en algo de mejor calidad. Se ve bonito por fotos pero es puro plástico barato y el volumen no se pued

In [None]:
# Función para clasificar cada ticket dentro de una categoría con Gemini
def analizar_categoria_gemini(texto):
  if not cliente:
    return " ⚠ Cliente Gemini no disponible"

  pregunta_zs = f"""Clasificá el corpus de tickets en una de estas categorías: {df['categorias'].unique().tolist()}.

                    Texto: {df['tickets'].tolist()}

                    """

  try:
      respuesta_zs = cliente.models.generate_content(
                     model=modelo,
                     contents=[pregunta_zs]
                      )
      return respuesta_zs.text


  except Exception as e:
    return f"❌ Error: {e}"


if cliente:
    print("🔎 Analizando con Gemini...")
    resultado_gemini = analizar_categoria_gemini(df['tickets'].tolist())
    print("\nAnálisis de Gemini:")
    print(resultado_gemini)
else:
    print("⏭️  Saltando análisis con Gemini (API Key no disponible)")

🔎 Analizando con Gemini...

Análisis de Gemini:
Aquí tienes la clasificación del corpus de tickets en las categorías proporcionadas:

*   **problema de envío:**

    *   "La compra salió bien, pero el envío fue problemático. Les avisé del timbre roto en comentarios y por mensaje privado, así y todo el envío falló tres veces y no tengo novedades de cuando vuelvan a pasar. Respondan!!"
    *   "Compré un mousepad pero nunca llegó. El del envío estaba supuestamente cerca pero no avisó nada y ahora me aparece “en distribución”. Ya es la sexta vez que les escribo para que por favor solucionen mi problema, espero respuestas a la brevedad"
    *   "Estaba contento con la compra, pero el envío fue un desastre. Demoraron y venían en horarios donde me encuentro trabajando. Estaria bueno que mejoren el sistema porque arruina la experiencia"

*   **consulta de stock:**

    *   "Lo compré hace una semana y me fascinó. Ahora quiero comprarle uno a mi mamá, pero está agotado. ¿Cuándo estará disponib



---


🔎 **Comparando Resultados con Gemini**:


*   Análisis de Sentimiento: Coincidió en 14 de los 15 casos con la clasificación manual, demostrando una mayor precisión para este conjunto de datos en particular.

*  Clasificación Zero-Shot: Coincidió en 14 de los 15 casos con la clasificación manual, mostrando nuevamente una mejor capacidad para adaptarse a las categorías definidas.

La diferencia se repitió con el mismo ticket, al cual calificamos como positivo y de consulta de producto, y Gemini por su parte lo procesó como neutral y de consulta de stock.


---




## 3. Extracción de Información Clave (NER/QA):

3.1 🤗 Reconocimiento de entidades nombradas (NER) Y QA con Hugging Face

In [None]:
# Cargamos el pipeline y el modelo de reconocimiento de entidades nombradas (NER) en español
ner_nlp = pipeline("ner", model="mrm8488/bert-spanish-cased-finetuned-ner",  aggregation_strategy="simple")

In [None]:
# Función para procesar los tickets y extraer entidades usando Transformers
def analizar_entidades_transformers(texto):
  if not ner_nlp:
    return []
  entidades = ner_nlp(texto)

  try:
    # Formatear resultados
    resultados = []
    for ent in entidades:
      resultados.append({
            'texto': ent['word'],
            'etiqueta': ent['entity_group'],
            'confianza': round(ent['score'], 2),
            'posicion': (ent['start'], ent['end'])
        })
    return resultados
  except Exception as e:
    return f"❌ Error: {e}"

if ner_nlp:
  # Aplicamos la función
  print(" 🔎 Analizando tickets...")
  print("\n📊 Entidades encontradas:")
  entidades_encontradas_list = []
  for ticket in df['tickets'].tolist():
    entidades_encontradas_list.extend(analizar_entidades_transformers(ticket))
  for ent in entidades_encontradas_list:
    print(f"  • {ent['texto']} → {ent['etiqueta']} (confianza: {ent['confianza']})")


 🔎 Analizando tickets...

📊 Entidades encontradas:
  • ALPHA01 → MISC (confianza: 0.9200000166893005)
  • Modelo TabLite → MISC (confianza: 1.0)


In [None]:
# Cargamos pipeline y modelo de Question Answering de respuestas a preguntas en español
qa_nlp = pipeline("question-answering", model="PlanTL-GOB-ES/roberta-large-bne-sqac")

In [None]:
# Función para para obtener una pregunta automática por ticket con Transformers
def obtener_respuestas_qa(df, qa_nlp, pregunta="¿Cuál es el problema del cliente?"):
    """
    Procesa los tickets del DataFrame y responde a la pregunta especificada usando el modelo QA.

    Parámetros:
    - df: DataFrame que contiene una columna 'tickets'
    - modelo_qa: pipeline QA de Hugging Face
    - pregunta: string con la pregunta a responder sobre cada ticket

    Retorna:
    - DataFrame con columnas 'ticket', 'answer' y 'score'
    """
    resultados = []
    for ticket in df['tickets'].tolist():
        try:
            salida = qa_nlp(question=pregunta, context=ticket)
            resultados.append({
                'ticket': ticket[:50] + '...',
                'answer': salida['answer'],
                'score': round(salida['score'], 3)
            })
        except Exception as e:
            resultados.append({
                'ticket': ticket[:50] + '...',
                'answer': 'Error al procesar',
                'score': None
            })
            print(f"Error con ticket: {ticket[:30]}... -> {e}")

    return pd.DataFrame(resultados)

respuestas_df = obtener_respuestas_qa(df, qa_nlp)
display(respuestas_df[['ticket', 'answer', 'score']])

Unnamed: 0,ticket,answer,score
0,"La compra salió bien, pero el envío fue proble...",el envío fue problemático,0.876
1,Compré un mousepad pero nunca llegó. El del en...,El del envío estaba supuestamente cerca pero n...,0.524
2,"Estaba contento con la compra, pero el envío f...",el envío fue un desastre,0.889
3,Lo compré hace una semana y me fascinó. Ahora ...,está agotado,0.668
4,Buenas tardes. Tengo una duda sobre la garantí...,Cubre fallas del regulador de temperatura,0.218
5,Hola! Tengo una consulta sobre el service del ...,no encuentro el ticket y creo que está necesit...,0.206
6,Buenas tardes. Me gustaría comprar el combo pe...,tienen que ser si o si los mismos modelos o si...,0.013
7,"Che, estoy viendo la descripción de la tablet ...",no me queda claro si viene con cargador incluido,0.978
8,"Gran decepción, las reseñas eran prometedoras ...",las reseñas eran prometedoras,0.724
9,"No vale la pena, no entiendo el atractivo de e...","No vale la pena, no entiendo el atractivo de e...",0.979


3.2 ✨ Reconocimiento de entidades nombradas (NER) y QA con Gemini API

In [None]:
# Función para reconocimiento de entidades usando Gemini
def extraer_entidades_ner_gemini(df, cliente, modelo):
    """
    Extrae entidades nombradas del texto de los tickets.

    Parámetros:
    - df: DataFrame con una columna 'tickets'
    - cliente: cliente Gemini autenticado
    - modelo: nombre del modelo a usar (ej. 'gemini-2.0-flash')

    Retorna:
    - String con las entidades extraídas y clasificadas por tipo
    """
    if not cliente:
        return "❌ Cliente Gemini no disponible."

    lista_tickets = df['tickets'].dropna().tolist()

    prompt = f"""
Extraé todas las entidades nombradas del siguiente texto en español argentino y clasificálas:

CATEGORÍAS:
- PERSONA: Nombres de personas
- LUGAR: Ciudades, países, barrios, direcciones, lugares específicos
- ORGANIZACIÓN: Empresas, universidades, instituciones
- MISCELÁNEO: Otros nombres propios (productos, eventos, marcas)

FORMATO DE RESPUESTA:
[ENTIDAD] → [CATEGORÍA] → [BREVE EXPLICACIÓN]

TEXTO A ANALIZAR:
{lista_tickets}
"""

    try:
        respuesta = cliente.models.generate_content(
            model=modelo,
            contents=[prompt]
        )
        return respuesta.text
    except Exception as e:
        return f"⚠️ Error al generar contenido con Gemini: {e}"

In [None]:
# Función para realizar pregunta automática con Gemini
def obtener_respuesta_gemini(texto):
  if not cliente:
    return " ❌ Cliente Gemini no disponible"
  tickets = df['tickets'].tolist()
  for ticket in df['tickets'].tolist():
    prompt_qa = "¿Cuál es el problema principal que se extrae de cada ticket"
    contexto = tickets

    prompt_qa = f"""Respondé la siguiente pregunta basada en el contenido de los tickets:
               Pregunta: {prompt_qa}
                Texto: {tickets}

                  """

  try:
      respuesta_qa = cliente.models.generate_content(
      model=modelo,
      contents=[prompt_qa]
      )
      return respuesta_qa.text


  except Exception as e:
    return f"❌ Error: {e}"


if cliente:
    print("🔎 Analizando con Gemini...")
    resultado_gemini = obtener_respuesta_gemini(df['tickets'].tolist())
    print("\nAnálisis de Gemini:")
    print(resultado_gemini)
else:
    print("⏭️  Saltando análisis con Gemini (API Key no disponible)")

🔎 Analizando con Gemini...

Análisis de Gemini:
Aquí está el problema principal extraído de cada ticket:

*   **Ticket 1-3:** Problemas con el envío (timbre roto, retrasos, horarios inconvenientes).
*   **Ticket 4:** Consulta sobre la disponibilidad de un producto agotado.
*   **Ticket 5-6:** Consulta sobre la cobertura de la garantía de un producto.
*   **Ticket 7:** Consulta sobre la personalización de un combo de productos.
*   **Ticket 8:** Falta de claridad en la descripción de un producto (si incluye cargador).
*   **Ticket 9-10:** Queja sobre la calidad del producto (materiales baratos, sonido deficiente).
*   **Ticket 11-14:** Comentarios positivos sobre la calidad del producto y la experiencia de compra.
*   **Ticket 15:** Consulta sobre la disponibilidad de otros colores y precios para diferentes medidas de un producto, además de la opción de retiro en tienda.





---
🔎 **Observaciones**:

* **Hugging Face** : El modelo NER identificó algunas entidades, pero no de forma exhaustiva. El modelo de QA, al preguntar por el problema principal en algunos casos lo identifica correctamente, como  por ejemplo, en los primeros tickets que señala problemas con el envío, pero en otros casos no detalla el problema sino que copia el mismo texto del ticket.


* **Gemini API**: La extracción de entidades nombradas fue más completa y organizada por tipo. En relación a la pregunta sobre el problema principal de cada ticket fue clara y concisa, resumiendo adecuadamente los temas.

---




## 4. Generación de Respuesta Personalizada

4.1 🤗 Respuesta personalizada con Hugging Face

In [None]:
# Cargamos pipeline y modelo para generar texto
generador = pipeline("text-generation", model="datificate/gpt2-small-spanish")

In [None]:
def generar_respuestas_hf(df, generador):
    """
    Genera respuestas automáticas personalizadas para cada ticket del DataFrame
    según su etiqueta de sentimiento ('negativo', 'neutro', 'positivo') utilizando Hugging Face.

    Parámetros:
    - df: DataFrame con columna 'etiquetas'
    - generador: pipeline de Hugging Face para generación de texto

    Retorna:
    - DataFrame con una columna 'respuesta' correspondiente a cada etiqueta
    """
    respuestas = []

    for etiqueta in df['etiquetas'].tolist():
        if etiqueta == 'negativo':
            prompt = ("Escribe una respuesta de no más de 4 líneas para atender la solicitud o queja del cliente, "
                      "con tono agradable. La misma debe comenzar con un pedido de disculpas e indicar que soporte se "
                      "comunicará a la brevedad si el problema es por envíos o desde el área de devoluciones si el problema es por cambio de producto.")
        elif etiqueta == 'neutro':
            prompt = ("Escribe una respuesta de no más de 4 líneas para atender la solicitud del cliente. "
                      "Se debe comunicar, con tono agradable, que atención al cliente se comunicará a la brevedad para resolver su consulta.")
        else:
            prompt = ("Escribe una respuesta para agradecer el comentario y la confianza, "
                      "mencionando que su apoyo es la motivación para seguir creciendo. "
                      "La misma no debe extenderse más de 4 líneas.")

        try:
            output = generador(prompt, max_new_tokens=100, truncation=True)
            respuesta = output[0]['generated_text'].strip()
        except Exception as e:
            respuesta = f"❌ Error: {e}"

        respuestas.append(respuesta)

    return pd.DataFrame({'respuesta': respuestas})

In [None]:
respuestas_cliente = generar_respuestas_hf(df, generador)
print(respuestas_cliente.head())


In [None]:
# Configuramos la opción de pandas para mostrar el contenido completo de las columnas
pd.set_option('display.max_colwidth', None)

In [None]:
# Imprimimos por pantalla la primer respuesta generada
respuestas_cliente.iloc[0]

4.2 ✨ Respuesta Personalizada con Gemini

> Gemini API tiene un límite de número de pedidos de `generate_content` que se púeden realizar por minuto en la versión gratuita de ` gemini-2.0-flash model`. Para evitar que arroje un error, cargaremos la librería time que nos permite pausar la ejecución.





In [None]:
import time
import pandas as pd

def generar_respuestas_gemini(df, cliente, modelo, pausa=10):
    """
    Genera respuestas personalizadas para cada ticket usando Gemini API.

    Parámetros:
    -----------
    df : pd.DataFrame
        DataFrame que debe contener una columna 'etiquetas' con valores 'negativo', 'neutro' o 'positivo'.

    cliente : object
        Cliente Gemini ya autenticado, por ejemplo: cliente = genai.GenerativeModel(...)

    modelo : str, opcional
        Nombre del modelo a usar (por defecto 'gemini-1.5-flash-latest').

    pausa : int, opcional
        Segundos de espera entre cada solicitud para evitar rate limit (por defecto 10).

    Retorna:
    --------
    pd.DataFrame
        Un DataFrame con una columna de respuestas generadas.
    """
    respuestas = []

    for etiqueta in df['etiquetas'].tolist():
        etiqueta = str(etiqueta).lower()

        if etiqueta == 'negativo':
            respuesta_inicial = "Estimado/a cliente, lamentamos los inconvenientes ocasionados con su pedido. "
            prompt = f"""Redactá una respuesta del servicio de atención al cliente que comience así:
{respuesta_inicial}
El mensaje debe ser en tono agradable y debe indicar que si es por problemas de envíos el área de soporte le solicitará a la brevedad número
de orden para su seguimiento y resolución o si quiere realizar un cambio, el área de devoluciones se comunicará.
No debe extenderse más de 4 líneas.
"""
        elif etiqueta == 'neutro':
            respuesta_inicial = "Estimado/a cliente, gracias por escribirnos."
            prompt = f"""Redactá una respuesta del servicio de atención al cliente que comience así:
{respuesta_inicial}
El mensaje debe ser en tono agradable y debe indicar que a la brevedad se comunicará el equipo de soporte
para responder su consulta. No debe extenderse más de 3 líneas.
"""
        else:
            respuesta_inicial = "Estimado/a cliente, agradecemos tu comentario. Tu apoyo nos motiva."
            prompt = f"""Redactá una respuesta del servicio de atención al cliente que comience así:
{respuesta_inicial}
Es un mensaje de agradecimiento al cliente por su comentario positivo.
No debe extenderse más de 3 líneas.
"""

        try:
            respuesta = cliente.models.generate_content(
                model=modelo,
                contents=[prompt]
            )
            respuestas.append(respuesta.text.strip())
        except Exception as e:
            respuestas.append(f"[ERROR]: {str(e)}")

        time.sleep(pausa)

    return pd.DataFrame({'respuesta': respuestas})

In [None]:
respuestas_cliente_gemini= pd.DataFrame(respuestas_g)
respuestas_cliente_gemini



---

🔎 **Observaciones**

* Para todas las respuestas generadas con Hugging Face, el modelo `datificate/gpt2-small-spanish` arroja textos que no cumplen con la instrucción dada y que se alejan del contexto y de la estructura lógica del tema planteado.
* En el caso de Gemini, obtuvimos resultados favorables ya que la estructura lógica de las respuestas generadas estuvieron en sintonía con las instrucciones dadas y todas mantuvieron una coherencia.



---



# 5. Interfaz Interactiva

In [None]:
# Importamos Gradio para crear una interfaz
import gradio as gr

In [None]:
# Definimos las funciones para analizar el ingreso de un Ticket de Soporte a la interfaz Gradio
def analisis_sentimiento_gemini(texto):
   if not cliente:
    return " ⚠ Cliente Gemini no disponible"

   try:
    pregunta = f"""Clasificá el siguiente corpus de tickets como positivo, negativo o neutral:
    Texto: {texto}
    """

    respuesta_sentimiento = cliente.models.generate_content( model=modelo,
                                                            contents=[pregunta])
    return respuesta_sentimiento.text

   except Exception as e:
    return f"❌ Error: {e}"


In [None]:
def analisis_categoria_gemini(texto):
  if not cliente:
    return " ⚠ Cliente Gemini no disponible"

  pregunta_zs = f"""Clasificá el corpus de tickets en una de estas categorías: {df['categorias'].unique().tolist()}.

                    Texto: {texto}

                    """
  try:
      respuesta_zs = cliente.models.generate_content(
                     model=modelo,
                     contents=[pregunta_zs]
                      )
      return respuesta_zs.text


  except Exception as e:
    return f"❌ Error: {e}"

In [None]:
def analisis_entidades_gemini(texto):
  if not cliente:
    return " ⚠ Cliente Gemini no disponible"
  prompt_ner = f"""Extraé todas las entidades nombradas del siguiente texto (personas, organizaciones, lugares, objetos) y clasificálas:
                Texto: {texto}
                """
  try:
    respuesta_ner = cliente.models.generate_content( model=modelo,
                                                    contents=[prompt_ner]
                                                     )

    return respuesta_ner.text


  except Exception as e:
    return f"❌ Error: {e}"


In [None]:
def respuesta_clave_gemini(texto):
  if not cliente:
    return " ⚠ Cliente Gemini no disponible"
  prompt_qa = "¿Cuál es el problema principal que se extrae de cada ticket"
  contexto = texto

  prompt_qa = f"""Respondé la siguiente pregunta basada en el contenido de los tickets:
  Pregunta: {prompt_qa}
  Texto: {texto}

  """
  try:
    respuesta_qa = cliente.models.generate_content(
      model=modelo,
      contents=[prompt_qa]
  )
    return respuesta_qa.text


  except Exception as e:
    return f"❌ Error: {e}"

In [None]:
def respuesta_generada_gemini(texto):
  if not cliente:
    return " ⚠ Cliente Gemini no disponible"
  etiqueta = analisis_sentimiento_gemini(texto)
  if etiqueta == 'negativo':
    respuesta_inicial = "Estimado/a cliente, lamentamos los inconvenientes ocasionados con su pedido. "
    prompt = f"""Redactá una respuesta del servicio de atención al cliente que comience así:{respuesta_inicial}
    El mensaje debe ser en tono agradable y debe indicar que si es por problemas de envíos el área de soporte le solicitará a la brevedad número
    de orden para su seguimiento y resolución o si quiere realizar un cambio, el área de devoluciones se comunicará.
    No debe extenderse más de 4 líneas.
    """
  elif etiqueta == 'neutro':
    respuesta_inicial = "Estimado/a cliente, gracias por escribirnos."
    prompt = f"""Redactá una respuesta del servicio de atención al cliente que comience así:
    {respuesta_inicial}
    El mensaje debe ser en tono agradable y debe indicar que a la brevedad se comunicará el equipo de soporte
para responder su consulta. No debe extenderse más de 3 líneas.
"""
  else:
            respuesta_inicial = "Estimado/a cliente, agradecemos tu comentario. Tu apoyo nos motiva."
            prompt = f"""Redactá una respuesta del servicio de atención al cliente que comience así:
{respuesta_inicial}
Es un mensaje de agradecimiento al cliente por su comentario positivo.
No debe extenderse más de 3 líneas.
"""

  try:
    respuesta = cliente.models.generate_content(
                model=modelo,
                contents=[prompt]
            )
    return respuesta.text.strip()
  except Exception as e:
    (f"[ERROR]: {str(e)}")

  time.sleep(20) # Pausa de 20 segundos

In [None]:
"""" Esta función permite ingresar un nuevo ticket de soporte y devuelve:
       • Sentimiento predicho del ticket
       • Categoría (Zero-Shot)
       • Entidad o Respuesta Clave
       • Respuesta del modelo de lenguaje  """

def interfaz_ticket_soporte(texto):
  if not texto:
    return " ⚠️ No se ingresó ningún ticket. Por favor ingresa uno: "

  if not cliente:
      return " ❌ Cliente Gemini no disponible. Por favor, asegúrate de haber configurado tu API Key."

  sentimiento = analisis_sentimiento_gemini(texto)
  categoria = analisis_categoria_gemini(texto)
  entidades = analisis_entidades_gemini(texto)
  respuesta_clave= respuesta_clave_gemini(texto)
  respuesta_personalizada = respuesta_generada_gemini(texto)

  # Pasamos los resultados en un solo bloque
  resultados_str = f"Análisis del Ticket:\n\n" \
                   f"Sentimiento: {sentimiento}\n" \
                   f"Categoría: {categoria}\n" \
                   f"Respuesta Clave: {respuesta_clave}\n" \
                   f"Entidades: {entidades}\n" \
                   f"Respuesta Personalizada: {respuesta_personalizada}"
  return resultados_str






In [None]:
# Lanzar interfaz de Ticket Soporte de Gemini
# Definimos algunos ejemplos la interfaz Gradio
if cliente:
  ejemplos_arg = [
    ["La compra salió bien, pero el envío fue problemático. Les avisé del timbre roto en comentarios y por mensaje privado, así y todo el envío falló tres veces y no tengo novedades de cuando vuelvan a pasar. Respondan!!"],
    ["Compré un mousepad pero nunca llegó. El del envío estaba supuestamente cerca pero no avisó nada y ahora me aparece “en distribución”. Ya es la sexta vez que les escribo para que por favor solucionen mi problema, espero respuestas a la brevedad"],
    ["Lo compré hace una semana y me fascinó. Ahora quiero comprarle uno a mi mamá, pero está agotado. ¿Cuándo estará disponible de nuevo?Muchas gracias"]
]
  demo_ticket_gemini = gr.Interface(fn=interfaz_ticket_soporte,
                             inputs=[
                                 gr.Textbox(
                                     label="📝 Ticket a analizar",
                                     placeholder="Escribe aquí , en español, para obtener información detallada de tu ticket..",
                                     lines=4
                                     )
                                 ],
                             outputs=[
                                 gr.Textbox(
                                     label="🧠 Análisis de Gemini", lines=10)],
                             title=" Análisis de Tickets de Soporte con Gemini",
                             description=""" **Modelo:** Google Gemini 2.0 Flash
          Prototipo Sistema de Detección de Quejas y Soporte Automático para
          E-commerce.""",
                             examples=ejemplos_arg,
                             allow_flagging="never",
                             theme=gr.themes.Soft()
                             )

  print("🚀 Lanzando interfaz de Gemini...")
  demo_ticket_gemini.launch(share=True, height=500)
else:
    print("❌ No se puede lanzar: No se encuentra conectado a la API de Gemini. Pruebe realizar la conexión.")



🚀 Lanzando interfaz de Gemini...
Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
* Running on public URL: https://4824d78d3a71dbe131.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


Keyboard interruption in main thread... closing server.
Killing tunnel 127.0.0.1:7865 <> https://4824d78d3a71dbe131.gradio.live




---
🧠 **Conclusiones**

Basado en este análisis comparativo con el conjunto de datos proporcionado:
1.	***Gemini API***  mostró un mejor rendimiento tanto en la clasificación de sentimiento y zero-shot como en la extracción de información clave y generación de respuestas personalizadas, coincidiendo en mayor medida con las etiquetas y expectativas manuales.

2.	***Los modelos de Hugging Face***, si bien son potentes, pueden requerir un ajuste más fino o la selección de modelos más específicos para tareas y lenguajes particulares para lograr un rendimiento óptimo en comparación con un modelo de lenguaje grande como Gemini.

3.	***La extracción de información con modelos de QA de Hugging Face*** parece ser más efectiva cuando la pregunta es específica y dirigida a un tipo particular de información que se busca extraer. En nuestros casos fue más eficiente las preguntas respondidas por Gemini API.

4.	***La generación de texto con los modelos de Hugging Face*** probados no fue satisfactoria para la tarea específica de generar respuestas de servicio al cliente personalizadas, mientras que Gemini API lo logró de manera efectiva.

5. ***Desafíos éticos***: Los sistemas de Inteligencia Artificial no solo presentan desafíos técnicos, sino también dilemas éticos que tienen que ver con la transparencia, la explicabilidad, la equidad, la privacidad de los datos, entre otros. Es importante tomar en cuenta este punto ya que las prácticas y las representaciones que imprimen en lo social se ven reflejadas en los modelos que desarrollamos.


En resumen, para este caso de uso específico de un sistema de detección de quejas y soporte automático con datos en español, Gemini API demostró ser una herramienta más robusta y precisa en comparación con los modelos de Hugging Face probados directamente sin entrenamiento adicional.

