# üöÄ **Capstone Project Curso Desarrolador 10x de Instituto de Inteligencia Artificial - Entregable 1**

## üìÑ Informaci√≥n del Proyecto  
**Estudiante:** Araceli Fradejas Mu√±oz  
**Curso:** Curso Desarrollador 10x ‚Äì Instituto de Inteligencia Artificial  
**Fecha:** 21/04/2025  

---

## üìù Descripci√≥n del Proyecto: An√°lisis Automatizado de Comentarios - KelceTS

### üîé Contexto  
**KelceTS S.L.** es una startup ficticia de venta de zapatillas online en toda Europa. Actualmente, el equipo de calidad revisa los comentarios recibidos en redes sociales o por email de los clientes de forma manual, lo que genera cuellos de botella y respuestas poco homog√©neas.

Adem√°s no est√°n coordinadoslos los distintos equipos para dar respuesta al cliente ni mejorar el servicio postventa de sus productos.

---

## üéØ Objetivo Principal

Dise√±ar un agente de IA generativa que automatice el ciclo completo de gesti√≥n de comentarios, incluyendo:

- üîç **An√°lisis estructurado de los comentarios** seg√∫n criterios definidos (env√≠o, embalaje, talla, calidad, expectativas‚Ä¶)
- üí¨ **Generaci√≥n de respuestas personalizadas** para clientes en 24 idiomas oficiales de la UE
- üìã **Notificaciones autom√°ticas** a los equipos internos de calidad y log√≠stica
- üìß **Correos formales a proveedores externos**, siguiendo reglas internas de actuaci√≥n
- üßæ **Exportaci√≥n de resultados** en formato Excel listo para auditor√≠a

---

## üõ†Ô∏è Pasos de Implementaci√≥n

1. Leer y preprocesar comentarios multiling√ºes desde archivo `.txt`
2. Generar prompts estructurados a partir de reglas internas (archivos `.xlsx`)
3. Llamar a modelos de IA (OpenAI y Gemini) con fallback din√°mico
4. Aplicar funciones de evaluaci√≥n, clasificaci√≥n y generaci√≥n de comunicaciones
5. Traducir autom√°ticamente los correos generados al idioma original del cliente
6. Separar errores y resultados v√°lidos en dataframes estructurados
7. Exportar el resultado completo en un Excel multiling√ºe con pesta√±as organizadas

---

## ‚öôÔ∏è Tecnolog√≠as Utilizadas

- **Python:** lenguaje principal para todo el procesamiento
- **OpenAI (gpt-4):** generaci√≥n principal de an√°lisis y comunicaciones
- **Gemini Pro (Google Cloud):** agente de respaldo (fallback) para asegurar robustez
- **Pandas:** manipulaci√≥n avanzada de datos estructurados
- **LangChain + prompting estructurado:** para control y trazabilidad
- **Google Colab:** entorno reproducible en la nube
- **XlsxWriter:** exportaci√≥n profesional a Excel con varias hojas
- **Gradio + Streamlit (futuros pasos):** interfaces amigables para usuarios finales

---

## üí° Impacto Esperado

Este proyecto permite automatizar de forma fiable y escalable la evaluaci√≥n de comentarios de clientes, proporcionando:

- ‚è±Ô∏è Ahorro de tiempo en tareas repetitivas de atenci√≥n al cliente  
- üìà Mejora en la consistencia de las comunicaciones internas y externas  
- üåç Inclusi√≥n de clientes en m√∫ltiples idiomas sin depender de traductores humanos  
- üìä Informes estructurados que permiten tomar decisiones con base en datos  



La integraci√≥n de OpenAI y Gemini como doble motor garantiza continuidad incluso ante fallos, l√≠mites de uso o costes inesperados en uno de los servicios.


## 1. ‚öôÔ∏è **Preparaci√≥n del entorno**

En este apartado, instalamos e importamos las librer√≠as necesarias y clonamos el repositorio p√∫blico de GitHub que contiene los archivos del proyecto.

Adem√°s, conectamos el notebook con los datos disponibles en el repositorio de GitHub, dese su directorio `data` sin depender de Google Drive (en versiones anteriores realizamos esta dependencia y aq√∫i est√° optimizado para que cualquier usuario pueda ejecutarlo).

Los archivos disponibles incluyen:

- `BD Comentarios KelceTS.txt`
- `Reglas de como valorar un comentario KelceTS SL.xlsx`
- `Reglas de calidad clientes KelceTS SL.xlsx`
- `Reglas de comunicaciones equipos calidad y log√≠stica KelceTS SL.xlsx`
- `Reglas de medidas de calidad KelceTS SL.xlsx`



 üöß En las siguientes celdas se instalan todas las dependencias necesarias y se configura el entorno base para comenzar con el an√°lisis automatizado.

 >‚ö†Ô∏è Ejecuta esta celda antes de continuar con la carga de datos o modelos IA.

In [1]:
#  1. Instalaci√≥n de librer√≠as necesarias
!pip install openai pandas matplotlib seaborn plotly openpyxl --quiet
!pip install -q google-generativeai python-dotenv
!pip install -U kaleido --quiet
!pip install xlsxwriter --quiet

#  2. Importaci√≥n de librer√≠as
import os
import json
import re
import time
import random
import pandas as pd
import xlsxwriter

# 3. Visualizaci√≥n
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

# 4. Modelos IA
import openai
import google.generativeai as genai

# 5. Estilo visual y reproducibilidad
plt.style.use("ggplot")
sns.set(style="whitegrid")
random.seed(42)

### 1.1 ***üîê Cargar claves de OpenAI y Gemini desde `.env` o desde `Secrets` en Colab*** **texto en negrita**

Este notebook puede ejecutarse de forma segura y privada gracias a un sistema mixto de carga de claves:

1. Primero busca un archivo `.env` en la ra√≠z del proyecto, donde deben definirse las variables:
   - `OPENAI_API_KEY`
   - `GEMINI_API_KEY`

2. Si el archivo `.env` no est√° disponible, intentar√° cargar las claves desde **Google Colab Secrets** (`userdata.get()`).

Este enfoque garantiza seguridad (no se exponen las claves) y compatibilidad al compartir p√∫blicamente el notebook en GitHub.


‚ö†Ô∏è **MUY IMPORTANTE:**  

>Si est√°s ejecutando este notebook por primera vez, aseg√∫rate de cargar las claves de API necesarias en el archivo `.env`.  
üîê Si no lo has hecho a√∫n, por favor, sigue las instrucciones para configurarlo antes de proceder.  
‚úÖ Este paso es esencial para que el acceso a las APIs de **OpenAI** y **Gemini** funcione correctamente.  
‚ùå Si no se ha cargado el archivo `.env`, las claves no estar√°n disponibles, lo que generar√° un error en las celdas posteriores.  
üîë Si lo prefieres, puedes guardar tus claves de **OpenAI** y **Gemini** como secretos pulsando el icono de la llave en este Colab.





In [2]:
# Configuraci√≥n de claves OpenAI + Gemini (.env o Colab Secrets)

import os
from dotenv import load_dotenv

# 1. Intentamos cargar desde archivo .env si existe
if os.path.exists(".env"):
    load_dotenv()
    print("üìÑ Archivo .env cargado.")
else:
    print("‚ö†Ô∏è No se encontr√≥ archivo .env. Intentando con Colab Secrets...")
    try:
        from google.colab import userdata
        os.environ["OPENAI_API_KEY"] = userdata.get("OPENAI_API_KEY")
        os.environ["GEMINI_API_KEY"] = userdata.get("GEMINI_API_KEY")
        print("üîê Claves cargadas desde Colab secrets.")
    except Exception as e:
        print(f"‚ùå No se encontraron claves: {str(e)}")

# 2. Configuramos clientes (¬°aqu√≠ va la l√≠nea de OpenAI moderna!)
from openai import OpenAI
import google.generativeai as genai

client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
genai.configure(api_key=os.getenv("GEMINI_API_KEY"))

# 3. Validaci√≥n
if not os.getenv("OPENAI_API_KEY") or not os.getenv("GEMINI_API_KEY"):
    raise ValueError("‚ùå No se detectaron claves API.")
else:
    print("‚úÖ Claves configuradas correctamente.")




‚ö†Ô∏è No se encontr√≥ archivo .env. Intentando con Colab Secrets...
üîê Claves cargadas desde Colab secrets.
‚úÖ Claves configuradas correctamente.


### ***1.3 üîÑ Validaci√≥n y traducci√≥n autom√°tica***

Ya que poder enviar comunicaciones en el idioma de los clientes va a ser una tarea de eficiencia muy importante que hay que cubrir para evitar errores relacionados con la cach√© y simplificar el flujo de traducci√≥n y validaci√≥n, centralizamos todo el proceso en un √∫nico bloque de funciones.

Estas funciones permiten:
- Limpiar la cach√© y la memoria antes de cada nuevo comentario (`clear_cache`)
- Traducir autom√°ticamente con fallback a OpenAI (`translate_comment`)
- Validar que la traducci√≥n tiene sentido y no ha perdido informaci√≥n clave (`validate_translation`)
- Procesar todo el flujo en un solo paso (`process_comment`)


In [3]:
# üîÅ Utilidades para traducci√≥n y validaci√≥n centralizadas

import gc
from functools import lru_cache
from openai import OpenAI

client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

# 1. Forzar recolecci√≥n de basura y limpiar cache de funciones
def clear_cache():
    gc.collect()
    try:
        translate_comment.cache_clear()
        validate_translation.cache_clear()
    except NameError:
        pass

# 2. Funci√≥n de traducci√≥n centralizada
@lru_cache(maxsize=128)
def translate_comment(comment: str, source_lang: str = None, target_lang: str = "es") -> str:
    prompt = f"Traduce este texto al {target_lang}:\n\n{comment}"
    if source_lang:
        prompt = f"El texto est√° en {source_lang}. " + prompt
    response = client.chat.completions.create(
        model="gpt-4",
        messages=[
            {"role": "system", "content": "Act√∫a como traductor fiel."},
            {"role": "user", "content": prompt}
        ],
        temperature=0.0,
    )
    return response.choices[0].message.content.strip()

# 3. Validaci√≥n de traducci√≥n
@lru_cache(maxsize=128)
def validate_translation(original: str, translated: str) -> bool:
    orig_len = len(original.split())
    trans_len = len(translated.split())
    if trans_len < 0.7 * orig_len or trans_len > 1.3 * orig_len:
        return False
    for token in original.split():
        if token.istitle() and token.lower() not in translated.lower():
            return False
    return True

# 4. Funci√≥n √∫nica para procesar un comentario completo
def process_comment(comment: str, source_lang: str = None):
    clear_cache()
    translation = translate_comment(comment, source_lang)
    is_valid = validate_translation(comment, translation)
    return {
        "original": comment,
        "translated": translation,
        "translation_valid": is_valid
    }


### ***1.4 üìÅ Clonaci√≥n del repositorio de GitHub***

Clonamos el repositorio p√∫blico donde se encuentran los archivos del proyecto. Se almacenan autom√°ticamente en la carpeta `data/`.


In [4]:
# Clonamos el repositorio p√∫blico de GitHub con los archivos del proyecto
!git clone https://github.com/AraceliFradejas/Capstone-Project---Desarrollador10X-IIA---Araceli-Fradejas.git

# Definimos la ruta base donde est√°n los datos dentro de la carpeta 'data'
ruta_base = "/content/Capstone-Project---Desarrollador10X-IIA---Araceli-Fradejas/data"
archivo_comentarios = f"{ruta_base}/BD Comentarios KelceTS.txt"

# Verificamos que los archivos est√°n disponibles
print("üìÅ Archivos encontrados en la carpeta 'data':")
!ls -1 {ruta_base}



fatal: destination path 'Capstone-Project---Desarrollador10X-IIA---Araceli-Fradejas' already exists and is not an empty directory.
üìÅ Archivos encontrados en la carpeta 'data':
'BD Comentarios KelceTS.txt'
dashboard_preview.png
gradio_preview.png
Informe_Ejecutivo_KelceTS.pdf
Informe_Final_KelceTS.xlsx
KelceTS_logo.png
'Reglas de calidad clientes KelceTS SL.xlsx'
'Reglas de como valorar un comentario KelceTS SL.xlsx'
'Reglas de comunicaciones equipos calidad y logistica KelceTS SL.xlsx'
'Reglas de medidas de calidad KelceTS SL.xlsx'


## **2. Lectura de comentarios del archivo**

Creamos una funci√≥n para extraer los comentarios desde el fichero `.txt`, identificando autom√°ticamente el idioma y separando comentarios aunque est√©n en diferentes formatos.


In [5]:
def leer_comentarios(archivo_path, limite=None):
    """
    Lee comentarios de un archivo de texto plano.
    Par√°metros:
        archivo_path (str): Ruta del archivo con los comentarios
        limite (int): L√≠mite de comentarios a leer (None para todos)
    """
    try:
        with open(archivo_path, 'r', encoding='utf-8') as f:
            contenido = f.read()

        # Posibles patrones multiling√ºes para dividir los comentarios
        patrones = [
            r'(?:Comentario|Kommentar|Commentaire|Commento|Opmerking|Komentarz|Coment√°rio|Kommentti|Œ£œáœåŒªŒπŒø)\\s+\\d+\\s*:\\s*(.*?)(?=(?:Comentario|Kommentar|Commentaire|Commento|Opmerking|Komentarz|Coment√°rio|Kommentti|Œ£œáœåŒªŒπŒø)\\s+\\d+\\s*:|$)',
            r'(?<=\\n)\\d+\\s*(.*?)(?=\\n\\d+\\s*|$)'
        ]

        comentarios = []
        for patron in patrones:
            matches = re.findall(patron, contenido, re.DOTALL)
            if matches:
                comentarios = [match.strip() for match in matches if match.strip()]
                break

        if not comentarios:
            comentarios = [linea.strip() for linea in contenido.split('\n') if linea.strip()]

        if limite and len(comentarios) > limite:
            comentarios = comentarios[:limite]

        print(f"‚úÖ Se han cargado {len(comentarios)} comentarios desde {archivo_path}")
        for i, comentario in enumerate(comentarios[:3]):
            print(f"Comentario {i+1} (muestra): {comentario[:100]}...")

        return comentarios

    except Exception as e:
        print(f"‚ùå Error al leer el archivo {archivo_path}: {str(e)}")
        return []


### 2.1 Validaci√≥n de la lectura de comentarios

Se muestra un resumen del n√∫mero total de comentarios cargados correctamente y una muestra aleatoria de 3 comentarios para verificar que se han le√≠do con √©xito desde el archivo `.txt`.


In [6]:
# Leer comentarios desde el archivo usando la funci√≥n definida
comentarios = leer_comentarios(archivo_comentarios)

# Validaci√≥n visual
print(f"\nüìä Total de comentarios cargados: {len(comentarios)}")

# Mostrar una muestra aleatoria
if comentarios:
    print("\nüßæ Muestra de 3 comentarios:")
    for i, comentario in enumerate(random.sample(comentarios, min(3, len(comentarios))), 1):
        print(f"{i}. {comentario[:150]}...")
else:
    print("‚ö†Ô∏è No se encontraron comentarios.")


‚úÖ Se han cargado 50 comentarios desde /content/Capstone-Project---Desarrollador10X-IIA---Araceli-Fradejas/data/BD Comentarios KelceTS.txt
Comentario 1 (muestra): Comment 1: Ordered late Monday and had the box in hand by Wednesday breakfast‚Äîbarely 36‚ÄØhours. Couri...
Comentario 2 (muestra): Comment 2: Two‚Äëday shipping promise kept: 47‚ÄØhours door to door. The discreet eco‚Äëpaper wrap looked ...
Comentario 3 (muestra): Comment 3: Box showed up unscathed within the 96‚Äëhour window. First impression: lightweight but stur...

üìä Total de comentarios cargados: 50

üßæ Muestra de 3 comentarios:
1. Kommentar 41: Versand dauerte genau 96‚ÄØStunden, Karton leicht eingedr√ºckt. Gr√∂√üe‚ÄØ42 sitzt ok, Obermaterial wirkt solide, aber nicht luxuri√∂s. Nach dre...
2. Commentaire 8: Exp√©dition √©clair‚ÄØ‚Äì‚ÄØmoins de deux jours. Emballage z√©ro plastique, chausson parfum√© au li√®ge naturel. J‚Äôai couru 12‚ÄØkm le long de la Se...
3. Comment 2: Two‚Äëday shipping promise kept: 47‚ÄØhou

### 2.2 Cargar los comentarios en una variable global

Utilizamos la funci√≥n definida anteriormente para leer los comentarios desde el archivo `.txt` y los almacenamos en una variable global llamada `comentarios`.


In [7]:
print("\n--- Cargando comentarios del archivo ---")
comentarios = leer_comentarios(archivo_comentarios)

# Guardamos la lista en una variable accesible globalmente
import sys
sys.modules['__main__'].comentarios = comentarios

print(f"\n‚úÖ Variable 'comentarios' creada con {len(comentarios)} comentarios")



--- Cargando comentarios del archivo ---
‚úÖ Se han cargado 50 comentarios desde /content/Capstone-Project---Desarrollador10X-IIA---Araceli-Fradejas/data/BD Comentarios KelceTS.txt
Comentario 1 (muestra): Comment 1: Ordered late Monday and had the box in hand by Wednesday breakfast‚Äîbarely 36‚ÄØhours. Couri...
Comentario 2 (muestra): Comment 2: Two‚Äëday shipping promise kept: 47‚ÄØhours door to door. The discreet eco‚Äëpaper wrap looked ...
Comentario 3 (muestra): Comment 3: Box showed up unscathed within the 96‚Äëhour window. First impression: lightweight but stur...

‚úÖ Variable 'comentarios' creada con 50 comentarios


### 2.3 Verificar carpeta y archivo de comentarios

Antes de avanzar, comprobamos si la ruta del archivo de comentarios existe y si el archivo est√° correctamente guardado en esa ubicaci√≥n. Mostramos tambi√©n los primeros comentarios para validar que el archivo se puede leer.


In [8]:
print(f"\nüìÇ Ruta de trabajo: {ruta_base}")

if os.path.exists(ruta_base):
    print(f"‚úÖ Carpeta encontrada correctamente")
    print("Archivos disponibles en la carpeta:")
    for archivo in os.listdir(ruta_base):
        print(f"  ‚Ä¢ {archivo}")

    if os.path.exists(archivo_comentarios):
        print(f"\n‚úÖ Archivo de comentarios encontrado: {archivo_comentarios}")
        with open(archivo_comentarios, 'r', encoding='utf-8') as f:
            primeras_lineas = ''.join(f.readlines()[:5])
            print(f"Primeras l√≠neas del archivo:\n{primeras_lineas}")
    else:
        print(f"\n‚ùå No se encontr√≥ el archivo de comentarios: {archivo_comentarios}")
else:
    print(f"‚ùå Ruta no encontrada: {ruta_base}")



üìÇ Ruta de trabajo: /content/Capstone-Project---Desarrollador10X-IIA---Araceli-Fradejas/data
‚úÖ Carpeta encontrada correctamente
Archivos disponibles en la carpeta:
  ‚Ä¢ Reglas de calidad clientes KelceTS SL.xlsx
  ‚Ä¢ gradio_preview.png
  ‚Ä¢ dashboard_preview.png
  ‚Ä¢ Reglas de como valorar un comentario KelceTS SL.xlsx
  ‚Ä¢ Informe_Final_KelceTS.xlsx
  ‚Ä¢ Reglas de comunicaciones equipos calidad y logistica KelceTS SL.xlsx
  ‚Ä¢ KelceTS_logo.png
  ‚Ä¢ Informe_Ejecutivo_KelceTS.pdf
  ‚Ä¢ Reglas de medidas de calidad KelceTS SL.xlsx
  ‚Ä¢ BD Comentarios KelceTS.txt
  ‚Ä¢ .gitkeep

‚úÖ Archivo de comentarios encontrado: /content/Capstone-Project---Desarrollador10X-IIA---Araceli-Fradejas/data/BD Comentarios KelceTS.txt
Primeras l√≠neas del archivo:
Comment 1: Ordered late Monday and had the box in hand by Wednesday breakfast‚Äîbarely 36‚ÄØhours. Courier handled it gently: not a single dent. Size 9 hugs my arches, algae‚Äëfoam midsole pops with energy, recycled knit vents the Tex

### 2.4  Comentarios cargados correctamente

Mostramos una muestra representativa de los primeros comentarios procesados, para verificar que la lectura y segmentaci√≥n se han realizado correctamente.


In [9]:
# Mostramos un resumen r√°pido
print(f"üîé Total de comentarios cargados: {len(comentarios)}")

# Mostramos una muestra aleatoria de 3 comentarios
print("\nüßæ Muestra de comentarios:")
for i, comentario in enumerate(random.sample(comentarios, 3), 1):
    print(f"{i}. {comentario[:150]}...")


üîé Total de comentarios cargados: 50

üßæ Muestra de comentarios:
1. Kommentti 48: Saapui kolmen p√§iv√§n kuluttua, pakkaus pikkiriikkisen rypistynyt. Koko 42 istuu, kantap√§√§ss√§ hieman liikaa tilaa. Materiaalit vaikuttava...
2. Comentariu 18: Comandate mar»õi, ajuns joi la pr√¢nz. Cutia din carton reciclat era intactƒÉ. MƒÉrimea 43 se potrive»ôte la milimetru, iar bran»õul din plut...
3. Kommentti 16: Tilasin sunnuntai‚Äëiltana, keng√§t olivat tiistaina postilaatikossa. Pakkaus oli kierr√§tyskartonkia, t√§ysin ehj√§. Koko 41 istuu t√§ydellise...


## **3. Cargar reglas de valoraci√≥n desde archivos Excel**

En este paso cargamos las reglas de negocio definidas por KelceTS desde los archivos `.xlsx` que se encuentran en la carpeta `data`.

Estas reglas incluyen:

- ‚úÖ Reglas de valoraci√≥n de comentarios
- ‚úÖ Reglas de calidad para clientes
- ‚úÖ Reglas de comunicaciones internas (calidad y log√≠stica)
- ‚úÖ Reglas de medidas de calidad a aplicar

La funci√≥n se encarga de leer cada archivo Excel, transformarlo en diccionarios y dejarlos listos para el an√°lisis posterior.



In [10]:
def cargar_reglas_excel(ruta_base):
    """
    Carga todas las reglas de negocio desde archivos Excel ubicados en la carpeta 'data'.
    Devuelve un diccionario con claves: valoracion, calidad_clientes, comunicaciones_equipos, medidas_calidad.
    """
    archivos = {
        "valoracion": "Reglas de como valorar un comentario KelceTS SL.xlsx",
        "calidad_clientes": "Reglas de calidad clientes KelceTS SL.xlsx",
        "comunicaciones_equipos": "Reglas de comunicaciones equipos calidad y logistica KelceTS SL.xlsx",
        "medidas_calidad": "Reglas de medidas de calidad KelceTS SL.xlsx"
    }

    reglas = {}

    for clave, nombre_archivo in archivos.items():
        ruta_completa = os.path.join(ruta_base, nombre_archivo)

        try:
            if os.path.exists(ruta_completa):
                df = pd.read_excel(ruta_completa)
                reglas[clave] = df.to_dict("records")
                print(f"‚úÖ {clave.upper()} cargadas correctamente ({len(df)} reglas)")
            else:
                print(f"‚ùå Archivo no encontrado: {nombre_archivo}")
                reglas[clave] = []
        except Exception as e:
            print(f"‚ùå Error al cargar {nombre_archivo}: {str(e)}")
            reglas[clave] = []

    return reglas


In [11]:
# Ejecutamos la carga de reglas desde la carpeta /data del repositorio
reglas = cargar_reglas_excel(ruta_base)

‚úÖ VALORACION cargadas correctamente (7 reglas)
‚úÖ CALIDAD_CLIENTES cargadas correctamente (4 reglas)
‚úÖ COMUNICACIONES_EQUIPOS cargadas correctamente (24 reglas)
‚úÖ MEDIDAS_CALIDAD cargadas correctamente (5 reglas)


### 3.1 Verificaci√≥n de reglas cargadas:
Mostramos cu√°ntas reglas se han detectado por cada categor√≠a y un peque√±o ejemplo de su contenido.

In [12]:
for nombre, datos in reglas.items():
    print(f"\nüìä Reglas de {nombre}: {len(datos)} registros")
    if datos:
        ejemplo = {k: v for k, v in list(datos[0].items())[:3]}
        print(f"Ejemplo: {ejemplo}")



üìä Reglas de valoracion: 7 registros
Ejemplo: {'Pregunta para detrminar la valoraci√≥n ': '<Identificaci√≥n del idioma del comentario >', 'Variable para establecer la valoraci√≥n de respuesta': 'Idioma comentario cliente', 'Detalle respuesta positiva': 'Si el idioma es castellano , debemos utilizar castellano en la respuesta al cliente '}

üìä Reglas de calidad_clientes: 4 registros
Ejemplo: {'Valoraci√≥n feedback del cliente': 'Calidad del env√≠o', 'Valoraci√≥n Positiva': 'Cumple que el env√≠o se ha recibido en menos de 96h o no se ha detectado ninguna anomal√≠a en el embalaje', 'Valoraci√≥n Negativa': 'No cumple que el env√≠o se ha recibido en menos de 96h o se ha detectado alguna anomal√≠a en el embalaje'}

üìä Reglas de comunicaciones_equipos: 24 registros
Ejemplo: {'Acciones a realizar en equipos de la startup': 'Calidad del env√≠o: env√≠o retrasado', 'Valoraci√≥n Positiva': 'Cumple que el env√≠o se ha recibido en menos de 96h', 'Valoraci√≥n Negativa': 'No cumple que el env√≠

## **4. Ejecutar an√°lisis con agente de IA**

Creamos una funci√≥n `analizar_comentario()` que procesa cada comentario de cliente utilizando la API de OpenAI y las reglas definidas. Para cada comentario, realizamos:

1. üìç Identificaci√≥n del idioma
2. üìö Resumen del contenido y extracci√≥n de factores clave
3. üòä An√°lisis de sentimiento
4. üìä Valoraci√≥n con base en reglas
5. üí¨ Generaci√≥n de respuesta al cliente
6. üè∑Ô∏è Notificaciones internas (si aplica)
7. ‚úâÔ∏è Correo para proveedor (si aplica)

Se devuelve un diccionario estructurado con todos los resultados.



In [13]:
def generar_prompt_con_reglas(reglas, comentario, traduccion=None):
    """
    Genera un prompt estructurado para el agente IA seg√∫n las reglas internas.
    """

    prompt_base = """
    Eres un asistente experto para el equipo de calidad de KelceTS S.L., una startup de zapatillas.
    Analiza el siguiente comentario de un cliente siguiendo EXACTAMENTE las reglas proporcionadas.

    COMENTARIO DEL CLIENTE:
    {comentario}

    INSTRUCCIONES DE AN√ÅLISIS (responde a cada punto):
    1. Identifica el idioma exacto del comentario.
    2. ¬øLas zapatillas se recibieron en menos de 96h? (s√≠/no/no mencionado)
    3. ¬øEl embalaje estaba da√±ado? (s√≠/no/no mencionado)
    4. ¬øLa talla es correcta? (s√≠/no/no mencionado)
    5. ¬øLos materiales son de buena calidad? (s√≠/no/parcialmente/no mencionado)
    6. ¬øQu√© tipo de uso hace el cliente? (diario/ocasional/no mencionado)
    7. ¬øEl producto cumple las expectativas? (s√≠/no/parcialmente)

    REGLAS PARA VALORACIONES NEGATIVAS:
    - Si menciona problemas con materiales, valora como "no" en calidad de materiales.
    - Si menciona que la talla es grande o peque√±a, valora como "no" en talla correcta.
    - Si menciona retraso en la entrega (m√°s de 96h), valora como "no" en env√≠o en 96h.
    - Si hay al menos una valoraci√≥n negativa, el producto no cumple expectativas.

    REGLAS PARA COMUNICACIONES:
    - Email al cliente:
        - En el idioma original del cliente
        - Tono cercano y uso del "t√∫"
        - Incluir soluciones espec√≠ficas seg√∫n el problema
        - Firmar como "KelceTS Team"
    - Notificaci√≥n interna y email a proveedor:
        - En espa√±ol
        - Claros y accionables
        - Firmar con el rol correspondiente

    FORMATO DE RESPUESTA:
    Devuelve solo un JSON con esta estructura (usa comillas dobles y no a√±adas explicaciones):

    {{
      "analisis": {{
        "idioma": "...",
        "envio_96h": "...",
        "embalaje_danado": "...",
        "talla_correcta": "...",
        "materiales_calidad": "...",
        "tipo_uso": "...",
        "cumple_expectativas": "..."
      }},
      "valoracion": "...",
      "comunicaciones": {{
        "email_cliente": "...",
        "email_cliente_traduccion": "...",
        "notificacion_interna": "...",
        "email_proveedor": "..."
      }}
    }}
    """

    return prompt_base.format(comentario=comentario)


### 4.1 üß† An√°lisis de Comentario con Agente de IA

Esta funci√≥n utiliza la API de OpenAI para analizar cada comentario individual seg√∫n las reglas internas de KelceTS S.L.:
- Eval√∫a idioma, calidad, embalaje, talla, materiales, etc.
- Clasifica autom√°ticamente la valoraci√≥n como positiva, negativa o neutra.
- Genera comunicaciones internas y externas.
- Extrae el bloque JSON de la respuesta de manera robusta con expresiones regulares, incluso si el modelo devuelve texto adicional.


#### 4.1.1 üõ°Ô∏è Protecci√≥n frente a errores JSON

A veces el modelo devuelve respuestas que no contienen JSON v√°lido (vac√≠as, incompletas o malformadas), lo cual genera un error `JSONDecodeError` al intentar convertir la cadena en un diccionario con `json.loads()`.

Para evitar que se interrumpa la ejecuci√≥n del an√°lisis de todos los comentarios, hemos a√±adido un bloque `try/except` dentro de la funci√≥n `analizar_comentario()` que:
- Detecta si el bloque JSON est√° malformado,
- Captura el error de decodificaci√≥n,
- Y devuelve un diccionario con el comentario original y el error encontrado.

Esto nos permite registrar qu√© comentarios han fallado, continuar con los que s√≠ funcionan, y mostrar la vista previa de errores al final.


In [14]:
def analizar_comentario(comentario, reglas):
    """
    Usa un agente de IA para analizar un comentario seg√∫n las reglas internas.
    Devuelve un diccionario con idioma, an√°lisis, valoraci√≥n, comunicaciones, etc.
    """

    try:
        prompt_sistema = {
            "role": "system",
            "content": "Eres un asistente especializado en KelceTS S.L. que analiza comentarios de clientes y genera respuestas siguiendo reglas internas."
        }

        prompt_usuario = {
            "role": "user",
            "content": generar_prompt_con_reglas(reglas, comentario)
        }

        respuesta = openai.ChatCompletion.create(
            model="gpt-3.5-turbo",
            messages=[prompt_sistema, prompt_usuario],
            temperature=0.4
        )

        texto = respuesta.choices[0].message["content"]

        # üß† Buscar el bloque JSON dentro del texto
        match = re.search(r"\{[\s\S]*\}", texto)
        if match:
            json_text = match.group()

            # ‚úÖ Protecci√≥n frente a errores de parseo JSON
            try:
                resultado_dict = json.loads(json_text)
                resultado_dict["comentario_original"] = comentario
                return resultado_dict
            except json.JSONDecodeError as e:
                return {
                    "comentario_original": comentario,
                    "error": f"JSONDecodeError: {str(e)}",
                    "respuesta_raw": texto
                }
        else:
            return {
                "comentario_original": comentario,
                "error": "‚ùå No se encontr√≥ JSON v√°lido en la respuesta.",
                "respuesta_raw": texto
            }

    except Exception as e:
        return {
            "comentario_original": comentario,
            "error": f"‚ùå Error en la llamada a OpenAI: {str(e)}"
        }


### 4.2 Validaci√≥n de comunicaciones multiidioma

Definimos una funci√≥n especializada que valida y corrige las comunicaciones generadas:
- Asegura que los emails al cliente est√©n en el idioma original del cliente
- Verifica que contengan todos los elementos obligatorios (email de contacto, firma correcta)
- A√±ade las medidas de calidad correspondientes seg√∫n el tipo de problema
- Genera autom√°ticamente traducciones y correcciones cuando sea necesario
- Soporta todos los idiomas de la Uni√≥n Europea

## **5. Ejecutar an√°lisis masivo y aplicar comunicaciones oficiales**

En este paso recorremos todos los comentarios cargados y aplicamos el flujo completo de an√°lisis y correcci√≥n:

1. üß† Procesamos cada comentario con `analizar_comentario()` o `analizar_con_fallback()`, que aplica las reglas internas mediante IA.
2. üõ†Ô∏è Aplicamos las reglas oficiales con `aplicar_comunicaciones_oficiales()` para asegurarnos de que:
   - Las respuestas al cliente siguen exactamente lo definido en los Excels del ejercicio.
   - Se incluyen las medidas correctivas (descuento 5%, 25%, cambio de talla...) seg√∫n las incidencias detectadas.
   - Se generan correctamente los textos para cliente, proveedor y departamentos internos, con el tono, idioma y firma adecuados.
3. üíæ Guardamos todos los resultados en una lista estructurada (`resultados`), lista para visualizar, exportar o analizar con gr√°ficos.

Este paso garantiza que todas las comunicaciones cumplen al 100% con el Prompt definido.



### 5.1 üß™ Verificaci√≥n inicial de an√°lisis con IA (antes del procesamiento masivo)

Antes de analizar todos los comentarios, hacemos una prueba individual para asegurarnos de que la funci√≥n `analizar_comentario_fallback()` funciona correctamente y devuelve los campos esperados (`analisis`, `valoracion`, `comunicaciones`).

Esto nos permite detectar errores tempranos (claves mal cargadas, estructura del prompt incorrecta, errores de conexi√≥n, etc.) sin tener que procesar los 50 comentarios.


#### 5.1.1 üß† *Funci√≥n de an√°lisis con Fallback (OpenAI ‚Üí Gemini)*

Esta funci√≥n `analizar_con_fallback()` realiza el an√°lisis del comentario usando primero el modelo `gpt-3.5-turbo` de OpenAI. Si la llamada falla (por error de clave, l√≠mite de uso, etc.), autom√°ticamente utiliza el modelo `gemini-pro` de Google AI como respaldo.

Este enfoque garantiza robustez, evitando que el an√°lisis completo se detenga por un solo fallo de conexi√≥n o error de proveedor.

- ‚úÖ Si OpenAI responde bien ‚Üí usa su resultado.
- üîÅ Si OpenAI falla ‚Üí cambia a Gemini autom√°ticamente.



##### 5.1.1.1. üîÅ *Uso de fallback entre OpenAI y Gemini*

En esta funci√≥n usamos un mecanismo de respaldo: intentamos generar la respuesta con OpenAI, y si falla (por timeout, l√≠mite, etc.), se lanza una segunda llamada con Gemini. La funci√≥n no convierte la respuesta a JSON, solo devuelve el texto crudo generado por el modelo.

La protecci√≥n frente a errores JSON la a√±adimos en la celda que utiliza esta funci√≥n (`json.loads()` o `extraer_json_desde_texto()`), y no aqu√≠ dentro.



In [15]:
def analizar_con_fallback(comentario, prompt_openai, prompt_gemini):
    try:
        # üß† Primero intentamos con OpenAI
        respuesta = client.chat.completions.create(
            model="gpt-3.5-turbo",
            messages=[
                {"role": "system", "content": "Eres un asistente experto de KelceTS S.L."},
                {"role": "user", "content": prompt_openai}
            ],
            temperature=0.4,
        )
        return respuesta.choices[0].message.content

    except Exception as e:
        print(f"‚ö†Ô∏è Error con OpenAI: {e}")
        print("üîÅ Usando Gemini como respaldo...")

        try:
            model = genai.GenerativeModel("gemini-pro")
            respuesta = model.generate_content(prompt_gemini)
            return respuesta.text
        except Exception as err:
            print(f"‚ùå Error con Gemini: {err}")
            return {
                "comentario_original": comentario,
                "error": str(err)
            }


In [16]:
# Probaremos el primer comentario antes del an√°lisis masivo
comentario_test = comentarios[0]

# Generamos el prompt usando las reglas
prompt_test = generar_prompt_con_reglas(reglas, comentario_test)

# Ejecutamos el an√°lisis con fallback OpenAI ‚Üí Gemini
respuesta_test = analizar_con_fallback(comentario_test, prompt_test, prompt_test)

# Mostramos resultado crudo
print("üîç Respuesta de la IA:")
print(respuesta_test)


üîç Respuesta de la IA:
{
  "analisis": {
    "idioma": "Ingl√©s",
    "envio_96h": "S√≠",
    "embalaje_danado": "No",
    "talla_correcta": "S√≠",
    "materiales_calidad": "S√≠",
    "tipo_uso": "Ocasional",
    "cumple_expectativas": "S√≠"
  },
  "valoracion": "Positiva",
  "comunicaciones": {
    "email_cliente": "Gracias por compartir tu experiencia con nosotros. Nos alegra saber que recibiste tus zapatillas en tiempo r√©cord y que cumplen con tus expectativas. ¬°Disfr√∫talas al m√°ximo!",
    "email_cliente_traduccion": "Thank you for sharing your experience with us. We are glad to hear that you received your sneakers in record time and that they meet your expectations. Enjoy them to the fullest!",
    "notificacion_interna": "El cliente ha expresado una experiencia positiva con el producto recibido.",
    "email_proveedor": "Estimado proveedor, queremos destacar que el cliente ha recibido el producto en excelentes condiciones y ha expresado su satisfacci√≥n con la calidad y aj

#### 5.1.1.2 üßº *Limpieza y normalizaci√≥n de la respuesta del agente IA*

Una vez obtenida la respuesta del agente de IA, es importante asegurarnos de que:

- Los valores est√°n correctamente formateados (todo en min√∫sculas).
- No hay traducci√≥n innecesaria al espa√±ol si el comentario original ya est√° en espa√±ol.
- La estructura del JSON es consistente con lo esperado en el flujo de an√°lisis.

Esta funci√≥n garantiza que los datos se puedan usar sin errores en el an√°lisis masivo, visualizaci√≥n y exportaci√≥n posterior.


In [17]:
def normalizar_resultado_ia(resultado):
    """
    Limpia y normaliza la estructura y valores del JSON generado por la IA.
    Convierte campos a min√∫sculas, asegura estructura y elimina traducciones innecesarias.
    """
    if "analisis" in resultado:
        for k, v in resultado["analisis"].items():
            if isinstance(v, str):
                resultado["analisis"][k] = v.strip().lower()

    if "valoracion" in resultado and isinstance(resultado["valoracion"], str):
        resultado["valoracion"] = resultado["valoracion"].strip().lower()

    if "comunicaciones" in resultado:
        idioma = resultado.get("analisis", {}).get("idioma", "").lower()
        if idioma == "espa√±ol":
            resultado["comunicaciones"]["email_cliente_traduccion"] = ""  # Vaciar si no aplica

    return resultado


In [18]:
# Validamos el contenido antes de intentar decodificar
def limpiar_json_marcado(texto):
    # Elimina encabezados como ```json y ```
    texto_limpio = re.sub(r"^```json\s*|\s*```$", "", texto.strip(), flags=re.IGNORECASE | re.MULTILINE)
    return texto_limpio.strip()

# Limpiamos el texto si viene en formato markdown con bloque ```json
if respuesta_test and respuesta_test.strip():
    try:
        respuesta_limpia = limpiar_json_marcado(respuesta_test)
        resultado_json = json.loads(respuesta_limpia)
        resultado_normalizado = normalizar_resultado_ia(resultado_json)
        print("üßº Resultado normalizado:")
        print(json.dumps(resultado_normalizado, indent=2, ensure_ascii=False))
    except json.JSONDecodeError as e:
        print("‚ùå Error al decodificar el JSON:")
        print(e)
        print("Contenido recibido (limpio):")
        print(repr(respuesta_limpia))
else:
    print("‚ö†Ô∏è La variable 'respuesta_test' est√° vac√≠a o solo contiene espacios.")


üßº Resultado normalizado:
{
  "analisis": {
    "idioma": "ingl√©s",
    "envio_96h": "s√≠",
    "embalaje_danado": "no",
    "talla_correcta": "s√≠",
    "materiales_calidad": "s√≠",
    "tipo_uso": "ocasional",
    "cumple_expectativas": "s√≠"
  },
  "valoracion": "positiva",
  "comunicaciones": {
    "email_cliente": "Gracias por compartir tu experiencia con nosotros. Nos alegra saber que recibiste tus zapatillas en tiempo r√©cord y que cumplen con tus expectativas. ¬°Disfr√∫talas al m√°ximo!",
    "email_cliente_traduccion": "Thank you for sharing your experience with us. We are glad to hear that you received your sneakers in record time and that they meet your expectations. Enjoy them to the fullest!",
    "notificacion_interna": "El cliente ha expresado una experiencia positiva con el producto recibido.",
    "email_proveedor": "Estimado proveedor, queremos destacar que el cliente ha recibido el producto en excelentes condiciones y ha expresado su satisfacci√≥n con la calidad y

#### 5.1.1.3 üßº *Limpieza segura del JSON devuelto por la IA*

Los modelos generativos como OpenAI o Gemini pueden a√±adir texto extra antes o despu√©s del JSON esperado. Para evitar errores del tipo `JSONDecodeError`, esta funci√≥n busca autom√°ticamente el primer bloque JSON v√°lido dentro del texto y lo extrae para analizarlo de forma segura.


In [19]:
def extraer_json_desde_texto(texto):
    """
    Extrae el primer bloque JSON v√°lido desde un texto generado por IA.
    Devuelve un diccionario o lanza excepci√≥n si no encuentra JSON.
    """
    try:
        # Buscar el primer bloque que parezca un JSON (delimitado por llaves)
        match = re.search(r"\{[\s\S]*\}", texto)
        if match:
            json_texto = match.group()
            return json.loads(json_texto)
        else:
            raise ValueError("‚ùå No se encontr√≥ JSON en la respuesta.")
    except Exception as e:
        raise ValueError(f"‚ö†Ô∏è Error al extraer JSON: {e}")


### 5.2 üß† An√°lisis autom√°tico de todos los comentarios (con fallback OpenAI ‚Üí Gemini)

En esta secci√≥n se ejecuta el an√°lisis automatizado sobre todos los comentarios usando el agente IA. Se utiliza un sistema de fallback que prioriza OpenAI y recurre a Gemini si ocurre alg√∫n error.

El flujo para cada comentario es el siguiente:

1. Se genera el prompt y se analiza con `analizar_con_fallback()`.
2. Se normaliza el resultado con `normalizar_resultado_ia()`.
3. Se asocia el comentario original para trazabilidad.
4. Si el an√°lisis falla, se captura el error sin detener el bucle.

Esto asegura una ejecuci√≥n robusta, con resultados v√°lidos y errores trazables en el `DataFrame` final.


#### 5.2.1 üß™ *Protecci√≥n de json.loads() en el an√°lisi principal*

Al usar la funci√≥n `analizar_con_fallback()`, obtenemos una cadena de texto que se espera est√© en formato JSON. Sin embargo, puede haber casos donde la respuesta est√© vac√≠a, incompleta o malformada, generando un `JSONDecodeError`.

Para evitar que se interrumpa el procesamiento del resto de comentarios, envolvemos `json.loads()` en un bloque `try/except`. Si el JSON no se puede parsear correctamente, registramos el error junto con el comentario original.


In [20]:
def safe_json_parse(response_str):
    try:
        return json.loads(response_str)
    except json.JSONDecodeError as e:
        print(f"‚ö†Ô∏è Error al parsear JSON: {e}")
        return None

resultados = []

# Procesamos todos los comentarios uno por uno
for i, comentario in enumerate(comentarios, 1):
    print(f"\nüîç Procesando comentario {i}/{len(comentarios)}...")

    try:
        # Generamos prompt y analizamos
        prompt = generar_prompt_con_reglas(reglas, comentario)
        respuesta = analizar_con_fallback(comentario, prompt, prompt)

        # Convertimos respuesta a diccionario si es JSON v√°lido
        resultado = safe_json_parse(respuesta) if isinstance(respuesta, str) else respuesta

        if resultado:
            resultado = normalizar_resultado_ia(resultado)
            resultado["comentario_original"] = comentario
        else:
            resultado = {
                "comentario_original": comentario,
                "error": "‚ùå Respuesta vac√≠a o malformada (no es JSON)"
            }

    except Exception as e:
        resultado = {
            "comentario_original": comentario,
            "error": repr(e)
        }
        print(f"‚ùå Error en comentario {i}: {e}")

    resultados.append(resultado)

print("\n‚úÖ Todos los comentarios han sido procesados correctamente.")



üîç Procesando comentario 1/50...

üîç Procesando comentario 2/50...

üîç Procesando comentario 3/50...

üîç Procesando comentario 4/50...

üîç Procesando comentario 5/50...

üîç Procesando comentario 6/50...

üîç Procesando comentario 7/50...

üîç Procesando comentario 8/50...

üîç Procesando comentario 9/50...

üîç Procesando comentario 10/50...

üîç Procesando comentario 11/50...

üîç Procesando comentario 12/50...

üîç Procesando comentario 13/50...

üîç Procesando comentario 14/50...

üîç Procesando comentario 15/50...

üîç Procesando comentario 16/50...

üîç Procesando comentario 17/50...

üîç Procesando comentario 18/50...

üîç Procesando comentario 19/50...

üîç Procesando comentario 20/50...

üîç Procesando comentario 21/50...
‚ö†Ô∏è Error al parsear JSON: Expecting value: line 1 column 1 (char 0)

üîç Procesando comentario 22/50...

üîç Procesando comentario 23/50...

üîç Procesando comentario 24/50...

üîç Procesando comentario 25/50...

üîç Proces

### 5.3 Verificaci√≥n final de reglas de calidad y comunicaciones (multiidioma)

Una vez procesados los comentarios, aplicamos una verificaci√≥n final para garantizar que se han respetado correctamente todas las reglas de calidad de KelceTS, independientemente del idioma del comentario.

Esta verificaci√≥n corrige:
- Valoraciones que deber√≠an ser negativas pero fueron clasificadas mal.
- Traducciones innecesarias si el idioma ya es espa√±ol.
- Campos de comunicaciones que falten, complet√°ndolos con mensajes por defecto.

Esta capa final asegura que el informe generado para la entrega cumpla con todos los criterios definidos en los documentos de reglas.


In [21]:
def verificacion_final_reglas_kelcets_multiidioma(resultado, texto_original, idioma, reglas):
    """
    Realiza una √∫ltima verificaci√≥n para asegurar que todas las reglas de KelceTS
    se han aplicado correctamente, con soporte para todos los idiomas.
    """
    analisis = resultado.get("analisis", {})
    valoracion = resultado.get("valoracion", "")
    comunicaciones = resultado.get("comunicaciones", {})

    # 1. Corrige la valoraci√≥n si hay problemas
    tiene_negativo = any(analisis.get(k) == "no" for k in ["envio_96h", "embalaje_danado", "talla_correcta", "materiales_calidad"])
    if tiene_negativo and valoracion != "negativa":
        resultado["valoracion"] = "negativa"

    # 2. Vac√≠a traducci√≥n si idioma ya es espa√±ol
    if idioma == "espa√±ol":
        comunicaciones["email_cliente_traduccion"] = ""

    # 3. Reemplaza campos vac√≠os por texto por defecto
    comunicaciones.setdefault("notificacion_interna", "No se gener√≥ notificaci√≥n interna.")
    comunicaciones.setdefault("email_proveedor", "No se gener√≥ email al proveedor.")
    comunicaciones.setdefault("email_cliente", "No se gener√≥ email al cliente.")
    comunicaciones.setdefault("email_cliente_traduccion", "")

    resultado["comunicaciones"] = comunicaciones
    return resultado

# ‚úÖ Aplicamos la verificaci√≥n final con control de errores
for resultado in resultados:
    if "analisis" in resultado and isinstance(resultado["analisis"], dict):
        idioma = resultado.get("analisis", {}).get("idioma", "espa√±ol")
        texto_original = resultado.get("comentario_original", "")

        try:
            resultado = verificacion_final_reglas_kelcets_multiidioma(resultado, texto_original, idioma, reglas)
        except Exception as e:
            print(f"‚ö†Ô∏è Error verificando comentario: {texto_original[:100]}...\n{e}")


#### 5.3.1  *Traducci√≥n autom√°tica del mensaje al idioma original del cliente*

Si el idioma del comentario no es espa√±ol, traducimos autom√°ticamente el mensaje generado para el cliente utilizando Gemini. Si Gemini falla, se hace fallback con OpenAI (GPT-4). As√≠ aseguramos que las medidas de calidad aplicadas lleguen al cliente en su idioma.


In [22]:
def traducir_texto(texto, idioma_destino):
    clave = f"{idioma_destino.lower()}::{texto.strip()}"

    if clave in traducciones_cache:
        return traducciones_cache[clave]

    prompt_traduccion = f"Traduce el siguiente mensaje al idioma {idioma_destino} manteniendo el tono profesional, claro y emp√°tico:\n\n\"{texto}\""

    try:
        print(f"üåç Traduciendo a {idioma_destino}...")
        time.sleep(3)  # Para evitar sobrecarga y cuelgues
        response = client.chat.completions.create(
            model="gpt-4",
            messages=[
                {"role": "system", "content": "Eres un traductor profesional de atenci√≥n al cliente."},
                {"role": "user", "content": prompt_traduccion}
            ],
            temperature=0.2
        )
        traduccion = response.choices[0].message.content.strip()
    except Exception as e_openai:
        print(f"‚ùå Error con OpenAI: {e_openai}")
        traduccion = "‚ö†Ô∏è No se pudo traducir el mensaje autom√°ticamente."

    traducciones_cache[clave] = traduccion
    return traduccion


### 5.4 üß† Versi√≥n mejorada de `aplicar_comunicaciones_oficiales()`

Esta versi√≥n:

- Asegura que se incluyan **todas las medidas de calidad que aplican al comentario**.
- Copia autom√°ticamente el `email_cliente` como traducci√≥n si el idioma no es espa√±ol.
- A√±ade los textos correctos para equipos internos y proveedores.



In [23]:
def aplicar_comunicaciones_oficiales(resultado):
    analisis = resultado.get("analisis", {})
    idioma = analisis.get("idioma", "espa√±ol")
    valoracion = resultado.get("valoracion", "")

    firma = "\n\nUn cordial saludo,\nKelceTS Team\natencionalcliente@kelcetssl.com"

    piezas_cliente = []
    acciones_internas = []
    acciones_proveedor = []

    if valoracion == "positiva":
        mensaje_cliente = f"¬°Gracias por confiar en KelceTS! Nos alegra saber que est√°s satisfecho con tu compra.{firma}"
        mensaje_interno = ""
        mensaje_proveedor = ""

    elif valoracion == "negativa":
        if analisis.get("envio_96h") == "no":
            piezas_cliente.append("Hemos detectado un retraso en la entrega. Te ofrecemos un 5% de descuento en tu pr√≥xima compra.")
            acciones_proveedor.append("- Contactar con el proveedor para mejorar el tiempo de entrega (menos de 24h).")

        if analisis.get("embalaje_danado") == "s√≠":
            piezas_cliente.append("Hemos registrado que el embalaje lleg√≥ da√±ado. Te ofrecemos un 5% de descuento por las molestias.")
            acciones_proveedor.append("- Evaluar calidad del embalaje con proveedor log√≠stico.")

        if analisis.get("talla_correcta") == "no":
            piezas_cliente.append("Vamos a enviarte en menos de 72h un nuevo par con la talla correcta, sin coste. Por favor, prepara el par anterior para su recogida.")
            acciones_proveedor.append("- Env√≠o urgente de nuevo par con talla correcta. Recojo del anterior.")

        if analisis.get("materiales_calidad") == "no":
            piezas_cliente.append("Te ofrecemos un 25% de descuento y env√≠o gratis. Enviaremos un miembro del staff en 72h para recoger el producto defectuoso.")
            acciones_proveedor.append("- Revisar materiales con proveedor. Plan de sustituci√≥n urgente.")

        if piezas_cliente:
            mensaje_cliente = "Lamentamos mucho los inconvenientes encontrados en tu compra. " + " ".join(piezas_cliente) + firma
            mensaje_interno = (
                "Este cliente ha recibido una valoraci√≥n negativa. Deben notificarse los siguientes puntos:\n"
                + "\n".join(acciones_proveedor) +
                "\n\nFirmado: Asistente IA de KelceTS S.L."
            )
            mensaje_proveedor = (
                "Estimado proveedor:\n"
                + "\n".join(acciones_proveedor) +
                "\n\nAtentamente,\nRodrigo Clemente, Director de Log√≠stica de KelceTS S.L."
            )
        else:
            mensaje_cliente = "Gracias por tu opini√≥n. Estamos revisando los aspectos mencionados para mejorar nuestro servicio." + firma
            mensaje_interno = ""
            mensaje_proveedor = ""

    elif valoracion == "parcialmente":
        mensaje_cliente = f"Gracias por tu opini√≥n. Vamos a revisar los aspectos que mencionas para seguir mejorando.{firma}"
        mensaje_interno = ""
        mensaje_proveedor = ""

    else:
        mensaje_cliente = "Gracias por tu comentario. Lo tendremos en cuenta para seguir mejorando nuestro servicio." + firma
        mensaje_interno = ""
        mensaje_proveedor = ""

    # Asignar textos finales
    resultado["email_cliente"] = mensaje_cliente
    resultado["email_cliente_traduccion"] = traducir_texto(mensaje_cliente, idioma) if idioma != "espa√±ol" else ""
    resultado["notificacion_interna"] = mensaje_interno
    resultado["email_proveedor"] = mensaje_proveedor

    return resultado


#### 5.4.1*Verificaci√≥n de comunicaciones generadas (vista previa)*

Mostramos en tabla los primeros comentarios procesados, con sus respectivos correos al cliente, notificaciones internas y correos al proveedor. Esta revisi√≥n sirve para validar que se aplican correctamente todas las medidas de calidad, descuentos y respuestas personalizadas.

##### 5.4.1.1 ‚úÖ Conversi√≥n de resultados en DataFrame y aplanamiento de campos anidados

En este bloque:

1. Convertimos la lista `resultados` en dos DataFrames: `df_validos` y `df_errores`.
2. Aplanamos el campo `analisis` (que contiene idioma, valoraci√≥n, etc.).
3. Aplanamos el campo `comunicaciones` (que contiene los textos de emails generados).
4. Mostramos las columnas clave para verificar que todo se ha generado correctamente.



In [24]:
#  Paso 1: Convertimos los resultados en DataFrame
df_validos = pd.DataFrame([r for r in resultados if "error" not in r])
df_errores = pd.DataFrame([r for r in resultados if "error" in r])

#  Paso 2: Aplanamos el campo "analisis"
if "analisis" in df_validos.columns:
    analisis_df = pd.json_normalize(df_validos["analisis"])
    df_validos = df_validos.drop(columns=["analisis"]).join(analisis_df)

#  Paso 3: Aplanamos el campo "comunicaciones"
if "comunicaciones" in df_validos.columns:
    comunicaciones_df = pd.json_normalize(df_validos["comunicaciones"])
    df_validos = df_validos.drop(columns=["comunicaciones"]).join(comunicaciones_df, rsuffix="_from_coms")

    # Renombramos las columnas para que se vean bien
    df_validos.rename(columns={
        "email_cliente_from_coms": "email_cliente",
        "email_cliente_traduccion_from_coms": "email_cliente_traduccion",
        "notificacion_interna_from_coms": "notificacion_interna",
        "email_proveedor_from_coms": "email_proveedor"
    }, inplace=True)

#  Paso 4: Mostramos una vista previa de las comunicaciones generadas
columnas_muestra = [
    "comentario_original", "idioma", "valoracion",
    "email_cliente", "email_cliente_traduccion",
    "notificacion_interna", "email_proveedor"
]

df_validos[columnas_muestra].head(5)


Unnamed: 0,comentario_original,idioma,valoracion,email_cliente,email_cliente_traduccion,notificacion_interna,email_proveedor
0,Comment 1: Ordered late Monday and had the box...,ingl√©s,negativa,Hi there! We're thrilled to hear you're enjoyi...,¬°Hola! Estamos emocionados de saber que est√°s ...,El cliente ha expresado una experiencia positi...,"Hola, queremos informarte que el cliente ha ex..."
1,Comment 2: Two‚Äëday shipping promise kept: 47‚ÄØh...,ingl√©s,negativa,Hi there! We're thrilled to hear you had such ...,¬°Hola! Estamos encantados de escuchar que tuvi...,El cliente ha expresado una experiencia muy po...,"Estimado proveedor, queremos felicitarte por l..."
2,Comment 3: Box showed up unscathed within the ...,ingl√©s,negativa,Hi there! We're thrilled to hear you're enjoyi...,¬°Hola! Estamos encantados de saber que est√°s d...,El cliente ha expresado una experiencia positi...,"Estimado proveedor, queremos informarte que un..."
3,Comment 4: Next‚Äëday delivery to rural Vermont ...,ingl√©s,negativa,"Hola, ¬°gracias por tu comentario! Nos alegra s...","Hello, thank you for your feedback! We are gla...",El cliente ha expresado su satisfacci√≥n con la...,"Estimado proveedor, queremos informarte que el..."
4,Kommentar 5: Von der Bestellung bis zur Haust√º...,alem√°n,negativa,"Lieber Kunde, vielen Dank f√ºr Ihr positives Fe...","Estimado cliente, ¬°muchas gracias por tus come...",El cliente ha dado una valoraci√≥n positiva de ...,"Estimado proveedor, queremos informarle que el..."


#### 5.5 üõ†Ô∏è *Aplicaci√≥n de comunicaciones oficiales tras el an√°lisis*

Una vez que todos los comentarios han sido procesados y normalizados, aplicamos esta funci√≥n adicional para generar las comunicaciones definitivas.

Esta funci√≥n a√±ade al an√°lisis de cada comentario:

- ‚úâÔ∏è `email_cliente`: texto de respuesta al cliente, en su idioma
- üì§ `notificacion_interna`: mensaje para el equipo de calidad o log√≠stica
- üè≠ `email_proveedor`: correo formal para el proveedor (si aplica)
- üåê `email_cliente_traduccion`: traducci√≥n al espa√±ol si el comentario era en otro idioma

Este paso es imprescindible para que esas comunicaciones aparezcan luego en el Excel final.


In [25]:
# Memoria de traducciones ya hechas
traducciones_cache = {}

# Aplicamos las comunicaciones oficiales a cada resultado v√°lido
resultados_corregidos = []

for r in resultados:
    if "error" not in r:
        r = aplicar_comunicaciones_oficiales(r)
    resultados_corregidos.append(r)

# Sobrescribimos la lista de resultados con las comunicaciones ya a√±adidas
resultados = resultados_corregidos


üåç Traduciendo a ingl√©s...
üåç Traduciendo a alem√°n...
üåç Traduciendo a franc√©s...
üåç Traduciendo a italiano...
üåç Traduciendo a portugu√©s...
üåç Traduciendo a holand√©s...
üåç Traduciendo a polaco...
üåç Traduciendo a finland√©s...
üåç Traduciendo a griego...
üåç Traduciendo a rumano...
üåç Traduciendo a ingl√©s...
üåç Traduciendo a alem√°n...
üåç Traduciendo a alem√°n...
üåç Traduciendo a franc√©s...
üåç Traduciendo a franc√©s...
üåç Traduciendo a italiano...
üåç Traduciendo a italiano...
üåç Traduciendo a portugu√©s...
üåç Traduciendo a holand√©s...
üåç Traduciendo a finland√©s...
üåç Traduciendo a griego...
üåç Traduciendo a h√∫ngaro...
üåç Traduciendo a irland√©s...
üåç Traduciendo a estonio...
üåç Traduciendo a let√≥n...
üåç Traduciendo a lituano...
üåç Traduciendo a ingl√©s...
üåç Traduciendo a alem√°n...
üåç Traduciendo a franc√©s...
üåç Traduciendo a italiano...
üåç Traduciendo a portugu√©s...
üåç Traduciendo a polaco...
üåç Traduciendo

#### 5.6 üëÄ *Vista previa de traducciones autom√°ticas del mensaje al cliente*

Comprobamos que el campo `email_cliente_traduccion` contiene una versi√≥n traducida autom√°ticamente del mensaje generado en espa√±ol, manteniendo las medidas de calidad y el tono profesional.


In [26]:
# Mostramos una tabla con comentarios que no est√°n en espa√±ol para verificar la traducci√≥n autom√°tica
df_traducciones = df_validos[df_validos["idioma"] != "espa√±ol"]

# Seleccionamos columnas relevantes
columnas_traduccion = [
    "comentario_original", "idioma", "email_cliente", "email_cliente_traduccion"
]

# Mostramos las primeras filas
display(df_traducciones[columnas_traduccion].head(5))


Unnamed: 0,comentario_original,idioma,email_cliente,email_cliente_traduccion
0,Comment 1: Ordered late Monday and had the box...,ingl√©s,Hi there! We're thrilled to hear you're enjoyi...,¬°Hola! Estamos emocionados de saber que est√°s ...
1,Comment 2: Two‚Äëday shipping promise kept: 47‚ÄØh...,ingl√©s,Hi there! We're thrilled to hear you had such ...,¬°Hola! Estamos encantados de escuchar que tuvi...
2,Comment 3: Box showed up unscathed within the ...,ingl√©s,Hi there! We're thrilled to hear you're enjoyi...,¬°Hola! Estamos encantados de saber que est√°s d...
3,Comment 4: Next‚Äëday delivery to rural Vermont ...,ingl√©s,"Hola, ¬°gracias por tu comentario! Nos alegra s...","Hello, thank you for your feedback! We are gla..."
4,Kommentar 5: Von der Bestellung bis zur Haust√º...,alem√°n,"Lieber Kunde, vielen Dank f√ºr Ihr positives Fe...","Estimado cliente, ¬°muchas gracias por tus come..."


## **6 Conversi√≥n de resultados a DataFrame y validaci√≥n**

En este paso transformamos la lista `resultados` en dos `DataFrames` separados:

- `df_resultados`: contiene solo los comentarios que fueron analizados correctamente.
- `df_errores`: contiene los comentarios que generaron errores durante el an√°lisis.

Esto nos permitir√° seguir con la visualizaci√≥n y exportaci√≥n solamente con los datos v√°lidos, y revisar por separado los errores si los hubiera.



In [27]:
# Separar los resultados v√°lidos y los que contienen errores
resultados_validos = [r for r in resultados if "error" not in r]
resultados_con_errores = [r for r in resultados if "error" in r]

# Convertir a DataFrame
df_resultados = pd.json_normalize(resultados_validos)
df_errores = pd.json_normalize(resultados_con_errores)

# Mostrar resumen
print(f"‚úÖ Comentarios procesados correctamente: {len(df_resultados)}")
print(f"‚ö†Ô∏è Comentarios con errores: {len(df_errores)}")

# Vista previa
print("\nüîç Vista previa de resultados v√°lidos:")
display(df_resultados.head(3))

if not df_errores.empty:
    print("\nüß™ Vista previa de errores:")
    display(df_errores[["comentario_original", "error"]].head(3))


‚úÖ Comentarios procesados correctamente: 48
‚ö†Ô∏è Comentarios con errores: 2

üîç Vista previa de resultados v√°lidos:


Unnamed: 0,valoracion,comentario_original,email_cliente,email_cliente_traduccion,notificacion_interna,email_proveedor,analisis.idioma,analisis.envio_96h,analisis.embalaje_danado,analisis.talla_correcta,analisis.materiales_calidad,analisis.tipo_uso,analisis.cumple_expectativas,comunicaciones.email_cliente,comunicaciones.email_cliente_traduccion,comunicaciones.notificacion_interna,comunicaciones.email_proveedor
0,negativa,Comment 1: Ordered late Monday and had the box...,Gracias por tu opini√≥n. Estamos revisando los ...,"""Thank you for your feedback. We are reviewing...",,,ingl√©s,s√≠,no,s√≠,s√≠,ocasional,s√≠,Hi there! We're thrilled to hear you're enjoyi...,¬°Hola! Estamos emocionados de saber que est√°s ...,El cliente ha expresado una experiencia positi...,"Hola, queremos informarte que el cliente ha ex..."
1,negativa,Comment 2: Two‚Äëday shipping promise kept: 47‚ÄØh...,Gracias por tu opini√≥n. Estamos revisando los ...,"""Thank you for your feedback. We are reviewing...",,,ingl√©s,s√≠,no,s√≠,s√≠,diario,s√≠,Hi there! We're thrilled to hear you had such ...,¬°Hola! Estamos encantados de escuchar que tuvi...,El cliente ha expresado una experiencia muy po...,"Estimado proveedor, queremos felicitarte por l..."
2,negativa,Comment 3: Box showed up unscathed within the ...,Gracias por tu opini√≥n. Estamos revisando los ...,"""Thank you for your feedback. We are reviewing...",,,ingl√©s,s√≠,no,no mencionado,s√≠,entrenamiento de media marat√≥n,s√≠,Hi there! We're thrilled to hear you're enjoyi...,¬°Hola! Estamos encantados de saber que est√°s d...,El cliente ha expresado una experiencia positi...,"Estimado proveedor, queremos informarte que un..."



üß™ Vista previa de errores:


Unnamed: 0,comentario_original,error
0,Comment 21: Arrived on time but colour is mile...,‚ùå Respuesta vac√≠a o malformada (no es JSON)
1,Komentarz 32: Czeka≈Çem prawie dwa tygodnie. Ka...,‚ùå Respuesta vac√≠a o malformada (no es JSON)


### 6.1 üìÇ *Separaci√≥n de comentarios v√°lidos y con errores + preparaci√≥n para visualizaci√≥n*

Una vez procesados todos los comentarios por el asistente inteligente y aplicadas las verificaciones finales, dividimos los resultados en dos conjuntos:

- ‚úÖ `df_validos`: comentarios correctamente analizados que contienen una valoraci√≥n y comunicaciones generadas.
- ‚ö†Ô∏è `df_errores`: comentarios que no han podido ser procesados correctamente (por ejemplo, por errores de formato JSON o respuestas vac√≠as del modelo).

Adem√°s, normalizamos las columnas `analisis` y `comunicaciones`, que vienen como diccionarios anidados, para que podamos visualizar cada variable como una columna independiente en los gr√°ficos y tablas.

Este paso es clave para habilitar las siguientes visualizaciones interactivas y para exportar los resultados al Excel final.


In [28]:
# ‚úÖ Separa comentarios v√°lidos de errores
df_validos = pd.DataFrame([r for r in resultados if "error" not in r])
df_errores = pd.DataFrame([r for r in resultados if "error" in r])

# ‚úÖ Aplana el campo "analisis" si est√° presente
if "analisis" in df_validos.columns:
    analisis_df = pd.json_normalize(df_validos["analisis"])
    df_validos = df_validos.drop(columns=["analisis"]).join(analisis_df)

# ‚úÖ Aplana el campo "comunicaciones" si est√° presente, evitando solapamientos
if "comunicaciones" in df_validos.columns:
    comunicaciones_df = pd.json_normalize(df_validos["comunicaciones"])
    df_validos = df_validos.drop(columns=["comunicaciones"]).join(comunicaciones_df, rsuffix="_from_coms")

    # Renombramos para que el Excel tenga los nombres esperados
    df_validos.rename(columns={
        "email_cliente_from_coms": "email_cliente",
        "email_cliente_traduccion_from_coms": "email_cliente_traduccion",
        "notificacion_interna_from_coms": "notificacion_interna",
        "email_proveedor_from_coms": "email_proveedor"
    }, inplace=True)



In [29]:
# üîç Vista previa de columnas clave con las comunicaciones generadas
columnas_muestra = [
    "comentario_original", "email_cliente", "notificacion_interna", "email_proveedor"
]

# Mostramos las primeras filas con las columnas de inter√©s
df_validos[columnas_muestra].head(3)


Unnamed: 0,comentario_original,email_cliente,email_cliente.1,notificacion_interna,notificacion_interna.1,email_proveedor,email_proveedor.1
0,Comment 1: Ordered late Monday and had the box...,Gracias por tu opini√≥n. Estamos revisando los ...,Hi there! We're thrilled to hear you're enjoyi...,,El cliente ha expresado una experiencia positi...,,"Hola, queremos informarte que el cliente ha ex..."
1,Comment 2: Two‚Äëday shipping promise kept: 47‚ÄØh...,Gracias por tu opini√≥n. Estamos revisando los ...,Hi there! We're thrilled to hear you had such ...,,El cliente ha expresado una experiencia muy po...,,"Estimado proveedor, queremos felicitarte por l..."
2,Comment 3: Box showed up unscathed within the ...,Gracias por tu opini√≥n. Estamos revisando los ...,Hi there! We're thrilled to hear you're enjoyi...,,El cliente ha expresado una experiencia positi...,,"Estimado proveedor, queremos informarte que un..."


## üìä **7.  Resultados anal√≠ticos del sistema IA del an√°lisis de comentarios**
En esta secci√≥n presentamos un resumen visual interactivo del an√°lisis de los comentarios de clientes realizado por el asistente inteligente de KelceTS S.L.

Gracias a la integraci√≥n con modelos de lenguaje y las reglas definidas por la empresa, se ha procesado autom√°ticamente cada comentario multiling√ºe para extraer:
- La valoraci√≥n general,
- El idioma,
- Las incidencias relacionadas con env√≠o, talla o materiales,
- Y las respuestas personalizadas generadas para cada cliente.

A continuaci√≥n se muestran los resultados visualizados mediante gr√°ficos interactivos y tablas din√°micas para facilitar el an√°lisis final. Esta secci√≥n tambi√©n sirve como informe visual para la entrega del proyecto.


### 7.1 üìä Distribuci√≥n de valoraciones por idioma

Este gr√°fico muestra c√≥mo se distribuyen las valoraciones (positiva, negativa, parcialmente positiva) en funci√≥n del idioma del comentario original. Permite detectar tendencias por idioma o regiones, y ayuda a identificar patrones de satisfacci√≥n o insatisfacci√≥n en distintos mercados europeos.


In [30]:
# Asegurarse de tener columnas correctas
if not df_validos.empty and "idioma" in df_validos.columns and "valoracion" in df_validos.columns:
    fig = px.histogram(
        df_validos,
        x="idioma",
        color="valoracion",
        barmode="group",
        title="Distribuci√≥n de valoraciones por idioma",
        labels={"idioma": "Idioma del comentario", "valoracion": "Valoraci√≥n"},
        category_orders={"idioma": sorted(df_validos["idioma"].unique())},
        color_discrete_sequence=px.colors.qualitative.Pastel
    )
    fig.update_layout(
        xaxis_title="Idioma",
        yaxis_title="N√∫mero de comentarios",
        legend_title="Valoraci√≥n",
        title_font_size=20
    )
    fig.write_image("grafico_valoraciones_idioma.png")  # Para exportarlo al Excel luego
    fig.show()
else:
    print("‚ö†Ô∏è No hay datos cargados para mostrar el gr√°fico.")


### 7.2 üß≠ Distribuci√≥n de valoraciones generales (positiva, negativa, parcialmente)

Este gr√°fico de pastel muestra de forma visual el desglose total de las valoraciones emitidas por el asistente de IA tras analizar cada comentario.

Cada porci√≥n representa el porcentaje de comentarios que han sido evaluados como:

- ‚úÖ Positivos
- ‚ö†Ô∏è Parcialmente positivos
- ‚ùå Negativos

Este gr√°fico nos permite tener una visi√≥n general del nivel de satisfacci√≥n global de los clientes en base a sus comentarios.


In [31]:
# Asegurarse de que hay datos v√°lidos
if not df_validos.empty and "valoracion" in df_validos.columns:
    valoraciones_counts = df_validos["valoracion"].value_counts().reset_index()
    valoraciones_counts.columns = ["Valoraci√≥n", "Cantidad"]

    fig_val = px.pie(
        valoraciones_counts,
        names="Valoraci√≥n",
        values="Cantidad",
        title="üß≠ Distribuci√≥n de valoraciones generales",
        color_discrete_sequence=px.colors.qualitative.Safe
    )
    fig_val.update_traces(textposition="inside", textinfo="percent+label")
    fig_val.write_image("grafico_valoraciones_pastel.png")  # Exportamos como imagen
    fig_val.show()
else:
    print("‚ö†Ô∏è No hay datos cargados para generar el gr√°fico de valoraciones.")


### 7.3 ‚ö†Ô∏è Distribuci√≥n de errores por idioma estimado

Este gr√°fico muestra cu√°ntos comentarios no pudieron ser procesados correctamente por el asistente de IA, agrupados por el idioma estimado a partir del texto original.

Los errores pueden deberse a:
- Respuestas vac√≠as o malformadas por parte del modelo,
- Comentarios con estructuras poco comunes o en idiomas complejos,
- Problemas de codificaci√≥n o truncamiento en la entrada.

Este an√°lisis permite detectar en qu√© idiomas o mercados el modelo tiene m√°s dificultades, lo cual es clave para mejorar su rendimiento futuro.

> ‚ö†Ô∏è Nota: El idioma ha sido estimado a partir de palabras clave del comentario original, ya que estos casos no pudieron ser analizados completamente.


In [32]:
# Estimamos el idioma de cada comentario con error en funci√≥n del encabezado
if not df_errores.empty and "comentario_original" in df_errores.columns:
    idioma_respaldo = []
    for comentario in df_errores["comentario_original"]:
        if "Comentario" in comentario:
            idioma_respaldo.append("espa√±ol")
        elif "Kommentar" in comentario:
            idioma_respaldo.append("alem√°n")
        elif "Œ£œáœåŒªŒπŒø" in comentario:
            idioma_respaldo.append("griego")
        elif "Kommentti" in comentario:
            idioma_respaldo.append("fin√©s")
        elif "Commentaire" in comentario:
            idioma_respaldo.append("franc√©s")
        elif "Komment√©r" in comentario:
            idioma_respaldo.append("dan√©s")
        elif "Komment" in comentario:
            idioma_respaldo.append("h√∫ngaro")
        else:
            idioma_respaldo.append("desconocido")

    df_errores["idioma_estimado"] = idioma_respaldo

    # Contamos errores por idioma
    errores_por_idioma = df_errores["idioma_estimado"].value_counts().reset_index()
    errores_por_idioma.columns = ["Idioma", "Errores"]

    # Generamos gr√°fico
    fig_errores = px.bar(
        errores_por_idioma,
        x="Idioma",
        y="Errores",
        title="‚ö†Ô∏è Distribuci√≥n de errores por idioma estimado",
        color="Errores",
        color_continuous_scale="reds"
    )
    fig_errores.update_layout(
        xaxis_title="Idioma estimado",
        yaxis_title="N√∫mero de errores",
        title_font_size=20
    )
    fig_errores.write_image("grafico_errores_idioma.png")  # Se guarda para exportar al Excel
    fig_errores.show()
else:
    print("‚úÖ No hay errores detectados. ¬°Todo ha sido procesado correctamente!")


### 7.4 üîç An√°lisis de variables clave de calidad

Este gr√°fico muestra el desglose de las respuestas detectadas por el asistente para cada una de las categor√≠as de calidad evaluadas en los comentarios:

- üì¶ Entrega en menos de 96 horas (`envio_96h`)
- üìâ Embalaje en buen estado (`embalaje_danado`)
- üëü Talla correcta (`talla_correcta`)
- üßµ Calidad de los materiales (`materiales_calidad`)
- üåü Cumplimiento de expectativas del cliente (`cumple_expectativas`)

Cada categor√≠a refleja cu√°ntos comentarios han indicado que **se cumple** (`s√≠`), que **no se cumple** (`no`) o que la informaci√≥n es **parcial** o dudosa (`parcialmente`). Esto ayuda a identificar las √°reas de mejora m√°s relevantes seg√∫n el feedback de los usuarios.


In [33]:
# Definimos las variables clave que queremos analizar
variables_calidad = ["envio_96h", "embalaje_danado", "talla_correcta", "materiales_calidad", "cumple_expectativas"]

# Preparar una lista con los datos de conteo para cada variable
datos_calidad = []
for var in variables_calidad:
    if var in df_validos.columns:
        counts = df_validos[var].value_counts().to_dict()
        for valor, cantidad in counts.items():
            datos_calidad.append({"Categor√≠a": var, "Valor": valor, "Cantidad": cantidad})

# Convertimos a DataFrame
df_calidad = pd.DataFrame(datos_calidad)

# Creamos el gr√°fico de barras agrupadas
fig_calidad = px.bar(
    df_calidad,
    x="Categor√≠a",
    y="Cantidad",
    color="Valor",
    barmode="group",
    title="üîç An√°lisis de variables clave de calidad",
    color_discrete_sequence=px.colors.qualitative.Set2
)
fig_calidad.update_layout(
    xaxis_title="Categor√≠a evaluada",
    yaxis_title="N√∫mero de comentarios",
    legend_title="Respuesta"
)

# Guardamos la imagen para exportarla al Excel
fig_calidad.write_image("grafico_calidad_por_variable.png")
fig_calidad.show()

# 8. üì§ **Exportaci√≥n final con comunicaciones correctas**

En este bloque se realiza lo siguiente:

1. Se recorre cada resultado y se aplica la funci√≥n `aplicar_comunicaciones_oficiales(resultado)`, la cual genera los textos oficiales para:
   - Email al cliente,
   - Notificaci√≥n interna,
   - Email al proveedor,  
   seg√∫n las reglas definidas en el prompt.

2. Se agrupan estas comunicaciones dentro de la clave `comunicaciones` para facilitar su exportaci√≥n.

3. Se crean los DataFrames para los resultados v√°lidos y los que tienen error, se aplanan las estructuras anidadas y se renombran las columnas de comunicaciones (usando un sufijo temporal para evitar solapamientos).

4. Finalmente, se exporta a un Excel con tres hojas:  
   - "Comentarios v√°lidos" (con las comunicaciones completas),
   - "Errores detectados",
   - "Resumen visual" (donde se insertan im√°genes de gr√°ficos ya generados).

Este paso garantiza que el Excel final refleje exactamente lo definido en las reglas del ejercicio pr√°ctico.



In [34]:
def aplicar_comunicaciones_oficiales(resultado):
    idioma = resultado.get("idioma", "espa√±ol")
    uso = resultado.get("tipo_uso", "")
    valoracion = resultado.get("valoracion", "")

    # Traducci√≥n solo si idioma no es espa√±ol
    if idioma != "espa√±ol":
        resultado["email_cliente_traduccion"] = "Traducci√≥n autom√°tica disponible bajo solicitud."
    else:
        resultado["email_cliente_traduccion"] = ""

    # Firma y email final
    firma = "\n\nUn cordial saludo,\nKelceTS Team\natencionalcliente@kelcetssl.com"

    # Inicializamos mensajes
    comunicacion_cliente = ""
    comunicacion_interna = ""
    comunicacion_proveedor = ""

    if valoracion == "positiva":
        comunicacion_cliente = f"¬°Gracias por confiar en KelceTS! Nos alegra saber que est√°s satisfecho con tu compra.{firma}"

    elif valoracion == "negativa":
        piezas = []

        if resultado.get("envio_96h") == "no":
            piezas.append("Hemos detectado un retraso en la entrega. Te ofrecemos un 5% de descuento en tu pr√≥xima compra.")
            comunicacion_proveedor += "- Contactar con el proveedor para mejorar el tiempo de entrega (menos de 24h).\n"

        if resultado.get("embalaje_danado") == "s√≠":
            piezas.append("Hemos registrado que el embalaje lleg√≥ da√±ado. Te ofrecemos un 5% de descuento por las molestias.")
            comunicacion_proveedor += "- Evaluar calidad del embalaje con proveedor log√≠stico.\n"

        if resultado.get("talla_correcta") == "no":
            piezas.append("Vamos a enviarte en menos de 72h un nuevo par con la talla correcta, sin coste. Por favor, prepara el par anterior para su recogida.")
            comunicacion_proveedor += "- Env√≠o urgente de nuevo par con talla correcta. Recojo del anterior.\n"

        if resultado.get("materiales_calidad") == "no":
            piezas.append("Te ofrecemos un 25% de descuento y env√≠o gratis. Enviaremos un miembro del staff en 72h para recoger el producto defectuoso.")
            comunicacion_proveedor += "- Revisar materiales con proveedor. Plan de sustituci√≥n urgente.\n"

        if piezas:
            comunicacion_cliente = "Lamentamos mucho los inconvenientes encontrados en tu compra. " + " ".join(piezas) + firma
            comunicacion_interna = "Este cliente ha recibido una valoraci√≥n negativa. Deben notificarse los siguientes puntos:\n" + comunicacion_proveedor + "\nFirmado: Asistente IA de KelceTS S.L."
            comunicacion_proveedor = "Estimado proveedor:\n" + comunicacion_proveedor + "\nAtentamente,\nRodrigo Clemente, Director de Log√≠stica de KelceTS S.L."

    elif valoracion == "parcialmente":
        comunicacion_cliente = f"Gracias por tu opini√≥n. Vamos a revisar los aspectos que mencionas para seguir mejorando.{firma}"

    # Asignamos campos generados
    resultado["email_cliente"] = comunicacion_cliente
    resultado["notificacion_interna"] = comunicacion_interna
    resultado["email_proveedor"] = comunicacion_proveedor

    return resultado


#### 8.1‚úÖ *Validaci√≥n final de las comunicaciones generadas*

Antes de entregar el archivo Excel, realizamos una validaci√≥n autom√°tica de las comunicaciones generadas por el asistente.

Esta revisi√≥n asegura que:

- Se aplican las medidas de calidad correctas (5%, 25%, env√≠o nuevo par...)
- Las firmas de los correos son las oficiales (KelceTS Team, Rodrigo Clemente)
- No hay respuestas vac√≠as o incompletas

Este control act√∫a como una auditor√≠a autom√°tica del contenido generado.


In [35]:
# Validaci√≥n de contenidos en comunicaciones

def check_keywords(text, keywords):
    if not isinstance(text, str):
        return False
    return any(k.lower() in text.lower() for k in keywords)

# Palabras clave que esperamos encontrar
requisitos = {
    "email_cliente": ["gracias por confiar", "lamentamos", "nuevo par", "25%", "5%"],
    "email_proveedor": ["Rodrigo Clemente", "log√≠stica", "proveedor", "evaluar"],
    "notificacion_interna": ["cliente ha recibido", "firmado", "sustituci√≥n", "notificar"]
}

# Creamos reporte de validaci√≥n
errores_validacion = []

for i, row in df_validos.iterrows():
    for campo, claves in requisitos.items():
        texto = row.get(campo, "")
        if not check_keywords(texto, claves):
            errores_validacion.append({
                "comentario_original": row.get("comentario_original", ""),
                "campo_fallido": campo,
                "texto_actual": texto
            })

df_errores_validacion = pd.DataFrame(errores_validacion)

if df_errores_validacion.empty:
    print("‚úÖ Todas las comunicaciones cumplen con las reglas oficiales.")
else:
    print(f"‚ö†Ô∏è Se encontraron {len(df_errores_validacion)} comunicaciones que podr√≠an no cumplir las reglas.")
    display(df_errores_validacion.head())


‚ö†Ô∏è Se encontraron 144 comunicaciones que podr√≠an no cumplir las reglas.


Unnamed: 0,comentario_original,campo_fallido,texto_actual
0,Comment 1: Ordered late Monday and had the box...,email_cliente,email_cliente Gracias por tu opini√≥n. Estam...
1,Comment 1: Ordered late Monday and had the box...,email_proveedor,email_proveedor ...
2,Comment 1: Ordered late Monday and had the box...,notificacion_interna,notificacion_interna ...
3,Comment 2: Two‚Äëday shipping promise kept: 47‚ÄØh...,email_cliente,email_cliente Gracias por tu opini√≥n. Estam...
4,Comment 2: Two‚Äëday shipping promise kept: 47‚ÄØh...,email_proveedor,email_proveedor ...


#### 8.2 üîé *Verificamos que las comunicaciones generadas est√°n presentes*

Mostramos una muestra de los textos generados para:
- `email_cliente`
- `notificacion_interna`
- `email_proveedor`

Si aparecen correctamente aqu√≠, el problema est√° en el momento de construir el Excel. Si est√°n vac√≠os, hay que revisar su generaci√≥n.


In [36]:
# Mostramos una muestra de resultados con comunicaciones
print("üîç Mostrando muestra de comunicaciones generadas:\n")

ejemplos_mostrar = 5

for i, r in enumerate(resultados):
    if "error" not in r and "comunicaciones" in r:
        print(f"üßæ Comentario {i+1}:")
        print("‚úâÔ∏è Email Cliente:\n", r["comunicaciones"].get("email_cliente", "‚ö†Ô∏è VAC√çO"))
        print("üì§ Notificaci√≥n Interna:\n", r["comunicaciones"].get("notificacion_interna", "‚ö†Ô∏è VAC√çA"))
        print("üè≠ Email Proveedor:\n", r["comunicaciones"].get("email_proveedor", "‚ö†Ô∏è VAC√çO"))
        print("\n" + "-"*80 + "\n")
        ejemplos_mostrar -= 1
        if ejemplos_mostrar == 0:
            break


üîç Mostrando muestra de comunicaciones generadas:

üßæ Comentario 1:
‚úâÔ∏è Email Cliente:
 Hi there! We're thrilled to hear you're enjoying your new shoes from KelceTS. It's great to know that they arrived so quickly and that they fit perfectly. If you ever need anything else, feel free to reach out to us. Happy running! KelceTS Team
üì§ Notificaci√≥n Interna:
 El cliente ha expresado una experiencia positiva con las zapatillas recibidas, destacando la rapidez de entrega, el ajuste perfecto y la calidad de los materiales.
üè≠ Email Proveedor:
 Hola, queremos informarte que el cliente ha expresado su satisfacci√≥n con las zapatillas recibidas, destacando la calidad de los materiales, el ajuste perfecto y la rapidez en la entrega. ¬°Enhorabuena por el buen trabajo! Rol correspondiente

--------------------------------------------------------------------------------

üßæ Comentario 2:
‚úâÔ∏è Email Cliente:
 Hi there! We're thrilled to hear you had such a positive experience with ou

#### 8.3 üì¢ *Exportaci√≥n Final de Resultados del An√°lisis*

En esta etapa, se ha consolidado todo el trabajo realizado en el an√°lisis automatizado de los comentarios de clientes. El archivo Excel generado, `Informe_Final_KelceTS.xlsx`, integra toda la informaci√≥n relevante y verificada para su revisi√≥n final.

Esta celda genera el archivo  con:

1. üü© Comentarios v√°lidos (con todas las comunicaciones generadas)
2. üü® Comentarios con error (si los hay)
3. üìä Gr√°ficos de resumen visual en una tercera hoja

El archivo se descargar√° autom√°ticamente al finalizar.

Este documento es la consolidaci√≥n de todo el proceso.


In [37]:

from google.colab import files

# Ruta del archivo final
ruta_excel = "Informe_Final_KelceTS.xlsx"

# Columnas seleccionadas para la hoja principal
columnas_entrega = [
    "comentario_original", "idioma", "valoracion",
    "envio_96h", "embalaje_danado", "talla_correcta", "materiales_calidad",
    "tipo_uso", "cumple_expectativas",
    "email_cliente", "email_cliente_traduccion",
    "notificacion_interna", "email_proveedor"
]

# Filtramos solo las columnas disponibles
columnas_entrega = [col for col in columnas_entrega if col in df_validos.columns]
df_validos_entrega = df_validos[columnas_entrega]

# Exportamos al Excel
with pd.ExcelWriter(ruta_excel, engine="xlsxwriter") as writer:
    # Hoja 1: Comentarios v√°lidos
    df_validos_entrega.to_excel(writer, sheet_name="Comentarios v√°lidos", index=False)

    # Hoja 2: Comentarios con errores
    if not df_errores.empty:
        df_errores.to_excel(writer, sheet_name="Errores detectados", index=False)

    # Hoja 3: Resumen visual (gr√°ficos si est√°n generados)
    workbook = writer.book
    worksheet = workbook.add_worksheet("Resumen visual")
    writer.sheets["Resumen visual"] = worksheet

    imagenes = [
        ("grafico_valoraciones_idioma.png", "Gr√°fico: Valoraciones por Idioma", "B2"),
        ("grafico_valoraciones_pastel.png", "Gr√°fico: Valoraciones Generales", "B22"),
        ("grafico_errores_idioma.png", "Gr√°fico: Errores por Idioma", "B42"),
        ("grafico_calidad_por_variable.png", "Gr√°fico: Variables de Calidad", "B62"),
    ]

    for archivo, titulo, celda in imagenes:
        try:
            worksheet.write(celda.replace("2", "1"), titulo)
            worksheet.insert_image(celda, archivo, {"x_scale": 0.8, "y_scale": 0.8})
        except Exception as e:
            print(f"‚ö†Ô∏è No se pudo insertar {archivo}: {e}")

# Descarga autom√°tica
print("üéâ ¬°Informe generado con √©xito!")
print("üìÅ Descargando archivo: Informe_Final_KelceTS.xlsx...")
files.download(ruta_excel)

üéâ ¬°Informe generado con √©xito!
üìÅ Descargando archivo: Informe_Final_KelceTS.xlsx...


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

##### *8.3.1 üìÑ Exportaci√≥n final a Excel y sincronizaci√≥n con Streamlit*
En este paso, exportamos el dataframe final df_resultado_final generado por el an√°lisis autom√°tico de los comentarios con IA y reglas internas a un archivo Excel llamado: Informe_Final_KelceTS.xlsx

Este archivo se guarda en la carpeta data/, lo que permite:

1. ‚úÖ Mantener una estructura coherente con el dashboard profesional desarrollado en Streamlit (como se puede ejecutar con el entregable 3 de este proyecto completo).
2. ‚úÖ Compartir la misma base de datos final enriquecida entre el notebook y la app web.
3. ‚úÖ Descargar autom√°ticamente el archivo para su entrega o revisi√≥n.

>‚ö†Ô∏è Aunque t√©cnicamente ser√≠a posible automatizar la subida directa a GitHub desde Colab usando un token de acceso personal (PAT), hemos optado por realizar esta subida de forma manual para:



*   Evitar exponer credenciales en el c√≥digo
*   Cumplir con las buenas pr√°cticas de seguridad
*   Facilitar la transparencia y trazabilidad para el profesorado



>üîÅ Por tanto, este archivo se ha subido manualmente a la carpeta /data de mi repositorio GitHub, desde donde el dashboard de Streamlit lo utiliza como fuente de an√°lisis visual.

# üìò **9. Conclusiones y Trabajo Futuro**

Este ejercicio pr√°ctico demuestra c√≥mo aplicar la Inteligencia Artificial Generativa para automatizar la gesti√≥n de comentarios multiling√ºes en una startup ficticia de zapatillas online: **KelceTS S.L.**

A partir de un archivo `.txt` con 50 comentarios reales en 24 idiomas oficiales de la UE, se ha desarrollado un flujo completo que:

- üß† Analiza autom√°ticamente los comentarios e identifica variables clave: env√≠o, embalaje, talla, calidad, uso y expectativas
- üóÇ Clasifica cada comentario como positivo, negativo o parcialmente positivo
- ‚úâÔ∏è Genera correos personalizados al cliente en su idioma original, incluyendo medidas de calidad (descuentos, env√≠os urgentes, recogidas...)
- üì§ Informa internamente a los equipos de calidad y log√≠stica si corresponde
- üè≠ Redacta emails al proveedor externo si hay errores atribuibles a la cadena de suministro
- üåç Traduce autom√°ticamente las respuestas generadas en castellano al idioma original del cliente, utilizando OpenAI y Gemini como fallback
- üìä Exporta todos los resultados, respuestas y gr√°ficas a un archivo Excel profesional con tres hojas: comentarios v√°lidos, errores y resumen visual

---

## üöÄ Posibles mejoras futuras

- Incluir una capa de an√°lisis de tono y emociones para adaptar el estilo de respuesta
- A√±adir soporte multimodal (im√°genes de productos da√±ados o v√≠deos de queja)
- Integrar feedback humano directo para mejorar la evaluaci√≥n autom√°tica
- Conectarlo directamente a canales reales (email, WhatsApp, chatbot) para implementaci√≥n real
- Desplegar como servicio API para integraci√≥n con CRMs u otras plataformas de soporte

---

# **10. üìò Agradecimientos y Cierre**

Gracias al equipo docente del Institututo de Inteligencia Artificial.
Ha sido toda una experiencia s√∫per enriquecedoara formarme con vosotros.

A todos los que me puedan leer os recomiendo formaros con ellos. Os dejo aq√∫i su link: https://iia.es/

¬°Much√≠simas gracias! üòç

**Araceli Fradejas Mu√±oz**
