# Etiquetado de Opiniones por Subjetividad

Este notebook implementa un sistema de clasificación automática de reseñas turísticas en tres categorías:
- **Objetiva**: contiene únicamente hechos verificables
- **Subjetiva**: contiene opiniones, juicios personales o sentimientos 
- **Mixta**: combina hechos verificables con opiniones

Utiliza LangChain con GPT-4o-mini para realizar la clasificación con structured output.

In [1]:
# Importaciones necesarias
import sys
import os

# Añadir el directorio scripts al path
sys.path.append('../scripts')

# Importar módulo de etiquetado personalizado
from etiquetado import (
    configurar_entorno, validar_dependencias, verificar_api_key,
    cargar_datasets, configurar_clasificador, proceso_completo_clasificacion,
    mostrar_opiniones_por_categoria, mostrar_ejemplos_detallados, analisis_avanzado_frases
)

# Configurar entorno
configurar_entorno()
validar_dependencias()

True

In [2]:
# Verificar configuración de API
verificar_api_key()

True

In [3]:
# Cargar datasets y verificar estado
resultado_carga = cargar_datasets(verificar_existentes=True)
df_reviews, df_existente, necesita_clasificacion = resultado_carga

✅ Dataset de análisis cargado desde: ../data/processed/dataset_opiniones_analisis.csv
📊 Total de registros: 2464
🔍 Dataset ya contiene clasificación LLM


In [4]:
# Configurar clasificador
clasificador = configurar_clasificador()

In [5]:
# Ejecutar clasificación completa
df_clasificado, df_analizado, guardado_exitoso = proceso_completo_clasificacion(
    df_reviews, clasificador, df_existente
)


� Análisis de 2464 reseñas clasificadas

🏷️ DISTRIBUCIÓN GENERAL:
   Objetiva: 21 reseñas (0.9%)
   Subjetiva: 630 reseñas (25.6%)
   Mixta: 1813 reseñas (73.6%)

🌎 POR CIUDAD:

  📍 Cancun:
     Objetiva: 7 reseñas (1.4%)
     Subjetiva: 135 reseñas (28.0%)
     Mixta: 341 reseñas (70.6%)

  📍 Cdmx:
     Objetiva: 3 reseñas (0.6%)
     Subjetiva: 103 reseñas (21.0%)
     Mixta: 384 reseñas (78.4%)

  📍 Puebla:
     Objetiva: 3 reseñas (0.6%)
     Subjetiva: 172 reseñas (34.4%)
     Mixta: 325 reseñas (65.0%)

  📍 Mazatlan:
     Objetiva: 1 reseñas (0.2%)
     Subjetiva: 108 reseñas (21.6%)
     Mixta: 391 reseñas (78.2%)

  📍 Puerto_vallarta:
     Objetiva: 7 reseñas (1.4%)
     Subjetiva: 112 reseñas (22.8%)
     Mixta: 372 reseñas (75.8%)


In [6]:
# Mostrar resumen del análisis
df_analizado.head()

Unnamed: 0,Titulo,Review,Calificacion,FechaEstadia,Ciudad,Atraccion,TituloReview,SentimientoPorCalificacion,SentimientoPorHF,SentimientoPorCardiff,SubjetividadConHF,TotalFrases,FrasesSubjetivas,FrasesObjetivas,TipoOpinion,EsMixta,PorcentajeSubjetivo,PorcentajeObjetivo,SubjetividadConFrases,SubjetividadConLLM
0,Noche diferente,Speechless. I never thought I'd have such a pl...,5,2025-08-01,Cancun,Xoximilco Cancun By Xcaret,Noche diferente. Speechless. I never thought I...,Positivo,Positivo,Positivo,Subjetivo,7,7,0,Subjetivo,False,100.0,0.0,Subjetivo,Subjetiva
1,Fun and exciting,Transportation was organized. Reception at th...,5,2025-08-01,Cancun,Xoximilco Cancun By Xcaret,Fun and exciting. Transportation was organized...,Positivo,Positivo,Positivo,Subjetivo,7,5,2,Mixta,True,71.428571,28.571429,Mixta,Mixta
2,Increíble,"Ninguno, me encantó toda la experiencias fue i...",5,2025-08-01,Cancun,Xoximilco Cancun By Xcaret,"Increíble. Ninguno, me encantó toda la experie...",Positivo,Positivo,Positivo,Subjetivo,5,4,1,Mixta,True,80.0,20.0,Mixta,Subjetiva
3,Great fun in Cancun,"This is a fabulous show, high energy and great...",5,2025-08-01,Cancun,Xoximilco Cancun By Xcaret,"Great fun in Cancun. This is a fabulous show, ...",Positivo,Positivo,Positivo,Subjetivo,4,4,0,Subjetivo,False,100.0,0.0,Subjetivo,Mixta
4,Xochimilco excelente experiencia,Joss y Roberto dieron muy buen servicio y ambi...,5,2025-08-01,Cancun,Xoximilco Cancun By Xcaret,Xochimilco excelente experiencia. Joss y Rober...,Positivo,Positivo,Positivo,Subjetivo,4,3,1,Mixta,True,75.0,25.0,Mixta,Mixta


In [7]:
# Mostrar ejemplos de opiniones por categoría
mostrar_opiniones_por_categoria(df_clasificado)


📋 Ejemplos por categoría:

🏷️ Objetiva:
   1. Great location. Convenient location. Main road, easy access to local bus routes, tourist places, shopping centers, restaurants, activities and hotels.
   2. Un símbolo de la zona hotelera y de todo Cancún. La avenida Kukulcán a lo largo de sus 26 kms. une todos los hoteles de la zona hotelera de norte a sur, inicia saliendo de Cancún y termina cerca del acceso al aeropuerto. Las numerosas líneas de "camiones" (ómnibus) trasladan a los turistas de los hoteles más distantes a la zona más céntrica y viceversa.
   3. Conexiones. Esta avenida conecta la zona hotelera, shoppings, casas de cambio, propuestas gastronómicas y de entretenimiento.Se puede pasear caminando o recorrerla en los buses que pasan continuamente.
   ... y 18 más

🏷️ Subjetiva:
   1. Noche diferente. Speechless. I never thought I'd have such a pleasant time. For several hours, it envelops you in its charm. Spectacular tour thanks to Cezar, our guide. I say thank you, Cezar, o

In [8]:
# Mostrar ejemplos con desglose detallado
mostrar_ejemplos_detallados(df_clasificado)

🔍 EJEMPLOS DE OPINIONES CON DESGLOSE DETALLADO

🎯 EJEMPLOS DE OPINIONES OBJETIVAS
----------------------------------------

📌 Ejemplo 1:
🏛️ Avenida Kukulkan - Cancun
⭐ Calificación: 5/5
💬 "Great location. Convenient location. Main road, easy access to local bus routes, tourist places, shopping centers, restaurants, activities and hotels."
🤖 Clasificaciones:
   • HuggingFace: Objetivo
   • Por frases: Mixta
   • LLM (GPT): Objetiva

📊 Desglose por frases:
   • Total: 3
   • Subjetivas: 2 (66.7%)
   • Objetivas: 1 (33.3%)

📌 Ejemplo 2:
🏛️ Vallarta Bahia De Banderas - Puerto_vallarta
⭐ Calificación: 5/5
💬 "bahia de banderas. bahia de banderas esta ubicado en el estado de nayarit pasando el rio ameca hay transporte para ir a la playa disfrutar con amigos y familiares."
🤖 Clasificaciones:
   • HuggingFace: Objetivo
   • Por frases: Objetivo
   • LLM (GPT): Objetiva

📊 Desglose por frases:
   • Total: 3
   • Subjetivas: 0 (0.0%)
   • Objetivas: 3 (100.0%)

🎯 EJEMPLOS DE OPINIONES SUBJETIVAS


In [9]:
# Análisis avanzado de frases usando subjetividad
analisis_avanzado_frases(df_clasificado)


🔬 ANÁLISIS AVANZADO DE FRASES


Device set to use cuda:0
Device set to use cuda:0



🎯 OPINIÓN 1:
💬 "Fun and exciting. Transportation was organized.  Reception at the park was great with greetings by professionals.  The shops were presented well and employees were friendly.  The boat ride was excellent and the captain and guide made it a lot of fun.  The tour was an exciting experience!  Thank you."
🏛️ Xoximilco Cancun By Xcaret - Cancun


You seem to be using the pipelines sequentially on GPU. In order to maximize efficiency please use a dataset



📊 DESGLOSE:
   • Total: 7 frases
   • Subjetivas: 5 (71.4%)
   • Objetivas: 2 (28.6%)
   • Clasificación: Mixta

📝 FRASES:
   💭 1. [Subjetivo] "Fun and exciting."
   📊 2. [Objetivo] "Transportation was organized."
   💭 3. [Subjetivo] "Reception at the park was great with greetings by professionals."
   📊 4. [Objetivo] "The shops were presented well and employees were friendly."
   💭 5. [Subjetivo] "The boat ride was excellent and the captain and guide made it a lot of fun."
   💭 6. [Subjetivo] "The tour was an exciting experience!"
   💭 7. [Subjetivo] "Thank you."

🎯 OPINIÓN 2:
💬 "Increíble. Ninguno, me encantó toda la experiencias fue increíble cada unos de las paradas así como su comida  . 10 de 10 . Me gustó y volvería a venir."
🏛️ Xoximilco Cancun By Xcaret - Cancun

📊 DESGLOSE:
   • Total: 5 frases
   • Subjetivas: 4 (80.0%)
   • Objetivas: 1 (20.0%)
   • Clasificación: Mixta

📝 FRASES:
   💭 1. [Subjetivo] "Increíble."
   💭 2. [Subjetivo] "Ninguno, me encantó toda la experiencias