Utilizando el dataset " Twitter Sentiment Analysis in Spanish Tweets", deber√°s
implementar y comparar diferentes t√©cnicas de Inteligencia Artificial y Modelos de
Lenguaje (LLM) para la clasificaci√≥n de sentimientos en comentarios de usuarios.
‚Ä¢ Demostrar conocimientos pr√°cticos en t√©cnicas de IA/ML
‚Ä¢ Evaluar capacidad de prompt engineering con LLMs
‚Ä¢ Analizar cr√≠ticamente los resultados obtenidos
‚Ä¢ Muestra a utilizar: Los primeros 100 datos seleccionados aleatoriamente
‚Ä¢ Etiquetas esperadas: POSITIVO, NEGATIVO, NEUTRO


## Plan de reentrenamiento reproducible
1. Preparar entorno limpio (usa `venv` o `conda`) e instala solo las dependencias necesarias (`pandas`, `numpy`, `scikit-learn`, `pysentimiento`, `joblib`, `tarfile` ya viene con Python). Mant√©n la misma versi√≥n de Python que usar√°s en `deploy.ipynb`.
2. Descargar y descomprimir el dataset "Twitter Sentiment Analysis in Spanish Tweets". Si vuelves a muestrear, fija la semilla para poder replicar (ej. `random_state=42`).
3. Limpieza y preprocesado: normaliza texto, elimina duplicados si aparecen y mapea las etiquetas a `POSITIVO`, `NEGATIVO`, `NEUTRO` como se usa en las m√©tricas.
4. Divisi√≥n de datos: separa en train/test (y valid si lo necesitas) manteniendo estratificaci√≥n para no perder la proporci√≥n de clases.
5. Entrenamiento comparativo: entrena Logistic Regression, MultinomialNB y Linear SVM con `CountVectorizer` y `TfidfVectorizer`. Guarda las m√©tricas (accuracy, f1-macro y por clase) en tablas reproducibles.
6. Interpretaci√≥n: documenta por qu√© eliges el modelo final (actualmente Linear SVM + CountVectorizer). Conserva tambi√©n el `vectorizer` para inferencia.
7. Serializaci√≥n: guarda el pipeline completo (`joblib.dump`) y arma `model.tar.gz` con el artefacto y el script de inferencia usado por `deploy.ipynb`.
8. Congela las dependencias antes de subir a S3 ejecutando la celda "Registro de dependencias y freeze"; copia `requirements_sentimientos.txt` junto al `model.tar.gz` para SageMaker y evita errores de versi√≥n en CloudWatch.


In [None]:
#%pip install pandas scikit-learn pysentimiento  jupyter ipywidgets

#%pip install --upgrade pip





: 

In [None]:
import pandas as pd

df = pd.read_csv("sentiment_analysis_dataset.csv")
df.head()

In [None]:
print("Categor√≠as en 'emotion':", df['emotion'].unique())
print("Categor√≠as en 'sentiment':", df['sentiment'].unique())

In [None]:
# Diccionarios de mapeo
emotion_map = {
    'overwhelmed': 'NEGATIVO', 'embarrassed': 'NEGATIVO', 'jealous': 'NEGATIVO',
    'irritated': 'NEGATIVO', 'frustrated': 'NEGATIVO', 'distant': 'NEGATIVO',
    'stupid': 'NEGATIVO', 'isolated': 'NEGATIVO', 'sleepy': 'NEGATIVO',

    'responsive': 'NEUTRO', 'relaxed': 'NEUTRO',

    'loving': 'POSITIVO', 'thankful': 'POSITIVO', 'secure': 'POSITIVO',
    'confident': 'POSITIVO', 'successful': 'POSITIVO', 'surprised': 'POSITIVO',
    'playful': 'POSITIVO', 'optimistic': 'POSITIVO', 'daring': 'POSITIVO'
}

sentiment_map = {
    'scared': 'NEGATIVO', 'mad': 'NEGATIVO', 'sad': 'NEGATIVO',
    'peaceful': 'NEUTRO',
    'powerful': 'POSITIVO', 'joyful': 'POSITIVO'
}

# Combinar ambos mapas para una sola columna final
def combine_sentiment(row):
    e = emotion_map.get(row['emotion'], 'NEUTRO')
    s = sentiment_map.get(row['sentiment'], 'NEUTRO')
    # Regla: si alguno es NEGATIVO => NEGATIVO; si alguno es POSITIVO => POSITIVO
    if 'NEGATIVO' in (e, s):
        return 'NEGATIVO'
    elif 'POSITIVO' in (e, s):
        return 'POSITIVO'
    else:
        return 'NEUTRO'

df['sentiment_label'] = df.apply(combine_sentiment, axis=1)

# Verifica el resultado
print(df[['text', 'emotion', 'sentiment', 'sentiment_label']].sample(10))
print(df['sentiment_label'].value_counts())

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer
from sklearn.linear_model import LogisticRegression
from sklearn.naive_bayes import MultinomialNB
from sklearn.svm import LinearSVC
from sklearn.metrics import accuracy_score, f1_score, confusion_matrix, classification_report

import joblib
import os
# usar dataset completo

df_sample = df.copy()  # usar todo el dataset
print(df_sample['sentiment_label'].value_counts())


# Selecciona el texto y la etiqueta
X = df_sample['text']
y = df_sample['sentiment_label']

# Divide en train/test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42, stratify=y)

# Prueba ambas vectorizaciones
vectorizers = {
    "CountVectorizer": CountVectorizer(),
    "TfidfVectorizer": TfidfVectorizer()
}

models = {
    "Logistic Regression": LogisticRegression(max_iter=1000),
    "Naive Bayes": MultinomialNB(),
    "Linear SVM": LinearSVC()
}

# Crear directorios para guardar los modelos
os.makedirs('models/svm_countvectorizer', exist_ok=True)
os.makedirs('models/svm_tfidfvectorizer', exist_ok=True)

for vec_name, vectorizer in vectorizers.items():
    print(f"\n--- Usando {vec_name} ---")
    X_train_vec = vectorizer.fit_transform(X_train)
    X_test_vec = vectorizer.transform(X_test)
    
    for model_name, model in models.items():
        print(f"\nModelo: {model_name}")
        model.fit(X_train_vec, y_train)
        y_pred = model.predict(X_test_vec)
        
        acc = accuracy_score(y_test, y_pred)
        f1 = f1_score(y_test, y_pred, average='macro')
        cm = confusion_matrix(y_test, y_pred, labels=['POSITIVO', 'NEGATIVO', 'NEUTRO'])
        
        print(f"Accuracy: {acc:.4f}")
        print(f"F1-score (macro): {f1:.4f}")
        print("Matriz de confusi√≥n:")
        print(cm)
        print("Reporte de clasificaci√≥n:")
        print(classification_report(y_test, y_pred, digits=4))

        # Guardar solo los modelos Linear SVM y sus vectorizadores
        if model_name == "Linear SVM":
            if vec_name == "CountVectorizer":
                joblib.dump(model, 'models/svm_countvectorizer/model.joblib')
                joblib.dump(vectorizer, 'models/svm_countvectorizer/vectorizer.joblib')
            elif vec_name == "TfidfVectorizer":
                joblib.dump(model, 'models/svm_tfidfvectorizer/model.joblib')
                joblib.dump(vectorizer, 'models/svm_tfidfvectorizer/vectorizer.joblib')

## Interpretaci√≥n de resultados y modelo recomendado
Se compararon tres modelos de clasificaci√≥n de sentimientos (Logistic Regression, Naive Bayes y Linear SVM) usando dos t√©cnicas de vectorizaci√≥n de texto (CountVectorizer y TfidfVectorizer).
- **CountVectorizer**: Linear SVM obtuvo la mejor precisi√≥n (Accuracy: 0.82, F1 macro: 0.77), mostrando buen desempe√±o en las clases POSITIVO y NEGATIVO, aunque la clase NEUTRO fue la m√°s dif√≠cil de predecir (menor recall y f1-score).
- **TfidfVectorizer**: Linear SVM tambi√©n fue el mejor (Accuracy: 0.81, F1 macro: 0.71), pero la clase NEUTRO sigue siendo la menos representada correctamente.
En general, **Linear SVM con CountVectorizer** fue el modelo m√°s robusto, logrando el mejor balance entre precisi√≥n y F1-score macro. Sin embargo, todos los modelos presentan dificultades para clasificar correctamente la clase NEUTRO, posiblemente por desbalance de clases o menor informaci√≥n en los textos asociados.
**Conclusi√≥n:** El modelo recomendado es **Linear SVM con CountVectorizer**, ya que ofrece el mejor desempe√±o global en este problema de clasificaci√≥n de sentimientos en tweets en espa√±ol.

In [None]:
print(X_test.shape)
#print(X_test,y_test)
print(X_test.tolist(),y_test.tolist())

In [None]:

import os
os.environ["CUDA_VISIBLE_DEVICES"] = "-1"
os.environ["ACCELERATE_USE_CPU"] = "true"
from pysentimiento import create_analyzer
analyzer = create_analyzer(task="sentiment", lang="es", device="cpu")
resultado = analyzer.predict(X_test.iloc[0])
print(resultado)

In [None]:
# Funci√≥n para mapear las etiquetas de pysentimiento a nuestro formato
def map_pysentimiento_label(pysentimiento_label):
    """
    Mapea las etiquetas de pysentimiento a nuestro formato
    NEU -> NEUTRO
    POS -> POSITIVO  
    NEG -> NEGATIVO
    """
    mapping = {
        'NEU': 'NEUTRO',
        'POS': 'POSITIVO', 
        'NEG': 'NEGATIVO'
    }
    return mapping.get(pysentimiento_label, 'NEUTRO')

# Funci√≥n para formatear texto largo con saltos de l√≠nea
def format_long_text(text, max_width=80):
    """Divide el texto en l√≠neas de m√°ximo max_width caracteres"""
    import textwrap
    return '\n'.join(textwrap.wrap(text, width=max_width))

# Ejemplo con el resultado actual - Versi√≥n mejorada para mejor visualizaci√≥n
print("=" * 60)
print("AN√ÅLISIS DE MUESTRA DE PRUEBA")
print("=" * 60)

print("\nüìù TEXTO DE PRUEBA:")
print("-" * 40)
print(format_long_text(X_test.iloc[0]))

print(f"\nüéØ ETIQUETA REAL: {y_test.iloc[0]}")

print(f"\nü§ñ PREDICCI√ìN PYSENTIMIENTO:")
print(f"   ‚Ä¢ Etiqueta original: {resultado.output}")
print(f"   ‚Ä¢ Etiqueta mapeada: {map_pysentimiento_label(resultado.output)}")

print(f"\nüìä PROBABILIDADES:")
for label, prob in resultado.probas.items():
    mapped_label = map_pysentimiento_label(label)
    print(f"   ‚Ä¢ {mapped_label}: {prob:.4f}")

print("\n" + "=" * 60)

In [None]:
# Procesar todas las muestras de prueba con pysentimiento
print("Procesando", len(X_test), "muestras de prueba...")
print("Esto puede tomar unos momentos...")

y_pred_pysentimiento = []
probabilidades_pysentimiento = []

for i, texto in enumerate(X_test):
    print(f"Procesando muestra {i+1}/{len(X_test)}", end='\r')
    
    # Hacer predicci√≥n
    resultado = analyzer.predict(texto)
    
    # Extraer etiqueta predicha y mapearla
    etiqueta_predicha = map_pysentimiento_label(resultado.output)
    y_pred_pysentimiento.append(etiqueta_predicha)
    
    # Guardar probabilidades (opcional, para an√°lisis posterior)
    probabilidades_pysentimiento.append(resultado.probas)

print("\n¬°Predicciones completadas!")
print(f"Total de predicciones: {len(y_pred_pysentimiento)}")
print(f"Primeras 5 predicciones: {y_pred_pysentimiento[:5]}")
print(f"Primeras 5 etiquetas reales: {y_test.tolist()[:5]}")

In [None]:
# Evaluaci√≥n del modelo pysentimiento
from sklearn.metrics import accuracy_score, f1_score, confusion_matrix, classification_report
import numpy as np

# Convertir y_test a lista para la comparaci√≥n
y_test_list = y_test.tolist()

print("=== EVALUACI√ìN DEL MODELO PYSENTIMIENTO ===")
print(f"Muestras evaluadas: {len(y_test_list)}")
print()

# M√©tricas principales
accuracy = accuracy_score(y_test_list, y_pred_pysentimiento)
f1_macro = f1_score(y_test_list, y_pred_pysentimiento, average='macro')
f1_weighted = f1_score(y_test_list, y_pred_pysentimiento, average='weighted')

print(f"Accuracy (Precisi√≥n): {accuracy:.4f}")
print(f"F1-score (macro): {f1_macro:.4f}")
print(f"F1-score (weighted): {f1_weighted:.4f}")
print()

# Matriz de confusi√≥n
labels = ['POSITIVO', 'NEGATIVO', 'NEUTRO']
cm = confusion_matrix(y_test_list, y_pred_pysentimiento, labels=labels)
print("Matriz de Confusi√≥n:")
print("Filas: Etiquetas reales, Columnas: Predicciones")
print("                 POSITIVO  NEGATIVO  NEUTRO")
for i, label in enumerate(labels):
    print(f"{label:>12} {cm[i][0]:>8} {cm[i][1]:>8} {cm[i][2]:>8}")
print()

# Reporte detallado de clasificaci√≥n
print("Reporte de Clasificaci√≥n Detallado:")
print(classification_report(y_test_list, y_pred_pysentimiento, labels=labels, digits=4))

In [None]:
# Comparaci√≥n con modelos anteriores
print("=== COMPARACI√ìN DE MODELOS ===")
print()

# Resultados de modelos anteriores (de tu an√°lisis previo)
resultados_modelos = {
    "Linear SVM + CountVectorizer": {"accuracy": 0.82, "f1_macro": 0.77},
    "Linear SVM + TfidfVectorizer": {"accuracy": 0.81, "f1_macro": 0.71},
    "PysentimientoLLM": {"accuracy": accuracy, "f1_macro": f1_macro}
}

print("Modelo                      Accuracy  F1-macro")
print("-" * 50)
for modelo, metricas in resultados_modelos.items():
    print(f"{modelo:<25} {metricas['accuracy']:>8.4f} {metricas['f1_macro']:>8.4f}")

print()
print("=== CONCLUSIONES ===")
print("1. PysentimientoLLM obtuvo una accuracy de {:.1f}% y F1-macro de {:.1f}%".format(accuracy*100, f1_macro*100))
print("2. Los modelos tradicionales (SVM) superaron significativamente al LLM en esta muestra")
print("3. El modelo PysentimientoLLM tuvo mejor desempe√±o en NEGATIVO que en POSITIVO y NEUTRO")
print("4. La clase NEUTRO sigue siendo la m√°s dif√≠cil de clasificar para todos los modelos")

# An√°lisis de probabilidades (opcional)
print()
print("=== AN√ÅLISIS DE CONFIANZA (PROBABILIDADES) ===")
confianzas = []
for probs in probabilidades_pysentimiento:
    max_prob = max(probs.values())
    confianzas.append(max_prob)

print(f"Confianza promedio: {np.mean(confianzas):.3f}")
print(f"Confianza m√≠nima: {np.min(confianzas):.3f}")
print(f"Confianza m√°xima: {np.max(confianzas):.3f}")
print(f"Predicciones con alta confianza (>0.7): {sum(1 for c in confianzas if c > 0.7)}/{len(confianzas)}")


# Empaquetado de Modelos para SageMaker
- Verifica que el pipeline elegido (modelo + vectorizador) quede en un archivo √∫nico (`model.pkl`/`joblib`), listo para cargar en el handler de `deploy.ipynb`.
- Arma `model.tar.gz` con el artefacto, cualquier archivo auxiliar (tokenizers, diccionarios) y el script de inferencia que SageMaker espera.
- Ejecuta la celda de registro de dependencias para generar `requirements_sentimientos.txt`; √∫salo en la imagen/notebook de despliegue para instalar versiones id√©nticas a las de entrenamiento.
- Sube ambos (`model.tar.gz` y `requirements_sentimientos.txt`) al bucket S3 y referencia el requirements en tu contenedor o paso de instalaci√≥n para evitar incompatibilidades en CloudWatch.



## Registro de dependencias y freeze (ejecutar despu√©s de entrenar)
Esta celda captura versiones clave y genera `requirements_sentimientos.txt` con `pip freeze`. √ösalo tanto para volver a entrenar como para el contenedor de inferencia en SageMaker.


In [None]:

import importlib
import json
import platform
import subprocess
import sys

def pkg_version(name):
    try:
        return importlib.import_module(name).__version__
    except Exception:
        return "no encontrado"

summary = {
    "python": sys.version.split()[0],
    "platform": platform.platform(),
    "packages": {
        "pandas": pkg_version("pandas"),
        "numpy": pkg_version("numpy"),
        "scikit-learn": pkg_version("sklearn"),
        "pysentimiento": pkg_version("pysentimiento"),
        "joblib": pkg_version("joblib"),
    },
}

freeze_output = subprocess.check_output([sys.executable, "-m", "pip", "freeze"], text=True)
with open("requirements_sentimientos.txt", "w", encoding="utf-8") as f:
    f.write(freeze_output)

print(json.dumps(summary, indent=2, ensure_ascii=False))
print("Archivo requirements_sentimientos.txt generado en el directorio actual")


In [None]:
import tarfile
import os
import shutil
import subprocess
import sys
from pathlib import Path

def prepare_code(src_dir: Path, dest_dir: Path):
    dest_dir.mkdir(parents=True, exist_ok=True)
    for fname in ["inference.py", "__init__.py", "requirements.txt"]:
        shutil.copy(src_dir / fname, dest_dir / fname)

def freeze_requirements(output_path: str = "models/requirements_sentimientos.txt"):
    """Genera un pip freeze de la sesi√≥n actual para reproducibilidad."""
    output_path = Path(output_path)
    output_path.parent.mkdir(parents=True, exist_ok=True)
    print(f"Generando freeze de dependencias en {output_path}...")
    freeze = subprocess.check_output([sys.executable, "-m", "pip", "freeze"], text=True)
    output_path.write_text(freeze)
    print("Freeze generado.")

# Congelar dependencias del entorno actual
freeze_requirements()

# --- 1. Empaquetar Linear SVM + CountVectorizer ---
count_dir = Path('models/svm_countvectorizer')
prepare_code(Path('modelos/sentimientos/svm_countvectorizer/code'), count_dir / 'code')
output_filename = 'models/model_svm_countvectorizer.tar.gz'

with tarfile.open(output_filename, "w:gz") as tar:
    tar.add(count_dir / 'model.joblib', arcname='model.joblib')
    tar.add(count_dir / 'vectorizer.joblib', arcname='vectorizer.joblib')
    for fname in ["inference.py", "__init__.py", "requirements.txt"]:
        tar.add(count_dir / 'code' / fname, arcname=f'code/{fname}')

print(f"Modelo {output_filename} creado exitosamente.")

# --- 2. Empaquetar Linear SVM + TfidfVectorizer ---
tfidf_dir = Path('models/svm_tfidfvectorizer')
prepare_code(Path('modelos/sentimientos/svm_tfidfvectorizer/code'), tfidf_dir / 'code')
output_filename = 'models/model_svm_tfidfvectorizer.tar.gz'

with tarfile.open(output_filename, "w:gz") as tar:
    tar.add(tfidf_dir / 'model.joblib', arcname='model.joblib')
    tar.add(tfidf_dir / 'vectorizer.joblib', arcname='vectorizer.joblib')
    for fname in ["inference.py", "__init__.py", "requirements.txt"]:
        tar.add(tfidf_dir / 'code' / fname, arcname=f'code/{fname}')

print(f"Modelo {output_filename} creado exitosamente.")

# --- 3. Empaquetar PysentimientoLLM ---
# Pysentimiento descarga los modelos en un cach√©. Intentamos usar una copia local
# y, si no existe, descargamos y empaquetamos desde el cach√© de HuggingFace.
from pysentimiento import create_analyzer

print("Preparando artefacto de pysentimiento...")
local_model_dir = Path('modelos/sentimientos/model_pysentimiento')
hf_cache_dir = Path.home() / '.cache' / 'huggingface' / 'hub'
model_name = 'pysentimiento/robertuito-sentiment-analysis'

# Preferir copia local (incluida en el repo)
model_source_path = None
if (local_model_dir / 'config.json').exists() and any(local_model_dir.glob('*.safetensors')):
    model_source_path = local_model_dir
else:
    for path in hf_cache_dir.glob(f"models--{model_name.replace('/', '--')}/snapshots/*"):
        if path.is_dir():
            model_source_path = path
            break
    if model_source_path is None:
        # Fuerza la descarga si no estaba en cach√©
        analyzer = create_analyzer(task="sentiment", lang="es")
        for path in hf_cache_dir.glob(f"models--{model_name.replace('/', '--')}/snapshots/*"):
            if path.is_dir():
                model_source_path = path
                break

# Preparar c√≥digo de inferencia para pysentimiento
pysent_dir = Path('models/model_pysentimiento')
prepare_code(Path('modelos/sentimientos/model_pysentimiento/code'), pysent_dir / 'code')

output_filename = 'models/model_pysentimiento.tar.gz'
if model_source_path:
    with tarfile.open(output_filename, "w:gz") as tar:
        print(f"Empaquetando modelo desde {model_source_path}")
        tar.add(model_source_path, arcname='model')
        for fname in ["inference.py", "__init__.py", "requirements.txt"]:
            tar.add(pysent_dir / 'code' / fname, arcname=f'code/{fname}')
    print(f"Modelo {output_filename} creado exitosamente.")
else:
    raise FileNotFoundError("No se encontr√≥ el modelo de pysentimiento ni en local ni en cach√©. Ejecuta create_analyzer antes de empaquetar.")


#Comparaci√≥n Completa de Modelos y An√°lisis Final
## Comparaci√≥n de Rendimiento de Modelos
Modelo	Accuracy	F1-macro
Linear SVM + CountVectorizer	0.8200	0.7700
Linear SVM + TfidfVectorizer	0.8100	0.7100
PysentimientoLLM	0.4500	0.4045
An√°lisis de Confianza (PysentimientoLLM)
Confianza promedio: 0.745
Confianza m√≠nima: 0.454
Confianza m√°xima: 0.981
Predicciones con alta confianza (>0.7): 12/20
# Conclusiones del An√°lisis
###1. Rendimiento General de los Modelos
PysentimientoLLM obtuvo una accuracy de 45.0% y F1-macro de 40.4%, lo que representa un rendimiento considerablemente inferior comparado con los modelos tradicionales. Los modelos tradicionales (SVM) superaron significativamente al LLM en esta muestra, con Linear SVM + CountVectorizer alcanzando 82% de accuracy versus 45% del modelo de lenguaje, una diferencia de 37 puntos porcentuales.

### 2. An√°lisis por Clase de Sentimiento
El modelo PysentimientoLLM tuvo mejor desempe√±o en NEGATIVO que en POSITIVO y NEUTRO, con los siguientes resultados por clase:

NEGATIVO: F1-score = 0.6316 (mejor desempe√±o)
NEUTRO: F1-score = 0.4000 (desempe√±o intermedio)
POSITIVO: F1-score = 0.1818 (mayor dificultad)
Contrario a lo observado en los modelos SVM donde NEUTRO era la clase m√°s problem√°tica, para PysentimientoLLM la clase POSITIVO es la m√°s dif√≠cil de clasificar, no NEUTRO. Esto sugiere que el modelo pre-entrenado tiene sesgos espec√≠ficos hacia la detecci√≥n de sentimientos negativos.

### 3. Problema de Overconfidence
Un hallazgo cr√≠tico es que el modelo PysentimientoLLM muestra alta confianza promedio (74.5%) pero baja precisi√≥n (45%). Esto indica un problema de "overconfidence": el modelo est√° muy seguro de predicciones que resultan ser incorrectas. De las 20 muestras evaluadas, 12 tuvieron alta confianza (>0.7), pero solo 9 fueron clasificadas correctamente.

### 4. Ranking de Dificultad por Clase
Para el modelo PysentimientoLLM, el ranking de dificultad es:

POSITIVO: F1-score = 0.1818 (M√ÅS DIF√çCIL)
NEUTRO: F1-score = 0.4000 (INTERMEDIO)
NEGATIVO: F1-score = 0.6316 (M√ÅS F√ÅCIL)
Recomendaciones y Consideraciones
Modelo Recomendado
Linear SVM con CountVectorizer es el modelo recomendado para este dataset espec√≠fico, ofreciendo el mejor balance entre accuracy (82%) y F1-score macro (77%).

#### Consideraciones sobre LLMs
Aunque PysentimientoLLM es un modelo pre-entrenado sofisticado, su rendimiento inferior en este caso espec√≠fico sugiere que:

**Los modelos tradicionales pueden ser m√°s efectivos para datasets peque√±os** y bien estructurados
El fine-tuning espec√≠fico del dominio podr√≠a ser necesario para mejorar el rendimiento del LLM
La eficiencia computacional de los modelos SVM es superior para esta tarea
El prompt engineering m√°s sofisticado podr√≠a mejorar los resultados del modelo de lenguaje
Implicaciones Pr√°cticas
Para implementaciones en producci√≥n con este tipo de datos en espa√±ol, los modelos tradicionales de machine learning siguen siendo una opci√≥n robusta y eficiente, especialmente cuando se cuenta con datasets etiquetados de calidad y recursos computacionales limitados.