# Análisis de Sentimiento con Modelos Preentrenados de HuggingFace

## Objetivo

En esta actividad vamos a utilizar un modelo de estado del arte ya entrenado para analizar el sentimiento de frases en español con apenas unas líneas de código, gracias a la librería HuggingFace Transformers.

Vamos a mostrar cómo es posible aprovechar el poder de los Transformers como BERT sin necesidad de entrenar redes neuronales desde cero.

### ¿Por qué esto es revolucionario?

Hasta ahora entrenamos modelos desde cero:
- Perceptrón con 6 ejemplos
- MLP con 10 ejemplos
- LSTM con 10 ejemplos

**El problema**: Con tan pocos datos, los modelos aprenden poco y generalizan mal.

**La solución**: Usar modelos que ya fueron entrenados con millones de textos. Esto se llama **transfer learning** (aprendizaje por transferencia).

## 1. Instalación de la librería transformers

Si estás en Google Colab, instalá la librería con el siguiente comando:

In [None]:
!pip install -q transformers

## 2. ¿Qué es BETO?

Antes de usar el modelo, entendamos qué estamos cargando.

### BETO = BERT en Español

**BERT** (Bidirectional Encoder Representations from Transformers) es una arquitectura de modelo de lenguaje desarrollada por Google en 2018 que revolucionó el NLP.

**BETO** es la versión en español de BERT, entrenada específicamente con textos en español.

### Características de BETO:

- **Entrenado con**: Wikipedia en español (millones de artículos)
- **Arquitectura**: Transformer con atención bidireccional
- **Parámetros**: ~110 millones
- **Tiempo de entrenamiento**: Días en múltiples GPUs
- **Costo de entrenamiento**: Miles de dólares en recursos computacionales

### ¿Qué significa "preentrenado"?

BETO ya aprendió:
- Gramática del español
- Vocabulario extenso
- Relaciones semánticas entre palabras
- Contextos en los que aparecen las palabras

Nosotros vamos a usar ese conocimiento para análisis de sentimiento, sin tener que entrenar nada desde cero.

## 3. Cargando el modelo de análisis de sentimiento

Vamos a usar `finiteautomata/beto-sentiment-analysis`, que es BETO ya ajustado específicamente para clasificar sentimientos en español.

### ¿Qué es un pipeline?

Un **pipeline** en HuggingFace encapsula todo el proceso:
1. Tokenización del texto
2. Conversión a formato del modelo
3. Inferencia (predicción)
4. Post-procesamiento de resultados

Todo esto en una sola línea de código.

In [None]:
from transformers import pipeline

print("Cargando modelo BETO para análisis de sentimiento...")
print("Este proceso descarga el modelo (puede tardar unos segundos la primera vez)\n")

# Cargamos el pipeline de análisis de sentimientos con el modelo en español
clasificador = pipeline("sentiment-analysis", model="finiteautomata/beto-sentiment-analysis")

print("Modelo cargado exitosamente")
print(f"Modelo: {clasificador.model.config._name_or_path}")
print(f"\nEste modelo fue ajustado (fine-tuned) específicamente para español.")

## 4. Comparación con nuestros modelos anteriores

Antes de probar BETO, recordemos las limitaciones de nuestros modelos:

| Aspecto | Nuestros modelos | BETO |
|---------|-----------------|------|
| Datos de entrenamiento | 6-10 frases | Millones de textos |
| Vocabulario | 10-50 palabras | ~30,000 tokens |
| Parámetros | Cientos/Miles | 110 millones |
| Tiempo de entrenamiento | Segundos | Días en GPUs |
| Comprensión del lenguaje | Básica | Avanzada |

Esta diferencia de escala es lo que hace que BETO sea tan poderoso.

## 5. Evaluación de frases variadas

Ahora vamos a probar el modelo con frases reales, incluyendo expresiones típicas de Argentina.

In [None]:
frases = [
    "Este lugar es espectacular, lo recomiendo totalmente",
    "Una decepción total. No pienso volver",
    "Más o menos... esperaba otra cosa",
    "Qué buena onda la atención, me encantó",
    "Mala calidad, pésimo servicio",
    "Zafa, pero nada especial",
    "Me sentí muy bien atendido",
    "Una estafa. Me arrepiento totalmente",
    "Todo excelente, 10 puntos",
    "Nunca más. Fue un desastre"
]

print("="*70)
print("PREDICCIONES DE BETO EN FRASES VARIADAS")
print("="*70)

# Clasificamos cada frase
resultados = clasificador(frases)

# Mostramos los resultados
for i, (frase, resultado) in enumerate(zip(frases, resultados), 1):
    sentimiento = resultado['label']
    confianza = resultado['score']

    print(f"\nFrase {i}: '{frase}'")
    print(f"  Predicción: {sentimiento} (confianza: {confianza:.2f})")

    # Indicador de confianza
    if confianza >= 0.9:
        print(f"  Confianza: Muy alta")
    elif confianza >= 0.7:
        print(f"  Confianza: Alta")
    elif confianza >= 0.5:
        print(f"  Confianza: Media")
    else:
        print(f"  Confianza: Baja (poco seguro)")

print("\n" + "="*70)

## 6. Análisis de expresiones rioplatenses

Vamos a probar específicamente con expresiones típicas de Argentina para ver si BETO las entiende.

In [None]:
expresiones_argentinas = [
    "Está re copado este lugar",
    "Qué garrón, me clavaron",
    "La pasé bomba, volvería sin dudarlo",
    "Un bodrio total, no lo banco más",
    "Me re sirvió, gracias",
    "Qué embole, fue un bajón"
]

print("="*70)
print("BETO CON EXPRESIONES RIOPLATENSES")
print("="*70)

resultados = clasificador(expresiones_argentinas)

for frase, resultado in zip(expresiones_argentinas, resultados):
    print(f"\nFrase: '{frase}'")
    print(f"  {resultado['label']} ({resultado['score']:.2f})")

print("\n" + "="*70)
print("Observá cómo BETO entiende modismos argentinos como:")
print("  'copado', 'garrón', 'bomba', 'bodrio', 'embole', 'bajón'")
print("Esto es gracias a su entrenamiento con textos en español variados.")
print("="*70)

## 7. Casos desafiantes: Opiniones mixtas y matices

Probemos con casos más complejos que suelen confundir a modelos simples.

In [None]:
casos_complejos = [
    "La comida estuvo bien pero el servicio fue horrible",
    "No estuvo mal, aunque esperaba más por el precio",
    "Pensé que iba a ser un desastre pero me sorprendió para bien",
    "Excelente producto, lástima la demora en el envío",
    "No puedo decir que no me gustó, porque sería mentir"
]

print("="*70)
print("CASOS COMPLEJOS: OPINIONES MIXTAS Y MATICES")
print("="*70)

resultados = clasificador(casos_complejos)

for i, (frase, resultado) in enumerate(zip(casos_complejos, resultados), 1):
    print(f"\nCaso {i}: '{frase}'")
    print(f"  Predicción: {resultado['label']} (confianza: {resultado['score']:.2f})")

    # Análisis del caso
    if i == 1:
        print(f"  Análisis: Opinión mixta (comida bien, servicio mal)")
    elif i == 2:
        print(f"  Análisis: Sentimiento tibio con matices")
    elif i == 3:
        print(f"  Análisis: Giro de expectativa negativa a positiva")
    elif i == 4:
        print(f"  Análisis: Positivo con salvedad")
    elif i == 5:
        print(f"  Análisis: Doble negación (no... no = sí)")

print("\n" + "="*70)

## 8. Comparación directa: ¿Cómo se compara con LSTM?

Recordemos que con LSTM entrenamos con 10 frases. BETO, en cambio, fue entrenado con millones de textos.

### Ventajas observadas de BETO:

1. **Vocabulario extenso**: Entiende palabras que nunca vio en nuestro pequeño dataset
2. **Contexto bidireccional**: Mira toda la frase simultáneamente, no solo de izquierda a derecha
3. **Modismos y expresiones**: Reconoce jerga argentina sin entrenamiento específico
4. **Matices**: Maneja mejor opiniones mixtas y giros en el sentimiento
5. **Confianza calibrada**: Los scores reflejan mejor la certeza del modelo

## 9. Probá tus propias frases

Ahora te toca experimentar. Agregá frases propias y observá cómo se comporta BETO.

In [None]:
# Agregá tus propias frases acá
mis_frases = [
    "Tu frase 1",
    "Tu frase 2",
    "Tu frase 3"
]

# Descomentá estas líneas cuando tengas tus frases
# resultados_propios = clasificador(mis_frases)
# for frase, resultado in zip(mis_frases, resultados_propios):
#     print(f"\nFrase: '{frase}'")
#     print(f"  Predicción: {resultado['label']} ({resultado['score']:.2f})")

## 10. Reflexión final

### ¿Qué aprendimos?

1. **Transfer learning es poderoso**: No necesitamos entrenar desde cero para obtener buenos resultados en NLP.

2. **Modelos preentrenados en español**: Existen modelos como BETO que entienden texto coloquial, incluso modismos regionales.

3. **Facilidad de uso**: Con HuggingFace Transformers podemos usar modelos de estado del arte con apenas unas líneas de código.

4. **Escala importa**: Un modelo entrenado con millones de ejemplos es cualitativamente diferente a uno entrenado con 10.

### Comparación con nuestros modelos anteriores:

**Perceptrón (Lab 1)**:
- Entrenamiento: 6 frases, segundos
- Limitación: Modelo lineal, bag-of-words
- Resultado: Clasificación básica

**MLP (Lab 2)**:
- Entrenamiento: 10 frases, segundos
- Mejora: Patrones no lineales
- Limitación: Sigue sin orden, bag-of-words

**LSTM (Lab 3)**:
- Entrenamiento: 10 frases, minutos
- Mejora: Procesa secuencias, embeddings
- Limitación: Dataset pequeño, vocabulario limitado

**BETO (Lab 4)**:
- Entrenamiento: Millones de textos, días en GPUs
- Mejora: Comprensión profunda del español
- Uso: Sin entrenar, solo inferencia

### ¿Por qué esto cambió el NLP?

Antes de 2018 (pre-BERT), cada tarea requería:
1. Conseguir dataset grande específico
2. Entrenar modelo desde cero
3. Esperar que generalizara

Después de 2018 (era Transformer):
1. Usar modelo preentrenado
2. Opcionalmente: ajustar con pocos ejemplos (fine-tuning)
3. Obtener resultados superiores

### Conceptos clave para entender LLMs:

Lo que vimos hoy es la base de cómo funcionan los LLMs modernos:

- **Preentrenamiento masivo**: GPT, BERT, LLaMA se entrenan con billones de palabras
- **Arquitectura Transformer**: Atención en lugar de procesamiento secuencial
- **Transfer learning**: El conocimiento se transfiere entre tareas
- **Emergencia de capacidades**: Con suficiente escala, surgen habilidades no programadas explícitamente

### ¿Qué sigue?

En las próximas clases vamos a profundizar en:
- Arquitectura Transformer en detalle
- Mecanismo de atención
- Cómo se entrenan modelos como GPT
- Fine-tuning y prompting
- Construcción de aplicaciones con LLMs

Hoy vimos **qué** pueden hacer estos modelos. Próximamente veremos **cómo** funcionan por dentro.