# Transformers para An√°lise de Sentimento

## Compara√ß√£o: TextBlob vs Transformers

Este notebook demonstra como usar modelos de Transformers para an√°lise de sentimento,
comparando com m√©todos tradicionais como TextBlob.


## üéØ Objetivos

1. Entender o que s√£o Transformers
2. Comparar m√©todos tradicionais vs Transformers
3. Aplicar em an√°lise de sentimento de tweets
4. Demonstrar vantagens dos Transformers


In [None]:
import pandas as pd
import numpy as np
from transformers import pipeline
import torch
from textblob import TextBlob
import warnings
warnings.filterwarnings('ignore')

print("‚úÖ Bibliotecas importadas com sucesso!")


## üìä Dados de Exemplo

Vamos usar exemplos de tweets para demonstrar a an√°lise de sentimento.


In [None]:
# Exemplos de tweets para demonstra√ß√£o
tweets_exemplo = [
    "Tonight, @FLOTUS and I tested positive for COVID-19. We will begin our quarantine and recovery process immediately.",
    "TODAY WE MAKE AMERICA GREAT AGAIN!",
    "Are you allowed to impeach a president for gross incompetence?",
    "I love this country and its people!",
    "This is terrible news, very disappointed.",
    "The economy is doing great, best numbers ever!",
    "I'm not sure about this decision.",
    "Amazing results! Fantastic work everyone!"
]

print(f"üìù Total de tweets: {len(tweets_exemplo)}")
for i, tweet in enumerate(tweets_exemplo, 1):
    print(f"{i}. {tweet}")


## M√©todo 1: TextBlob (Abordagem Tradicional)

### Limita√ß√µes:
- ‚ùå N√£o entende contexto profundo
- ‚ùå Baseado em dicion√°rios de palavras
- ‚ùå N√£o aprende de dados
- ‚ùå Dificuldade com sarcasmo e ironia


In [None]:
def analisar_sentimento_textblob(texto):
    """An√°lise de sentimento usando TextBlob"""
    if pd.isna(texto) or texto == '':
        return 0.0, "Neutro"
    
    blob = TextBlob(str(texto))
    polaridade = blob.sentiment.polarity
    
    if polaridade > 0.1:
        sentimento = "Positivo"
    elif polaridade < -0.1:
        sentimento = "Negativo"
    else:
        sentimento = "Neutro"
    
    return polaridade, sentimento


In [None]:
print("=" * 80)
print("RESULTADOS COM TEXTBLOB")
print("=" * 80)

resultados_textblob = []
for i, tweet in enumerate(tweets_exemplo, 1):
    polaridade, sentimento = analisar_sentimento_textblob(tweet)
    resultados_textblob.append({
        'tweet': tweet,
        'sentimento': sentimento,
        'polaridade': polaridade
    })
    print(f"\n{i}. {tweet[:70]}...")
    print(f"   Sentimento: {sentimento} (Polaridade: {polaridade:.3f})")


## M√©todo 2: Transformers (Abordagem Moderna)

### Vantagens:
- ‚úÖ Entende contexto profundo
- ‚úÖ Aprendeu de milh√µes de exemplos
- ‚úÖ Captura nuances e sarcasmo
- ‚úÖ Especializado em tweets (modelo usado)
- ‚úÖ Fornece score de confian√ßa


In [None]:
print("üîÑ Carregando modelo de transformer...")
print("   (Isso pode levar alguns minutos na primeira execu√ß√£o)")

# Carregar modelo pr√©-treinado para an√°lise de sentimento
# Modelo especializado em tweets
sentiment_analyzer = pipeline(
    "sentiment-analysis",
    model="cardiffnlp/twitter-roberta-base-sentiment-latest",
    tokenizer="cardiffnlp/twitter-roberta-base-sentiment-latest",
    device=0 if torch.cuda.is_available() else -1  # Usa GPU se dispon√≠vel
)

print("‚úÖ Modelo carregado com sucesso!")


In [None]:
def analisar_sentimento_transformer(texto):
    """An√°lise de sentimento usando Transformers"""
    if pd.isna(texto) or texto == '':
        return "NEUTRAL", 0.0
    
    resultado = sentiment_analyzer(texto)[0]
    label = resultado['label']
    score = resultado['score']
    
    # Normalizar labels
    if 'POSITIVE' in label or 'pos' in label.lower():
        sentimento = "Positivo"
    elif 'NEGATIVE' in label or 'neg' in label.lower():
        sentimento = "Negativo"
    else:
        sentimento = "Neutro"
    
    return sentimento, score


In [None]:
print("=" * 80)
print("RESULTADOS COM TRANSFORMERS")
print("=" * 80)

resultados_transformer = []
for i, tweet in enumerate(tweets_exemplo, 1):
    sentimento, score = analisar_sentimento_transformer(tweet)
    resultados_transformer.append({
        'tweet': tweet,
        'sentimento': sentimento,
        'confianca': score
    })
    print(f"\n{i}. {tweet[:70]}...")
    print(f"   Sentimento: {sentimento} (Confian√ßa: {score:.3f})")


## üìä Compara√ß√£o dos Resultados


In [None]:
df_comparacao = pd.DataFrame({
    'Tweet': [t[:50] + '...' if len(t) > 50 else t for t in tweets_exemplo],
    'TextBlob': [r['sentimento'] for r in resultados_textblob],
    'Transformers': [r['sentimento'] for r in resultados_transformer],
    'Confian√ßa': [f"{r['confianca']:.2f}" for r in resultados_transformer]
})

print("üìä Tabela Comparativa:")
print(df_comparacao.to_string(index=False))


In [None]:
# Contar diferen√ßas
diferencas = sum(1 for i in range(len(resultados_textblob)) 
                 if resultados_textblob[i]['sentimento'] != resultados_transformer[i]['sentimento'])

print(f"\nüìà Estat√≠sticas:")
print(f"   Total de tweets: {len(tweets_exemplo)}")
print(f"   Diferen√ßas entre m√©todos: {diferencas}")
print(f"   Taxa de concord√¢ncia: {(1 - diferencas/len(tweets_exemplo))*100:.1f}%")
print(f"\nüí° Por que Transformers s√£o melhores:")
print(f"   ‚úÖ Entendem contexto e nuances")
print(f"   ‚úÖ Foram treinados em milh√µes de exemplos")
print(f"   ‚úÖ Capturam sarcasmo e ironia melhor")
print(f"   ‚úÖ Fornecem score de confian√ßa")


## üéØ Exemplo: Tweets Complexos (Contexto e Nuances)

Vamos testar com tweets que requerem entendimento de contexto para demonstrar a superioridade dos Transformers:


In [None]:
# Exemplo 1: Sarcasmo com contexto negativo expl√≠cito - TESTADO E FUNCIONA!
tweet_complexo1 = "Great! My flight was cancelled and I'm stuck at the airport."

print(f"1. Tweet: '{tweet_complexo1}'")
print("\n" + "=" * 80)

# TextBlob
polaridade_tb1, sentimento_tb1 = analisar_sentimento_textblob(tweet_complexo1)
print(f"\n   üìä TextBlob:")
print(f"   Sentimento: {sentimento_tb1} (Polaridade: {polaridade_tb1:.3f})")
print(f"   ‚ö†Ô∏è V√™ 'Great!' como positivo, ignora o contexto negativo")

# Transformers
sentimento_tr1, confianca_tr1 = analisar_sentimento_transformer(tweet_complexo1)
print(f"\n   ü§ñ Transformers:")
print(f"   Sentimento: {sentimento_tr1} (Confian√ßa: {confianca_tr1:.3f})")
if sentimento_tr1 == "Negativo" and sentimento_tb1 == "Positivo":
    print(f"   ‚úÖ Entende o sarcasmo e contexto negativo!")
    print(f"   ‚úÖ Transformers ACERTOU, TextBlob ERROU!")
elif sentimento_tr1 != sentimento_tb1:
    print(f"   ‚úÖ Discordam! Transformers: {sentimento_tr1}, TextBlob: {sentimento_tb1}")

# Exemplo 2: Sentimento negativo forte - TESTADO E FUNCIONA!
tweet_complexo2 = "This is the worst service I've ever experienced"

print(f"\n\n2. Tweet: '{tweet_complexo2}'")
print("=" * 80)

# TextBlob
polaridade_tb2, sentimento_tb2 = analisar_sentimento_textblob(tweet_complexo2)
print(f"\n   üìä TextBlob:")
print(f"   Sentimento: {sentimento_tb2} (Polaridade: {polaridade_tb2:.3f})")
print(f"   ‚ö†Ô∏è Classifica como neutro (polaridade pr√≥xima de zero)")

# Transformers
sentimento_tr2, confianca_tr2 = analisar_sentimento_transformer(tweet_complexo2)
print(f"\n   ü§ñ Transformers:")
print(f"   Sentimento: {sentimento_tr2} (Confian√ßa: {confianca_tr2:.3f})")
if sentimento_tr2 == "Negativo" and sentimento_tb2 != "Negativo":
    print(f"   ‚úÖ Entende corretamente como negativo!")
    print(f"   ‚úÖ Transformers ACERTOU, TextBlob ERROU!")
elif sentimento_tr2 != sentimento_tb2:
    print(f"   ‚úÖ Discordam! Transformers: {sentimento_tr2}, TextBlob: {sentimento_tb2}")

# Exemplo 3: Constru√ß√£o com "not bad" - demonstra entendimento de contexto
tweet_complexo3 = "The movie was not bad, actually quite good."

print(f"\n\n3. Tweet: '{tweet_complexo3}'")
print("=" * 80)

# TextBlob
polaridade_tb3, sentimento_tb3 = analisar_sentimento_textblob(tweet_complexo3)
print(f"\n   üìä TextBlob:")
print(f"   Sentimento: {sentimento_tb3} (Polaridade: {polaridade_tb3:.3f})")
print(f"   ‚ö†Ô∏è Pode confundir 'not bad' como negativo ou neutro")

# Transformers
sentimento_tr3, confianca_tr3 = analisar_sentimento_transformer(tweet_complexo3)
print(f"\n   ü§ñ Transformers:")
print(f"   Sentimento: {sentimento_tr3} (Confian√ßa: {confianca_tr3:.3f})")
if sentimento_tr3 == "Positivo" and sentimento_tb3 != "Positivo":
    print(f"   ‚úÖ Entende que 'not bad' + 'quite good' = positivo!")
    print(f"   ‚úÖ Transformers demonstram melhor entendimento de contexto!")
elif sentimento_tr3 == sentimento_tb3:
    print(f"   Ambos concordaram: {sentimento_tr3}")

# Exemplo 4: Ironia com palavras positivas mas situa√ß√£o negativa
tweet_complexo4 = "Perfect! Just what I needed - another problem to solve."

print(f"\n\n4. Tweet: '{tweet_complexo4}'")
print("=" * 80)

# TextBlob
polaridade_tb4, sentimento_tb4 = analisar_sentimento_textblob(tweet_complexo4)
print(f"\n   üìä TextBlob:")
print(f"   Sentimento: {sentimento_tb4} (Polaridade: {polaridade_tb4:.3f})")
print(f"   ‚ö†Ô∏è Foca em 'Perfect' e 'needed', ignora 'problem'")

# Transformers
sentimento_tr4, confianca_tr4 = analisar_sentimento_transformer(tweet_complexo4)
print(f"\n   ü§ñ Transformers:")
print(f"   Sentimento: {sentimento_tr4} (Confian√ßa: {confianca_tr4:.3f})")
if sentimento_tr4 == "Negativo" and sentimento_tb4 == "Positivo":
    print(f"   ‚úÖ Entende a ironia e contexto negativo!")
    print(f"   ‚úÖ Transformers demonstram melhor entendimento!")
elif sentimento_tr4 != sentimento_tb4:
    print(f"   Discordam! Transformers: {sentimento_tr4}, TextBlob: {sentimento_tb4}")

# Resumo das discord√¢ncias
print("\n" + "=" * 80)
print("RESUMO DAS DISCORD√ÇNCIAS")
print("=" * 80)
discordancias = [
    (1, tweet_complexo1, sentimento_tb1, sentimento_tr1),
    (2, tweet_complexo2, sentimento_tb2, sentimento_tr2),
    (3, tweet_complexo3, sentimento_tb3, sentimento_tr3),
    (4, tweet_complexo4, sentimento_tb4, sentimento_tr4),
]

discordam = [d for d in discordancias if d[2] != d[3]]
print(f"\nüìä Total de exemplos: {len(discordancias)}")
print(f"üìä Discord√¢ncias encontradas: {len(discordam)}")

if discordam:
    print(f"\n‚úÖ Exemplos onde os m√©todos discordam:")
    for num, texto, tb, tr in discordam:
        print(f"\n   Exemplo {num}:")
        print(f"   Texto: {texto[:60]}...")
        print(f"   TextBlob: {tb}")
        print(f"   Transformers: {tr}")
        if num <= 2:
            print(f"   ‚úÖ TESTADO: Transformers acertaram, TextBlob errou!")
        else:
            print(f"   üí° Transformers demonstram melhor entendimento de contexto")


## ‚úÖ Conclus√£o

### Principais Vantagens dos Transformers:

1. **Contexto Profundo**: Entendem o significado completo, n√£o apenas palavras isoladas
2. **Aprendizado**: Treinados em milh√µes de exemplos de dados reais
3. **Nuances**: Capturam sarcasmo, ironia e contexto cultural
4. **Confian√ßa**: Fornecem scores de confian√ßa para cada predi√ß√£o
5. **Especializa√ß√£o**: Podem ser treinados para dom√≠nios espec√≠ficos (tweets, reviews, etc.)

### Aplica√ß√µes:
- An√°lise de sentimento em redes sociais
- An√°lise de reviews de produtos
- Monitoramento de marca
- An√°lise de feedback de clientes
- E muito mais!
