# Experimentos com TweetEval e Modelos Pré-Treinados

Este notebook realiza testes de análise de sentimentos utilizando modelos disponíveis no Hugging Face, incluindo o TweetEval e outros modelos multilíngues como BERT e RoBERTa.


In [None]:
!pip install torch torchvision torchaudio transformers datasets --quiet

## Importando bibliotecas

In [None]:
from transformers import AutoTokenizer, AutoModelForSequenceClassification, pipeline
from datasets import load_dataset


## Carregando modelo de sentimentos multilíngue (ex.: BERT Multilingual)

In [None]:
model_name = 'nlptown/bert-base-multilingual-uncased-sentiment'
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

sentiment_pipeline = pipeline('sentiment-analysis', model=model, tokenizer=tokenizer)

exemplo = 'O HB20 é um carro econômico, mas tem pouco espaço interno.'
print(sentiment_pipeline(exemplo))

## Testando com o dataset TweetEval (sentiment)

In [None]:
dataset = load_dataset('tweet_eval', 'sentiment')
print(dataset)

### Exemplo de avaliação no dataset TweetEval

In [None]:
exemplos = dataset['test']['text'][:5]
for texto in exemplos:
    print(texto)
    print(sentiment_pipeline(texto))
    print('-'*50)

## Próximos passos
- Adaptar para classificação de sentimentos em português.
- Avaliar modelos específicos para PT-BR (ex.: `neuralmind/bert-base-portuguese-cased`).
- Integrar pipeline com os dados coletados do Twitter ou ReclameAqui.
