In [2]:
from transformers import AutoTokenizer, AutoModelForSequenceClassification

# Escolha do modelo
model_name = "nlptown/bert-base-multilingual-uncased-sentiment"

# Carregamento do tokenizer e do modelo
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# Texto de entrada
text = "Eu odiei este produto! Nao Funciona de maneira alguma. "

# Tokeniza√ß√£o do texto
inputs = tokenizer(text, return_tensors="pt")

# Obten√ß√£o das previs√µes
outputs = model(**inputs)

# Processamento das sa√≠das
logits = outputs.logits
import torch
predicted_class = torch.argmax(logits).item()
print(f"Classe prevista: {predicted_class}")


Classe prevista: 0


# An√°lise de Sentimento com BERT Multil√≠ngue

## Bibliotecas Utilizadas

### ü§ó Transformers
- Biblioteca desenvolvida pela Hugging Face
- Fornece acesso a milhares de modelos pr√©-treinados
- Facilita o uso de arquiteturas transformer como BERT, GPT, T5
- Principais componentes utilizados:
  - `AutoTokenizer`: Tokeniza√ß√£o autom√°tica espec√≠fica para cada modelo
  - `AutoModelForSequenceClassification`: Carregamento autom√°tico de modelos para classifica√ß√£o

### PyTorch
- Framework de deep learning
- Usado para processamento tensorial e opera√ß√µes de ML
- No c√≥digo: utilizado para processar os logits e obter a classe prevista

## O Modelo BERT Multil√≠ngue para Sentimento

### Caracter√≠sticas
- Nome: `nlptown/bert-base-multilingual-uncased-sentiment`
- Baseado na arquitetura BERT
- Suporte multil√≠ngue (funciona em diversos idiomas)
- Classifica√ß√£o em 5 n√≠veis (0 a 4):
  - 0: Muito negativo
  - 1: Negativo
  - 2: Neutro
  - 3: Positivo
  - 4: Muito positivo

### Funcionamento
1. Tokeniza√ß√£o do texto em subpalavras
2. Processamento atrav√©s das camadas BERT
3. Classifica√ß√£o final atrav√©s de uma camada de classifica√ß√£o

## Resultado Obtido
No exemplo, a classe prevista foi 0 (muito negativo) para o texto:
> "Eu odiei este produto! Nao Funciona de maneira alguma."

Este resultado √© coerente dado o conte√∫do claramente negativo da mensagem.

## Aplica√ß√µes Pr√°ticas
- An√°lise de satisfa√ß√£o de clientes
- Monitoramento de redes sociais
- An√°lise de reviews de produtos
- Feedback de servi√ßos
- Pesquisas de mercado

## Poss√≠veis Melhorias

### T√©cnicas
1. Pr√©-processamento do texto:
   - Corre√ß√£o ortogr√°fica
   - Normaliza√ß√£o de acentua√ß√£o
   - Remo√ß√£o de ru√≠dos

2. P√≥s-processamento:
   - Adicionar threshold de confian√ßa
   - Implementar m√©dia m√≥vel para an√°lises sequenciais

### Funcionais
1. Adicionar interpretabilidade:
```python
from transformers import pipeline
classifier = pipeline("sentiment-analysis", model=model, tokenizer=tokenizer)
```

2. Implementar an√°lise de aspectos espec√≠ficos:
```python
def analyze_aspects(text, aspects):
    results = {}
    for aspect in aspects:
        aspect_text = f"Sobre {aspect}: {text}"
        results[aspect] = classifier(aspect_text)
    return results
```

3. Adicionar tratamento de erros e valida√ß√µes:
```python
def predict_sentiment(text):
    if not text or len(text.strip()) == 0:
        raise ValueError("Texto n√£o pode ser vazio")
    try:
        inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=512)
        outputs = model(**inputs)
        return torch.argmax(outputs.logits).item()
    except Exception as e:
        logging.error(f"Erro na predi√ß√£o: {str(e)}")
        raise
```

## Considera√ß√µes Finais
O modelo demonstra boa capacidade de an√°lise de sentimento em portugu√™s, sendo especialmente √∫til por seu suporte multil√≠ngue. Para uso em produ√ß√£o, recomenda-se implementar as melhorias sugeridas e realizar uma avalia√ß√£o mais extensa com um conjunto de dados espec√≠fico do dom√≠nio de aplica√ß√£o.