In [2]:
from transformers import AutoTokenizer, AutoModelForSequenceClassification

# Escolha do modelo
model_name = "nlptown/bert-base-multilingual-uncased-sentiment"

# Carregamento do tokenizer e do modelo
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)

# Texto de entrada
text = "Eu odiei este produto! Nao Funciona de maneira alguma. "

# Tokenização do texto
inputs = tokenizer(text, return_tensors="pt")

# Obtenção das previsões
outputs = model(**inputs)

# Processamento das saídas
logits = outputs.logits
import torch
predicted_class = torch.argmax(logits).item()
print(f"Classe prevista: {predicted_class}")


Classe prevista: 0


# Análise de Sentimento com BERT Multilíngue

## Bibliotecas Utilizadas

### 🤗 Transformers
- Biblioteca desenvolvida pela Hugging Face
- Fornece acesso a milhares de modelos pré-treinados
- Facilita o uso de arquiteturas transformer como BERT, GPT, T5
- Principais componentes utilizados:
  - `AutoTokenizer`: Tokenização automática específica para cada modelo
  - `AutoModelForSequenceClassification`: Carregamento automático de modelos para classificação

### PyTorch
- Framework de deep learning
- Usado para processamento tensorial e operações de ML
- No código: utilizado para processar os logits e obter a classe prevista

## O Modelo BERT Multilíngue para Sentimento

### Características
- Nome: `nlptown/bert-base-multilingual-uncased-sentiment`
- Baseado na arquitetura BERT
- Suporte multilíngue (funciona em diversos idiomas)
- Classificação em 5 níveis (0 a 4):
  - 0: Muito negativo
  - 1: Negativo
  - 2: Neutro
  - 3: Positivo
  - 4: Muito positivo

### Funcionamento
1. Tokenização do texto em subpalavras
2. Processamento através das camadas BERT
3. Classificação final através de uma camada de classificação

## Resultado Obtido
No exemplo, a classe prevista foi 0 (muito negativo) para o texto:
> "Eu odiei este produto! Nao Funciona de maneira alguma."

Este resultado é coerente dado o conteúdo claramente negativo da mensagem.

## Aplicações Práticas
- Análise de satisfação de clientes
- Monitoramento de redes sociais
- Análise de reviews de produtos
- Feedback de serviços
- Pesquisas de mercado

## Possíveis Melhorias

### Técnicas
1. Pré-processamento do texto:
   - Correção ortográfica
   - Normalização de acentuação
   - Remoção de ruídos

2. Pós-processamento:
   - Adicionar threshold de confiança
   - Implementar média móvel para análises sequenciais

### Funcionais
1. Adicionar interpretabilidade:
```python
from transformers import pipeline
classifier = pipeline("sentiment-analysis", model=model, tokenizer=tokenizer)
```

2. Implementar análise de aspectos específicos:
```python
def analyze_aspects(text, aspects):
    results = {}
    for aspect in aspects:
        aspect_text = f"Sobre {aspect}: {text}"
        results[aspect] = classifier(aspect_text)
    return results
```

3. Adicionar tratamento de erros e validações:
```python
def predict_sentiment(text):
    if not text or len(text.strip()) == 0:
        raise ValueError("Texto não pode ser vazio")
    try:
        inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=512)
        outputs = model(**inputs)
        return torch.argmax(outputs.logits).item()
    except Exception as e:
        logging.error(f"Erro na predição: {str(e)}")
        raise
```

## Considerações Finais
O modelo demonstra boa capacidade de análise de sentimento em português, sendo especialmente útil por seu suporte multilíngue. Para uso em produção, recomenda-se implementar as melhorias sugeridas e realizar uma avaliação mais extensa com um conjunto de dados específico do domínio de aplicação.