In [None]:
import pandas as pd
import nltk 
from nltk.sentiment.vader import SentimentIntensityAnalyzer
  # Importamos a biblioteca para tradução

# Baixar os recursos necessários do NLTK
nltk.download('vader_lexicon')

print("Bibliotecas carregadas e VADER está pronto.")

In [None]:
# Carregar as reviews que criamos anteriormente
try:
    df_reviews = pd.read_csv("../data/mock_reviews.csv")
    print(f"Total de {len(df_reviews)} reviews carregados.")
except FileNotFoundError:
    print("ERRO: Arquivo de reviews não encontrado. Certifique-se de que o arquivo '../data/mock_reviews.csv' existe.")
df_reviews.head()

Total de 30 reviews carregados.


Unnamed: 0,user_id,provincia,review_texto
0,1,Luanda,"Mussulo é o paraíso, mas os preços são absurdo..."
1,2,Benguela,"A Praia Morena é um clássico. Sempre bom, mas ..."
2,3,Malanje,Kalandula é de outro mundo! Absolutamente impe...
3,4,Namibe,"O deserto é mágico, uma experiência única. No ..."
4,5,Huambo,"Adorei o Huambo. Muito acessível, pessoas simp..."


In [None]:
# Inicializar o analisador de sentimento VADER
sia = SentimentIntensityAnalyzer()

# Testar uma review de exemplo
exemplo_positivo = "Kalandula é de outro mundo! Absolutamente imperdível."
exemplo_negativo = "Péssimo hotel, muito caro e o serviço foi horrível."
exemplo_misto = "A praia é linda, mas o lixo na areia foi decepcionante."

print(f"Positivo: {sia.polarity_scores(exemplo_positivo)}")
print(f"Negativo: {sia.polarity_scores(exemplo_negativo)}")
print(f"Misto: {sia.polarity_scores(exemplo_misto)}")

Positivo: {'neg': 0.0, 'neu': 1.0, 'pos': 0.0, 'compound': 0.0}
Negativo: {'neg': 0.0, 'neu': 1.0, 'pos': 0.0, 'compound': 0.0}
Misto: {'neg': 0.0, 'neu': 1.0, 'pos': 0.0, 'compound': 0.0}


4. Processar Reviews e Mapear para Ratings (1-5)

Aqui está o "coração" do notebook. Primeiro, criamos a função que extrai o score *compound*. Segundo, criamos a função que converte esse score (de -1 a 1) num rating (de 1 a 5).

In [None]:
def get_sentiment_score(review_texto):
    """
    Usa o VADER para calcular o score 'compound' de uma review.
    """
    if pd.isna(review_texto):
        return 0.0
    return sia.polarity_scores(review_texto)['compound']


def map_score_to_rating(score):
    """
    Converte um score 'compound' (-1 a 1) para um rating de 1 a 5 estrelas.
    Esta lógica é uma decisão de negócio e pode ser ajustada.
    """
    if score >= 0.5:
        return 5  # Muito Positivo
    elif score >= 0.1:
        return 4  # Positivo
    elif score > -0.1:
        return 3  # Neutro
    elif score > -0.5:
        return 2  # Negativo
    else:
        return 1  # Muito Negativo