# Projeto: Análise de Sentimentos em Redes Sociais
## Etapa: Predições Finais
**Autor:** Vinícius Ramos
**Fonte do Dataset:** [Kaggle](https://www.kaggle.com/datasets/kashishparmar02/social-media-sentiments-analysis-dataset)

## 1. Importações e Carregamento do Modelo

In [6]:
import joblib
import re
import nltk
from nltk.corpus import stopwords
from nltk.stem import WordNetLemmatizer

# Carregar o modelo que salvamos na etapa anterior
caminho_modelo = '../data/modelos_salvos/modelo_final_otimizado.joblib'
modelo_carregado = joblib.load(caminho_modelo)

print("Modelo carregado com sucesso!")
print(f"Tipo do objeto carregado: {type(modelo_carregado)}")
print("\nDetalhes do pipeline do modelo:")
print(modelo_carregado)

Modelo carregado com sucesso!
Tipo do objeto carregado: <class 'sklearn.pipeline.Pipeline'>

Detalhes do pipeline do modelo:
Pipeline(steps=[('tfidf',
                 TfidfVectorizer(max_features=5000, ngram_range=(1, 2))),
                ('classifier',
                 OneVsRestClassifier(estimator=LogisticRegression(class_weight='balanced',
                                                                  random_state=42,
                                                                  solver='liblinear')))])


## 2. Função de Pré-processamento

In [7]:
# Inicializando os componentes necessários
stop_words = set(stopwords.words('english'))
stop_words.add('like')
lemmatizer = WordNetLemmatizer()

def preprocess_text(text):
    # 1. Converter para minúsculas
    text = text.lower()
    # 2. Remover URLs
    text = re.sub(r'http\S+|www\S+|https\S+', '', text, flags=re.MULTILINE)
    # 3. Remover menções (@) e hashtags (#)
    text = re.sub(r'\@\w+|\#','', text)
    # 4. Remover pontuação e números
    text = re.sub(r'[^a-z\s]', '', text)
    # 5. Tokenização e remoção de stopwords
    tokens = text.split()
    tokens = [word for word in tokens if word not in stop_words]
    # 6. Lematização
    tokens = [lemmatizer.lemmatize(word) for word in tokens]
    # 7. Juntar os tokens de volta em uma string
    return " ".join(tokens)


## 3. Função de Predição

In [8]:
def prever_sentimento(frase):
    """
    Recebe uma frase em texto puro, a processa e retorna o sentimento
    previsto pelo modelo carregado.
    """
    # Garante que a entrada seja uma string
    if not isinstance(frase, str):
        return "Erro: A entrada deve ser um texto."

    # 1. Processar o texto
    texto_processado = preprocess_text(frase)

    # 2. Fazer a predição    
    predicao = modelo_carregado.predict([texto_processado])
    
    # 3. Retornar o resultado
    return predicao[0]


## 4. Testando o Modelo

In [9]:
# Lista de frases para testar
frases_teste = [
    "I had a wonderful and amazing vacation in the mountains!",
    "This is the worst service I have ever received. I am very disappointed.",
    "The movie was okay, not great but not bad either.",
    "I'm so excited about the concert tonight!",
    "My flight was delayed and I lost my luggage. What a terrible day.",
    "The documentation is clear and provides all the necessary information.",
    "I feel a bit sad today, I miss my friends.",
    "This new feature is quite confusing to use.",
    "Congratulations on your incredible achievement!",
    "I'm just watching the clouds go by."
]

# Iterar sobre as frases e mostrar a predição
for frase in frases_teste:
    sentimento = prever_sentimento(frase)
    print(f"Frase: '{frase}'\n  -> Sentimento Previsto: {sentimento}\n")

Frase: 'I had a wonderful and amazing vacation in the mountains!'
  -> Sentimento Previsto: Positivo

Frase: 'This is the worst service I have ever received. I am very disappointed.'
  -> Sentimento Previsto: Negativo

Frase: 'The movie was okay, not great but not bad either.'
  -> Sentimento Previsto: Negativo

Frase: 'I'm so excited about the concert tonight!'
  -> Sentimento Previsto: Positivo

Frase: 'My flight was delayed and I lost my luggage. What a terrible day.'
  -> Sentimento Previsto: Negativo

Frase: 'The documentation is clear and provides all the necessary information.'
  -> Sentimento Previsto: Neutro

Frase: 'I feel a bit sad today, I miss my friends.'
  -> Sentimento Previsto: Negativo

Frase: 'This new feature is quite confusing to use.'
  -> Sentimento Previsto: Positivo

Frase: 'Congratulations on your incredible achievement!'
  -> Sentimento Previsto: Neutro

Frase: 'I'm just watching the clouds go by.'
  -> Sentimento Previsto: Negativo



## 5. Interativo

In [10]:
print("Digite uma frase (em inglês) e pressione Enter para ver a predição.")
print("Digite 'sair' para terminar.")

while True:
    try:
        frase_usuario = input("\nSua frase: ")
        if frase_usuario.lower() == 'sair':
            print("Obrigado!")
            break
        
        sentimento_previsto = prever_sentimento(frase_usuario)
        print(f"  -> Sentimento Previsto: {sentimento_previsto}")

    except (EOFError, KeyboardInterrupt):
        print("\nSessão interativa encerrada.")
        break

Digite uma frase (em inglês) e pressione Enter para ver a predição.
Digite 'sair' para terminar.
  -> Sentimento Previsto: Positivo
Obrigado!
