In [11]:
import requests
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.svm import LinearSVC
from sklearn.pipeline import Pipeline
from sklearn.metrics import classification_report
import re
import nltk
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
from nltk.stem import WordNetLemmatizer

# Baixar recursos adicionais do NLTK
nltk.download('omw-1.4')
nltk.download('punkt')
nltk.download('stopwords')
nltk.download('wordnet')

# Carregar os dados
data = pd.read_excel('Expanded_Dataset_Tweets.xlsx')

# Pré-processamento do texto
def preprocess_text(text):
    text = text.lower()
    text = re.sub(r'[^a-zA-Z\s]', '', text)
    tokens = word_tokenize(text)
    stop_words = set(stopwords.words('portuguese'))
    tokens = [word for word in tokens if word not in stop_words]
    lemmatizer = WordNetLemmatizer()
    tokens = [lemmatizer.lemmatize(word) for word in tokens]
    processed_text = ' '.join(tokens)
    return processed_text

data['processed_tweets'] = data['tweets'].apply(preprocess_text)

# Dividir os dados em treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(data['processed_tweets'], data['classificador'], test_size=0.55, random_state=42)

# Criar o pipeline de classificação
pipeline = Pipeline([
    ('tfidf', TfidfVectorizer()),
    ('clf', LinearSVC())
])

# Definir os hiperparâmetros para o GridSearch
param_grid = {
    'tfidf__max_df': [0.8, 0.9, 1.0],
    'tfidf__ngram_range': [(1,1), (1,2)],
    'clf__C': [0.1, 1, 10]
}

# Realizar o GridSearch com validação cruzada
grid_search = GridSearchCV(pipeline, param_grid, cv=5, scoring='accuracy')
grid_search.fit(X_train, y_train)

# Imprimir os melhores hiperparâmetros
print(f"Melhores hiperparâmetros: {grid_search.best_params_}")

# Avaliar o modelo com os melhores hiperparâmetros
best_pipeline = grid_search.best_estimator_
predictions = best_pipeline.predict(X_test)
print(classification_report(y_test, predictions))

# Frases para teste
frases_depressivas = [
    "Sinto que minha vida não tem sentido.",
    "Eu me sinto tão sozinho e triste o tempo todo.",
    "Nada me traz alegria, estou sempre desanimado.",
    "Não vejo uma saída para essa escuridão.",
    "Não quero mais viver!",
    "Tudo parece tão difícil e sem esperança.",
    "A tristeza é a única companhia que me resta.",
    "Sinto que ninguém se importa comigo.",
    "Meu coração está pesado de tanta dor.",
    "Acordar todos os dias é uma luta constante.",
    "O futuro parece sombrio e incerto.",
    "Não consigo encontrar motivação para nada.",
    "Estou preso em um ciclo de sofrimento.",
    "A felicidade parece algo inalcançável.",
    "Sinto que estou me afundando cada vez mais.",
    "O mundo seria melhor sem mim.",
    "Perdi a vontade de fazer qualquer coisa.",
    "Sinto que estou desaparecendo lentamente.",
    "Não vejo um propósito para continuar.",
    "Me sinto um peso para todos ao meu redor.",
    "A dor emocional é insuportável.",
    "Não tenho forças para lutar.",
    "Tudo ao meu redor parece vazio e sem vida.",
    "Sinto que estou sempre no escuro.",
    "Estou cansado de fingir que estou bem.",
    "A solidão me consome por dentro.",
    "Não consigo parar de chorar.",
    "A vida parece uma sequência interminável de sofrimento.",
    "Não consigo escapar dos meus pensamentos negativos.",
    "Sinto que estou à beira de um colapso.",
    "Nada me motiva a seguir em frente.",
    "Estou constantemente triste e abatido.",
    "A escuridão parece me envolver.",
    "Sinto que estou perdendo a esperança.",
    "Estou preso em uma espiral de negatividade.",
    "A alegria parece um conceito distante.",
    "Sinto que estou em um beco sem saída.",
    "A vida perdeu todo o seu brilho.",
    "Estou emocionalmente exausto.",
    "A dor parece nunca desaparecer.",
    "Sinto que estou me desintegrando.",
    "Não consigo encontrar paz interior.",
    "Estou cansado de lutar contra meus próprios demônios.",
    "A tristeza me acompanha aonde quer que eu vá.",
    "Sinto que estou perdendo o controle.",
    "Não vejo uma luz no fim do túnel.",
    "Estou preso em um mar de desespero.",
    "Sinto que estou sendo esmagado pela vida.",
    "A escuridão dentro de mim está crescendo."
]

frases_normais = [
    "Hoje foi um dia incrível e cheio de conquistas.",
    "Eu adoro passar tempo com minha família e amigos.",
    "Estou muito animado para os planos do fim de semana.",
    "A vida é cheia de momentos felizes e gratificantes.",
    "O tatá é foda.",
    "Estou muito satisfeito com meu trabalho e minha carreira.",
    "Acordar cedo me faz sentir produtivo.",
    "Adoro aprender coisas novas todos os dias.",
    "O céu azul me traz paz e tranquilidade.",
    "Gosto de fazer exercícios e cuidar do meu corpo.",
    "A natureza me inspira profundamente.",
    "Estou grato por todas as bênçãos na minha vida.",
    "Rir com amigos é a melhor terapia.",
    "A música tem o poder de alegrar minha alma.",
    "Estou sempre em busca de novos desafios.",
    "A comida caseira é a melhor de todas.",
    "Viajar abre minha mente para novas culturas.",
    "Estou contente com as pequenas coisas da vida.",
    "Adoro ler um bom livro em um dia chuvoso.",
    "A generosidade das pessoas me toca profundamente.",
    "A criatividade é a chave para a inovação.",
    "Estou cheio de energia positiva hoje.",
    "O amor da minha família me dá forças.",
    "Estou confiante em minhas habilidades.",
    "A vida é uma jornada emocionante.",
    "Estou cercado por pessoas incríveis.",
    "Cada dia é uma nova oportunidade.",
    "Adoro ajudar os outros.",
    "A honestidade é um valor fundamental para mim.",
    "A felicidade está nas pequenas coisas.",
    "Estou sempre aprendendo e crescendo.",
    "A vida é um presente precioso.",
    "Sinto-me realizado com minhas conquistas.",
    "O pôr do sol é um espetáculo maravilhoso.",
    "Estou em paz comigo mesmo.",
    "A amizade verdadeira é um tesouro.",
    "Estou animado para ver o que o futuro me reserva.",
    "A bondade pode mudar o mundo.",
    "Estou em sintonia com a natureza.",
    "A beleza está nos olhos de quem vê.",
    "Estou focado em ser a melhor versão de mim mesmo.",
    "A gratidão transforma tudo em suficiente.",
    "Estou cercado de amor e carinho.",
    "A vida é cheia de surpresas boas.",
    "Estou comprometido com meu crescimento pessoal.",
    "A positividade atrai coisas boas.",
    "Estou inspirado a fazer a diferença.",
    "A fé me guia em tempos difíceis.",
    "Estou cheio de esperança para o amanhã."
]

# Função para classificar frases
def classify_phrases(phrases, pipeline):
    for phrase in phrases:
        processed_text = preprocess_text(phrase)
        classification = pipeline.predict([processed_text])[0]
        print(f"Frase: {phrase}")
        print(f"Classificação: {classification}")
        print()

# Classificar frases depressivas
print("Classificação de frases com sintomas depressivos:")
classify_phrases(frases_depressivas, best_pipeline)

# Classificar frases normais
print("Classificação de frases sem sintomas depressivos:")
classify_phrases(frases_normais, best_pipeline)


[nltk_data] Downloading package omw-1.4 to
[nltk_data]     C:\Users\lucas\AppData\Roaming\nltk_data...
[nltk_data]   Package omw-1.4 is already up-to-date!
[nltk_data] Downloading package punkt to
[nltk_data]     C:\Users\lucas\AppData\Roaming\nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package stopwords to
[nltk_data]     C:\Users\lucas\AppData\Roaming\nltk_data...
[nltk_data]   Package stopwords is already up-to-date!
[nltk_data] Downloading package wordnet to
[nltk_data]     C:\Users\lucas\AppData\Roaming\nltk_data...
[nltk_data]   Package wordnet is already up-to-date!


Melhores hiperparâmetros: {'clf__C': 1, 'tfidf__max_df': 0.8, 'tfidf__ngram_range': (1, 1)}
                             precision    recall  f1-score   support

Post  com Potencial Suicida       0.94      0.92      0.93       264
           Post Não Suicida       0.92      0.94      0.93       270

                   accuracy                           0.93       534
                  macro avg       0.93      0.93      0.93       534
               weighted avg       0.93      0.93      0.93       534

Classificação de frases com sintomas depressivos:
Frase: Sinto que minha vida não tem sentido.
Classificação: Post  com Potencial Suicida

Frase: Eu me sinto tão sozinho e triste o tempo todo.
Classificação: Post  com Potencial Suicida

Frase: Nada me traz alegria, estou sempre desanimado.
Classificação: Post  com Potencial Suicida

Frase: Não vejo uma saída para essa escuridão.
Classificação: Post  com Potencial Suicida

Frase: Não quero mais viver!
Classificação: Post  com Potencial S