# Projeto de Ciências de Dados

## **Impacto das Redes Sociais na Saúde Mental**

As redes sociais, apesar de oferecerem diversos benefícios, também podem apresentar efeitos negativos na saúde mental dos usuários. Estudos recentes indicam que o uso excessivo das redes sociais pode estar associado a diversos transtornos, como ansiedade, depressão, baixa autoestima, problemas de sono e até mesmo vício.

Este projeto se propõe a contribuir para a compreensão mais profunda dos efeitos do uso excessivo das redes sociais na saúde mental, fornecendo dados empíricos que possibilitem a criação de intervenções eficazes para prevenir e mitigar tais efeitos.

Os objetivos especificos do projeto são:
> Identificar os principais impactos do uso excessivo das redes sociais na saúde mental dos indivíduos;

> Investigar as variáveis que moderam a relação entre o uso das redes sociais e a saúde mental;

> Desenvolver um modelo preditivo para identificar indivíduos em risco de desenvolver problemas de saúde mental devido ao uso excessivo das redes sociais.



## Analise de Dados



### Parte 1 

> Importação dos dados

In [122]:

import pandas as pd

dados = pd.read_excel('D:\Cosmo\Documentos\Ciencia_dados\Questionário de Pesquisa_ Impacto das Redes Sociais na Saúde Mental.xlsx')



In [123]:
dados.head()

Unnamed: 0,Id,Hora de início,Hora de conclusão,Email,Nome,"Antes de iniciarmos, gostaríamos de confirmar se você consente em utilizar suas respostas para fins de pesquisa",Quantos anos você tem?,Qual é o seu sexo?,Quais são suas principais ocupações? (Marque todas as opções que se aplicam a você),Você usa redes sociais?,...,Com que frequência você busca validação nas redes sociais?,Com que frequência você se sente deprimido ou desanimado?,"Em uma escala de 1 a 5, com que frequência você experimenta mudanças no seu interesse pelas atividades diárias? Isso inclui trabalho, hobbies, exercícios, interações sociais e tarefas domésticas","Com base na pergunta anterior, marque qual das seguintes opções melhor descreve o modo como o seu interesse muda:","Em uma escala de 1 a 5, com que frequência você tem problemas para dormir?",Você já tentou reduzir o tempo que passa no celular?,"Se sim, o que te motivou a tentar reduzir o tempo que passa no celular?",Quais medidas você tomou para reduzir o tempo que passa no celular? (Marque todas que se aplicam),"Em relação às medidas que você mencionou na pergunta anterior, qual foi o seu nível de sucesso em reduzir o tempo que passa no celular?",Quais foram os principais desafios que você enfrentou ao tentar reduzir o tempo que passa no celular?
0,2,2024-03-27 20:32:50,2024-03-27 20:37:19,anonymous,,"Sim, eu consinto em utilizar minhas respostas ...",34,Feminino,Empregado com carteira assinada;Dedicação excl...,Sim,...,Sempre,Frequentemente,3,Prazer: O quanto você se diverte ou se sente g...,4,Não,,,,
1,3,2024-03-27 20:35:50,2024-03-27 20:39:17,anonymous,,"Sim, eu consinto em utilizar minhas respostas ...",33,Feminino,Empregado com carteira assinada;Freelancer;,Sim,...,Às vezes,Às vezes,4,Prazer: O quanto você se diverte ou se sente g...,5,Não,,,,
2,4,2024-03-27 20:40:57,2024-03-27 20:52:42,anonymous,,"Sim, eu consinto em utilizar minhas respostas ...",19,Masculino,Dedicação exclusiva à família;,Sim,...,Raramente,Raramente,2,Prazer: O quanto você se diverte ou se sente g...,3,Não,,,,
3,5,2024-03-27 20:46:25,2024-03-27 20:58:37,anonymous,,"Sim, eu consinto em utilizar minhas respostas ...",23,Masculino,Graduação;Empregado com carteira assinada;,Sim,...,Nunca,Raramente,2,Intensidade: O nível de entusiasmo ou motivaçã...,1,Sim,Motivos de produtividade,Desativar notificações;Limitar o tempo de uso;,Sucesso moderado,"O principal desafio, e foi o que fez eu desati..."
4,6,2024-03-27 21:02:30,2024-03-27 21:04:47,anônima,,"Sim, eu consinto em utilizar minhas respostas ...",21,Feminino,Graduação,Sim,...,Raramente,Às vezes,3,Duração: A quantidade de tempo que você conseg...,2,Não,,,,


### Parte 2

> Padronização dos Dados

In [124]:
dados.columns

Index(['Id', 'Hora de início', 'Hora de conclusão', 'Email', 'Nome',
       'Antes de iniciarmos, gostaríamos de confirmar se você consente em utilizar suas respostas para fins de pesquisa',
       'Quantos anos você tem?', 'Qual é o seu sexo?',
       'Quais são suas principais ocupações? (Marque todas as opções que se aplicam a você)',
       'Você usa redes sociais?',
       'Quais redes sociais você usa? (Marque todas que se aplicam)',
       'Quanto tempo você costuma passar nas redes sociais por dia?',
       'Com que frequência você usa as redes sociais sem um propósito específico?',
       'Com que frequência você se distrai com as redes sociais enquanto faz outras atividades?',
       'Você se sente ansioso se não usa as redes sociais por um tempo?',
       'Em uma escala de 1 a 5, quão fácil é para você se distrair?',
       'Em uma escala de 1 a 5, quanto você se preocupa com pensamentos negativos?',
       'Você acha difícil se concentrar nas suas atividades de trabalho/est

In [125]:
colunas = pd.Series(dados.columns)

colunas_resumidas = {
    'Id' : 'Id', 'Hora de início': 'Inicio', 'Hora de conclusão': 'Fim', 'Email': 'Email', 'Nome' : 'Nome',
       'Antes de iniciarmos, gostaríamos de confirmar se você consente em utilizar suas respostas para fins de pesquisa': 'Consentimento',
       'Quantos anos você tem?': 'Idade', 'Qual é o seu sexo?': 'Sexo',
       'Quais são suas principais ocupações? (Marque todas as opções que se aplicam a você)': 'Ocupações',
       'Você usa redes sociais?': 'UsaRedesSociais',
       'Quais redes sociais você usa? (Marque todas que se aplicam)': 'RedesSociais',
       'Quanto tempo você costuma passar nas redes sociais por dia?': 'TempoRedesSociais',
       'Com que frequência você usa as redes sociais sem um propósito específico?': 'FrequenciaUsoRedes',
       'Com que frequência você se distrai com as redes sociais enquanto faz outras atividades?': 'DistraçãoRedes',
       'Você se sente ansioso se não usa as redes sociais por um tempo?': 'AnsiedadeRedes',
       'Em uma escala de 1 a 5, quão fácil é para você se distrair?': 'FacilidadeDistração',
       'Em uma escala de 1 a 5, quanto você se preocupa com pensamentos negativos?': 'PreocupaçãoNegativa',
       'Você acha difícil se concentrar nas suas atividades de trabalho/estudo?': 'DificuldadeConcentração',
       'Quais tipos de contas você costuma seguir nas redes sociais? (Marque todas as que se aplicam)': 'ContasSeguidas',
       'Em uma escala de 1 a 5, com que frequência você se compara a outras pessoas de sucesso nas redes sociais?': 'ComparaçãoSucesso',
       'Como você geralmente se sente ao se comparar com outras pessoas nas redes sociais': 'SentimentoComparação' ,
       'Com que frequência você busca validação nas redes sociais?': 'BuscaValidação',
       'Com que frequência você se sente deprimido ou desanimado?': 'FrequenciaDepressão',
       'Em uma escala de 1 a 5, com que frequência você experimenta mudanças no seu interesse pelas atividades diárias?\xa0Isso inclui trabalho, hobbies, exercícios, interações sociais e tarefas domésticas': 'MudancaInteresse',
       'Com base na pergunta anterior,\xa0marque qual das seguintes opções melhor descreve o modo como o seu interesse muda:': 'DescriçãoMudançaInteresse',
       'Em uma escala de 1 a 5, com que frequência você tem problemas para dormir?': 'ProblemasSono',
       'Você já tentou reduzir o tempo que passa no celular?': 'TentativaReduçãoCelular',
       'Se sim, o que te motivou a tentar reduzir o tempo que passa no celular?': 'MotivaçãoRedução',
       'Quais medidas você tomou para reduzir o tempo que passa no celular?\xa0(Marque todas que se aplicam)': 'MedidasRedução',
       'Em relação às medidas que você mencionou na pergunta anterior, qual foi o seu nível de sucesso em reduzir o tempo que passa no celular?': 'SucessoRedução',
       'Quais foram os principais desafios que você enfrentou ao tentar reduzir o tempo que passa no celular?': 'DesafiosRedução'}


colunas = colunas.replace(colunas_resumidas)

dados.columns = colunas

In [126]:
dados.columns

Index(['Id', 'Inicio', 'Fim', 'Email', 'Nome', 'Consentimento', 'Idade',
       'Sexo', 'Ocupações', 'UsaRedesSociais', 'RedesSociais',
       'TempoRedesSociais', 'FrequenciaUsoRedes', 'DistraçãoRedes',
       'AnsiedadeRedes', 'FacilidadeDistração', 'PreocupaçãoNegativa',
       'DificuldadeConcentração', 'ContasSeguidas', 'ComparaçãoSucesso',
       'SentimentoComparação', 'BuscaValidação', 'FrequenciaDepressão',
       'MudancaInteresse', 'DescriçãoMudançaInteresse', 'ProblemasSono',
       'TentativaReduçãoCelular', 'MotivaçãoRedução', 'MedidasRedução',
       'SucessoRedução', 'DesafiosRedução'],
      dtype='object')

In [128]:
ocupacoes_dummies = dados['Ocupações'].str.get_dummies(sep=';')
ocupacoes_dummies.columns = ocupacoes_dummies.columns.str.strip().str.replace(' ', '_')

redes_sociais_dummies = dados['RedesSociais'].str.get_dummies(sep=';')
redes_sociais_dummies.columns = redes_sociais_dummies.columns.str.strip().str.replace(' ', '_')

contas_seguidas_dummies = dados['ContasSeguidas'].str.get_dummies(sep=';')
contas_seguidas_dummies.columns = contas_seguidas_dummies.columns.str.strip().str.replace(' ', '_')

medidas_reducao_dummies = dados['MedidasRedução'].str.get_dummies(sep=';')
medidas_reducao_dummies.columns = medidas_reducao_dummies.columns.str.strip().str.replace(' ', '_')


In [129]:
ocupacoes_dummies.head()


Unnamed: 0,Aposentada_recentemente,Bolsista,Dedicação_exclusiva_à_família,Doutorado,Empreendedor,Empregado_com_carteira_assinada,Estagiário,Estudante,Freelancer,Graduação,Mestrado,Pós-graduação,Voluntário
0,0,0,1,0,0,1,0,1,0,0,0,0,0
1,0,0,0,0,0,1,0,0,1,0,0,0,0
2,0,0,1,0,0,0,0,0,0,0,0,0,0
3,0,0,0,0,0,1,0,0,0,1,0,0,0
4,0,0,0,0,0,0,0,0,0,1,0,0,0


In [130]:
redes_sociais_dummies.head()

Unnamed: 0,Facebook,Instagram,Snapchat,TikTok,Twitter,WhatsApp,YouTube
0,1,1,0,1,0,1,0
1,1,1,0,1,0,1,1
2,1,1,0,0,0,1,1
3,1,1,0,0,0,1,1
4,0,1,0,1,0,1,0


In [131]:
contas_seguidas_dummies.head()

Unnamed: 0,Contas_de_celebridades_e_influenciadores,Contas_de_esportes,"Contas_de_hobbies_e_interesses_específicos_(música,_culinária,_viagens,_etc.)",Contas_de_humor_e_memes,Contas_de_marcas_e_empresas,Contas_de_notícias_e_política,Contas_pessoais_de_amigos_e_familiares,"Jogos,_séries,_filmes",sobre_trabalho
0,1,0,1,1,0,1,0,0,0
1,1,0,0,1,0,0,1,0,0
2,0,1,0,1,0,0,0,0,0
3,0,0,1,1,1,1,1,0,0
4,0,0,1,0,1,1,1,0,0


In [132]:
medidas_reducao_dummies.head()

Unnamed: 0,Buscar_ajuda_profissional,Desativar_notificações,Desinstalar_aplicativos,Limitar_o_tempo_de_uso,Usar_aplicativos_de_controle_de_tela
0,0,0,0,0,0
1,0,0,0,0,0
2,0,0,0,0,0
3,0,1,0,1,0
4,0,0,0,0,0


In [137]:
dados = pd.concat([dados, ocupacoes_dummies, redes_sociais_dummies, contas_seguidas_dummies, medidas_reducao_dummies], axis=1)

In [138]:
dados.head()

Unnamed: 0,Id,Inicio,Fim,Email,Nome,Consentimento,Idade,Sexo,Ocupações,UsaRedesSociais,...,Contas_de_marcas_e_empresas,Contas_de_notícias_e_política,Contas_pessoais_de_amigos_e_familiares,"Jogos,_séries,_filmes",sobre_trabalho,Buscar_ajuda_profissional,Desativar_notificações,Desinstalar_aplicativos,Limitar_o_tempo_de_uso,Usar_aplicativos_de_controle_de_tela
0,2,2024-03-27 20:32:50,2024-03-27 20:37:19,anonymous,,"Sim, eu consinto em utilizar minhas respostas ...",34,Feminino,Empregado com carteira assinada;Dedicação excl...,Sim,...,0,1,0,0,0,0,0,0,0,0
1,3,2024-03-27 20:35:50,2024-03-27 20:39:17,anonymous,,"Sim, eu consinto em utilizar minhas respostas ...",33,Feminino,Empregado com carteira assinada;Freelancer;,Sim,...,0,0,1,0,0,0,0,0,0,0
2,4,2024-03-27 20:40:57,2024-03-27 20:52:42,anonymous,,"Sim, eu consinto em utilizar minhas respostas ...",19,Masculino,Dedicação exclusiva à família;,Sim,...,0,0,0,0,0,0,0,0,0,0
3,5,2024-03-27 20:46:25,2024-03-27 20:58:37,anonymous,,"Sim, eu consinto em utilizar minhas respostas ...",23,Masculino,Graduação;Empregado com carteira assinada;,Sim,...,1,1,1,0,0,0,1,0,1,0
4,6,2024-03-27 21:02:30,2024-03-27 21:04:47,anônima,,"Sim, eu consinto em utilizar minhas respostas ...",21,Feminino,Graduação,Sim,...,1,1,1,0,0,0,0,0,0,0


In [139]:
colunas_remover = ['Ocupações', 'RedesSociais', 'ContasSeguidas', 'MedidasRedução']

dados = dados.drop(columns=colunas_remover)

In [140]:
dados.columns

Index(['Id', 'Inicio', 'Fim', 'Email', 'Nome', 'Consentimento', 'Idade',
       'Sexo', 'UsaRedesSociais', 'TempoRedesSociais',
       ...
       'Contas_de_marcas_e_empresas', 'Contas_de_notícias_e_política',
       'Contas_pessoais_de_amigos_e_familiares', 'Jogos,_séries,_filmes',
       'sobre_trabalho', 'Buscar_ajuda_profissional', 'Desativar_notificações',
       'Desinstalar_aplicativos', 'Limitar_o_tempo_de_uso',
       'Usar_aplicativos_de_controle_de_tela'],
      dtype='object', length=101)

## Separação de dados para Validação

Separar dados para validação antes de qualquer análise é crucial para garantir a confiabilidade e generalização de modelos. Essa prática previne problemas como sobreajuste e auxilia na detecção de vazamento de dados, promovendo análises mais precisas e resultados robustos

Dado a natureza do projeto, nosso objetivo é identificar valores ou padrões que justificam certos comportamentos ou respondem a perguntas, como por exemplo, alguém que passa muitas horas nas redes sociais tendem a ter níveis de ansiedade elevadas?

Por esse motivo, nossas variáveis Targets serão as colunas `AnsiedadeRedes`, `PreocupaçãoNegativa` e `FrequenciaDepressão`, tendo como principal feature `FrequenciaDepressão`.

In [141]:
dados.head()

Unnamed: 0,Id,Inicio,Fim,Email,Nome,Consentimento,Idade,Sexo,UsaRedesSociais,TempoRedesSociais,...,Contas_de_marcas_e_empresas,Contas_de_notícias_e_política,Contas_pessoais_de_amigos_e_familiares,"Jogos,_séries,_filmes",sobre_trabalho,Buscar_ajuda_profissional,Desativar_notificações,Desinstalar_aplicativos,Limitar_o_tempo_de_uso,Usar_aplicativos_de_controle_de_tela
0,2,2024-03-27 20:32:50,2024-03-27 20:37:19,anonymous,,"Sim, eu consinto em utilizar minhas respostas ...",34,Feminino,Sim,Mais de 5 horas,...,0,1,0,0,0,0,0,0,0,0
1,3,2024-03-27 20:35:50,2024-03-27 20:39:17,anonymous,,"Sim, eu consinto em utilizar minhas respostas ...",33,Feminino,Sim,Mais de 5 horas,...,0,0,1,0,0,0,0,0,0,0
2,4,2024-03-27 20:40:57,2024-03-27 20:52:42,anonymous,,"Sim, eu consinto em utilizar minhas respostas ...",19,Masculino,Sim,1-2 horas,...,0,0,0,0,0,0,0,0,0,0
3,5,2024-03-27 20:46:25,2024-03-27 20:58:37,anonymous,,"Sim, eu consinto em utilizar minhas respostas ...",23,Masculino,Sim,3-4 horas,...,1,1,1,0,0,0,1,0,1,0
4,6,2024-03-27 21:02:30,2024-03-27 21:04:47,anônima,,"Sim, eu consinto em utilizar minhas respostas ...",21,Feminino,Sim,Mais de 5 horas,...,1,1,1,0,0,0,0,0,0,0


In [146]:
from sklearn.model_selection import train_test_split

# Ansiedade, Preocupação e Depressão como variáveis alvo
targets = ["AnsiedadeRedes", "PreocupaçãoNegativa", "FrequenciaDepressão"]

# Separação 80/20 com random_state fixo
dados_featutes = dados.drop(targets, axis=1)  # Features
dados_targets= dados[targets]  # Target variables

dados_featutes_train, dados_featutes_test, dados_targets_train, dados_targets_test = train_test_split(dados_featutes, dados_targets, test_size=0.2, shuffle=True, random_state=42)



In [150]:
print(dados_featutes_train.shape)
print(dados_featutes_test.shape)
print(dados_targets_train.shape)
print(dados_targets_test.shape)

(28, 98)
(7, 98)
(28, 3)
(7, 3)


In [151]:
dados_featutes_train.head()

Unnamed: 0,Id,Inicio,Fim,Email,Nome,Consentimento,Idade,Sexo,UsaRedesSociais,TempoRedesSociais,...,Contas_de_marcas_e_empresas,Contas_de_notícias_e_política,Contas_pessoais_de_amigos_e_familiares,"Jogos,_séries,_filmes",sobre_trabalho,Buscar_ajuda_profissional,Desativar_notificações,Desinstalar_aplicativos,Limitar_o_tempo_de_uso,Usar_aplicativos_de_controle_de_tela
12,14,2024-03-27 23:44:19,2024-03-27 23:49:47,anônima,,"Sim, eu consinto em utilizar minhas respostas ...",23,Feminino,Sim,2-3 horas,...,0,1,1,0,0,0,1,1,1,1
8,10,2024-03-27 21:19:53,2024-03-27 21:23:07,anônima,,"Sim, eu consinto em utilizar minhas respostas ...",25,Masculino,Sim,3-4 horas,...,1,0,1,0,0,0,1,1,0,0
16,18,2024-03-28 08:51:22,2024-03-28 08:53:30,anônima,,"Sim, eu consinto em utilizar minhas respostas ...",27,Masculino,Sim,Mais de 5 horas,...,0,0,1,0,0,0,0,0,0,0
9,11,2024-03-27 22:11:51,2024-03-27 22:19:29,anônima,,"Sim, eu consinto em utilizar minhas respostas ...",17,Masculino,Sim,1-2 horas,...,0,0,1,0,0,0,0,0,1,0
33,35,2024-04-01 08:53:37,2024-04-01 08:58:46,anônima,,"Sim, eu consinto em utilizar minhas respostas ...",32,Feminino,Sim,4-5 horas,...,0,0,1,0,0,0,1,1,1,1


In [152]:
dados_targets_train.head()

Unnamed: 0,AnsiedadeRedes,PreocupaçãoNegativa,FrequenciaDepressão
12,Raramente,3,Às vezes
8,Às vezes,2,Raramente
16,Às vezes,3,Frequentemente
9,Nunca,5,Frequentemente
33,Às vezes,4,Às vezes


In [153]:
dados_featutes_train.info()

<class 'pandas.core.frame.DataFrame'>
Index: 28 entries, 12 to 28
Data columns (total 98 columns):
 #   Column                                                                         Non-Null Count  Dtype         
---  ------                                                                         --------------  -----         
 0   Id                                                                             28 non-null     int64         
 1   Inicio                                                                         28 non-null     datetime64[ns]
 2   Fim                                                                            28 non-null     datetime64[ns]
 3   Email                                                                          28 non-null     object        
 4   Nome                                                                           0 non-null      float64       
 5   Consentimento                                                                  28 non-null 

In [154]:
dados_targets_train.info()

<class 'pandas.core.frame.DataFrame'>
Index: 28 entries, 12 to 28
Data columns (total 3 columns):
 #   Column               Non-Null Count  Dtype 
---  ------               --------------  ----- 
 0   AnsiedadeRedes       28 non-null     object
 1   PreocupaçãoNegativa  28 non-null     int64 
 2   FrequenciaDepressão  28 non-null     object
dtypes: int64(1), object(2)
memory usage: 896.0+ bytes


In [155]:
dados_featutes_train.describe()

Unnamed: 0,Id,Inicio,Fim,Nome,Idade,FacilidadeDistração,ComparaçãoSucesso,MudancaInteresse,ProblemasSono,Aposentada_recentemente,...,Contas_de_marcas_e_empresas,Contas_de_notícias_e_política,Contas_pessoais_de_amigos_e_familiares,"Jogos,_séries,_filmes",sobre_trabalho,Buscar_ajuda_profissional,Desativar_notificações,Desinstalar_aplicativos,Limitar_o_tempo_de_uso,Usar_aplicativos_de_controle_de_tela
count,28.0,28,28,0.0,28.0,28.0,28.0,28.0,28.0,28.0,...,28.0,28.0,28.0,28.0,28.0,28.0,28.0,28.0,28.0,28.0
mean,18.0,2024-03-28 13:32:48.392857088,2024-03-28 13:41:58.214286080,,26.464286,3.357143,2.678571,2.928571,2.75,0.035714,...,0.321429,0.428571,0.892857,0.0,0.035714,0.035714,0.392857,0.321429,0.392857,0.107143
min,2.0,2024-03-27 20:32:50,2024-03-27 20:37:19,,16.0,1.0,1.0,1.0,1.0,0.0,...,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
25%,8.75,2024-03-27 21:02:22.750000128,2024-03-27 21:17:27.249999872,,19.75,2.0,1.75,2.0,2.0,0.0,...,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
50%,17.0,2024-03-28 08:22:15,2024-03-28 08:25:02,,25.0,3.5,2.5,3.0,3.0,0.0,...,0.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
75%,27.5,2024-03-28 16:53:48.750000128,2024-03-28 17:00:19,,29.25,4.25,4.0,3.25,3.0,0.0,...,1.0,1.0,1.0,0.0,0.0,0.0,1.0,1.0,1.0,0.0
max,36.0,2024-04-01 12:49:59,2024-04-01 13:00:53,,59.0,5.0,5.0,5.0,5.0,1.0,...,1.0,1.0,1.0,0.0,1.0,1.0,1.0,1.0,1.0,1.0
std,10.934146,,,,10.326098,1.339272,1.389206,1.086229,1.205696,0.188982,...,0.475595,0.503953,0.31497,0.0,0.188982,0.188982,0.497347,0.475595,0.497347,0.31497


In [157]:
dados_targets_train.describe()

Unnamed: 0,PreocupaçãoNegativa
count,28.0
mean,3.5
std,1.347151
min,1.0
25%,2.0
50%,4.0
75%,5.0
max,5.0
