In [None]:
import pandas as pd
import seaborn as srn
import matplotlib.pyplot as plt
plt.style.use('ggplot')

In [None]:
arquivo_personal = pd.read_parquet('personal_data.parquet')
arquivo_experimental = pd.read_parquet('experimental_data.parquet')

df_ap = pd.read_parquet(arquivo_personal)
df_ae = pd.read_parquet(arquivo_experimental)

df_ae.head()

In [None]:
df_ap.head()

In [None]:
df_ae.info()
df_ae.isnull().sum()

In [None]:
df_ap.info()
df_ap.isnull().sum()

In [None]:
df_ap = df_ap.dropna()
df_ae = df_ae.dropna()

In [None]:
df_ae.head()

In [None]:
df_ap.head()

In [None]:
# quantos participaram da pesquisa?
num_pessoas = df_ap.shape[0]
print(f"Participaram da pesquisa:  {num_pessoas} indivíduos.")

In [None]:
# idade igual ou superior a 45

idade = 45
igual_ou_maior = df_ap[df_ap['Age'] >= idade]

resultado_idade = igual_ou_maior.shape[0]

print(f'O número de individuos com idade igual ou superior a {idade} é: {resultado_idade}')

In [None]:
# moda, média e mediana da idade dos individuos que não tem distúrbios do sono

df_merged = pd.merge(df_ap, df_ae, on = 'Person ID')

nao_disturbio = df_merged[df_merged['Sleep Disorder'] == 'N/A']

moda_idade = nao_disturbio['Age'].mode()[0]
media_idade = nao_disturbio['Age'].mean()
mediana_idade = nao_disturbio['Age'].median()


print(moda_idade)
print(media_idade)
print(mediana_idade)

In [None]:
# correlação entre qualidade de sono e nível de stress

correlacao = df_ae['Quality of Sleep'].corr(df_ae['Stress Level'])

print(f'Correlação entre qualidade do sono e nível de estresse: {correlacao:.3f}')
print(f'\nSabendo que o valor obtido foi de {correlacao:.3f}, podemos perceber que melhorar a qualidade do sono pode ser muito benéfico para reduzir o estresse.')

In [None]:
# gráfico da duração média do sono por idade

def horas_to_decimal(duracao):
        horas, minutos = map(int, duracao.split(':'))
        return horas + minutos / 60


df_merged ['Sleep Duration'] = df_merged['Sleep Duration'].apply(horas_to_decimal)
duracao_media_sono_por_idade = df_merged.groupby('Age')['Sleep Duration'].mean().reset_index()


plt.plot(duracao_media_sono_por_idade['Age'], duracao_media_sono_por_idade['Sleep Duration'], color = 'orange', label = 'Média')
plt.title('Duração média do sono por idade')
plt.xlabel('Idade')
plt.ylabel('Duração média do sono (horas)')


In [None]:
#  gráfico contendo a duração média do sono entre os diferentes tipo de distúrbio, fazendo a separação por gênero

dur_media_sono_por_disturbio_genero = df_merged.groupby(['Sleep Disorder', 'Gender'])['Sleep Duration'].mean().reset_index()

cores = ['#FF6347', '#4682B4']

plt.figure(figsize = (5, 7))
srn.barplot(data = dur_media_sono_por_disturbio_genero, x = 'Sleep Disorder', y = 'Sleep Duration', hue = 'Gender', palette = cores)
plt.title('Duração Média do Sono por Tipo de Distúrbio e Gênero')
plt.xlabel('Tipo de Distúrbio')
plt.ylabel('Duração Média do Sono (horas)')
plt.xticks(rotation = 45)
plt.legend(title = 'Gênero')
plt.show()

In [None]:
#  gráfico contendo a duração média do sono entre os diferentes tipo de distúrbio, fazendo a separação por profissão

dur_media_sono_por_profissao_genero = df_merged.groupby(['Sleep Disorder', 'Occupation'])['Sleep Duration'].mean().reset_index()

plt.figure(figsize = (15, 7))
srn.barplot(data=dur_media_sono_por_profissao_genero, x = 'Sleep Disorder', y = 'Sleep Duration', hue = 'Occupation', palette = 'viridis')
plt.title('Duração Média do Sono por Tipo de Distúrbio e Profissão')
plt.xlabel('Tipo de Distúrbio')
plt.ylabel('Duração Média do Sono (horas)')
plt.xticks(rotation = 30)
plt.legend(title ='Profissão')
plt.show()