Você é uma pesquisadora que está tentando entender melhor qual o impacto do estilo de vida de uma pessoa na sua qualidade de sono, por isso fez a coleta dos dados de sobre 373 pessoas, onde foram recolhidas 12 características para cada uma delas. Por competência a sua pesquisa foi bem controlada e você não tem dados faltosos na sua base. Chegou o momento de você fazer sua análise e responder algumas perguntas.

In [None]:
import pandas as pd

df = pd.read_csv('/content/saude_do_sono_estilo_vida.csv')

# Verificando se a DataFrame foi realmente importada corretamente
print(df.head(10))
df.info()

**1. Ao visualizar a base você percebeu que seria melhor alterar o nome de algumas colunas. Mude o ‘ID’ para ‘Identificador’, corrija o nome da coluna que indica a pressão sanguínea, mude a coluna ‘Ocupação’ para ‘Profissão’, a coluna ‘Categoria BMI’ está em parte em inglês, substitua para ‘Categoria IMC’**

In [None]:
df = df.rename(columns={'ID': 'Identificador'})
df = df.rename(columns={'Pressão sanguíneaaaa': 'Pressão sanguínea'})
df = df.rename(columns={'Ocupação': 'Profissão'})
df = df.rename(columns={'Categoria BMI': 'Categoria IMC'})

print(df.head(10))

**Qual é a média, a moda e a mediana de horas de sono para cada uma das profissões? [‘mean’, np.median, pd.Series.mode]**

In [None]:
profissão_sono = df.groupby('Profissão')['Duração do sono']

print('Média: ' + str(profissão_sono.mean()) + '\n')
print('Mediana: ' + str(profissão_sono.median()) + '\n')
print('Moda: Profissão')
for profissão, moda in profissão_sono.apply(lambda x: x.mode()).groupby(level=0):
    print(f"{profissão}: {list(moda.values)}")

**3. Das pessoas que atuam com engenharia de software qual a porcentagem de obesos?**

In [None]:
software_obeso = df[(df['Profissão'] == 'Eng. de Software')
                    & (df['Categoria IMC'] == 'Obesidade')]

total_software = df[df['Profissão'] == 'Eng. de Software']

porcentagem_obesos = (len(software_obeso) / len(total_software)) * 100 if len(total_software) > 0 else 0

print(f"Porcentagem de engenheiros de software obesos: {porcentagem_obesos:.2f}%")

**4. De acordo com os dados, advogar ou ser representante de vendas faz você dormir menos? (Use o método ‘isin’, considere a média)**

In [None]:
profissões_especificas = df[df['Profissão'].isin(
    ['Advogado(a)', 'Representante de Vendas'])]

verificacao = profissões_especificas['Duração do sono'].mean() < 8

if verificacao == True:
  print('Sim. De acordo com os dados, advogar ou ser representante de vendas realmente faz você dormir menos.')
else:
  print('Não. De acordo com os dados, advogar ou ser representante de vendas não faz você dormir menos.')

**5. Entre quem fez enfermagem e quem fez medicina, quem tem menos horas de sono? (Use o método ‘isin’, considere a média)**

In [None]:
medico = df[df['Profissão'].isin(['Médico(a)'])]
enfermeiro = df[df['Profissão'].isin(['Enfermeiro(a)'])]

medico_sono = medico['Duração do sono'].mean()
enfermeiro_sono = enfermeiro['Duração do sono'].mean()

if medico_sono > enfermeiro_sono:
    print('Os(As) Enfermeiros(as) têm menos horas de sono que os(as) médicos(as).')
elif medico_sono < enfermeiro_sono:
    print('Os(As) Médicos(as) têm menos horas de sono que os(as) enfermeiros(as).')

print('------------------------')

medias_sono = df[df['Profissão'].isin(['Médico(a)', 'Enfermeiro(a)'])] \
    .groupby('Profissão')['Duração do sono'].mean()

if medias_sono['Médico(a)'] < medias_sono['Enfermeiro(a)']:
    print('Os(As) Médicos(as) têm menos horas de sono que os(as) enfermeiros(as).')
else:
    print('Os(As) Enfermeiros(as) têm menos horas de sono que os(as) médicos(as).')

**6. Faça um subconjunto com as colunas Identificador, Gênero, Idade, Pressão sanguínea e Frequência cardíaca.**

In [None]:
subconjunto_colunas = df[['Identificador', 'Gênero', 'Idade', 'Pressão sanguínea', 'Frequência cardíaca']]

print(subconjunto_colunas)

**7. Descubra qual a profissão menos frequente no conjunto. (Use value_counts)**

In [None]:
frequencia = df['Profissão'].value_counts().idxmin()

print('A profissão menos frequente no conjunto é o(a) '+ str(frequencia) + '.')

**8. Quem tem maior pressão sanguínea média, homens ou mulheres? (Considere a média)**

In [None]:
def media_pressao(pressao):
    try:
        sistolica, diastolica = pressao.split('/')
        return (float(sistolica) + float(diastolica)) / 2
    except:
        return None

mulher = df[df['Gênero'].isin(['Mulher'])]
homem = df[df['Gênero'].isin(['Homem'])]

mulher.loc[:, 'Pressão sanguínea'] = mulher['Pressão sanguínea'].apply(media_pressao)
homem.loc[:, 'Pressão sanguínea'] = homem['Pressão sanguínea'].apply(media_pressao)

mulher_sangue = mulher['Pressão sanguínea'].mean()
print('A pressão sanguínea média das mulheres é: ' + str(mulher_sangue))
homem_sangue = homem['Pressão sanguínea'].mean()
print('A pressão sanguínea média dos homens é: ' + str(homem_sangue))

if mulher_sangue > homem_sangue:
    print('\nAs mulheres têm maior pressão sanguínea que os homens.')
elif mulher_sangue < homem_sangue:
    print('\nOs homens têm maior pressão sanguínea que as mulheres.')

**9. É predominante entre os participantes dormir 8 horas por dia (considere usar Moda como medida)?**

In [None]:
sono_geral = df['Duração do sono']

moda_geral = sono_geral.mode()

if moda_geral.iloc[0] < 8:
    print(f'Moda geral: {moda_geral.iloc[0]}. Logo, os participantes, predominantemente, dormem menos de 8 horas por dia.\n')
else:
    print(f'Moda geral: {moda_geral.iloc[0]}. Logo, os participantes, predominantemente, dormem 8 horas por dia (ou mais!).\n')

**10. Pessoas com frequências cardíacas acima de 70 dão mais passos que pessoas com frequência cardíaca menor ou igual a 70? (Use a média)**

In [None]:
freq_mais70 = df['Frequência cardíaca'] >= 70
freq_menos70 = df['Frequência cardíaca'] <= 70

freq_mais70_passo = df[freq_mais70]['Passos diários'].mean()
print(freq_mais70_passo)
freq_menos70_passo = df[freq_menos70]['Passos diários'].mean()
print(freq_menos70_passo)

if freq_mais70_passo > freq_menos70_passo:
    print('\nSim! Pessoas com frequências cardíacas acima de 70 dão mais passos que pessoas com frequência cardíaca menor ou igual a 70.')
elif freq_mais70_passo < freq_menos70_passo:
    print('\nNão. Pessoas com frequências cardíacas acima de 70 não dão mais passos que pessoas com frequência cardíaca menor ou igual a 70.')
else:
    print('\nPessoas com frequências cardíacas acima de 70 dão os mesmos passos que pessoas com frequência cardíaca menor ou igual a 70.')