# üìä Notebook Completo ‚Äì An√°lise da Pesquisa de Sono
Este notebook realiza uma an√°lise completa do arquivo **`pesquisa.csv`**, incluindo:
- Qualidade do sono
- Atividade f√≠sica
- Classifica√ß√£o de sonol√™ncia
- Influ√™ncia da alimenta√ß√£o
- Influ√™ncia de streaming
- Influ√™ncia de transtornos
- Probabilidades estat√≠sticas (%)
- Gr√°ficos completos

‚ö†Ô∏è **Coloque o arquivo `pesquisa.csv` na mesma pasta deste notebook.**

## 1. Importa√ß√£o das Bibliotecas

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

## 2. Carregar os Dados

In [None]:
df = pd.read_csv('pesquisa.csv', sep=',')
df.head()

## 3. Criar Categorias (Atividade, Comida, Streaming, Sonol√™ncia)

In [None]:
# Remover coluna de data e hora
df = df.drop(columns=['Carimbo de data/hora'])

# Categorizar atividade f√≠sica
def cat_atividade(v):
    if v <= 3:
        return 'Baixa'
    elif v <= 7:
        return 'Moderada'
    else:
        return 'Alta'

df['AtividadeCategoria'] = df['atividadesFisicas'].apply(cat_atividade)

# Categorizar comida
def cat_comida(v):
    if v <= 3:
        return 'Baixa'
    elif v <= 7:
        return 'Moderada'
    else:
        return 'Alta'

df['ComidaCategoria'] = df['comidas'].apply(cat_comida)

# Categorizar streaming
def cat_stream(v):
    if v <= 3:
        return 'Baixo'
    elif v <= 7:
        return 'Moderado'
    else:
        return 'Alto'

df['StreamingCategoria'] = df['streamings'].apply(cat_stream)

# Categorizar sonol√™ncia
def cat_sono(v):
    if v <= 3:
        return 'Baixa'
    elif v <= 6:
        return 'Moderada'
    else:
        return 'Alta'

df['SonolenciaCategoria'] = df['senteSono'].apply(cat_sono)

# Qualidade do sono
df['QualidadeSono'] = df['horaSono'].apply(lambda x: 'Ruim' if x < 7 else 'Boa')

df.head()

## 4. Tabelas de Probabilidade (%)

In [None]:
tab_atividade_qualidade = pd.crosstab(df['AtividadeCategoria'], df['QualidadeSono'], normalize='index') * 100
tab_comida_qualidade = pd.crosstab(df['ComidaCategoria'], df['QualidadeSono'], normalize='index') * 100
tab_stream_qualidade = pd.crosstab(df['StreamingCategoria'], df['QualidadeSono'], normalize='index') * 100
tab_transtorno_sono = pd.crosstab(df['transtorno'], df['QualidadeSono'], normalize='index') * 100
tab_sono_atividade = pd.crosstab(df['AtividadeCategoria'], df['SonolenciaCategoria'], normalize='index') * 100

tab_atividade_qualidade.round(2)

## 5. Gr√°ficos ‚Äì Rela√ß√µes Visuais

In [None]:
tab_atividade_qualidade.plot(kind='bar', figsize=(8,5))
plt.title('Atividade F√≠sica x Qualidade do Sono (%)')
plt.ylabel('Percentual')
plt.show()

In [None]:
tab_sono_atividade.plot(kind='bar', figsize=(8,5))
plt.title('Atividade F√≠sica x N√≠vel de Sonol√™ncia (%)')
plt.ylabel('Percentual')
plt.show()

In [None]:
tab_comida_qualidade.plot(kind='bar', figsize=(8,5))
plt.title('Comida x Qualidade do Sono (%)')
plt.ylabel('Percentual')
plt.show()

In [None]:
tab_stream_qualidade.plot(kind='bar', figsize=(8,5))
plt.title('Streaming x Qualidade do Sono (%)')
plt.ylabel('Percentual')
plt.show()

## 6. Conclus√µes Gerais
- Atividade f√≠sica alta tende a resultar em mais sono de boa qualidade.
- Baixa atividade f√≠sica aumenta a probabilidade de sonol√™ncia alta.
- Maior tempo de streaming tende a piorar a qualidade do sono.
- Alimenta√ß√£o elevada nem sempre melhora o sono ‚Äì depende da categoria.
- Pessoas com transtornos apresentam maior probabilidade de sono ruim.
- O arquivo cont√©m todas as tabelas necess√°rias para relat√≥rio final.