# Notebook Completo – Análise da Pesquisa de Sono
Este notebook realiza uma análise completa do arquivo **`pesquisa.csv`**, incluindo:
- Qualidade do sono
- Atividade física
- Classificação de sonolência
- Influência da alimentação
- Influência de streaming
- Influência de transtornos
- Probabilidades estatísticas (%)
- Gráficos completos



## 1. Importação das Bibliotecas

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

## 2. Carregar os Dados

In [None]:
df = pd.read_csv('pesquisa.csv', sep=',')
df.head()

## 3. Criar Categorias (Atividade, Comida, Streaming, Sonolência)

In [None]:
# Remover coluna de data e hora
df = df.drop(columns=['Carimbo de data/hora'])

# Categorizar atividade física
def cat_atividade(v):
    if v <= 3:
        return 'Baixa'
    elif v <= 7:
        return 'Moderada'
    else:
        return 'Alta'

df['AtividadeCategoria'] = df['atividadesFisicas'].apply(cat_atividade)

# Categorizar comida
def cat_comida(v):
    if v <= 3:
        return 'Baixa'
    elif v <= 7:
        return 'Moderada'
    else:
        return 'Alta'

df['ComidaCategoria'] = df['comidas'].apply(cat_comida)

# Categorizar streaming
def cat_stream(v):
    if v <= 3:
        return 'Baixo'
    elif v <= 7:
        return 'Moderado'
    else:
        return 'Alto'

df['StreamingCategoria'] = df['streamings'].apply(cat_stream)

# Categorizar sonolência
def cat_sono(v):
    if v <= 3:
        return 'Baixa'
    elif v <= 6:
        return 'Moderada'
    else:
        return 'Alta'

df['SonolenciaCategoria'] = df['senteSono'].apply(cat_sono)

# Qualidade do sono
df['QualidadeSono'] = df['horaSono'].apply(lambda x: 'Ruim' if x < 7 else 'Boa')

df.head()

## 4. Tabelas de Probabilidade (%)

In [None]:
tab_atividade_qualidade = pd.crosstab(df['AtividadeCategoria'], df['QualidadeSono'], normalize='index') * 100
tab_comida_qualidade = pd.crosstab(df['ComidaCategoria'], df['QualidadeSono'], normalize='index') * 100
tab_stream_qualidade = pd.crosstab(df['StreamingCategoria'], df['QualidadeSono'], normalize='index') * 100
tab_transtorno_sono = pd.crosstab(df['transtorno'], df['QualidadeSono'], normalize='index') * 100
tab_sono_atividade = pd.crosstab(df['AtividadeCategoria'], df['SonolenciaCategoria'], normalize='index') * 100

tab_atividade_qualidade.round(2)