### Estatísticas descritivas
O objetivo desse notebook é calcular certas estatísticas descritivas para o conjunto dos pacientes em geral e para os subconjuntos de pacientes com e sem obesidade. As estatísticas escolhidas foram média, mediana, moda e desvio padrão. Os cálculos foram feitos para o BMI (em kg/m2) e CK (CPK) (em IU/L) médios de cada paciente.

In [10]:
import pandas as pd
import numpy as np

df = pd.read_csv('../data/processed/bmi_norm.csv')

bmi = df.groupby(['subject_id'])['result_value'].mean().reset_index()

# Separando os dados em pacientes com obesidade (BMI >= 30) e sem obesidade
bmi_ob = bmi[bmi['result_value'] >= 30]
bmi_other = bmi[bmi['result_value'] < 30]

# Calculando a média, desvião padrão, mediana e moda 
av = bmi['result_value'].mean()
med = bmi['result_value'].median()
mode = bmi['result_value'].mode()[0]
std_dev = bmi['result_value'].std()
print(f"A média do BMI é: {av:.2f} kg/m2")
print(f"A mediana do BMI é: {med:.2f} kg/m2")
print(f"A moda do BMI é: {mode:.2f} kg/m2")
print(f"O desvio padrão do BMI é: {std_dev:.2f} kg/m2")
print()

# Calculando a média, desvião padrão, mediana e moda dos pacientes com obesidade
av_ob = bmi_ob['result_value'].mean()
med_ob = bmi_ob['result_value'].median()
mode_ob = bmi_ob['result_value'].mode()[0]
std_dev_ob = bmi_ob['result_value'].std()
print(f"A média do BMI de pacientes com obesidade é: {av_ob:.2f} kg/m2")
print(f"A mediana do BMI de pacientes com obesidade é: {med_ob:.2f} kg/m2")
print(f"A moda do BMI de pacientes com obesidade é: {mode_ob:.2f} kg/m2")
print(f"O desvio padrão do BMI de pacientes com obesidade é: {std_dev_ob:.2f} kg/m2")
print()

# Calculando a média, desvião padrão, mediana e moda dos pacientes sem obesidade
av_other = bmi_other['result_value'].mean()
med_other = bmi_other['result_value'].median()
mode_other = bmi_other['result_value'].mode()[0]
std_dev_other = bmi_other['result_value'].std()
print(f"A média do BMI de pacientes sem obesidade é: {av_other:.2f} kg/m2")
print(f"A mediana do BMI de pacientes sem obesidade é: {med_other:.2f} kg/m2")
print(f"A moda do BMI de pacientes sem obesidade é: {mode_other:.2f} kg/m2")
print(f"O desvio padrão do BMI de pacientes sem obesidade é: {std_dev_other:.2f} kg/m2")
print()

A média do BMI é: 28.51 kg/m2
A mediana do BMI é: 27.25 kg/m2
A moda do BMI é: 25.00 kg/m2
O desvio padrão do BMI é: 7.18 kg/m2

A média do BMI de pacientes com obesidade é: 36.22 kg/m2
A mediana do BMI de pacientes com obesidade é: 34.22 kg/m2
A moda do BMI de pacientes com obesidade é: 32.10 kg/m2
O desvio padrão do BMI de pacientes com obesidade é: 6.54 kg/m2

A média do BMI de pacientes sem obesidade é: 24.62 kg/m2
A mediana do BMI de pacientes sem obesidade é: 24.96 kg/m2
A moda do BMI de pacientes sem obesidade é: 25.00 kg/m2
O desvio padrão do BMI de pacientes sem obesidade é: 3.32 kg/m2



In [11]:
df = pd.read_csv('../data/processed/ck_norm.csv')

ck = df.groupby(['subject_id'])['valuenum'].mean().reset_index()

ck_ob = ck[ck['subject_id'].isin(bmi_ob['subject_id'])]
ck_other = ck[ck['subject_id'].isin(bmi_other['subject_id'])]
# Como há elementos em bmi_ob e bmi_other que não estão em ck_ob e ck_other, retiramos eles para a criaçao do gráfico
bmi_ob_redux = bmi_ob[bmi_ob['subject_id'].isin(ck_ob['subject_id'])]
bmi_other_redux = bmi_other[bmi_other['subject_id'].isin(ck_other['subject_id'])]

# Calculando a média, desvião padrão, mediana e moda 
av = ck['valuenum'].mean()
med = ck['valuenum'].median()
mode = ck['valuenum'].mode()[0]
std_dev = ck['valuenum'].std()
print(f"A média do CK (CPK) é: {av:.2f} IU/L")
print(f"A mediana do CK (CPK) é: {med:.2f} IU/L")
print(f"A moda do CK (CPK) é: {mode:.2f} IU/L")
print(f"O desvio padrão do CK (CPK) é: {std_dev:.2f} IU/L")
print()

# Calculando a média, desvião padrão, mediana e moda dos pacientes com obesidade
av_ob = ck_ob['valuenum'].mean()
med_ob = ck_ob['valuenum'].median()
mode_ob = ck_ob['valuenum'].mode()[0]
std_dev_ob = ck_ob['valuenum'].std()
print(f"A média do CK (CPK) de pacientes com obesidade é: {av_ob:.2f} IU/L")
print(f"A mediana do CK (CPK) de pacientes com obesidade é: {med_ob:.2f} IU/L")
print(f"A moda do CK (CPK) de pacientes com obesidade é: {mode_ob:.2f} IU/L")
print(f"O desvio padrão do CK (CPK) de pacientes com obesidade é: {std_dev_ob:.2f} IU/L")
print()

# Calculando a média, desvião padrão, mediana e moda dos pacientes sem obesidade
av_other = ck_other['valuenum'].mean()
med_other = ck_other['valuenum'].median()
mode_other = ck_other['valuenum'].mode()[0]
std_dev_other = ck_other['valuenum'].std()
print(f"A média do CK (CPK) de pacientes sem obesidade é: {av_other:.2f} IU/L")
print(f"A mediana do CK (CPK) de pacientes sem obesidade é: {med_other:.2f} IU/L")
print(f"A moda do CK (CPK) de pacientes sem obesidade é: {mode_other:.2f} IU/L")
print(f"O desvio padrão do CK (CPK) de pacientes sem obesidade é: {std_dev_other:.2f} IU/L")
print()

A média do CK (CPK) é: 574.45 IU/L
A mediana do CK (CPK) é: 155.00 IU/L
A moda do CK (CPK) é: 38.00 IU/L
O desvio padrão do CK (CPK) é: 1154.00 IU/L

A média do CK (CPK) de pacientes com obesidade é: 661.31 IU/L
A mediana do CK (CPK) de pacientes com obesidade é: 171.50 IU/L
A moda do CK (CPK) de pacientes com obesidade é: 30.00 IU/L
O desvio padrão do CK (CPK) de pacientes com obesidade é: 1292.40 IU/L

A média do CK (CPK) de pacientes sem obesidade é: 466.49 IU/L
A mediana do CK (CPK) de pacientes sem obesidade é: 131.00 IU/L
A moda do CK (CPK) de pacientes sem obesidade é: 41.00 IU/L
O desvio padrão do CK (CPK) de pacientes sem obesidade é: 986.92 IU/L

