## Importando e verificando dataset

In [None]:
# Importando bibliotecas
import pandas as pd
import numpy as np

print("Bibliotecas importadas com sucesso!")

In [None]:
# Carregando o dataset
df = pd.read_csv('pacientes.csv')

# Exibindo o head do dataset
df.head()

In [None]:
# Verificação geral do dataset
df.info()

In [None]:
# Contando valores faltantes em cada coluna
df.isnull().sum()

## Limpeza de dados do dataset
* Preencher valores faltantes de idade com o valor médio
* Preencher Escore Motor com valor da mediana

In [None]:
# Calculando média das idades e a mediana do escore
media_idade = df['idade'].mean()
mediana_escore = df['escore_motor_updrs'].median()

print(f"Média das idades: {media_idade:.2f}")
print(f"Mediana dos escores: {mediana_escore:.2f}")

In [None]:
# Preencher os valores faltantes
df['idade'].fillna(media_idade, inplace=True)
df['escore_motor_updrs'].fillna(mediana_escore, inplace=True)

# Verificar se ainda há valores nulos
df.isnull().sum()

## Criar coluna que separa pacientes por faixa etária

In [None]:
# Definindo etiquetas de faixa etária
bins = [0, 50, 70, float('inf')]
labels = ['Jovem', 'Adulto', 'Idoso']

# Criando nova coluna
df['faixa_etaria'] = pd.cut(df['idade'], bins=bins, labels=labels, right=False)

# Verificando coluna criada
df['faixa_etaria'].value_counts()

## Filtragem de dados

In [None]:
# Filtro para selecionar conjunto desejado
df_filtrado = df[(df['sexo'] == 'Feminino') & (df['tempo_diagnostico_meses'] > 24)]

# Vendo as primeiras linhas do resultado
df_filtrado.head()

## Gerar novo dataframe 

In [None]:
# Criando novo arquivo CSV
df_filtrado.to_csv('pacientes_filtrado.csv', index=False)

print("Arquivo salvo com sucesso!")