# Importando Bibliotecas
Importe as bibliotecas necessárias, incluindo NumPy, Pandas, Seaborn e Matplotlib.

In [None]:
# Importando bibliotecas
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

sns.set_theme()  # Define o tema para o seaborn
# %matplotlib inline  # Habilita a plotagem inline para notebooks Jupyter

# Carregando o DataFrame
Carregue o dataframe SINASC e exiba suas informações básicas.

In [None]:
# Carregando o DataFrame

# Carregar o dataframe SINASC
sinasc_raw = pd.read_csv('SINASC_RO_2019.csv')

# Exibir as primeiras linhas do dataframe
display(sinasc_raw.head())

# Exibir informações básicas do dataframe
sinasc_raw.info()

# Exibir estatísticas descritivas do dataframe
display(sinasc_raw.describe())

# Verificar valores nulos no dataframe
display(sinasc_raw.isnull().sum())

# Exibir a distribuição das variáveis categóricas
for column in sinasc_raw.select_dtypes(include=['object']).columns:
    display(sinasc_raw[column].value_counts())

# Análise Exploratória de Dados (EDA)
Realize uma análise exploratória de dados para entender melhor o conjunto de dados, incluindo a visualização de distribuições e correlações.

In [None]:
# Análise Exploratória de Dados (EDA)

# Visualizar a distribuição da idade das mães
plt.figure(figsize=(10, 6))
sns.histplot(sinasc_raw['IDADEMAE'], bins=30, kde=True)
plt.title('Distribuição da Idade das Mães')
plt.xlabel('Idade')
plt.ylabel('Frequência')
plt.show()

# Visualizar a distribuição do peso dos bebês
plt.figure(figsize=(10, 6))
sns.histplot(sinasc_raw['PESO'], bins=30, kde=True)
plt.title('Distribuição do Peso dos Bebês')
plt.xlabel('Peso (gramas)')
plt.ylabel('Frequência')
plt.show()

# Visualizar a correlação entre as variáveis numéricas
plt.figure(figsize=(12, 8))
sns.heatmap(sinasc_raw.corr(), annot=True, cmap='coolwarm', fmt='.2f')
plt.title('Mapa de Calor das Correlações')
plt.show()

# Visualizar a relação entre a idade da mãe e o peso do bebê
plt.figure(figsize=(10, 6))
sns.scatterplot(data=sinasc_raw, x='IDADEMAE', y='PESO')
plt.title('Relação entre a Idade da Mãe e o Peso do Bebê')
plt.xlabel('Idade da Mãe')
plt.ylabel('Peso do Bebê (gramas)')
plt.show()

# Visualizar a distribuição do APGAR1 e APGAR5
fig, axes = plt.subplots(1, 2, figsize=(18, 6))
sns.histplot(sinasc_raw['APGAR1'], bins=10, kde=True, ax=axes[0])
axes[0].set_title('Distribuição do APGAR1')
axes[0].set_xlabel('APGAR1')
axes[0].set_ylabel('Frequência')

sns.histplot(sinasc_raw['APGAR5'], bins=10, kde=True, ax=axes[1])
axes[1].set_title('Distribuição do APGAR5')
axes[1].set_xlabel('APGAR5')
axes[1].set_ylabel('Frequência')

plt.show()

# Visualizar a relação entre a escolaridade da mãe e a idade da mãe
plt.figure(figsize=(12, 6))
sns.boxplot(data=sinasc_raw, x='ESCMAE', y='IDADEMAE')
plt.title('Relação entre a Escolaridade da Mãe e a Idade da Mãe')
plt.xlabel('Escolaridade da Mãe')
plt.ylabel('Idade da Mãe')
plt.xticks(rotation=45)
plt.show()

# Visualizar a relação entre a escolaridade da mãe e o peso do bebê
plt.figure(figsize=(12, 6))
sns.boxplot(data=sinasc_raw, x='ESCMAE', y='PESO')
plt.title('Relação entre a Escolaridade da Mãe e o Peso do Bebê')
plt.xlabel('Escolaridade da Mãe')
plt.ylabel('Peso do Bebê (gramas)')
plt.xticks(rotation=45)
plt.show()

# Visualizar a relação entre a idade da mãe e o APGAR5
plt.figure(figsize=(10, 6))
sns.scatterplot(data=sinasc_raw, x='IDADEMAE', y='APGAR5')
plt.title('Relação entre a Idade da Mãe e o APGAR5')
plt.xlabel('Idade da Mãe')
plt.ylabel('APGAR5')
plt.show()