Centro de Inovação em Inteligência Artificial para a Saúde da UFMG

**Curso de Qualidade de Dados em Saúde para IA**

**Prof. Juliano Gaspar** - Faculdade de Medicina da UFMG

Mais informações: https://ciia-saude.medicina.ufmg.br/

# **Visualização e formatação de gráficos**

In [None]:
# importar as bibliotecas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
from google.colab import files

import statistics  as sts
import scipy.stats as stats

# Abrir o arquivo

In [None]:
# Endereço do arquivo com a base de dados
arquivo = 'https://ftp.medicina.ufmg.br/cursosciia/qds/BD_PARTOS.xlsx'

# Ler o arquivo
dados = pd.read_excel(arquivo)
dados

# Histogramas

In [None]:
sns.histplot(data=dados, x='PESO_NASCER')

In [None]:
# Histograma - sem a linha de contorno
sns.histplot(data=dados, x='PESO_NASCER', linewidth=0)

In [None]:
# Histograma - com linha de densidade
sns.histplot(data=dados, x='PESO_NASCER', linewidth=0, kde=True)

In [None]:
# Histograma - só a linha de densidade
sns.histplot(data=dados, x='PESO_NASCER', linewidth=0, kde=True, fill=False)

In [None]:
# Histograma - com valor y separado por uma categoria
sns.histplot(data=dados, x='PESO_NASCER', hue='TIPO_PARTO', linewidth=0, kde=True)

In [None]:
# Histograma do peso ao nascer
graf1 = sns.histplot(dados.IG_OBSTETRA, binwidth=1)
graf1.set_title('Histograma da Idade Gestacional')

# Gráfico de histograma, mostrado como um mapa de calor
Aparentando uma distruição de intensidade

In [None]:
# Histograma mostrado como heatmap (mapa de calor)
# Ele é mostrado dessa forma, quando o histograma é criado e escolhido duas variáveis númericas (x e y)

sns.histplot(dados, x='IG_OBSTETRA', y='PESO_NASCER', bins=20, cbar=True)

In [None]:
#  para mudar a cor do mapa de calor (barra lateral)
sns.histplot(dados, x='IG_OBSTETRA', y='PESO_NASCER', bins=20, cbar=True, cmap="BuPu")

# Formatação de Rótulos e elementos gráficos

In [None]:
# Histograma do peso ao nascer
graf1 = sns.histplot(dados.IG_OBSTETRA, binwidth=1)
graf1.set_title('Histograma da Idade Gestacional')
graf1.set_xlabel('Idade Gestacional')
graf1.set_ylabel('Quantidade')

In [None]:
# Histograma da idade gestacional
graf1 = sns.histplot(dados.IG_OBSTETRA, bins=22, color='coral')

graf1.set_title('Histograma da Idade Gestacional')
graf1.set_xlabel('Semanas')
graf1.set_ylabel('Quantidade')

Cores: https://matplotlib.org/stable/gallery/color/named_colors.html

In [None]:
# Histograma da idade gestacional
graf1 = sns.histplot(dados.IG_PEDIATRA, bins=22, color='yellowgreen')

# Formatando o título
graf1.set_title('Histograma da Idade Gestacional', fontsize=14, fontweight='bold', color='green')

# Formatando os rótulos dos eixos
graf1.set_xlabel('Semanas', fontsize=14, fontweight='bold', color='steelblue')
graf1.set_ylabel('Quantidade', fontsize=14, fontweight='bold', color='steelblue')

In [None]:
# Histograma da idade gestacional
graf1 = sns.histplot(dados.IG_PEDIATRA, bins=22, color='yellowgreen')

# Formatando o título
graf1.set_title('Histograma da Idade Gestacional', fontsize=14, fontweight='bold', color='green')

# Formatando os rótulos dos eixos
graf1.set_xlabel('Semanas', fontsize=14, fontweight='bold', color='steelblue')
graf1.set_ylabel('Quantidade', fontsize=14, fontweight='bold', color='steelblue')

# Formatando os ticks (números dos eixos)
plt.xticks(fontsize=12, fontweight='bold', color='coral')
plt.yticks(fontsize=12, fontweight='bold', color='coral')

In [None]:
# Criando o gráfico
graf1 = sns.histplot(dados.IG_OBSTETRA, binwidth=1)

# Formatando os rótulos do eixos x e y
graf1.set_xlabel('Idade Gestacional', fontsize=12)
graf1.set_ylabel('Quantidade', fontsize=12)

# Incluindo uma linha no gráfico (axvline, axhline)
graf1.axvline(36, color='gold', linestyle='--', linewidth=1.5)

In [None]:
# Criando o gráfico
graf1 = sns.histplot(dados.IG_OBSTETRA, binwidth=1)

# Formatando os rótulos do eixos x e y
graf1.set_xlabel('Idade Gestacional', fontsize=12)
graf1.set_ylabel('Quantidade', fontsize=12)

# Incluindo uma linha no gráfico (axvline, axhline)
graf1.axvline(36, color='gold', linestyle='--', linewidth=1.5)

# Incluindo uma linha no gráfico (axvline, axhline)
graf1.axvline(30, color='red', linestyle='--', linewidth=1.5)

In [None]:
# Criando o gráfico
graf1 = sns.histplot(dados.IG_OBSTETRA, binwidth=1)

# Formatando os rótulos do eixos x e y
graf1.set_xlabel('Idade Gestacional', fontsize=12)
graf1.set_ylabel('Quantidade', fontsize=12)

# Incluindo uma linha no gráfico (axvline, axhline)
graf1.axvline(36, color='red', linestyle='--', linewidth=1.5)

# Incluindo um texto e uma seta no gráfico
graf1.annotate('36 semanas', color='red', xytext=(30, 300), fontsize=11, xy=(30, 300))

In [None]:
# Criando o gráfico
graf1 = sns.histplot(dados.IG_OBSTETRA, binwidth=1)

# Formatando os rótulos do eixos x e y
graf1.set_xlabel('Idade Gestacional', fontsize=12)
graf1.set_ylabel('Quantidade', fontsize=12)

# Incluindo uma linha no gráfico (axvline, axhline)
graf1.axvline(36, color='red', linestyle='--', linewidth=1.5)

# Incluindo um texto e uma seta no gráfico
graf1.annotate('36 semanas', color='red', xytext=(29, 300), fontsize=11, xy=(36, 295), arrowprops=dict(color='red',  shrink=0.1))

In [None]:
# Criando o gráfico
graf1 = sns.histplot(dados.IG_OBSTETRA, binwidth=1)

# Formatando os rótulos do eixos x e y
graf1.set_xlabel('Idade Gestacional', fontsize=12)
graf1.set_ylabel('Quantidade', fontsize=12)

# Incluindo uma faixa no gráfico (axhspan, axvspan)
plt.axvspan(36, 38, alpha=0.5, color='gold')

# Incluindo um texto e uma seta no gráfico
graf1.annotate('Termo-precoce', color='gray', xytext=(27, 300), fontsize=11, xy=(36, 295), arrowprops=dict(color='gray',  shrink=0.1))


# Gráfico de Pizza

In [None]:
dados.IG_TERMO.value_counts().plot.pie(autopct='%1.1f%%')

In [None]:
# Tabela resumo com a contagem das categorias
tabela = dados.IG_TERMO.value_counts()

# Definir conjunto de cores
cores = ['lightblue', 'pink', 'moccasin']

# Gráfico de setores, considerando o conjunto de cores definido
graf2 = tabela.plot.pie(autopct='%1.1f%%', colors = cores)

graf2.set_title('Taxas de prematuridade e termos')
graf2.set_ylabel('')

# Gráficos de Boxplot

In [None]:
# Boxplot simples
sns.boxplot(data=dados, y='PESO_NASCER')

In [None]:
# Boxplot agrupado
sns.boxplot(data=dados, y='PESO_NASCER', x='TIPO_PARTO', linewidth=1)

In [None]:
sns.boxplot(data=dados, y='PESO_NASCER', x='TIPO_PARTO', hue='IG_TERMO', linewidth=1)

In [None]:
# Criar uma variável contendo a ordem desejada
ordem = ['Prematuro', 'Termo-precoce', 'Termo']

# Boxplot agrupado e subdividido por categoria
graf1 = sns.boxplot(data=dados, y='PESO_NASCER', x='TIPO_PARTO', hue='IG_TERMO', hue_order=ordem, palette="Paired", linewidth=1)

# Formatar o título do gráfico
graf1.set_title('Boxplot do peso ao nascer agrupado')

# Formatar os rótulos dos eixos
graf1.set_xlabel("Tipo de Parto")
graf1.set_ylabel("Peso ao Nascer")

# Colocar a legenda ao lado do gráfico
graf1.legend(bbox_to_anchor=(1,1), title='Idade Gestacional')

# Gráficos de dispersão

In [None]:
# Gráfico de dispersão
sns.scatterplot(data=dados, x="IG_OBSTETRA", y="PESO_NASCER")

In [None]:
# Gráfico de dispersão
sns.scatterplot(data=dados, x="IG_OBSTETRA", y="PESO_NASCER", hue="ALTO_RISCO")

# Multiplos gráficos em uma figura

In [None]:
# Mostrar vários gráficos em uma única figura - Exemplo 2 gráficos em 1 figura
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))


#ajusta o layout
plt.tight_layout()

In [None]:
# Mostrar vários gráficos em uma única figura - Exemplo 2 gráficos em 1 figura
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))


#ajusta o layout
plt.tight_layout()

# para salvar/preparar a figura (depois baixar)
plt.savefig('Figura1.png', format='png', dpi=300)

In [None]:
# Mostrar vários gráficos em uma única figura - Exemplo 2 gráficos em 1 figura
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))

# histograma
sns.histplot(dados.PESO_NASCER, linewidth=0, ax=ax1)

# Boxplot
sns.boxplot(data=dados, y='PESO_NASCER', x='TIPO_PARTO', linewidth=1, ax=ax2)

#ajusta o layout
plt.tight_layout()

# para salvar/preparar a figura (depois baixar)
nome_arquivo = 'Roteiro_QDS05_atividade8.jpg'
plt.savefig(nome_arquivo, format='jpg', dpi=300)
files.download(nome_arquivo)

Saiba mais: https://matplotlib.org/stable/gallery/subplots_axes_and_figures/index.html