In [None]:
%pip install pandas matplotlib

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from func_analises import (
    maiores_ocorrencias_por_genero,
    grafico_entradas_por_hospital,
    segmentacao_por_entrada_em_hospitais,
)


In [None]:
diretorio_dados = "healthcare_dataset.csv"
df = pd.read_csv(diretorio_dados, encoding="utf-8", sep=",", decimal=".")

# Informações base do DataFrame

In [None]:
print("Primeiras cinco linhas da tabela:")
print(df.head())
print("\nUltimas cinco linhas da tabela:")
print(df.tail())
print("\nDescrição dos dados da tabela:")
print(df.describe())
print("\nInformação sobre as linhas e colunas das tabelas:")
print(df.info())

In [None]:
print(f"O dataframe contém {df.shape[0]} linhas e {df.shape[1]} colunas.")

In [None]:
# Verificando a quantidade de linhas vazias para cada coluna
df.isnull().sum()

In [None]:
# Verificando valores e quantidade de todas as colunas do DataFrame
colunas = df.columns.to_list()
for nome_coluna in colunas:
    print(f"{df[nome_coluna].value_counts()} \n\n")

# Tratamento/Conversão de dados

In [None]:
# Convertendo as colunas referente a datas de objetos para datas
df["Date of Admission"] = pd.to_datetime(df["Date of Admission"])
df["Discharge Date"] = pd.to_datetime(df["Discharge Date"])
df.info()

In [None]:
# Transformando os nomes em minúsculo e verficando
df["Name"] = df["Name"].str.lower()
df.head()

# Dataframes e gráficos

In [None]:
# Ocorrências de condição médica segmentado pelo sexo feminino
maiores_ocorrencias_feminina = maiores_ocorrencias_por_genero(df, "Female")
df_ocorrencias_feminina = maiores_ocorrencias_feminina.reset_index(name="Count")
df_ocorrencias_feminina

In [None]:
plt.bar(df_ocorrencias_feminina["Medical Condition"], df_ocorrencias_feminina["Count"])
plt.title(f"Condição médica por Gênero: Mulheres")
plt.xlabel("Doenças")
plt.ylabel("Num. de Ocorrências")
plt.show()

In [None]:
# Dataframe: Ocorrências de condição médica segmentado pelo sexo masculino
maiores_ocorrencias_masculina = maiores_ocorrencias_por_genero(df, "Male")
df_ocorrencias_masculina = maiores_ocorrencias_masculina.reset_index(name="Count")
df_ocorrencias_masculina

In [None]:
# Gráfico de barras: Ocorrências de condição médica segmentado pelo sexo masculino
plt.bar(
    df_ocorrencias_masculina["Medical Condition"], df_ocorrencias_masculina["Count"]
)
plt.title(f"Condição médica por Gênero: Homens")
plt.xlabel("Doenças")
plt.ylabel("Num. de Ocorrências")
plt.show()

In [None]:
# Dataframe: Entrada em hospitais do tipo "Urgent"
segmentacao_por_entrada_em_hospitais(df, pd, admissao="Urgent", numero_indicadores=5)

In [None]:
# Gráfico de pizza: Entrada em hospitais do tipo "Urgent"
grafico_entradas_por_hospital(df, admissao="Urgent", numero_indicadores=10)

In [None]:
# Dataframe: Entrada em hospitais do tipo "Emergency"
segmentacao_por_entrada_em_hospitais(df, pd, admissao="Emergency", numero_indicadores=5)

In [None]:
# Gráfico de pizza: Entrada em hospitais do tipo "Emergency"
grafico_entradas_por_hospital(df, admissao="Emergency", numero_indicadores=10)

In [None]:
# Dataframe: Entrada em hospitais do tipo "Elective"
segmentacao_por_entrada_em_hospitais(df, pd, admissao="Elective", numero_indicadores=5)

In [None]:
# Gráfico de pizza: Entrada em hospitais do tipo "Elective"
grafico_entradas_por_hospital(df, admissao="Elective", numero_indicadores=10)

In [None]:
# Dataframe: quantidade e medicação utilizada por tipo de entrada
contagem_medicacao_por_entrada = (
    df[["Medication", "Admission Type"]]
    .value_counts()
    .reset_index(name="Counts")
    .sort_values(
        by=["Medication", "Counts"], ascending=[True, False], ignore_index=True
    )
)
contagem_medicacao_por_entrada

In [None]:
# Gráfico: quantidade e medicação utilizada por tipo de entrada
medicacoes_utilizadas = set(contagem_medicacao_por_entrada["Medication"].tolist())
tipos_de_entradas = set(contagem_medicacao_por_entrada["Admission Type"].tolist())
tabela_agrupada = {
    entrada: {medicacao: 0 for medicacao in medicacoes_utilizadas}
    for entrada in tipos_de_entradas
}

for _, row in contagem_medicacao_por_entrada.iterrows():
    entrada = row["Admission Type"]
    medicacao = row["Medication"]
    contagem = row["Counts"]
    tabela_agrupada[entrada][medicacao] = contagem

dataframe = pd.DataFrame(tabela_agrupada)
dataframe.plot(kind="bar", stacked=True)
plt.title("Distribuição de Medicamentos por Tipo de Entrada")
plt.xlabel("Medicações", labelpad=15)
plt.subplots_adjust(top=1, bottom=0.3)
plt.xticks(rotation=360)
plt.legend(title="Medicações", loc="upper left", bbox_to_anchor=(1.05, 1))
plt.show()

In [None]:
# Dataframe: relação de cobrança acumulada por hospitais
maiores_cobrancas_acumuladas_por_hospitais = (
    df.groupby("Hospital")["Billing Amount"]
    .sum()
    .reset_index()
    .nlargest(10, "Billing Amount")
)
maiores_cobrancas_acumuladas_por_hospitais

In [None]:
# Gráfico: relação de cobrança acumulada por hospitais
plt.bar(
    maiores_cobrancas_acumuladas_por_hospitais["Hospital"],
    maiores_cobrancas_acumuladas_por_hospitais["Billing Amount"].astype(int),
)
plt.title(label="Maiores cobranças acumuladas por hospital")
plt.xlabel(xlabel="Hospitais")
plt.xticks(rotation=90)
plt.ticklabel_format(style="plain", axis="y")
plt.show()