<h1>Análise de Dados Sobre as Causas de Morte no Brasil</h1>

Este notebook, realiza uma análise abrangente das causas de mortes ocorridas no Brasil durante um período de dez anos, de 2011 a 2021. O objetivo desta análise é investigar as causas subjacentes das mortes no país, identificar tendências e variações ao longo do tempo e fornecer insights sobre a distribuição de óbitos por diferentes segmentos.
Para isso são utilizados diferentes tipos de ilustrações gráficas, como gráfico de linhas, gráfico de barras, gráfico de pizza e também mapa de calor.

<h2>Importação das bibliotecas</h2>

In [None]:
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt
import seaborn as sns
import folium as folium
from branca.colormap import linear
import json
import os

<h2>Visualização da base de dados</h2>

In [None]:
for dirname, _, filenames in os.walk('/kaggle/input'):
    for filename in filenames:
        print(os.path.join(dirname, filename))

<h2>Tratamento Inicial das tabelas</h2

<b>Substituição de valores representados por "-" para 0</b>, para padronizar a representação de dados ausentes.<br>
Tal tratamento é feito na sessão 4, em que todos os dataframes são lidos em um loop e os valores são alterados de uma só vez. <br><br>
<b>Remoção de Linhas e Colunas</b> que não contribuem com a análise e podem distorcer os resultados.<br>
Tal tratamento é feito abaixo e na sessão 4, em que o dataframe de todos os anos é lido em um loop e a remoção é feita de uma só vez
                                                                                                                                      
                                                                                                                                      

In [None]:
df_nasc = pd.read_csv('/kaggle/input/analisetcc/nascimento 2011-2021.csv')
df_nasc = df_nasc.drop(11)

df_obitos = pd.read_csv('/kaggle/input/analisetcc/obitos_anos.csv')
df_obitos = df_obitos.drop('Total', axis=1)

df_dist_2021 = pd.read_csv('/kaggle/input/analisetcc/casos geral - 2021.csv')
df_dist_2021 = df_dist_2021.drop(228)
df_dist_2021 = df_dist_2021.drop('Total', axis=1)

<h2>Definição do JSON para mapeamento das regiões do Brasil</h2>

In [None]:
regioes_geoJSON = json.load(open('/kaggle/input/analisetcc/regioes1.json'))

<h2>1 - Panorama Geral de Mortes no Brasil</h2>

Nesta seção é apresentado a evolução do número de óbitos e um comparativo do número de óbitos com o número de nascimentos no Brasil. <br>
Além disso, apresenta a taxa de mortalidade de todas as regiões do país (Norte, Nordeste, Suldeste, Sul e Centro-oeste) dentre os anos de 2011 a 2021.

In [None]:
def obter_total_por_ano(ano):
    # Carrega o arquivo CSV correspondente ao ano
    nome_arquivo = f'/kaggle/input/analisetcc/distribuio de mortes por regio - {ano}.csv'
    df = pd.read_csv(nome_arquivo)
    # Filtra a linha correspondente ao 'Total'
    total = df[df['Região'] == 'Total'].values[0]
    return total

anos = list(range(2011, 2022)) 

# Dicionário para armazenar os totais de cada ano
totais_por_ano = {}

# Obter o total para cada ano
for ano in anos:
    total_ano = obter_total_por_ano(ano)
    totais_por_ano[ano] = total_ano

totais_por_ano = [1170498, 1181166, 1210474, 1227039, 1264175, 1309774, 1312663, 1316719, 1349801, 1556824, 1832649]   # Substitua com os totais correspondentes

# Criar o gráfico de linha
plt.figure(figsize=(13, 7))
plt.plot(anos, totais_por_ano, marker='o', linestyle='-')

# Adicionar rótulos e título
plt.xlabel('Ano')
plt.ylabel('Total de Óbitos')
plt.title('Evolução do Total de Óbitos ao Longo dos Anos')

# Adicionar anotações aos pontos no gráfico
for i in range(len(anos)):
    plt.annotate(f'{totais_por_ano[i]:,}', (anos[i], totais_por_ano[i]), textcoords="offset points", xytext=(0,10), ha='center')

# Exibir o gráfico
plt.grid(True)
plt.show()


<p> <b> O gráfico acima ilustra a evolução de óbitos no Brasil de 2011 a 2021.</b> É possível observar que durante o período analisado houve um constante crescimento no número de óbitos. O total de óbitos aumentou de 1.170.498 em 2011 para 1.182.649 em 2021, um aumento de aproximadamente 56,5%. </p>
<p> A partir do ano de 2020, é notável um aumento expressivo e a aceleração do crescimento de óbitos em relação aos anos anteriores, sendo um aumento de cerca de 31,6% em apenas 1 ano. Isso se dá pelo início e permanência da pandemia causada pelo novo Coronavírus. Em 11 de março de 2020, a Organização Mundial da Saúde (OMS), declarou oficialmente estado de pandemia pela COVID-19, doença causada pelo Coronavírus (OMS, 2021). </p>    
<p> O crescimento do número de óbitos nos anos anteriores a 2020, foi ocorrido por diferentes fatores. Um deles, é o crescimento populacional. A figura 16, relaciona a evolução do número de óbitos com o número de nascimentos anuais.</p>



In [None]:
nascimentos = df_nasc['Total'].tolist()

nascimentos_formatados = [f'{num:,}'.replace(',', '.') for num in nascimentos]
    
plt.figure(figsize=(12, 8))
plt.plot(anos, totais_por_ano, marker='o', linestyle='-', label='Óbitos')
plt.plot(anos, nascimentos, marker='o', linestyle='-', label='Nascimentos')

# Adicionar rótulos e título
plt.xlabel('Ano')
plt.ylabel('Total de Óbitos / Nascimentos')
plt.title('Evolução do Total de Óbitos e Nascimentos ao Longo dos Anos')

# Adicionar anotações aos pontos no gráfico para a linha de óbitos
for i in range(len(anos)):
     plt.annotate(f'{totais_por_ano[i]:,}'.format(totais_por_ano[i]).replace(',','.'), (anos[i], totais_por_ano[i]), textcoords="offset points", xytext=(0, 10), ha='center')

# Adicionar anotações aos pontos no gráfico para a linha de nascimentos
for i in range(len(anos)):
    plt.annotate(f'{nascimentos[i]:,}'.format(nascimentos[i]).replace(',','.'), (anos[i], nascimentos[i]), textcoords="offset points", xytext=(0, 10), ha='center')

# Adicionar legenda
plt.legend()

# Exibir o gráfico
plt.grid(True)
plt.show()


<b> Pensanso nisso, foi elaborado um comparativo entre o número de óbitos e o número de nascimentos. </b>
<p> O número de nascimentos anuais no Brasil são maiores em comparação às mortes anuais, como ilustra a figura acima. No entanto, contrapondo os dados de óbitos, o número de nascimentos apresentou uma tendência decrescente. Em 2011, foram registrados 2.913.160 nascimentos, enquanto em 2021 esse número caiu para 2.677.101, uma redução de aproximadamente 8% no mesmo período. </p>
<p> Nesse caso, vale ressaltar, que a implicação da pandemia ocasionou um grande número de óbitos que podem ter refletido nos nascimentos. 2021 foi o ano que apresentou o menor número de nascimentos, uma queda de 1,6% em comparação ao ano de 2020. Segundo um artigo publicado pela OMS, a redução de registros de nascimentos pode estar associada à queda de natalidade e fecundidade no Brasil. Outra hipótese aponta que a pandemia tenha gerado insegurança entre os casais, fazendo com que a decisão pela gravidez tenha sido adiada (OMS, 2023). </p>


In [None]:
df_populacao = pd.read_csv('/kaggle/input/analisetcc/populacao_regioes.csv')

taxa_de_mortalidade_df = df_obitos.copy()

# Calcule a taxa de mortalidade para cada ano
for ano in range(2011, 2022):
    taxa_de_mortalidade_df[str(ano)] = (df_obitos[str(ano)] / df_populacao[str(ano)]) * 100000

# Exiba o novo DataFrame
taxa_de_mortalidade_df = taxa_de_mortalidade_df.drop(5)
taxa_de_mortalidade_df = taxa_de_mortalidade_df.round(1)
taxa_grafico = taxa_de_mortalidade_df.set_index('Região').T

# Plote as barras para cada região
ax = taxa_grafico.plot(kind='bar', 
                      rot=0, 
                      title='Taxa de Mortalidade por Região (2011-2021)', 
                      figsize=(25, 8),
                      xlabel='Ano',
                      ylabel='Taxa de Mortalidade por 100,000 habitantes',width=0.9)

# Adicione os valores acima das barras
for p in ax.patches:
    ax.annotate(str(p.get_height()), (p.get_x() + p.get_width() / 2., p.get_height()),
                ha='center', va='bottom',xytext=(0, 5), textcoords='offset points')

plt.show()

In [None]:
df_populacao = pd.read_csv('/kaggle/input/analisetcc/populacao_regioes.csv')

taxa_de_mortalidade_df = df_obitos.copy()

# Calcule a taxa de mortalidade para cada ano
for ano in range(2011, 2022):
    taxa_de_mortalidade_df[str(ano)] = (df_obitos[str(ano)] / df_populacao[str(ano)]) * 100000

# Exiba o novo DataFrame
taxa_de_mortalidade_df = taxa_de_mortalidade_df.drop(5)
taxa_grafico = taxa_de_mortalidade_df.set_index('Região').T

plt.figure(figsize=(15, 7))
plt.title('Taxa de Mortalidade por Região (2011-2021)')
plt.xlabel('Ano')
plt.ylabel('Taxa de Mortalidade por 100,000 habitantes')

# Plote as linhas para cada região
for regiao in taxa_de_mortalidade_df['Região']:
    plt.plot(taxa_de_mortalidade_df.columns[1:], taxa_de_mortalidade_df[taxa_de_mortalidade_df['Região'] == regiao].values[0][1:], label=regiao)


plt.legend()
plt.grid(True)

# Exiba o gráfico
plt.show()

<b>Para compreender como as mortes são distribuídas entre as regiões do Brasil de forma mais equitativa</b>, foi realizado o cálculo da taxa de mortalidade para cada região ao longo dos anos. A seguinte fórmula foi utilizada para o cálculo:

<b>Taxa de Mortalidade = (Número de Mortes na Região / População da Região) * 100.000</b>

<p> A região que apresenta a maior taxa de mortalidade é a região Sudeste, que apresenta flutuações no resultado da taxa de mortalidade ao longo dos anos, como ilustra o gráfico acima.
<p> A região Sul se aproxima dos valores da região Sudeste e ao longo dos anos apresentou pequenas flutuações </p> 
<p> Em seguida, a região Nordeste apresenta certa estabilidade entre os anos de 2011 a 2014, quando os valores passam a crescer a cada ano. A região Centro-oeste apresenta poucas variações ao longo dos anos. 


<h2>2 - Principais Casos de Morte no Brasil</h2>

Nesta seção é apresentado as 10 principais causas de morte no Brasil, do ano de 2011 ao ano de 2021, abordando as evolução dessas causas e sua prevalência em cada ano.

In [None]:
# Lista de anos de 2011 a 2021
anos = list(range(2011, 2022))

# Dicionário para armazenar a contagem total de casos para cada causa
total_casos_por_causa = {}

# Iterar sobre os anos
for ano in anos:
    # Carregar os dados para o ano específico
    arquivo_csv = f"/kaggle/input/analisetcc/casos geral - {ano}.csv"
    try:
        df_ano = pd.read_csv(arquivo_csv)
    except FileNotFoundError:
        print(f"Arquivo não encontrado para o ano {ano}.")
        continue

    # Excluir a causa "Total" e ordenar as causas de morte com base no total de casos em ordem decrescente
    df_ano = df_ano[df_ano["Grupo CID-10"] != "Total"]
    top_10_causas = df_ano.sort_values(by="Total", ascending=False).head(9)

    # Atualizar o total de casos para cada causa
    for _, row in top_10_causas.iterrows():
        causa = row["Grupo CID-10"]
        # Consolidar "Neoplasias malignas" se a causa contiver essa expressão
        if "neoplasias malignas" in causa.lower():
            causa = "Neoplasias malignas"
        casos = row["Total"]
        total_casos_por_causa[causa] = total_casos_por_causa.get(causa, 0) + casos
        
total_casos_por_causa_ordenado = dict(sorted(total_casos_por_causa.items(), key=lambda item: item[1], reverse=True))


# Preparar os dados para o gráfico de barras
categorias = list(total_casos_por_causa_ordenado.keys())
total_casos = [total_casos_por_causa_ordenado[causa] for causa in categorias]

# Criar o gráfico de barras
plt.figure(figsize=(12, 8))
plt.bar(categorias, total_casos, color='skyblue')

# Adicionar rótulos e título
plt.xlabel("Causa")
plt.ylabel("Número Total de Casos")
plt.title("Número Total de Casos das 10 Principais Causas de Morte (2011-2021)")

# Rotacionar os rótulos do eixo x para melhor visualização
plt.xticks(rotation=45, ha="right")
plt.tight_layout()

# Exibir o gráfico
plt.show()


Os dados apresentados no gráfico acima, oferecem uma visão clara das 10 principais causas de morte no Brasil, de acordo com o Grupo CID-10, durante o período de 2011-2021.<br>
Com um total de 4.989.335 óbitos ao longo de uma década, neoplasias malignas, popularmente conhecidas como câncer, é a principal causa de morte no Brasil. 
A segunda principal causa, doenças isquêmicas do coração, e a terceira, doenças cerebrovasculares.



In [None]:
# Função para calcular os casos de uma causa específica para cada ano
def calcular_casos_por_ano(causa, anos):
    casos_por_ano = []
    for ano in anos:
        arquivo_csv = f"/kaggle/input/analisetcc/casos geral - {ano}.csv"
        try:
            df_ano = pd.read_csv(arquivo_csv)
        except FileNotFoundError:
            print(f"Arquivo não encontrado para o ano {ano}.")
            casos_por_ano.append(0)
            continue

        if "neoplasias malignas" in causa.lower():
            df_causa = df_ano[df_ano["Grupo CID-10"].str.lower().str.contains("neoplasias malignas", na=False)]
        else:
            df_causa = df_ano[df_ano["Grupo CID-10"] == causa]

        casos = df_causa["Total"].sum() if not df_causa.empty else 0
        casos_por_ano.append(casos)

    return casos_por_ano

# Lista de anos de 2011 a 2021
anos = list(range(2011, 2022))

# Causas a serem analisadas
causas = [
    "Neoplasias malignas",
    "Doenças isquêmicas do coração",
    "Doenças cerebrovasculares",
    "Acidentes",
    "Causas mal definidas e desconhecidas mortalidade",
    "Influenza [gripe] e pneumonia",
    "Outras formas de doença do coração",
    "Diabetes mellitus",
    "Agressões",
    "Outras doenças por vírus"
]

plt.figure(figsize=(13, 7))

for causa in causas:
    casos_por_ano = calcular_casos_por_ano(causa, anos)
    plt.fill_between(anos, casos_por_ano, alpha=0.5, label=causa)

# Adicionar rótulos e título
plt.xlabel("Ano")
plt.ylabel("Número de Casos")
plt.title("Evolução de Causas (2011-2021)")
plt.legend(loc='upper left', bbox_to_anchor=(1, 1))
plt.grid(True)

# Exibir o gráfico
plt.show()

O gráfico acima revela a evolução das principais causas de morte ao longo dos anos. É notável que o número de óbitos por neoplasias malignas (câncer) tenha mantido um crescimento constante, aumentando cerca de 29,94% de 2011 a 2021. Doenças isquêmicas do coração também apresentaram um aumento constante, com um crescimento de aproximadamente 11,77% ao longo da década.


In [None]:
# Função para calcular os casos de uma causa específica para cada ano
def calcular_casos_por_ano(causa):
    casos_por_ano = []
    for ano in range(2011, 2022):
        # Carregar os dados para o ano específico
        arquivo_csv = f"/kaggle/input/analisetcc/casos geral - {ano}.csv"
        try:
            df_ano = pd.read_csv(arquivo_csv)
        except FileNotFoundError:
            print(f"Arquivo não encontrado para o ano {ano}.")
            casos_por_ano.append(0)
            continue

        # Filtrar a causa específica
        if "neoplasias malignas" in causa.lower():
            df_causa = df_ano[df_ano["Grupo CID-10"].str.lower().str.contains("neoplasias malignas", na=False)]
        else:
            df_causa = df_ano[df_ano["Grupo CID-10"] == causa]

        casos = df_causa["Total"].sum() if not df_causa.empty else 0
        casos_por_ano.append(casos)
    
    return casos_por_ano

# Lista de anos de 2011 a 2021
anos = list(range(2011, 2022))

# Causas a serem analisadas
causas = [
    "Neoplasias malignas",
    "Doenças isquêmicas do coração",
    "Doenças cerebrovasculares",
    "Acidentes",
    "Causas mal definidas e desconhecidas mortalidade",
    "Influenza [gripe] e pneumonia",
    "Outras formas de doença do coração",
    "Diabetes mellitus",
    "Agressões",
    "Outras doenças por vírus"
]

# Criar um gráfico individual para cada causa
for causa in causas:
    casos_por_ano = calcular_casos_por_ano(causa)

    plt.figure(figsize=(12, 6))
    plt.plot(anos, casos_por_ano, label=causa)
    
    # Adicionar rótulos e título
    plt.xlabel("Ano")
    plt.ylabel("Número de Casos")
    plt.title(f"Evolução de {causa} (2011-2021)")
    plt.legend()
    plt.grid(True)

    # Exibir o gráfico
    plt.show()

In [None]:
# Função para criar um gráfico de pizza para um ano específico
def criar_grafico_pizza(ano):
    casos_por_ano = [calcular_casos_por_ano(causa)[ano - 2011] for causa in causas]
    valores = [calcular_casos_por_ano(causa)[ano - 2011] for causa in causas]
    
    total = sum(valores)
    porcentagens = [(valor / total) * 100 for valor in valores]
    
    # Criar o gráfico de pizza
    plt.figure(figsize=(3, 3))
    plt.pie(valores, labels=None)
    
    labels = [f'{porcentagens[i]:.1f}% - {causas[i]}' for i in range(len(causas))]
    plt.legend(labels, bbox_to_anchor=(1.05, 1), loc='upper left')
    plt.title(f"Prevalência de Causas em {ano}")

    plt.show()

# Lista de anos de 2011 a 2021
anos = list(range(2011, 2022))

# Causas a serem analisadas
causas = [
    "Neoplasias malignas",
    "Doenças isquêmicas do coração",
    "Doenças cerebrovasculares",
    "Acidentes",
    "Causas mal definidas e desconhecidas mortalidade",
    "Influenza [gripe] e pneumonia",
    "Outras formas de doença do coração",
    "Diabetes mellitus",
    "Agressões",
    "Outras doenças por vírus"
]

# Criar um gráfico de pizza para cada ano
for ano in anos:
    criar_grafico_pizza(ano)

Os gráficos acima apresentam as proporções de óbitos em relação a cada causa principal ao longo dos anos. Neoplasias malignas, representam cerca de 43,7% dos óbitos em 2011,  aumentando para 48,7% em 2019. No entanto, a partir de 2020, os valores tendem a cair em decorrência a outras causas que apresentam mais casos, chegando a 35,3% em 2021.

<h2>3 - Distribuição das Principais Causas de Morte por Região - 2021</h2>

Nesta seção é apresentado a distribuição das principais causas de mortes nas regiões do Brasil para o ano de 2021.

In [None]:
df = df_dist_2021.query("`Grupo CID-10` == 'Neoplasias malignas' |`Grupo CID-10` == 'Doenças isquêmicas do coração' | `Grupo CID-10` ==  'Doenças cerebrovasculares' | `Grupo CID-10` ==  'Acidentes' | `Grupo CID-10` ==  'Causas mal definidas e desconhecidas mortalidade' | `Grupo CID-10` ==  'Influenza [gripe] e pneumonia' | `Grupo CID-10` ==  'Outras formas de doença do coração' | `Grupo CID-10` ==  'Diabetes mellitus' | `Grupo CID-10` ==  'Agressões' | `Grupo CID-10` ==  'Outras doenças por vírus'")

df.set_index('Grupo CID-10', inplace=True)

# Converter as colunas para tipo numérico
df = df.apply(pd.to_numeric)

# Criar o gráfico de barras empilhadas
ax = df.plot(kind='barh', stacked=True, figsize=(13, 7))

# Configurações do gráfico
plt.ylabel('Grupo CID-10')
plt.xlabel('Número de Casos')
plt.title('Gráfico de Barras Horizontais Empilhadas por Grupo CID-10 e Região')
plt.tight_layout()

# Exibir o gráfico
plt.show()



O gráfico acima revela a distribuição de cada causa nas regiões no Brasil no ano de 2021. <br><br>
A seguir, mapas de calor do Brasil com a prevalência de cada causa nas regiões para o ano de 2021.

In [None]:
df_dist_2021_nm = df_dist_2021[df_dist_2021['Grupo CID-10'] == 'Neoplasias malignas']

df_dist_2021_nm = df_dist_2021_nm.rename(columns={'1 Região Norte': '1'})
df_dist_2021_nm = df_dist_2021_nm.rename(columns={'2 Região Nordeste': '2'})
df_dist_2021_nm = df_dist_2021_nm.rename(columns={'3 Região Sudeste': '3'})
df_dist_2021_nm = df_dist_2021_nm.rename(columns={'4 Região Sul': '4'})
df_dist_2021_nm = df_dist_2021_nm.rename(columns={'5 Região Centro-Oeste': '5'})

df_dist_2021_nm['1'] = df_dist_2021_nm['1'].astype(int)
df_dist_2021_nm['2'] = df_dist_2021_nm['2'].astype(int)
df_dist_2021_nm['3'] = df_dist_2021_nm['3'].astype(int)
df_dist_2021_nm['4'] = df_dist_2021_nm['4'].astype(int)
df_dist_2021_nm['5'] = df_dist_2021_nm['5'].astype(int)

df_dist_2021_nm = df_dist_2021_nm.set_index('Grupo CID-10').T

# Certifique-se de que o índice é uma coluna no DataFrame
df_dist_2021_nm.reset_index(inplace=True)
df_dist_2021_nm = df_dist_2021_nm.rename(columns={'Neoplasias malignas': 'values'})
df_dist_2021_nm['index'] = df_dist_2021_nm['index'].astype(int)

# Criar um dicionário a partir do DataFrame
dic_2021_nm = df_dist_2021_nm.set_index('index')['values'].to_dict()

mapa_cores = linear.Oranges_04.scale(df_dist_2021_nm['values'].min(),
                                 df_dist_2021_nm['values'].max(),
                                 max_labels=5)


mapa = folium.Map(location = [-15.84286684776115, -48.026985518146226],
                 width=600,
                 height=500,
                 zoom_start=4
                 )

#folium.GeoJson(regioes_geoJSON).add_to(mapa)

mapa_cores.caption = "Neoplasias Malignas nas regioes do Brasil - 2021"
mapa_cores.add_to(mapa)

folium.GeoJson(
    regioes_geoJSON,
    style_function=lambda x: {
                                'fillColor': mapa_cores(dic_2021_nm[int(x['properties']['codarea'])]),
                                'weight': '0.3',
                            }
).add_to(mapa)
mapa

In [None]:
df_dist_2021_co = df_dist_2021[df_dist_2021['Grupo CID-10'] == 'Doenças isquêmicas do coração']

df_dist_2021_co = df_dist_2021_co.rename(columns={'1 Região Norte': '1'})
df_dist_2021_co = df_dist_2021_co.rename(columns={'2 Região Nordeste': '2'})
df_dist_2021_co = df_dist_2021_co.rename(columns={'3 Região Sudeste': '3'})
df_dist_2021_co = df_dist_2021_co.rename(columns={'4 Região Sul': '4'})
df_dist_2021_co = df_dist_2021_co.rename(columns={'5 Região Centro-Oeste': '5'})

df_dist_2021_co['1'] = df_dist_2021_co['1'].astype(int)
df_dist_2021_co['2'] = df_dist_2021_co['2'].astype(int)
df_dist_2021_co['3'] = df_dist_2021_co['3'].astype(int)
df_dist_2021_co['4'] = df_dist_2021_co['4'].astype(int)
df_dist_2021_co['5'] = df_dist_2021_co['5'].astype(int)

df_dist_2021_co = df_dist_2021_co.set_index('Grupo CID-10').T

# Certifique-se de que o índice é uma coluna no DataFrame
df_dist_2021_co.reset_index(inplace=True)
df_dist_2021_co = df_dist_2021_co.rename(columns={'Doenças isquêmicas do coração': 'values'})
df_dist_2021_co['index'] = df_dist_2021_co['index'].astype(int)

# Criar um dicionário a partir do DataFrame
dic_2021_co = df_dist_2021_co.set_index('index')['values'].to_dict()

mapa_cores = linear.Oranges_04.scale(df_dist_2021_co['values'].min(),
                                 df_dist_2021_co['values'].max(),
                                 max_labels=5)


mapa = folium.Map(location = [-15.84286684776115, -48.026985518146226],
                 width=600,
                 height=500,
                 zoom_start=4
                 )

#folium.GeoJson(regioes_geoJSON).add_to(mapa)

mapa_cores.caption = "Doencas isquemicas nas regioes do Brasil - 2021"
mapa_cores.add_to(mapa)

folium.GeoJson(
    regioes_geoJSON,
    style_function=lambda x: {
                                'fillColor': mapa_cores(dic_2021_co[int(x['properties']['codarea'])]),
                                'weight': '0.3',
                            }
).add_to(mapa)
mapa

In [None]:
df_dist_2021_ce = df_dist_2021[df_dist_2021['Grupo CID-10'] == 'Doenças cerebrovasculares']

df_dist_2021_ce = df_dist_2021_ce.rename(columns={'1 Região Norte': '1'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'2 Região Nordeste': '2'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'3 Região Sudeste': '3'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'4 Região Sul': '4'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'5 Região Centro-Oeste': '5'})

df_dist_2021_ce['1'] = df_dist_2021_ce['1'].astype(int)
df_dist_2021_ce['2'] = df_dist_2021_ce['2'].astype(int)
df_dist_2021_ce['3'] = df_dist_2021_ce['3'].astype(int)
df_dist_2021_ce['4'] = df_dist_2021_ce['4'].astype(int)
df_dist_2021_ce['5'] = df_dist_2021_ce['5'].astype(int)

df_dist_2021_ce = df_dist_2021_ce.set_index('Grupo CID-10').T

# Certifique-se de que o índice é uma coluna no DataFrame
df_dist_2021_ce.reset_index(inplace=True)
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'Doenças cerebrovasculares': 'values'})
df_dist_2021_ce['index'] = df_dist_2021_ce['index'].astype(int)

# Criar um dicionário a partir do DataFrame
dic_2021_ce = df_dist_2021_ce.set_index('index')['values'].to_dict()

mapa_cores = linear.Oranges_04.scale(df_dist_2021_ce['values'].min(),
                                 df_dist_2021_ce['values'].max(),
                                 max_labels=5)


mapa = folium.Map(location = [-15.84286684776115, -48.026985518146226],
                 width=600,
                 height=500,
                 zoom_start=4
                 )

#folium.GeoJson(regioes_geoJSON).add_to(mapa)

mapa_cores.caption = "Doenças cerebrovasculares nas regioes do Brasil - 2021"
mapa_cores.add_to(mapa)

folium.GeoJson(
    regioes_geoJSON,
    style_function=lambda x: {
                                'fillColor': mapa_cores(dic_2021_ce[int(x['properties']['codarea'])]),
                                'weight': '0.3',
                            }
).add_to(mapa)
mapa

In [None]:
df_dist_2021_ce = df_dist_2021[df_dist_2021['Grupo CID-10'] == 'Acidentes']

df_dist_2021_ce = df_dist_2021_ce.rename(columns={'1 Região Norte': '1'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'2 Região Nordeste': '2'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'3 Região Sudeste': '3'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'4 Região Sul': '4'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'5 Região Centro-Oeste': '5'})

df_dist_2021_ce['1'] = df_dist_2021_ce['1'].astype(int)
df_dist_2021_ce['2'] = df_dist_2021_ce['2'].astype(int)
df_dist_2021_ce['3'] = df_dist_2021_ce['3'].astype(int)
df_dist_2021_ce['4'] = df_dist_2021_ce['4'].astype(int)
df_dist_2021_ce['5'] = df_dist_2021_ce['5'].astype(int)

df_dist_2021_ce = df_dist_2021_ce.set_index('Grupo CID-10').T

# Certifique-se de que o índice é uma coluna no DataFrame
df_dist_2021_ce.reset_index(inplace=True)
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'Acidentes': 'values'})
df_dist_2021_ce['index'] = df_dist_2021_ce['index'].astype(int)

# Criar um dicionário a partir do DataFrame
dic_2021_ce = df_dist_2021_ce.set_index('index')['values'].to_dict()

mapa_cores = linear.Oranges_04.scale(df_dist_2021_ce['values'].min(),
                                 df_dist_2021_ce['values'].max(),
                                 max_labels=5)


mapa = folium.Map(location = [-15.84286684776115, -48.026985518146226],
                 width=600,
                 height=500,
                 zoom_start=4
                 )

#folium.GeoJson(regioes_geoJSON).add_to(mapa)

mapa_cores.caption = "Acidentes nas regioes do Brasil - 2021"
mapa_cores.add_to(mapa)

folium.GeoJson(
    regioes_geoJSON,
    style_function=lambda x: {
                                'fillColor': mapa_cores(dic_2021_ce[int(x['properties']['codarea'])]),
                                'weight': '0.3',
                            }
).add_to(mapa)
mapa



In [None]:
df_dist_2021_ce = df_dist_2021[df_dist_2021['Grupo CID-10'] == 'Causas mal definidas e desconhecidas mortalidade']

df_dist_2021_ce = df_dist_2021_ce.rename(columns={'1 Região Norte': '1'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'2 Região Nordeste': '2'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'3 Região Sudeste': '3'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'4 Região Sul': '4'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'5 Região Centro-Oeste': '5'})

df_dist_2021_ce['1'] = df_dist_2021_ce['1'].astype(int)
df_dist_2021_ce['2'] = df_dist_2021_ce['2'].astype(int)
df_dist_2021_ce['3'] = df_dist_2021_ce['3'].astype(int)
df_dist_2021_ce['4'] = df_dist_2021_ce['4'].astype(int)
df_dist_2021_ce['5'] = df_dist_2021_ce['5'].astype(int)

df_dist_2021_ce = df_dist_2021_ce.set_index('Grupo CID-10').T

# Certifique-se de que o índice é uma coluna no DataFrame
df_dist_2021_ce.reset_index(inplace=True)
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'Causas mal definidas e desconhecidas mortalidade': 'values'})
df_dist_2021_ce['index'] = df_dist_2021_ce['index'].astype(int)

# Criar um dicionário a partir do DataFrame
dic_2021_ce = df_dist_2021_ce.set_index('index')['values'].to_dict()

mapa_cores = linear.Oranges_04.scale(df_dist_2021_ce['values'].min(),
                                 df_dist_2021_ce['values'].max(),
                                 max_labels=5)


mapa = folium.Map(location = [-15.84286684776115, -48.026985518146226],
                 width=600,
                 height=500,
                 zoom_start=4
                 )

#folium.GeoJson(regioes_geoJSON).add_to(mapa)

mapa_cores.caption = "Causas mal definidas e desconhecidas mortalidade nas regioes do Brasil - 2021"
mapa_cores.add_to(mapa)

folium.GeoJson(
    regioes_geoJSON,
    style_function=lambda x: {
                                'fillColor': mapa_cores(dic_2021_ce[int(x['properties']['codarea'])]),
                                'weight': '0.3',
                            }
).add_to(mapa)
mapa



In [None]:
df_dist_2021_ce = df_dist_2021[df_dist_2021['Grupo CID-10'] == 'Influenza [gripe] e pneumonia']

df_dist_2021_ce = df_dist_2021_ce.rename(columns={'1 Região Norte': '1'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'2 Região Nordeste': '2'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'3 Região Sudeste': '3'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'4 Região Sul': '4'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'5 Região Centro-Oeste': '5'})

df_dist_2021_ce['1'] = df_dist_2021_ce['1'].astype(int)
df_dist_2021_ce['2'] = df_dist_2021_ce['2'].astype(int)
df_dist_2021_ce['3'] = df_dist_2021_ce['3'].astype(int)
df_dist_2021_ce['4'] = df_dist_2021_ce['4'].astype(int)
df_dist_2021_ce['5'] = df_dist_2021_ce['5'].astype(int)

df_dist_2021_ce = df_dist_2021_ce.set_index('Grupo CID-10').T

# Certifique-se de que o índice é uma coluna no DataFrame
df_dist_2021_ce.reset_index(inplace=True)
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'Influenza [gripe] e pneumonia': 'values'})
df_dist_2021_ce['index'] = df_dist_2021_ce['index'].astype(int)

# Criar um dicionário a partir do DataFrame
dic_2021_ce = df_dist_2021_ce.set_index('index')['values'].to_dict()

mapa_cores = linear.Oranges_04.scale(df_dist_2021_ce['values'].min(),
                                 df_dist_2021_ce['values'].max(),
                                 max_labels=5)


mapa = folium.Map(location = [-15.84286684776115, -48.026985518146226],
                 width=600,
                 height=500,
                 zoom_start=4
                 )

#folium.GeoJson(regioes_geoJSON).add_to(mapa)

mapa_cores.caption = "Influenza [gripe] e pneumonia nas regioes do Brasil - 2021"
mapa_cores.add_to(mapa)

folium.GeoJson(
    regioes_geoJSON,
    style_function=lambda x: {
                                'fillColor': mapa_cores(dic_2021_ce[int(x['properties']['codarea'])]),
                                'weight': '0.3',
                            }
).add_to(mapa)
mapa



In [None]:
df_dist_2021_ce = df_dist_2021[df_dist_2021['Grupo CID-10'] == 'Outras formas de doença do coração']

df_dist_2021_ce = df_dist_2021_ce.rename(columns={'1 Região Norte': '1'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'2 Região Nordeste': '2'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'3 Região Sudeste': '3'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'4 Região Sul': '4'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'5 Região Centro-Oeste': '5'})

df_dist_2021_ce['1'] = df_dist_2021_ce['1'].astype(int)
df_dist_2021_ce['2'] = df_dist_2021_ce['2'].astype(int)
df_dist_2021_ce['3'] = df_dist_2021_ce['3'].astype(int)
df_dist_2021_ce['4'] = df_dist_2021_ce['4'].astype(int)
df_dist_2021_ce['5'] = df_dist_2021_ce['5'].astype(int)

df_dist_2021_ce = df_dist_2021_ce.set_index('Grupo CID-10').T

# Certifique-se de que o índice é uma coluna no DataFrame
df_dist_2021_ce.reset_index(inplace=True)
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'Outras formas de doença do coração': 'values'})
df_dist_2021_ce['index'] = df_dist_2021_ce['index'].astype(int)

# Criar um dicionário a partir do DataFrame
dic_2021_ce = df_dist_2021_ce.set_index('index')['values'].to_dict()

mapa_cores = linear.Oranges_04.scale(df_dist_2021_ce['values'].min(),
                                 df_dist_2021_ce['values'].max(),
                                 max_labels=5)


mapa = folium.Map(location = [-15.84286684776115, -48.026985518146226],
                 width=600,
                 height=500,
                 zoom_start=4
                 )

#folium.GeoJson(regioes_geoJSON).add_to(mapa)

mapa_cores.caption = "Outras formas de doença do coração nas regioes do Brasil - 2021"
mapa_cores.add_to(mapa)

folium.GeoJson(
    regioes_geoJSON,
    style_function=lambda x: {
                                'fillColor': mapa_cores(dic_2021_ce[int(x['properties']['codarea'])]),
                                'weight': '0.3',
                            }
).add_to(mapa)
mapa



In [None]:
df_dist_2021_ce = df_dist_2021[df_dist_2021['Grupo CID-10'] == 'Diabetes mellitus']

df_dist_2021_ce = df_dist_2021_ce.rename(columns={'1 Região Norte': '1'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'2 Região Nordeste': '2'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'3 Região Sudeste': '3'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'4 Região Sul': '4'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'5 Região Centro-Oeste': '5'})

df_dist_2021_ce['1'] = df_dist_2021_ce['1'].astype(int)
df_dist_2021_ce['2'] = df_dist_2021_ce['2'].astype(int)
df_dist_2021_ce['3'] = df_dist_2021_ce['3'].astype(int)
df_dist_2021_ce['4'] = df_dist_2021_ce['4'].astype(int)
df_dist_2021_ce['5'] = df_dist_2021_ce['5'].astype(int)

df_dist_2021_ce = df_dist_2021_ce.set_index('Grupo CID-10').T

# Certifique-se de que o índice é uma coluna no DataFrame
df_dist_2021_ce.reset_index(inplace=True)
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'Diabetes mellitus': 'values'})
df_dist_2021_ce['index'] = df_dist_2021_ce['index'].astype(int)

# Criar um dicionário a partir do DataFrame
dic_2021_ce = df_dist_2021_ce.set_index('index')['values'].to_dict()

mapa_cores = linear.Oranges_04.scale(df_dist_2021_ce['values'].min(),
                                 df_dist_2021_ce['values'].max(),
                                 max_labels=5)


mapa = folium.Map(location = [-15.84286684776115, -48.026985518146226],
                 width=600,
                 height=500,
                 zoom_start=4
                 )

#folium.GeoJson(regioes_geoJSON).add_to(mapa)

mapa_cores.caption = "Diabetes mellitus nas regioes do Brasil - 2021"
mapa_cores.add_to(mapa)

folium.GeoJson(
    regioes_geoJSON,
    style_function=lambda x: {
                                'fillColor': mapa_cores(dic_2021_ce[int(x['properties']['codarea'])]),
                                'weight': '0.3',
                            }
).add_to(mapa)
mapa



In [None]:
df_dist_2021_ce = df_dist_2021[df_dist_2021['Grupo CID-10'] == 'Agressões']

df_dist_2021_ce = df_dist_2021_ce.rename(columns={'1 Região Norte': '1'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'2 Região Nordeste': '2'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'3 Região Sudeste': '3'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'4 Região Sul': '4'})
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'5 Região Centro-Oeste': '5'})

df_dist_2021_ce['1'] = df_dist_2021_ce['1'].astype(int)
df_dist_2021_ce['2'] = df_dist_2021_ce['2'].astype(int)
df_dist_2021_ce['3'] = df_dist_2021_ce['3'].astype(int)
df_dist_2021_ce['4'] = df_dist_2021_ce['4'].astype(int)
df_dist_2021_ce['5'] = df_dist_2021_ce['5'].astype(int)

df_dist_2021_ce = df_dist_2021_ce.set_index('Grupo CID-10').T

# Certifique-se de que o índice é uma coluna no DataFrame
df_dist_2021_ce.reset_index(inplace=True)
df_dist_2021_ce = df_dist_2021_ce.rename(columns={'Agressões': 'values'})
df_dist_2021_ce['index'] = df_dist_2021_ce['index'].astype(int)

# Criar um dicionário a partir do DataFrame
dic_2021_ce = df_dist_2021_ce.set_index('index')['values'].to_dict()

mapa_cores = linear.Oranges_04.scale(df_dist_2021_ce['values'].min(),
                                 df_dist_2021_ce['values'].max(),
                                 max_labels=5)


mapa = folium.Map(location = [-15.84286684776115, -48.026985518146226],
                 width=600,
                 height=500,
                 zoom_start=4
                 )

#folium.GeoJson(regioes_geoJSON).add_to(mapa)

mapa_cores.caption = "Agressões nas regioes do Brasil - 2021"
mapa_cores.add_to(mapa)

folium.GeoJson(
    regioes_geoJSON,
    style_function=lambda x: {
                                'fillColor': mapa_cores(dic_2021_ce[int(x['properties']['codarea'])]),
                                'weight': '0.3',
                            }
).add_to(mapa)
mapa



In [None]:
df_dist_2021_vi = df_dist_2021[df_dist_2021['Grupo CID-10'] == 'Outras doenças por vírus']

df_dist_2021_vi = df_dist_2021_vi.rename(columns={'1 Região Norte': '1'})
df_dist_2021_vi = df_dist_2021_vi.rename(columns={'2 Região Nordeste': '2'})
df_dist_2021_vi = df_dist_2021_vi.rename(columns={'3 Região Sudeste': '3'})
df_dist_2021_vi = df_dist_2021_vi.rename(columns={'4 Região Sul': '4'})
df_dist_2021_vi = df_dist_2021_vi.rename(columns={'5 Região Centro-Oeste': '5'})

df_dist_2021_vi['1'] = df_dist_2021_vi['1'].astype(int)
df_dist_2021_vi['2'] = df_dist_2021_vi['2'].astype(int)
df_dist_2021_vi['3'] = df_dist_2021_vi['3'].astype(int)
df_dist_2021_vi['4'] = df_dist_2021_vi['4'].astype(int)
df_dist_2021_vi['5'] = df_dist_2021_vi['5'].astype(int)

df_dist_2021_vi = df_dist_2021_vi.set_index('Grupo CID-10').T

# Certifique-se de que o índice é uma coluna no DataFrame
df_dist_2021_vi.reset_index(inplace=True)
df_dist_2021_vi = df_dist_2021_vi.rename(columns={'Outras doenças por vírus': 'values'})
df_dist_2021_vi['index'] = df_dist_2021_vi['index'].astype(int)

# Criar um dicionário a partir do DataFrame
dic_2021_vi = df_dist_2021_vi.set_index('index')['values'].to_dict()

mapa_cores = linear.Oranges_04.scale(df_dist_2021_vi['values'].min(),
                                 df_dist_2021_vi['values'].max(),
                                 max_labels=5)


mapa = folium.Map(location = [-15.84286684776115, -48.026985518146226],
                 width=600,
                 height=500,
                 zoom_start=4
                 )

#folium.GeoJson(regioes_geoJSON).add_to(mapa)

mapa_cores.caption = "Outras doencas causadas por virus - 2021"
mapa_cores.add_to(mapa)

folium.GeoJson(
    regioes_geoJSON,
    style_function=lambda x: {
                                'fillColor': mapa_cores(dic_2021_vi[int(x['properties']['codarea'])]),
                                'weight': '0.3',
                            }
).add_to(mapa)
mapa



<h2>4 - Permanência das Principais Causas de Morte nas Faixas Etárias</h2>

Nesta seção é apresentado como as principais causas de mortes se manifestam nas faixas etárias ao longo dos anos.

In [None]:
# Definir as categorias de doenças que queremos analisar
categorias_doencas = [
    'Neoplasias malignas', 
    'Doenças isquêmicas do coração', 
    'Doenças cerebrovasculares', 
    'Acidentes', 
    'Causas mal definidas e desconhecidas mortalidade', 
    'Influenza [gripe] e pneumonia', 
    'Outras formas de doença do coração', 
    'Diabetes mellitus', 
    'Agressões', 
    'Outras doenças por vírus'
]

# Carregar os dados para cada ano e criar o mapa de calor
anos = range(2011, 2022)

for ano in anos:
    # Carregar os dados para o ano específico
    arquivo_csv = f"/kaggle/input/analisetcc/grupo_faixa_{ano}.csv"
    dados = pd.read_csv(arquivo_csv)
    
    dados.replace('-', 0, inplace=True)
    
    dados = dados.drop('Total', axis=1)
    dados = dados.drop('Idade ignorada', axis=1)
    
    dados.iloc[:, 1:] = dados.iloc[:, 1:].apply(pd.to_numeric, errors='coerce')

    # Filtrar os dados para as categorias de doenças selecionadas
    dados_filtrados = dados[dados['Grupo CID-10'].isin(categorias_doencas)]
    
    dados_filtrados.set_index('Grupo CID-10', inplace=True)
    
    dados_filtrados = dados_filtrados.T

    
    # Criar o mapa de calor
    plt.figure(figsize=(12, 8))
    sns.heatmap(dados_filtrados.astype(float), annot=True, cmap='YlGnBu', cbar=True, fmt='g')
    plt.xlabel('Causas')
    plt.ylabel('Faixas Etárias')
    plt.title(f'Mapa de Calor - Ano {ano}')
    plt.show()
