##### DATASET: Causa de morte 
##### Pergunta-1: Qual faixa etária apresenta a maior taxa de mortalidade no Brasil, e quais 
##### são as causas mais comuns de morte para essa faixa etária

In [None]:
# Importação das bibliotecas necessárias
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Carregar o dataset (Substitua 'causa_de_morte_brasil.csv' pelo caminho correto do seu arquivo)
df = pd.read_csv('causa_de_morte_brasil.csv')

# Exibir as primeiras linhas do dataset para inspeção
df.head()

# Verificar informações gerais sobre o dataset (tipos de dados, valores ausentes)
df.info()

# 1. Analisando a faixa etária com a maior taxa de mortalidade
# Agrupar por faixa etária e somar o número de óbitos
faixa_etaria_mortalidade = df.groupby('faixa_etaria')['numero_de_obitos'].sum().sort_values(ascending=False)

# Exibir a faixa etária com maior taxa de mortalidade
faixa_etaria_mortalidade_top = faixa_etaria_mortalidade.idxmax()
print(f"A faixa etária com a maior taxa de mortalidade é: {faixa_etaria_mortalidade_top}")

# 2. Encontrar as causas mais comuns de morte para essa faixa etária
# Filtrar os dados para a faixa etária com maior número de óbitos
dados_faixa_top = df[df['faixa_etaria'] == faixa_etaria_mortalidade_top]

# Agrupar por causa de morte e contar as ocorrências
causas_comuns = dados_faixa_top['causa_de_morte'].value_counts().head(10)

# Exibir as 10 causas mais comuns de morte para essa faixa etária
print("\nCausas mais comuns de morte para a faixa etária:", faixa_etaria_mortalidade_top)
print(causas_comuns)

# 3. Visualização: Gráfico das causas mais comuns para a faixa etária com maior mortalidade
plt.figure(figsize=(10,6))
sns.barplot(x=causas_comuns.values, y=causas_comuns.index, palette='viridis')
plt.title(f'Causas de Morte mais Comuns para a Faixa Etária {faixa_etaria_mortalidade_top}')
plt.xlabel('Número de Óbitos')
plt.ylabel('Causa de Morte')
plt.show()





##### Pergunta-2: Como a mortalidade por causas específicas difere entre homens e 
##### mulheres no Brasil? Quais são as principais causas de morte para cada gênero?


In [None]:
# Importação das bibliotecas necessárias
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configuração do estilo dos gráficos
sns.set(style="whitegrid")

# Passo 1: Carregar o dataset
# Substitua o caminho do arquivo pelo local do seu arquivo CSV
file_path = 'causas_de_morte_brasil.csv'
df = pd.read_csv(file_path)

# Exibir as primeiras linhas para entender o formato dos dados
df.head()

# Passo 2: Verificar colunas e tipos de dados
df.info()

# Passo 3: Verificar as colunas relevantes para a análise
# Vamos assumir que as colunas relevantes para a análise são 'Sexo', 'Causa_de_Morte', e 'Quantidade_de_Mortes'
# Você pode precisar ajustar o nome das colunas dependendo do seu dataset real.
# Verificar os nomes das colunas
df.columns

# Passo 4: Filtrando os dados para homens e mulheres
df_homens = df[df['Sexo'] == 'Masculino']
df_mulheres = df[df['Sexo'] == 'Feminino']

# Passo 5: Análise das principais causas de morte para homens
# Agrupar por 'Causa_de_Morte' e somar as mortes por causa
causas_homens = df_homens.groupby('Causa_de_Morte')['Quantidade_de_Mortes'].sum().sort_values(ascending=False)

# Passo 6: Análise das principais causas de morte para mulheres
# Agrupar por 'Causa_de_Morte' e somar as mortes por causa
causas_mulheres = df_mulheres.groupby('Causa_de_Morte')['Quantidade_de_Mortes'].sum().sort_values(ascending=False)

# Passo 7: Gerar gráficos para as causas de morte mais comuns por gênero

# Gráfico para homens
plt.figure(figsize=(10,6))
causas_homens.head(10).plot(kind='bar', color='blue')
plt.title('Principais causas de morte para Homens no Brasil')
plt.xlabel('Causa de Morte')
plt.ylabel('Quantidade de Mortes')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()

# Gráfico para mulheres
plt.figure(figsize=(10,6))
causas_mulheres.head(10).plot(kind='bar', color='pink')
plt.title('Principais causas de morte para Mulheres no Brasil')
plt.xlabel('Causa de Morte')
plt.ylabel('Quantidade de Mortes')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()

# Passo 8: Comparar as causas de morte mais comuns entre homens e mulheres
# Vamos gerar um gráfico comparativo entre as 10 principais causas de morte para homens e mulheres
top_causas_homens = causas_homens.head(10)
top_causas_mulheres = causas_mulheres.head(10)

# Criando um gráfico de barras lado a lado
fig, ax = plt.subplots(figsize=(12, 7))

# Definindo as barras para homens e mulheres
top_causas_homens.plot(kind='bar', ax=ax, position=1, width=0.4, color='blue', label='Homens')
top_causas_mulheres.plot(kind='bar', ax=ax, position=0, width=0.4, color='pink', label='Mulheres')

# Adicionando título e rótulos
ax.set_title('Comparação das 10 Principais Causas de Morte por Gênero no Brasil')
ax.set_xlabel('Causa de Morte')
ax.set_ylabel('Quantidade de Mortes')
ax.set_xticklabels(top_causas_homens.index, rotation=45, ha='right')
plt.tight_layout()

# Exibir o gráfico
plt.legend()
plt.show()


##### Pergunta-3: Quais estados apresentam o maior número de óbitos, e como as causas 
##### de morte variam entre esses estados?

In [None]:
# Passo 1: Importação das bibliotecas necessárias
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configuração do estilo dos gráficos
sns.set(style="whitegrid")

# Passo 2: Carregar o dataset
# Substitua pelo caminho correto do seu arquivo CSV
file_path = 'causas_de_morte_brasil.csv'
df = pd.read_csv(file_path)

# Exibir as primeiras linhas para verificar o formato dos dados
df.head()

# Passo 3: Verificar as colunas e tipos de dados para saber como os dados estão estruturados
df.info()

# Passo 4: Filtrando as colunas necessárias
# Supondo que as colunas sejam 'Estado', 'Causa_de_Morte', 'Quantidade_de_Mortes'
# Ajuste de acordo com o nome das colunas reais no seu dataset
df.columns

# Passo 5: Análise dos estados com o maior número de óbitos
# Agrupar os dados por 'Estado' e somar a quantidade de óbitos
obitos_por_estado = df.groupby('Estado')['Quantidade_de_Mortes'].sum().sort_values(ascending=False)

# Passo 6: Selecionar os 10 estados com o maior número de óbitos
top_10_estados = obitos_por_estado.head(10)

# Exibir os 10 estados com mais óbitos
top_10_estados

# Passo 7: Gerar um gráfico para visualizar os estados com o maior número de óbitos
plt.figure(figsize=(12, 6))
top_10_estados.plot(kind='bar', color='teal')
plt.title('Top 10 Estados com Maior Número de Óbitos no Brasil')
plt.xlabel('Estado')
plt.ylabel('Quantidade de Mortes')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()

# Passo 8: Análise das causas de morte nos estados com maior número de óbitos
# Vamos focar nos 10 estados com maior número de óbitos
# Filtrando o DataFrame para os estados selecionados
df_top_estados = df[df['Estado'].isin(top_10_estados.index)]

# Passo 9: Agrupar os dados por estado e causa de morte para ver a distribuição das causas
causas_por_estado = df_top_estados.groupby(['Estado', 'Causa_de_Morte'])['Quantidade_de_Mortes'].sum().unstack().fillna(0)

# Passo 10: Visualizar a distribuição das causas de morte para os estados
# Vamos gerar um gráfico para os 3 estados com mais óbitos, e as top 5 causas de morte
top_3_estados = top_10_estados.head(3)
causas_top_3_estados = causas_por_estado.loc[top_3_estados.index, :]

# Gerar o gráfico de barras para as 5 principais causas de morte
causas_top_3_estados.head(5).plot(kind='bar', stacked=True, figsize=(12, 8), colormap='Set3')

plt.title('Principais Causas de Morte nos 3 Estados com Maior Número de Óbitos')
plt.xlabel('Estado')
plt.ylabel('Quantidade de Mortes')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.legend(title='Causa de Morte')
plt.show()


