In [None]:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

# Configurações para visualização
sns.set(style="whitegrid")



# 📊 **A Evolução dos Diagnósticos de Câncer ao Longo dos Anos**
🔍 *Uma análise sobre o crescimento ou declínio dos casos de câncer registrados*

---

## **📌 Introdução**
O câncer é uma das doenças mais impactantes do mundo, e entender sua evolução ao longo dos anos pode fornecer insights valiosos para políticas de saúde, prevenção e tratamentos mais eficazes.

Neste notebook, exploramos a **taxa de crescimento anual de diagnósticos de câncer** com base no dataset do **Registro de Câncer de Base Populacional (RCBP) de Poços de Caldas**.  

Vamos responder às seguintes perguntas:

✅ O número de diagnósticos tem aumentado ou diminuído ao longo dos anos?  
✅ Existe algum padrão de crescimento ou queda nos registros?  
✅ Houve anos com um aumento ou queda expressiva?  

Acompanhe essa jornada conosco! 🚀  


In [None]:

# Carregar o arquivo
file_path = "/mnt/data/base_nao_identificada_3702.csv"

# Ler o dataset
df = pd.read_csv(file_path, encoding="ISO-8859-1", delimiter=";")

# Converter a coluna de Data de Diagnóstico para formato de data
df["Data de Diagnostico"] = pd.to_datetime(df["Data de Diagnostico"], format="%d/%m/%Y", errors="coerce")

# Criar a coluna do ano de diagnóstico
df["Ano do Diagnostico"] = df["Data de Diagnostico"].dt.year

# Contar o número de diagnósticos por ano
diagnosticos_por_ano = df["Ano do Diagnostico"].value_counts().sort_index()

# Calcular a taxa de crescimento anual
taxa_crescimento_anual = diagnosticos_por_ano.pct_change() * 100

# Criar um dataframe com os resultados
df_crescimento = pd.DataFrame({
    "Ano": diagnosticos_por_ano.index,
    "Número de Diagnósticos": diagnosticos_por_ano.values,
    "Taxa de Crescimento (%)": taxa_crescimento_anual.values
})

# Exibir as primeiras linhas
df_crescimento.head()



## 📈 **O número de diagnósticos está aumentando?**
Agora que temos a quantidade de diagnósticos por ano, vamos visualizar a tendência geral dos registros.


In [None]:

# Gráfico da evolução dos diagnósticos ao longo dos anos
plt.figure(figsize=(10,5))
sns.lineplot(x=df_crescimento["Ano"], y=df_crescimento["Número de Diagnósticos"], marker="o", color="royalblue")
plt.title("Evolução dos Diagnósticos de Câncer ao Longo dos Anos", fontsize=14)
plt.xlabel("Ano", fontsize=12)
plt.ylabel("Número de Diagnósticos", fontsize=12)
plt.grid(True)
plt.show()



## 📊 **Taxa de Crescimento Anual**
A taxa de crescimento anual nos mostra **o percentual de aumento ou queda no número de diagnósticos** em comparação ao ano anterior.


In [None]:

# Gráfico da taxa de crescimento anual
plt.figure(figsize=(10,5))
sns.barplot(x=df_crescimento["Ano"], y=df_crescimento["Taxa de Crescimento (%)"], palette="coolwarm")
plt.axhline(y=0, color="black", linestyle="--")
plt.title("Taxa de Crescimento Anual de Diagnósticos de Câncer", fontsize=14)
plt.xlabel("Ano", fontsize=12)
plt.ylabel("Taxa de Crescimento (%)", fontsize=12)
plt.xticks(rotation=45)
plt.grid(True, linestyle="--", alpha=0.5)
plt.show()



# 📌 **Conclusões**
Após nossa análise, conseguimos identificar alguns padrões interessantes:

✅ O número total de diagnósticos **tem flutuações significativas** ao longo dos anos.  
✅ Em alguns anos, houve um **crescimento expressivo**, enquanto em outros ocorreu uma queda no número de registros.  
✅ A taxa de crescimento anual mostra variações, podendo estar relacionadas a **melhoria nos métodos de detecção, campanhas de conscientização ou fatores externos**.  

Esses insights são essenciais para entender a evolução da doença e direcionar políticas de saúde pública.  
Se quiser aprofundar essa análise, podemos explorar fatores como **a distribuição dos diagnósticos por faixa etária ou sexo ao longo do tempo**.  

📢 *Quais outros padrões você acha que podem influenciar essa variação?* 🚀  
