In [None]:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

# Configura√ß√µes para visualiza√ß√£o
sns.set(style="whitegrid")



# üìä **A Evolu√ß√£o dos Diagn√≥sticos de C√¢ncer ao Longo dos Anos**
üîç *Uma an√°lise sobre o crescimento ou decl√≠nio dos casos de c√¢ncer registrados*

---

## **üìå Introdu√ß√£o**
O c√¢ncer √© uma das doen√ßas mais impactantes do mundo, e entender sua evolu√ß√£o ao longo dos anos pode fornecer insights valiosos para pol√≠ticas de sa√∫de, preven√ß√£o e tratamentos mais eficazes.

Neste notebook, exploramos a **taxa de crescimento anual de diagn√≥sticos de c√¢ncer** com base no dataset do **Registro de C√¢ncer de Base Populacional (RCBP) de Po√ßos de Caldas**.  

Vamos responder √†s seguintes perguntas:

‚úÖ O n√∫mero de diagn√≥sticos tem aumentado ou diminu√≠do ao longo dos anos?  
‚úÖ Existe algum padr√£o de crescimento ou queda nos registros?  
‚úÖ Houve anos com um aumento ou queda expressiva?  

Acompanhe essa jornada conosco! üöÄ  


In [None]:

# Carregar o arquivo
file_path = "/mnt/data/base_nao_identificada_3702.csv"

# Ler o dataset
df = pd.read_csv(file_path, encoding="ISO-8859-1", delimiter=";")

# Converter a coluna de Data de Diagn√≥stico para formato de data
df["Data de Diagnostico"] = pd.to_datetime(df["Data de Diagnostico"], format="%d/%m/%Y", errors="coerce")

# Criar a coluna do ano de diagn√≥stico
df["Ano do Diagnostico"] = df["Data de Diagnostico"].dt.year

# Contar o n√∫mero de diagn√≥sticos por ano
diagnosticos_por_ano = df["Ano do Diagnostico"].value_counts().sort_index()

# Calcular a taxa de crescimento anual
taxa_crescimento_anual = diagnosticos_por_ano.pct_change() * 100

# Criar um dataframe com os resultados
df_crescimento = pd.DataFrame({
    "Ano": diagnosticos_por_ano.index,
    "N√∫mero de Diagn√≥sticos": diagnosticos_por_ano.values,
    "Taxa de Crescimento (%)": taxa_crescimento_anual.values
})

# Exibir as primeiras linhas
df_crescimento.head()



## üìà **O n√∫mero de diagn√≥sticos est√° aumentando?**
Agora que temos a quantidade de diagn√≥sticos por ano, vamos visualizar a tend√™ncia geral dos registros.


In [None]:

# Gr√°fico da evolu√ß√£o dos diagn√≥sticos ao longo dos anos
plt.figure(figsize=(10,5))
sns.lineplot(x=df_crescimento["Ano"], y=df_crescimento["N√∫mero de Diagn√≥sticos"], marker="o", color="royalblue")
plt.title("Evolu√ß√£o dos Diagn√≥sticos de C√¢ncer ao Longo dos Anos", fontsize=14)
plt.xlabel("Ano", fontsize=12)
plt.ylabel("N√∫mero de Diagn√≥sticos", fontsize=12)
plt.grid(True)
plt.show()



## üìä **Taxa de Crescimento Anual**
A taxa de crescimento anual nos mostra **o percentual de aumento ou queda no n√∫mero de diagn√≥sticos** em compara√ß√£o ao ano anterior.


In [None]:

# Gr√°fico da taxa de crescimento anual
plt.figure(figsize=(10,5))
sns.barplot(x=df_crescimento["Ano"], y=df_crescimento["Taxa de Crescimento (%)"], palette="coolwarm")
plt.axhline(y=0, color="black", linestyle="--")
plt.title("Taxa de Crescimento Anual de Diagn√≥sticos de C√¢ncer", fontsize=14)
plt.xlabel("Ano", fontsize=12)
plt.ylabel("Taxa de Crescimento (%)", fontsize=12)
plt.xticks(rotation=45)
plt.grid(True, linestyle="--", alpha=0.5)
plt.show()



# üìå **Conclus√µes**
Ap√≥s nossa an√°lise, conseguimos identificar alguns padr√µes interessantes:

‚úÖ O n√∫mero total de diagn√≥sticos **tem flutua√ß√µes significativas** ao longo dos anos.  
‚úÖ Em alguns anos, houve um **crescimento expressivo**, enquanto em outros ocorreu uma queda no n√∫mero de registros.  
‚úÖ A taxa de crescimento anual mostra varia√ß√µes, podendo estar relacionadas a **melhoria nos m√©todos de detec√ß√£o, campanhas de conscientiza√ß√£o ou fatores externos**.  

Esses insights s√£o essenciais para entender a evolu√ß√£o da doen√ßa e direcionar pol√≠ticas de sa√∫de p√∫blica.  
Se quiser aprofundar essa an√°lise, podemos explorar fatores como **a distribui√ß√£o dos diagn√≥sticos por faixa et√°ria ou sexo ao longo do tempo**.  

üì¢ *Quais outros padr√µes voc√™ acha que podem influenciar essa varia√ß√£o?* üöÄ  
