# Estudo sobre os dados de suicídios no Brasil nos anos de 2014 a 2018

### Este estudo visa responder as seguintes perguntas:

1. **Tendências ao longo do tempo**: Como as quantidades de suicídios mudaram ao longo do tempo? Elas estão aumentando, diminuindo ou permanecendo estáveis?

2. **Diferenças demográficas**: Existem diferenças nas taxas de suicídio entre diferentes grupos demográficos? Por exemplo, as taxas de suicídio são diferentes para homens e mulheres? E quanto a diferentes faixas etárias ou níveis de educação?

3. **Localização geográfica**: Existem diferenças nas taxas de suicídio entre diferentes localidades? Algumas áreas têm taxas de suicídio consistentemente mais altas do que outras?

4. **Métodos de suicídio**: Quais são os métodos de suicídio mais comuns? Existem diferenças nos métodos usados por diferentes grupos demográficos ou em diferentes localidades?

5. **Prevenção de suicídio**: Com base nos dados, quais estratégias podem ser mais eficazes na prevenção do suicídio? Existem certos grupos demográficos ou localidades que devem ser alvo de esforços de prevenção?


In [1]:
# importando as bibliotecas necessárias
import pandas as pd
import sqlite3
import plotly.express as px

In [9]:
# conectando com o banco de dados SQLite
conn = sqlite3.connect("suicidios_tratado.db")

# criando uma query com o pandas para selecionar os dados
df = pd.read_sql_query("SELECT * FROM suicidios_tratado", conn)

# fechando a conexão com o banco de dados
conn.close()

In [11]:
# visualizando os dados
df.head(3)

Unnamed: 0,uf_obito,municipio_residencia_pessoa,circunstancia_obito,sexo,raca,estado_civil,escolaridade,ocupacao,local_ocorrencia,assistencia_medica,causas_basicas_obito,dia_obito,mes_obito,ano_obito,dia_nascimento,mes_nascimento,ano_nascimento,idade
0,AC,Rio Branco,Suicídio,Masculino,Preta,Casado,ensino fundamental,ATLETA PROFISSIONAL DE FUTEBOL,Domicílio,Não,X700,2,1,2014,2,7,1977,37
1,AC,Rio Branco,Suicídio,Masculino,Branca,União consensual,graduacao,MEDICO GINECOLOGISTA E OBSTETRA,Domicílio,Não,X800,23,1,2014,30,7,1966,48
2,AC,Epitaciolândia,Suicídio,Masculino,Branca,Solteiro,ensino fundamental,ESTUDANTE,Outros,Não,X700,5,2,2014,4,7,1999,15


### **1. Tendência ao longo do tempo**

In [34]:
df_tempo = df.groupby("ano_obito").count()["uf_obito"]

df_tempo

ano_obito
2014    4893
2015    5328
2016    5749
2017    6644
2018    6969
Name: uf_obito, dtype: int64

In [35]:
# renomeando as colunas de df_tempo
df_tempo = df_tempo.reset_index().rename(columns={"uf_obito": "qtd_obitos"})

df_tempo

Unnamed: 0,ano_obito,qtd_obitos
0,2014,4893
1,2015,5328
2,2016,5749
3,2017,6644
4,2018,6969


In [44]:
# criando o gráfico de linha para visualizar as mudanças ao longo do tempo
fig = px.line(
    df_tempo,
    x="ano_obito",
    y="qtd_obitos",
    title="Evolução dos suicídios no Brasil",
    markers=True,
    template="ggplot2",
    text="qtd_obitos",
)
# adicionando rótulos aos marcadores
fig.update_traces(textposition="top center")

fig.update_layout(
    xaxis_title="Ano",
    yaxis_title="Quantidade de óbitos",
    font=dict(size=12, color="#000000"),
)
# eixo x com intervalo de 1 ano
fig.update_xaxes(dtick=1)


fig.show()

#### Conclusão 1:

De acordo com o gráfico, o número de suicídios no Brasil tem aumentado ao longo do tempo.

Em 2014, houve aproximadamente 4.893 suicídios.
Em 2015, o número aumentou para 5.328.
Em 2016, houve 5.749 suicídios.
Em 2017, o número aumentou novamente para 6.544.
Finalmente, em 2018, houve 6.969 suicídios.

Portanto, a tendência geral é de um aumento no número de suicídios no Brasil de 2014 a 2018.

### **2. Diferenças demográficas**

#### Homens x Mulheres

In [52]:
# quantidade de obitos por sexo e ano
df_tempo_sexo = df.groupby(["ano_obito", "sexo"]).count()["uf_obito"]

# renomeando as colunas de df_tempo_sexo
df_tempo_sexo = df_tempo_sexo.reset_index().rename(columns={"uf_obito": "qtd_obitos"})

df_tempo_sexo

Unnamed: 0,ano_obito,sexo,qtd_obitos
0,2014,Feminino,1092
1,2014,Masculino,3801
2,2015,Feminino,1190
3,2015,Masculino,4138
4,2016,Feminino,1238
5,2016,Masculino,4511
6,2017,Feminino,1481
7,2017,Masculino,5163
8,2018,Feminino,1599
9,2018,Masculino,5370


In [53]:
# separando os homens
df_homens = df_tempo_sexo[df_tempo_sexo["sexo"] == "Masculino"]

df_homens

Unnamed: 0,ano_obito,sexo,qtd_obitos
1,2014,Masculino,3801
3,2015,Masculino,4138
5,2016,Masculino,4511
7,2017,Masculino,5163
9,2018,Masculino,5370


In [59]:
# separando as mulheres
df_mulheres = df_tempo_sexo[df_tempo_sexo["sexo"] == "Feminino"]

df_mulheres

Unnamed: 0,ano_obito,sexo,qtd_obitos
0,2014,Feminino,1092
2,2015,Feminino,1190
4,2016,Feminino,1238
6,2017,Feminino,1481
8,2018,Feminino,1599


In [73]:
from plotly.subplots import make_subplots

# criando o gráfico de linha dos homens
fig_homem = px.line(
    df_homens,
    x="ano_obito",
    y="qtd_obitos",
    title="Evolução dos suicídios no Brasil por sexo",
    markers=True,
    template="ggplot2",
    text="qtd_obitos",
)
# mudar cor da linha
fig_homem.update_traces(line_color="blue")

# criando o gráfico de linha das mulheres
fig_mulher = px.line(
    df_mulheres,
    x="ano_obito",
    y="qtd_obitos",
    title="Evolução dos suicídios no Brasil por sexo",
    markers=True,
    template="ggplot2",
    text="qtd_obitos",
)

# mudando a cor da linha
fig_mulher.update_traces(line_color="pink")

# criando a figura com os 3 gráficos
fig = make_subplots(
    rows=1,
    cols=2,
    subplot_titles=("Homens", "Mulheres"),
)

# adicionando os gráficos à figura
fig.add_trace(fig_homem.data[0], row=1, col=1)
fig.add_trace(fig_mulher.data[0], row=1, col=2)

# posição do texto
fig.update_traces(textposition="top center")

# nomes dos eixos
fig.update_layout(
    xaxis_title="Ano",
    yaxis_title="Quantidade de óbitos",
    font=dict(size=12, color="#000000"),
)

# eixo x com intervalo de 1 ano
fig.update_xaxes(dtick=1)

fig.show()

In [75]:
# grafico de ambos para comparação
# criando o gráfico de linha dos 2 sexos
fig_ambos = px.line(
    df_tempo_sexo,
    x="ano_obito",
    y="qtd_obitos",
    color="sexo",
    title="Evolução dos suicídios no Brasil por sexo",
    markers=True,
    template="ggplot2",
    text="qtd_obitos",
)

# adicionando nomes aos eixos
fig_ambos.update_layout(
    xaxis_title="Ano",
    yaxis_title="Quantidade de óbitos",
    font=dict(size=12, color="#000000"),
)

# alterar cor da linha Masculino e Feminino
fig_ambos.update_traces(line_color="blue", selector=dict(name="Masculino"))
fig_ambos.update_traces(line_color="pink", selector=dict(name="Feminino"))

# posição do texto
fig_ambos.update_traces(textposition="top center")
# eixo x com intervalo de 1 ano
fig_ambos.update_xaxes(dtick=1)

fig_ambos.show()

#### Conclusão 2:

De acordo com os gráficos, há diferenças significativas nas taxas de suicídio entre homens e mulheres no Brasil de 2014 a 2018. Aqui estão algumas observações baseadas nos dados:

- **Taxas mais altas entre os homens**: Em todos os anos, o número de suicídios entre os homens é consistentemente maior do que entre as mulheres. Por exemplo, em 2018, houve 5.370 suicídios entre os homens, em comparação com 1.599 entre as mulheres.

- **Aumento ao longo do tempo**: Ambos os sexos mostram um aumento no número de suicídios ao longo do tempo. No entanto, o aumento é mais acentuado entre os homens. Por exemplo, o número de suicídios entre os homens aumentou de 3.801 em 2014 para 5.370 em 2018. Entre as mulheres, o número aumentou de 1.092 em 2014 para 1.599 em 2018.

Essas tendências sugerem que, embora as taxas de suicídio estejam aumentando para ambos os sexos, os homens estão em maior risco.

#### Suicídios por idade

In [119]:
# quantidade de obitos por idade
df_idade = df.groupby("idade").count()["uf_obito"]

# renomeando as colunas de df_idade
df_idade = df_idade.reset_index().rename(columns={"uf_obito": "qtd_obitos"})

# transformando os valores de idade em positivos
df_idade["idade"] = df_idade["idade"].abs()

df_idade

Unnamed: 0,idade,qtd_obitos
0,35,42
1,34,94
2,33,132
3,32,189
4,31,213
...,...,...
96,64,303
97,65,198
98,66,159
99,67,120


In [128]:
# criando faixas de idades
df_idade["faixa_etaria"] = pd.cut(
    df_idade["idade"],
    bins=[0, 9, 19, 29, 39, 49, 59, 69],
    labels=[
        "0 a 9",
        "10 a 19",
        "20 a 29",
        "30 a 39",
        "40 a 49",
        "50 a 59",
        "60 a 69",
    ],
)

df_faixa = df_idade.groupby("faixa_etaria").sum()["qtd_obitos"]

df_faixa = pd.DataFrame(df_faixa)

df_faixa





Unnamed: 0_level_0,qtd_obitos
faixa_etaria,Unnamed: 1_level_1
0 a 9,80
10 a 19,2862
20 a 29,7375
30 a 39,7205
40 a 49,5402
50 a 59,4536
60 a 69,2121


In [132]:
# grafico de barras com as faixas de idades
fig = px.bar(
    df_faixa,
    x=df_faixa.index,
    y="qtd_obitos",
    title="Quantidade de óbitos por faixa etária",
    template="ggplot2",
    text="qtd_obitos",
)

# nomeando os eixos
fig.update_layout(
    xaxis_title="Faixa etária",
    yaxis_title="Quantidade de óbitos",
    font=dict(size=12, color="#000000"),
)

fig.show()

#### Conclusão 3:

Com base no gráfico, podemos observar as seguintes tendências nos casos de suicídio em relação às diferentes faixas etárias:

- **Faixa etária de 0 a 9 anos**: Esta faixa etária tem a menor quantidade de óbitos, com 80 casos registrados. Isso pode ser devido à menor exposição a fatores de risco para o suicídio nessa idade.

- **Faixa etária de 10 a 19 anos**: Há um aumento significativo na quantidade de óbitos nesta faixa etária, com 2.862 casos. Isso pode ser atribuído a uma variedade de fatores, incluindo o início da puberdade e o aumento das pressões sociais e acadêmicas.

- **Faixa etária de 20 a 29 anos**: Esta faixa etária tem a maior quantidade de óbitos, com 7.375 casos. Isso pode ser devido a uma combinação de fatores, incluindo o estresse associado à transição para a vida adulta e o início de carreiras profissionais.

- **Faixa etária de 30 a 39 anos**: A quantidade de óbitos nesta faixa etária é quase igual à faixa etária de 20 a 29 anos, com 7.205 casos. Isso pode ser devido a fatores como estresse no trabalho, problemas financeiros e questões familiares.

- **Faixa etária de 40 a 49 anos**: Há uma diminuição na quantidade de óbitos nesta faixa etária, com 5.402 casos. No entanto, o número ainda é significativamente alto.

- **Faixa etária de 50 a 59 anos**: A quantidade de óbitos continua a diminuir nesta faixa etária, com 4.536 casos.

- **Faixa etária de 60 a 69 anos**: Esta faixa etária tem uma quantidade significativamente menor de óbitos, com 2.121 casos. Isso pode ser devido a uma variedade de fatores, incluindo aposentadoria e mudanças no estilo de vida.

Essas tendências sugerem que as taxas de suicídio variam significativamente entre diferentes faixas etárias. Se destacando os números das faixas de 20 a 39, onde os jovens passam a ter mais responsabilidades e pressões sociais.

### Suicídios x Nível de escolaridade

In [133]:
# suicidios por nivel de escolaridade
df_escolaridade = df.groupby("escolaridade").count()["uf_obito"]

# renomeando as colunas de df_escolaridade
df_escolaridade = df_escolaridade.reset_index().rename(
    columns={"uf_obito": "qtd_obitos"}
)

df_escolaridade

Unnamed: 0,escolaridade,qtd_obitos
0,Nenhuma,1731
1,educacao infantil,5096
2,ensino fundamental,9529
3,ensino medio,9755
4,graduacao,3472


In [135]:
# criando o grafico de barra
fig = px.bar(
    df_escolaridade,
    x="escolaridade",
    y="qtd_obitos",
    title="Quantidade de óbitos por nível de escolaridade",
    template="ggplot2",
    text="qtd_obitos",
)

# nomeando os eixos
fig.update_layout(
    xaxis_title="Nível de escolaridade",
    yaxis_title="Quantidade de óbitos",
    font=dict(size=12, color="#000000"),
)

fig.show()

#### Conclusão 4:

Com base no gráfico obtido, podemos observar as seguintes tendências nas taquantidades de suicídio entre diferentes grupos demográficos em relação às diferentes níveis de escolaridade:

- **Nenhuma escolaridade**: Este grupo tem a menor quantidade de óbitos, com 1.731 casos. Isso pode ser devido a uma variedade de fatores, incluindo a idade (pessoas muito jovens que ainda não começaram a escola) e o acesso limitado a meios letais.

- **Educação infantil**: Há um aumento significativo na quantidade de óbitos neste grupo, com 5.096 casos. Isso pode ser atribuído a uma variedade de fatores, incluindo o início da puberdade e o aumento das pressões sociais e acadêmicas.

- **Ensino fundamental**: Este grupo tem uma quantidade ainda maior de óbitos, com 9.529 casos. Isso pode ser devido a uma combinação de fatores, incluindo o estresse associado à transição para a adolescência e o início de problemas de saúde mental.

- **Ensino médio**: Este grupo tem a maior quantidade de óbitos, com 9.755 casos. Isso pode ser devido a fatores como estresse no trabalho, problemas financeiros e questões familiares.

- **Graduação**: Há uma diminuição na quantidade de óbitos neste grupo, com 3.472 casos. Isso pode ser devido a uma variedade de fatores, incluindo maior estabilidade financeira, melhor acesso a serviços de saúde mental e maior resiliência ao estresse.

Essas tendências sugerem que as quantidades de suicídio variam significativamente entre diferentes níveis de escolaridade.

### **3. Localização geográfica**

In [140]:
# suicidios por uf_obito
df_uf = df.groupby("uf_obito").count()["idade"]

# renomeando as colunas de df_uf
df_uf = (
    df_uf.reset_index()
    .rename(columns={"idade": "qtd_obitos"})
    .sort_values(ascending=True, by="qtd_obitos")
)

df_uf

Unnamed: 0,uf_obito,qtd_obitos
21,RR,33
1,AL,77
0,AC,110
3,AP,113
14,PB,151
19,RN,211
26,TO,299
20,RO,372
7,ES,400
6,DF,417


In [146]:
# criando um grafico de barras horizontais
fig = px.bar(
    df_uf,
    x="qtd_obitos",
    y="uf_obito",
    orientation="h",
    title="Quantidade de obitos por UF (Todo o período)",
    template="ggplot2",
    text="qtd_obitos",
)

# nomeando os eixos
fig.update_layout(
    xaxis_title="Quantidade de óbitos",
    yaxis_title="UF",
    font=dict(size=12, color="#000000"),
)

fig.show()

In [147]:
# suicidios por uf e ano
df_uf_ano = df.groupby(["uf_obito", "ano_obito"]).count()["idade"]

# renomeando as colunas de df_uf_ano
df_uf_ano = (
    df_uf_ano.reset_index()
    .rename(columns={"idade": "qtd_obitos"})
    .sort_values(ascending=True, by="qtd_obitos")
)

df_uf_ano

Unnamed: 0,uf_obito,ano_obito,qtd_obitos
106,RR,2015,1
105,RR,2014,1
6,AL,2015,6
5,AL,2014,7
109,RR,2018,7
...,...,...,...
125,SP,2014,920
126,SP,2015,926
127,SP,2016,1007
128,SP,2017,1068


In [157]:
# Cria o gráfico de linha
fig = px.bar(
    df_uf_ano,
    x="ano_obito",
    y="qtd_obitos",
    color="uf_obito",
    title="Óbitos por Suicídio no Brasil por UF e Ano",
    template="ggplot2",
)

# nomeando os eixos
fig.update_layout(
    xaxis_title="Ano",
    yaxis_title="Quantidade de óbitos",
    font=dict(size=12, color="#000000"),
)


fig.show()

### Conclusão 5:

Com base no gráfico obtido, podemos observar as seguintes tendências nas quantidades de suicídio entre diferentes localidades ao longo do tempo:

- **Diferenças significativas entre localidades**: Existem diferenças notáveis nas quantidades de suicídio entre diferentes localidades ao longo do tempo. Por exemplo, São Paulo (SP) tem um número significativamente maior de óbitos por suicídio do que Roraima (RR) em todos os anos observados.

- **São Paulo (SP)**: Esta unidade federativa tem a maior quantidade de óbitos em todos os anos, com um pico de 1.069 casos em 2018. Isso pode ser devido a vários fatores, como o tamanho da população, o status socioeconômico, o acesso a serviços de saúde mental, entre outros.

- **Roraima (RR)**: Esta unidade federativa tem a menor quantidade de óbitos em todos os anos, com um pico de 7 casos em 2018. Isso pode ser devido a uma população menor, diferentes fatores socioeconômicos, ou uma variedade de outras possíveis razões.

- **Outras unidades federativas**: As outras unidades federativas apresentam números variados de óbitos por suicídio ao longo do tempo, indicando que a taxa de suicídio pode variar significativamente de uma localidade para outra e ao longo do tempo.

Essas tendências sugerem que as taxas de suicídio podem variar significativamente entre diferentes localidades e ao longo do tempo.

### **4. Métodos de suicídio**

In [160]:
# suicidios por causas_basicas_obito
df_causa = df.groupby("causas_basicas_obito").count()["uf_obito"]

# renomeando as colunas de df_causa
df_causa = (
    df_causa.reset_index()
    .rename(columns={"uf_obito": "qtd_obitos"})
    .sort_values(ascending=False, by="qtd_obitos")
)

df_causa

Unnamed: 0,causas_basicas_obito,qtd_obitos
87,X700,15002
96,X709,2489
124,X740,1010
95,X708,996
91,X704,740
...,...,...
55,X655,1
53,X652,1
52,X651,1
47,X646,1


In [164]:
# representando os valores da coluna causas_basicas_obito em porcentagem
df_causa["porcentagem"] = (df_causa["qtd_obitos"] / df_causa["qtd_obitos"].sum()) * 100

# arredondando os valores da coluna porcentagem
df_causa["porcentagem"] = df_causa["porcentagem"].round(2)

df_causa

Unnamed: 0,causas_basicas_obito,qtd_obitos,porcentagem
87,X700,15002,50.71
96,X709,2489,8.41
124,X740,1010,3.41
95,X708,996,3.37
91,X704,740,2.50
...,...,...,...
55,X655,1,0.00
53,X652,1,0.00
52,X651,1,0.00
47,X646,1,0.00


In [166]:
# grafico de barras com as maiores causas de obitos
fig = px.bar(
    df_causa.head(10),
    x="causas_basicas_obito",
    y="qtd_obitos",
    title="Maiores causas de óbitos por suicídio",
    template="ggplot2",
    text="porcentagem",
)

# nomeando os eixos
fig.update_layout(
    xaxis_title="Causas básicas de óbito",
    yaxis_title="Quantidade de óbitos (%)",
    font=dict(size=12, color="#000000"),
)

fig.show()

### Conclusão 6:

Com base no gráfico obtido, podemos observar as seguintes tendências nos métodos de suicídio ao longo do tempo:

- **Diferenças significativas entre métodos**: Existem diferenças notáveis nos métodos de suicídio ao longo do tempo. Por exemplo, o X700 tem sido consistentemente o método mais comum de suicídio em todos os anos observados.

- **X700**: Este método tem sido consistentemente o mais comum em todos os anos, correspondendo a mais de 50% dos casos de suicídio de 2014 a 2018. Isso pode ser devido a vários fatores, como o acesso a meios letais, a facilidade de uso e a eficácia.

Breve descrição do método X700: O código X700 na Classificação Internacional de Doenças (CID 10) refere-se a uma lesão autoinfligida intencionalmente causada por enforcamento, estrangulamento e sufocação em casa.

### **5. Prevenção de suicídio**