<h1 align="center">ANÁLISE DE DADOS DE SUICÍDIO NO BRASIL</h1>
<h4 align="center">Entre os anos de 2000 à 2015</h4>

--------------------------------------------------------------------------------

<h3 align="center"> Disclaimer / Aviso Legal ⚠️</h3>
<p align="center">Este notebook tem um fim único e exclusivamente didático, para alunos da FATEC, como uma introdução à Análise de Dados Públicos.
Desse modo, está excluída a garantia ou responsabilidade de qualquer tipo, por exemplo, de precisão, confiabilidade, completude e atualidade das informações.</p>


--------------------------------------------------------------------------

Análise da taxa de suicidio no Brasil
--------------------------------------------------------

#### 🔹 Atividades na primeira semana
- ✔ Importação das bibliotecas que serão utilizadas
- ✔ Importação do primeiro DataSet 'suicidio 2016'
- Análise do tamanho do arquivo (Linhas x Colunas)
- Análise de informações detalhadas da tabela
- Limpeza dos dados: deixar apenas o que vai ser utilizado



---


<h2 align="center">Importação das Bibliotecas 📥<h2>

In [1]:
# Importando bibiotecas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [2]:
# Alterando a visualização do tamanho da tabela
pd.set_option("display.max_rows", 400)



---


<h2 align="center">Importando o primeiro DataSet com dados dos anos de 1987 - 2015</h2>

In [3]:
# Importando o DataSet de dados com os casos de Covid-19
dados_mundiais = pd.read_csv('https://gist.githubusercontent.com/littlebru/c14170c16839c58ce3ab939cc2dba675/raw/354afe9457639a8fe4d9d60253997a6284cd7a01/suicide_1987-2016.csv')

In [4]:
# 5 primeiras linhas do primeiro DataSet
dados_mundiais.head()

Unnamed: 0,country,year,sex,age,suicides_no,population,suicides/100k pop,country-year,HDI for year,gdp_for_year ($),gdp_per_capita ($),generation
0,Albania,1987,male,15-24 years,21,312900,6.71,Albania1987,,2156624900,796,Generation X
1,Albania,1987,male,35-54 years,16,308000,5.19,Albania1987,,2156624900,796,Silent
2,Albania,1987,female,15-24 years,14,289700,4.83,Albania1987,,2156624900,796,Generation X
3,Albania,1987,male,75+ years,1,21800,4.59,Albania1987,,2156624900,796,G.I. Generation
4,Albania,1987,male,25-34 years,9,274300,3.28,Albania1987,,2156624900,796,Boomers


-----------------------------------------------

<h1 align="center">Informações detalhadas do DataSet 🧾</h1>

Nos códigos abaixo, eu vou estar extraindo informações do tipo:
- Total de linhas e colunas do dataset
- Tipos de dados existentes
- Listagem de todas as colunas
- Verificação da existência de dados NAN (Not a Number)

<h4 align="center"><strong>DataSet 1</strong></h4>


In [5]:
# Total de linhas X colunas
dados_mundiais.shape

(27820, 12)

In [6]:
# Listando os nomes das colunas
list(dados_mundiais.columns)

['country',
 'year',
 'sex',
 'age',
 'suicides_no',
 'population',
 'suicides/100k pop',
 'country-year',
 'HDI for year',
 ' gdp_for_year ($) ',
 'gdp_per_capita ($)',
 'generation']

In [7]:
# Visualizando o tipo das informações em cada coluna
dados_mundiais.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 27820 entries, 0 to 27819
Data columns (total 12 columns):
country               27820 non-null object
year                  27820 non-null int64
sex                   27820 non-null object
age                   27820 non-null object
suicides_no           27820 non-null int64
population            27820 non-null int64
suicides/100k pop     27820 non-null float64
country-year          27820 non-null object
HDI for year          8364 non-null float64
 gdp_for_year ($)     27820 non-null object
gdp_per_capita ($)    27820 non-null int64
generation            27820 non-null object
dtypes: float64(2), int64(4), object(6)
memory usage: 1.9+ MB


In [8]:
# Exibindo a descrição dos dados e alterando as linhas em colunas e colunas em linhas
dados_mundiais.describe().T

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
year,27820.0,2001.258,8.469055,1985.0,1995.0,2002.0,2008.0,2016.0
suicides_no,27820.0,242.5744,902.0479,0.0,3.0,25.0,131.0,22338.0
population,27820.0,1844794.0,3911779.0,278.0,97498.5,430150.0,1486143.25,43805210.0
suicides/100k pop,27820.0,12.8161,18.96151,0.0,0.92,5.99,16.62,224.97
HDI for year,8364.0,0.7766011,0.09336671,0.483,0.713,0.779,0.855,0.944
gdp_per_capita ($),27820.0,16866.46,18887.58,251.0,3447.0,9372.0,24874.0,126352.0


In [9]:
# Fazendo uma transposição dos dados e ordenação pela média
dados_mundiais.describe().sort_values(by='mean', axis= 1).T

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
HDI for year,8364.0,0.7766011,0.09336671,0.483,0.713,0.779,0.855,0.944
suicides/100k pop,27820.0,12.8161,18.96151,0.0,0.92,5.99,16.62,224.97
suicides_no,27820.0,242.5744,902.0479,0.0,3.0,25.0,131.0,22338.0
year,27820.0,2001.258,8.469055,1985.0,1995.0,2002.0,2008.0,2016.0
gdp_per_capita ($),27820.0,16866.46,18887.58,251.0,3447.0,9372.0,24874.0,126352.0
population,27820.0,1844794.0,3911779.0,278.0,97498.5,430150.0,1486143.25,43805210.0




---



<h1 align="center">Limpando os Dados do primeiro DataSet 🧼</h1>

Abaixo eu vou estar realizando uma "limpeza" nos dados, como:
- Renomeando colunas
- Tratando valores nulos
- Removendo linhas e colunas que não serão utilizadas na análise
- Criação de DataFrames que serão utilizados nos gráficos

In [10]:
# Renomeando as Colunas
dados_mundiais.rename(columns={'country': 'país', 'year':'ano', 'sex':'genero', 'age': 'idade', 'suicides_no':'numero_de_suicidios', 'population':'população', 'HDI for year':'IDH por ano'}, inplace=True)

In [11]:
# Removendo colunas que não serão utilizadas na análise
dados_mundiais = dados_mundiais.drop(columns={'suicides/100k pop', 'country-year',' gdp_for_year ($) ', 'gdp_per_capita ($)', 'generation', 'IDH por ano'})

In [12]:
dados_br = dados_mundiais[dados_mundiais.país == 'Brazil']

In [13]:
# Verificando a quantidade de dados nulos
dados_br.isnull().sum()

país                   0
ano                    0
genero                 0
idade                  0
numero_de_suicidios    0
população              0
dtype: int64

In [14]:
dados_br.head()

Unnamed: 0,país,ano,genero,idade,numero_de_suicidios,população
4172,Brazil,1985,male,75+ years,129,840300
4173,Brazil,1985,male,55-74 years,535,5364900
4174,Brazil,1985,male,35-54 years,1011,11986300
4175,Brazil,1985,male,25-34 years,791,10762900
4176,Brazil,1985,male,15-24 years,661,13834000



---



<h1 align="center">Destaque dos dados 🎨</h1>

Abaixo estão algumas visualizações dos dados, como:
- Maior numero de suicidios
- Menor numero de suicidios
- Mapa de cores do numero de suicidios

(Esses dados estão sendo visualizados por enquanto nas próprias tabelas, com o método de mapa de cores e destaque nos dados com **styler**)

In [15]:
# Utilizando mapa de cores para visualizar os maiores e menores valores nos numeros de suicidios
dados_br.style.background_gradient(subset=['numero_de_suicidios'], cmap='cool')

Unnamed: 0,país,ano,genero,idade,numero_de_suicidios,população
4172,Brazil,1985,male,75+ years,129,840300
4173,Brazil,1985,male,55-74 years,535,5364900
4174,Brazil,1985,male,35-54 years,1011,11986300
4175,Brazil,1985,male,25-34 years,791,10762900
4176,Brazil,1985,male,15-24 years,661,13834000
4177,Brazil,1985,female,75+ years,32,988100
4178,Brazil,1985,female,55-74 years,148,5650100
4179,Brazil,1985,female,25-34 years,269,10798700
4180,Brazil,1985,female,35-54 years,296,12185200
4181,Brazil,1985,female,15-24 years,280,13751800


<h4 align="center">Suicidio entre Homens🙎‍♂️ e Mulheres 🙎 </h4>

In [16]:
# Criando DataFrames de Mulheres e Homens

dados_homens_brasileiros = pd.DataFrame(dados_br.query('genero == "male"'))

dados_mulheres_brasileiras = pd.DataFrame(dados_br.query('genero == "female"'))

In [17]:
# Maior taxa de mortes entre homens
dados_homens_brasileiros.tail(20).style.highlight_max(subset="numero_de_suicidios", color="#f76773")

Unnamed: 0,país,ano,genero,idade,numero_de_suicidios,população
4500,Brazil,2012,male,15-24 years,1313,17644319
4506,Brazil,2012,male,5-14 years,79,16810876
4508,Brazil,2013,male,75+ years,370,2240434
4509,Brazil,2013,male,55-74 years,1474,12036068
4510,Brazil,2013,male,35-54 years,3053,25965164
4511,Brazil,2013,male,25-34 years,2004,17534209
4512,Brazil,2013,male,15-24 years,1317,17627508
4518,Brazil,2013,male,5-14 years,72,16555477
4520,Brazil,2014,male,75+ years,390,2349303
4521,Brazil,2014,male,55-74 years,1534,12492114


In [18]:
# Menor taxa de mortes entre homens
dados_homens_brasileiros.head(20).style.highlight_min(subset="numero_de_suicidios", color="#3cd0e0")

Unnamed: 0,país,ano,genero,idade,numero_de_suicidios,população
4172,Brazil,1985,male,75+ years,129,840300
4173,Brazil,1985,male,55-74 years,535,5364900
4174,Brazil,1985,male,35-54 years,1011,11986300
4175,Brazil,1985,male,25-34 years,791,10762900
4176,Brazil,1985,male,15-24 years,661,13834000
4183,Brazil,1985,male,5-14 years,35,15693700
4184,Brazil,1986,male,75+ years,103,823700
4185,Brazil,1986,male,55-74 years,581,5492100
4186,Brazil,1986,male,35-54 years,967,12396000
4187,Brazil,1986,male,25-34 years,754,9895200


In [19]:
# Maior taxa de mortes entre mulheres
dados_mulheres_brasileiras.tail(20).style.highlight_max(subset="numero_de_suicidios", color="#f76773")

Unnamed: 0,país,ano,genero,idade,numero_de_suicidios,população
4505,Brazil,2012,female,15-24 years,383,17145894
4507,Brazil,2012,female,5-14 years,41,16175024
4513,Brazil,2013,female,35-54 years,897,27475364
4514,Brazil,2013,female,55-74 years,433,14022927
4515,Brazil,2013,female,75+ years,88,3462431
4516,Brazil,2013,female,25-34 years,393,17492228
4517,Brazil,2013,female,15-24 years,362,17123318
4519,Brazil,2013,female,5-14 years,50,15923724
4525,Brazil,2014,female,35-54 years,871,27971096
4526,Brazil,2014,female,55-74 years,389,14550395


In [20]:
# Menor taxa de mortes entre mulheres
dados_mulheres_brasileiras.head(25).query('genero == "female"').style.highlight_min(subset="numero_de_suicidios", color="#3cd0e0")

Unnamed: 0,país,ano,genero,idade,numero_de_suicidios,população
4177,Brazil,1985,female,75+ years,32,988100
4178,Brazil,1985,female,55-74 years,148,5650100
4179,Brazil,1985,female,25-34 years,269,10798700
4180,Brazil,1985,female,35-54 years,296,12185200
4181,Brazil,1985,female,15-24 years,280,13751800
4182,Brazil,1985,female,5-14 years,41,15622900
4189,Brazil,1986,female,75+ years,33,1079400
4190,Brazil,1986,female,55-74 years,163,6093600
4191,Brazil,1986,female,35-54 years,335,13195700
4192,Brazil,1986,female,15-24 years,331,13514000
