<h1 align="center">ANÁLISE DE DADOS DE SUICÍDIO NO BRASIL</h1>
<h4 align="center">Entre os anos de 2000 à 2016</h4>

--------------------------------------------------------------------------------

<h3 align="center"> Disclaimer / Aviso Legal ⚠️</h3>
<p align="center">Este notebook tem um fim único e exclusivamente didático, para alunos da FATEC, como uma introdução à Análise de Dados Públicos.
Desse modo, está excluída a garantia ou responsabilidade de qualquer tipo, por exemplo, de precisão, confiabilidade, completude e atualidade das informações.</p>


--------------------------------------------------------------------------

Análise da taxa de suicidio no Brasil
--------------------------------------------------------

#### 🔹 Atividades na primeira semana
- ✔ Importação das bibliotecas que serão utilizadas
- ✔ Importação do primeiro DataSet 'suicidio 2016'
- Análise do tamanho do arquivo (Linhas x Colunas)
- Análise de informações detalhadas da tabela
- Limpeza dos dados: deixar apenas o que vai ser utilizado

# Indice do status da atividades

| |||
|---------------|--------------------|-----------------|
|✔ - Finalizado| 🔹 - Desenvolvendo | 🔸- Não iniciado|

In [None]:
# Importando bibiotecas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

<h2 align="center">Importando o primeiro DataSet com dados dos anos de 1987 - 2016</h2>

In [None]:
# Importando o DataSet de dados com os casos de Covid-19
dados_mundiais_d1 = pd.read_csv('https://gist.githubusercontent.com/littlebru/c14170c16839c58ce3ab939cc2dba675/raw/354afe9457639a8fe4d9d60253997a6284cd7a01/suicide_1987-2016.csv')

In [None]:
# 5 primeiras linhas do primeiro DataSet
dados_mundiais_d1.head()

Unnamed: 0,country,year,sex,age,suicides_no,population,suicides/100k pop,country-year,HDI for year,gdp_for_year ($),gdp_per_capita ($),generation
0,Albania,1987,male,15-24 years,21,312900,6.71,Albania1987,,2156624900,796,Generation X
1,Albania,1987,male,35-54 years,16,308000,5.19,Albania1987,,2156624900,796,Silent
2,Albania,1987,female,15-24 years,14,289700,4.83,Albania1987,,2156624900,796,Generation X
3,Albania,1987,male,75+ years,1,21800,4.59,Albania1987,,2156624900,796,G.I. Generation
4,Albania,1987,male,25-34 years,9,274300,3.28,Albania1987,,2156624900,796,Boomers


<h1 align="center">Importando Dados do Segundo DataSet</h1>

In [None]:
dmd2 = pd.read_csv('https://gist.githubusercontent.com/littlebru/c14170c16839c58ce3ab939cc2dba675/raw/354afe9457639a8fe4d9d60253997a6284cd7a01/suicide_statistics.csv')

In [None]:
# 5 primeiras linhas do segundo DataSet
dmd2.head()

Unnamed: 0,country,year,sex,age,suicides_no,population
0,Albania,1985,female,15-24 years,,277900.0
1,Albania,1985,female,25-34 years,,246800.0
2,Albania,1985,female,35-54 years,,267500.0
3,Albania,1985,female,5-14 years,,298300.0
4,Albania,1985,female,55-74 years,,138700.0


-----------------------------------------------

<h1 align="center">Informações detalhadas dos DataSets 🧾</h1>

Nos códigos abaixo, eu vou estar extraindo informações do tipo:
- Total de linhas e colunas do dataset
- Tipos de dados existentes
- Listagem de todas as colunas

**DataSet 1**


In [None]:
# Total de linhas X colunas
dados_mundiais_d1.shape

(27820, 12)

In [None]:
# Tipos de dados existentes na tabela
dados_mundiais_d1.dtypes

country                object
year                    int64
sex                    object
age                    object
suicides_no             int64
population              int64
suicides/100k pop     float64
country-year           object
HDI for year          float64
 gdp_for_year ($)      object
gdp_per_capita ($)      int64
generation             object
dtype: object

In [None]:
list(dados_mundiais_d1.columns)

['country',
 'year',
 'sex',
 'age',
 'suicides_no',
 'population',
 'suicides/100k pop',
 'country-year',
 'HDI for year',
 ' gdp_for_year ($) ',
 'gdp_per_capita ($)',
 'generation']

**DataSet 2**

In [None]:
#Total de linhas x colunas
dmd2.shape

(43776, 6)

In [None]:
#Tipos de dados existentes na tabela
dmd2.dtypes

country         object
year             int64
sex             object
age             object
suicides_no    float64
population     float64
dtype: object

In [None]:
list(dmd2.columns)

['country', 'year', 'sex', 'age', 'suicides_no', 'population']

## Limpando os Dados 🧼

Abaixo eu vou estar realizando uma "limpeza" nos dados, como:
- Substituindo valores nulos
- Removendo linhas e colunas que não serão utilizadas na análise

In [None]:
#Análise do número de ocorrências de cada país
dmd2['country'].value_counts()

Mauritius                   456
Romania                     456
United States of America    456
Iceland                     456
Netherlands                 456
                           ... 
Saudi Arabia                 24
Macau                        12
Cabo Verde                   12
Iraq                         12
Zimbabwe                     12
Name: country, Length: 141, dtype: int64

In [None]:
#Verificação de campos nulos
qds = dmd2.query('country == "Brazil"')
qds.isnull().sum()

country        0
year           0
sex            0
age            0
suicides_no    0
population     0
dtype: int64

In [None]:
#Contagem para certificar que pegamos todas as aparições do Brasil
dados = pd.DataFrame(dmd2['country'])
dados.query('country == "Brazil"').count

<bound method DataFrame.count of      country
6204  Brazil
6205  Brazil
6206  Brazil
6207  Brazil
6208  Brazil
...      ...
6643  Brazil
6644  Brazil
6645  Brazil
6646  Brazil
6647  Brazil

[444 rows x 1 columns]>

In [None]:
#Criação de um DataFrame apenas com os dados Brasil
df = dmd2[6204:6648]
bai = pd.DataFrame(df)
bai

Unnamed: 0,country,year,sex,age,suicides_no,population
6204,Brazil,1979,female,15-24 years,385.0,12448100.0
6205,Brazil,1979,female,25-34 years,227.0,8867900.0
6206,Brazil,1979,female,35-54 years,269.0,10282200.0
6207,Brazil,1979,female,5-14 years,47.0,14135000.0
6208,Brazil,1979,female,55-74 years,121.0,4678800.0
...,...,...,...,...,...,...
6643,Brazil,2015,male,25-34 years,1897.0,17625976.0
6644,Brazil,2015,male,35-54 years,3238.0,26989063.0
6645,Brazil,2015,male,5-14 years,79.0,16057040.0
6646,Brazil,2015,male,55-74 years,1693.0,12987357.0
