<img src="http://sonetodigital.com.br/adm/wp-content/uploads/2018/12/logo-fiap.png" width="150" align="left"/>

<br/><br/>

<font size=5 color="#ed145b"><b> Inteligência Artificial e Machine Learning </b></font>

<font size=5 color="#ed145b"> NAC1 - Análise Exploratória de Dados </font>

O governo do estado de São Paulo solicitou ao nosso grupo uma análise dos crimes ocorridos no estado em 2016. O governo quer saber qual cidade tem maior número de ocorrência, qual é o crime mais cometido, qual a delegacia que mais registra boletins de ocorrência e as possíveis relações entre esses dados.

Nós recebemos um arquivo que contém os dados relativos ao ano de 2016 e fizemos as análises abaixo.

In [1]:
import numpy as np
import pandas as pd

pd.set_option("display.precision", 3)
pd.set_option("display.max_columns",300)

O arquivo que recebemos contém informações como: Número do BO, ID da Delegacia, Nome do Departamento, etc. Dê uma olhada na parte inicial dele:

In [2]:
df = pd.read_csv("../data/crimes_2016.csv", sep="\s*,\s*", engine="python", error_bad_lines=False, warn_bad_lines=False)
df.head()

Unnamed: 0,NUM_BO,ANO_BO,ID_DELEGACIA,NOME_DEPARTAMENTO,NOME_SECCIONAL,DELEGACIA,NOME_DEPARTAMENTO_CIRC,NOME_SECCIONAL_CIRC,NOME_DELEGACIA_CIRC,ANO,MES,FLAG_STATUS,RUBRICA,DESDOBRAMENTO,CONDUTA,LATITUDE,LONGITUDE,CIDADE,LOGRADOURO,NUMERO_LOGRADOURO,FLAG_STATUS.1
0,10957,2016,20249,DECAP,DEL.SEC.8º SAO MATEUS,49º D.P. SAO MATEUS,DECAP,DEL.SEC.8º SAO MATEUS,49º D.P. SAO MATEUS,2016,10,C,A.I.-Furto (art. 155),,RESIDENCIA,-23.594,-46.483,S.PAULO,RUA ANDRE DE ALMEIDA,1260.0,C
1,1672,2016,20230,DECAP,DEL.SEC.5º LESTE,30º D.P. TATUAPE,DECAP,DEL.SEC.5º LESTE,30º D.P. TATUAPE,2016,5,C,Roubo (art. 157),,TRANSEUNTE,-23.543,-46.562,S.PAULO,RUA MONTE SERRAT,500.0,C
2,211,2016,10376,DECAP,DEL.SEC.3º OESTE,09ª DEL.DEF.MUL. OESTE,DECAP,DEL.SEC.3º OESTE,87º D.P. V. P. BARRETO,2016,2,C,Lesão corporal (art 129 § 9º),,,-23.481,-46.718,S.PAULO,AVENIDA COMENDADOR FEIZ ZARZUR,100.0,C
3,4438,2016,10323,DECAP,DEL.SEC.3º OESTE,23º D.P. PERDIZES,DECAP,DEL.SEC.3º OESTE,23º D.P. PERDIZES,2016,9,C,Lesão corporal (art. 129),,,-23.532,-46.664,S.PAULO,AVENIDA FRANCISCO MATARAZZO,1028.0,C
4,676155,2016,900020,DIPOL - DEPTO DE INTELIGENCIA,DELEGACIA ELETRONICA,DELEGACIA ELETRONICA,DECAP,DEL.SEC.1º CENTRO,04º D.P. CONSOLAÇÃO,2016,5,C,Furto (art. 155),,TRANSEUNTE,-23.554,-46.659,S.PAULO,RUA BELA CINTRA,670.0,C


Ao todo, são 44.741 linhas de dados, divididas em 21 colunas.

In [3]:
df.shape

(44741, 21)

Atendendo a função que fomos designados a fazer, nós primeiro identificamos que a cidade com o maior número de ocorrências é São Paulo. Isso não é nenhuma surpresa, pois SP é a cidade mais extensa e com maior número de habitantes. O número de crimes ocorridos na cidade de São Paulo é dezenas de milhares de vezes maior do que nas outras cidades. São 29.588 casos.

In [4]:
df['CIDADE'].value_counts().head()

S.PAULO                29588
GUARULHOS               2052
S.BERNARDO DO CAMPO     1661
S.ANDRE                 1629
OSASCO                  1536
Name: CIDADE, dtype: int64

Depois de identificar a cidade com o maior número de crimes, nós analisamos qual foi o crime mais recorrente no estado. De acordo com os dados, o crime mais cometido foi roubo. O topo da lista de crimes é marcado por 19.726 casos de roubo, vindo em seguida o furto, com 18.568 ocorrências.

Com os dados que temos a nossa disposição, não conseguimos encontrar algo que dê base, ou que justifique de alguma maneira, o fato do roubo ser o crime mais cometido.

In [5]:
df['RUBRICA'].value_counts().head()

Roubo (art. 157)                                                     19726
Furto (art. 155)                                                     18568
Lesão corporal (art. 129)                                             2862
Lesão corporal culposa na direção de veículo automotor (Art. 303)     1900
Lesão corporal (art 129 § 9º)                                          837
Name: RUBRICA, dtype: int64

E então nós passamos para a análise de qual delegacia registrou mais boletins de ocorrência.

A que teve mais registros foi a Delegacia Eletrônica. O número de registro supera em muito o das demais delegacias. São 17.096 boletins registrados na Delegacia Eletrônica. Acreditamos que isso se dá pela facilidade, por ser menos burocrático e pelo fato de a vítima não ter que se locomover até uma unidade policial.

In [6]:
df['DELEGACIA'].value_counts().head()

DELEGACIA ELETRONICA        17096
POLICIA MILITAR               552
49º D.P.  SAO MATEUS          411
73º D.P. JACANA               386
50º D.P.  ITAIM PAULISTA      383
Name: DELEGACIA, dtype: int64

Depois de analisarmos a cidade, o crime e a delegacia com os maiores índices, nós fizemos algumas análises sobre como eles se relacionam...

In [7]:
crd = df[['CIDADE', 'RUBRICA', 'DELEGACIA']]

Primeiro relacionamos o roubo à cidade de São Paulo. Identificamos que dos 19.726 casos de roubo no estado, 12.950 foram na cidade de SP. Esse é um dado impressionante!

Ainda que a cidade de São Paulo seja maior do que as outras, e tenha muito mais habitantes, a discrepância do número de roubos é MUITO grande.

In [8]:
crd.loc[(df.RUBRICA == 'Roubo (art. 157)') & (df.CIDADE == 'S.PAULO'), :]

Unnamed: 0,CIDADE,RUBRICA,DELEGACIA
1,S.PAULO,Roubo (art. 157),30º D.P. TATUAPE
6,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
7,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
13,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
25,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
30,S.PAULO,Roubo (art. 157),101º D.P. JDIM IMBUIAS
31,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
37,S.PAULO,Roubo (art. 157),66º D.P. JDIM ARICANDUVA
42,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
44,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA


Depois analisamos a relação entre os BOs na delegacia eletrônica e a cidade de São Paulo. Descobrimos que dos 17.096 registros feitos na delegacia eletrônica, 12.525 são da cidade de São Paulo. A grande maioria.

Acreditamos que isso se dá pelo fato de a cidade de São Paulo ter tecnologia mais desenvolvida e acesso à internet facilitado.

In [9]:
crd.loc[(df.DELEGACIA == 'DELEGACIA ELETRONICA') & (df.CIDADE == 'S.PAULO'), :]

Unnamed: 0,CIDADE,RUBRICA,DELEGACIA
4,S.PAULO,Furto (art. 155),DELEGACIA ELETRONICA
5,S.PAULO,Furto (art. 155),DELEGACIA ELETRONICA
6,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
7,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
12,S.PAULO,Furto (art. 155),DELEGACIA ELETRONICA
13,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
15,S.PAULO,Furto (art. 155),DELEGACIA ELETRONICA
20,S.PAULO,Furto (art. 155),DELEGACIA ELETRONICA
21,S.PAULO,Furto (art. 155),DELEGACIA ELETRONICA
25,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA


E então nós analisamos a quantidade de roubos registrados na delegacia eletrônica... Existem 7.389 registros de roubo na delegacia eletrônica.

In [10]:
crd.loc[(df.RUBRICA == 'Roubo (art. 157)') & (df.DELEGACIA == 'DELEGACIA ELETRONICA'), :]

Unnamed: 0,CIDADE,RUBRICA,DELEGACIA
6,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
7,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
13,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
25,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
31,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
34,OSASCO,Roubo (art. 157),DELEGACIA ELETRONICA
41,FERRAZ DE VASCONCELOS,Roubo (art. 157),DELEGACIA ELETRONICA
42,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
44,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
63,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA


Por fim, analisamos os três juntos. Os roubos cometidos na cidade de São Paulo e registrados na delegacia eletrônica. Cruzando esses dados, chegamos ao número 5.046.

In [11]:
crd.loc[(df.CIDADE == 'S.PAULO') & (df.RUBRICA == 'Roubo (art. 157)') & (df.DELEGACIA == 'DELEGACIA ELETRONICA'), :]

Unnamed: 0,CIDADE,RUBRICA,DELEGACIA
6,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
7,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
13,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
25,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
31,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
42,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
44,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
63,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
71,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA
74,S.PAULO,Roubo (art. 157),DELEGACIA ELETRONICA


Concluímos a nossa análise exploratória sabendo que, no ano de 2016, a cidade com maior índice de criminalidade foi São Paulo, o crime mais cometido foi o roubo e a delegacia com maior número de boletins de ocorrência foi a delegacia eletrônica. Descobrimos também que a grande maioria dos roubos no estado ocorreram na cidade de São Paulo, assim como a maioria dos registros na delegacia eletrônica.