# **PROJETO FACÇÕES**

![](projeto-faccoes.jpg)


# **Bibliotecas**

## Instalação das bibliotecas necessárias

In [2]:
# !pip install gspread -U -q
# !pip install gmaps -U -q
# !pip install googlemaps -U -q
# !pip install geopandas -U -q
# !pip install folium -U -q

## Importando as bibliotecas.


In [3]:
%matplotlib inline
# importar biblioteca Pandas
import pandas as pd

# importar Matplotlib biblioteca de gráficos
import matplotlib.pyplot as plt

# importar Seaborn biblioteca de gráficos
import seaborn as sns

import geopandas as gpd

# Importar Numpy, train_test_split
import numpy as np
from sklearn.model_selection import train_test_split

# importa o modelo de regressão linear, metrics, r2_score
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
from sklearn import metrics

from sklearn.preprocessing import OrdinalEncoder

from sklearn.preprocessing import LabelEncoder

# acesso ao so e ao sys
import os
import sys

# Garbage collector, para recuperar memória após carregar o dataset inicial
import gc

import graphviz.backend as be
import statistics as sts

# Importar algoritmo
# from dtreeviz.trees import *
from IPython.display import Image, display_svg, SVG
from sklearn.tree import DecisionTreeClassifier, DecisionTreeRegressor
from mpl_toolkits.mplot3d import axes3d

# import dtreeviz

random_state = 1234

# controlar as notificações
from sklearn.exceptions import ConvergenceWarning
import warnings

warnings.simplefilter(action="ignore", category=FutureWarning)
warnings.simplefilter("ignore", category=ConvergenceWarning)

pd.set_option("display.max_columns", None)
pd.set_option("display.max_rows", None)
pd.set_option("display.width", None)
pd.set_option("display.float_format", lambda x: "%.8f" % x)

%config InlineBackend.figure_format = 'retina' # Make visualizations look good
# %config InlineBackend.figure_format = 'svg'
%matplotlib inline

# **1. Preparando o Ambiente**


## Carregando o conjunto de dados


NOME DOS CAMPOS NO GOOGLE PLANILHA
====================================
Carimbo de data/hora (A1)
Endereço de e-mail (A2)
Foto recente (A3)
Fotos das tatuagens (A4)
Nome completo (A5)
Vulgo ou Alcunha (A6)
Filiação (A7)
Data de nascimento (A8)
CPF (A9)
RG (A10)
Órgão expedidor (A11)
CNH (A12)
UF da CNH (A13)
Função na facção (A14)
Área de atuação (A15)
Área(s) que já atuou (A16)
BO(s) (A17)
Registro na SERIS como reeducando (A18)
Período como reeducando (em caso de SIM) (A19)
Situação jurídica (A20)
Alvo da SSPAL	(A21)
Qual Operação foi Alvo (A22)
Ocorrências de destaque (A23)
Pena em Presídio Federal (A24)
Qual Presídio e Estado (A25)
Endereço Atual (A26)
Endereço Anterior (A27)
Endereço de algum familiar (A28)
CEP (A29)
Latitude (A30)
Logitude (A31)
Tornozeleira (A32)
Redes Sociais (A33)
Registro de homízio (A34)
Informações de homízidio (A35)
Parentes no Crime (A36)
Informações de Parentes criminosos (A37)
Nome Completo do Conjugue (A38)
Tempo com o Conjugue  (A39)
Tipos dos Bens (A40)
Descrição dos Bens (A41)
Observações (A42)
Qual à facção (A43)
Bairro Atual (A44)
Cidade Atual (A45)
UF Atual (A46)
Tipo de Rede Social (A47)
Histórico (A48)

In [4]:
column_names = [
    "A1",
    "A2",
    "A3",
    "A4",
    "A5",
    "A6",
    "A7",
    "A8",
    "A9",
    "A10",
    "A11",
    "A12",
    "A13",
    "A14",
    "A15",
    "A16",
    "A17",
    "A18",
    "A19",
    "A20",
    "A21",
    "A22",
    "A23",
    "A24",
    "A25",
    "A26",
    "A27",
    "A28",
    "A29",
    "A30",
    "A31",
    "A32",
    "A33",
    "A34",
    "A35",
    "A36",
    "A37",
    "A38",
    "A39",
    "A40",
    "A41",
    "A42",
    "A43",
    "A44",
    "A45",
    "A46",
    "A47",
    "A48",
]

## 1.1 Google Planilha

### 1.1.1. Buscando os dados da Planilha: "Projeto Facções Criminosas (respostas).csv"

In [5]:
#!wget --no-check-certificate "https://docs.google.com/spreadsheets/d/1ON1_havmapkHsa8SlWS_lXmbzwmxUs2YgkeZHtLpMyQ/export?format=csv" -O "Projeto Facções Criminosas (respostas).csv"

### 1.1.2 Acessando à Google Planilha (google sheets)

In [6]:
name_csv = "Projeto Facções Criminosas (respostas).csv"
name_google_plan = "Projeto Facções Criminosas (respostas)"

In [7]:
if "google.colab" in sys.modules:

    from google.colab import auth
    from google.auth import default
    import gspread

    auth.authenticate_user()
    creds, _ = default()
    gc = gspread.authorize(creds)

    worksheet = gc.open(name_google_plan).sheet1

    rows = worksheet.get_all_values()


    df = pd.DataFrame.from_records(rows, columns=column_names)

else:
    df = pd.read_csv(name_csv, encoding="utf-8")

In [70]:
df.shape

(231, 48)

In [8]:
# df = df.iloc[0:]

In [9]:
df.columns

Index(['Carimbo de data/hora', 'Endereço de e-mail', 'Foto recente',
       'Fotos das tatuagens', 'Nome completo', 'Vulgo ou Alcunha', 'Filiação',
       'Data de nascimento', 'CPF', 'RG', 'Órgão expedidor', 'CNH',
       'UF da CNH', 'Função na facção ', 'Área de atuação ',
       'Área(s) que já atuou', 'BOs', 'Registro na SERIS como reeducando ',
       'Período como reeducando (em caso de SIM)', 'Situação jurídica ',
       'Alvo da SSPAL', 'Qual Operação foi Alvo', 'Ocorrências de destaque ',
       'Pena em Presídio Federal', 'Qual Presídio e Estado', 'Endereço Atual',
       'Endereço Anterior', 'Endereço de algum familiar', 'CEP Atual',
       'Latitude', 'Longitude', 'Tornozeleira', 'ID da Redes Sociais',
       'Registro de homízio', 'Informações de homízidio', 'Parentes no Crime',
       'Informações de Parentes criminosos', 'Nome Completo do Conjugue',
       'Tempo com o Conjugue', 'Tipos dos Bens', 'Descrição dos Bens',
       'Observações', 'Qual à Facção', 'Bairro Atua

In [10]:
df.head(5)

Unnamed: 0,Carimbo de data/hora,Endereço de e-mail,Foto recente,Fotos das tatuagens,Nome completo,Vulgo ou Alcunha,Filiação,Data de nascimento,CPF,RG,Órgão expedidor,CNH,UF da CNH,Função na facção,Área de atuação,Área(s) que já atuou,BOs,Registro na SERIS como reeducando,Período como reeducando (em caso de SIM),Situação jurídica,Alvo da SSPAL,Qual Operação foi Alvo,Ocorrências de destaque,Pena em Presídio Federal,Qual Presídio e Estado,Endereço Atual,Endereço Anterior,Endereço de algum familiar,CEP Atual,Latitude,Longitude,Tornozeleira,ID da Redes Sociais,Registro de homízio,Informações de homízidio,Parentes no Crime,Informações de Parentes criminosos,Nome Completo do Conjugue,Tempo com o Conjugue,Tipos dos Bens,Descrição dos Bens,Observações,Qual à Facção,Bairro Atual,Cidade Atual,UF Atual,Tipo de Rede Social,Histórico do Faccionado
0,19/03/2024 21:28:31,thaislima.mcz@hotmail.com,https://drive.google.com/open?id=1s1cpbkt6wqv1...,,Kayo Nascimento de Magalhães,Cabra/ 99,Micheline Gomes de Magalhães e Antônio Sérgio ...,08/01/2000,12514121493.0,40840859,SSP/AL,,,Financeiro,,Jarbas Oiticica (Rio Largo) e acampamento Dand...,SUPOSTO AUTOR DE ROUBO - 11442841-00/2015/2704...,SIM,,FORAGIDO,SIM,,,NÃO,,Complexo do Alemão/RJ,,"R. NOSSA SENHORA DA CONCEICAO , 504 , CEP:\n57...",,-22860294.0,-43273285.0,NÃO,,SIM,Informações que está homiziado no Complexo do ...,NÃO,,Amalia Natalia de Lima Santos,5 a 10 anos,,,,NI,,,,,Atua no financeiro da cúpula de Alagoas da fac...
1,20/03/2024 20:30:39,thaislima.mcz@hotmail.com,https://drive.google.com/open?id=1_KcAyEB2pc7U...,https://drive.google.com/open?id=1-_qEifQW0BVH...,José Mariano dos Santos,Rato,Maria Josefa dos Santos e Mário Pereira dos Sa...,20/05/1986,9246079477.0,,,,,Braço Direito,,,CUMPRIMENTO DE MANDADO DE PRISÃO - 09246079477...,SIM,,FORAGIDO,SIM,,,,,"Rua Yacatan, nº 95, Inhauma, Rio de Janeiro, C...","e Rua Canitar, 625, Inhauma, Rio de Janeiro/RJ...",,,-2286601688.0,-4327394383.0,NÃO,,SIM,Informações que encontra-se homiziado no Compl...,SIM,Esposa tem registro na SERIS como reeducando,SARA JULICELIA DO NASCIMENTO NOBERTO,15 a 20 anos,Empresas,"SARA MAKE UP, 43881885000198, SARA JULICELIA D...",,NI,,,,,Braço direito do líder da facção em Alagoas
2,21/03/2024 14:53:42,thaislima.mcz@hotmail.com,quinzinho - Thais Lima.jpg,cicatriz - Thais Lima.jpg,GIVALDO BARBOSA DE FRANÇA,Quinzinho,MARLY ROSA BARBOSA DE FRANÇA e JOSÉ LOPES DE F...,13/04/1981,7275481405.0,1999001021061,SSP/AL,4110193167.0,AL,Chefe/Líder,,,SUPOSTO AUTOR DE DIREÇÃO PERIGOSA DE VEÍCULO E...,SIM,,FORAGIDO,SIM,,Suspeito de ameaçar secretário de Segurança Pú...,SIM,,Complexo do Alemão/RJ,,,,-22860294.0,-43273285.0,NÃO,,SIM,Informações que está homiziado junto com outra...,SIM,"A esposa, Maria Célia da Silva, tem cadastro n...",Maria Célia da Silva,15 a 20 anos,Veículos,,,NI,,,,,"Liderança da facção na parte baixa de Maceió, ..."
3,25/03/2024 20:57:25,thaislima.mcz@hotmail.com,https://drive.google.com/open?id=1iSR7mQPMKSBk...,,José Erivaldo da Paz,Índio,MARIA HELENA DA PAZ e ANTONIO FERNANDES DA PAZ,19/11/1990,9482616413.0,33582840,SSP/AL,5310496230.0,SE,Chefe/Líder,,Arapiraca/AL (sendo oriundo do bairro Primaver...,SUPOSTO AUTOR DE HOMICÍDIO SIMPLES - 1023524...,SIM,,LIBERADO ATRAVÉS DE ALVARÁ,SIM,,"Acusado de torturar, mutilar e matar o próprio...",,,,"RUA ESMERALDO DA SILVA, 578, CASA, TABOCAS, 49...","R. ROSENDO MAIA , 603 , CEP: 57310-520\nBRASIL...",,,,NÃO,,SIM,Tem endereço da CNH cadastrado no Estado de SE...,SIM,\nO IRMÃO JOSÉ ALDERIVAN DA PAZ TEM BO DE CUMP...,,,,,,NI,,,,,Vice liderança da facção em Arapiraca e respon...
4,26/03/2024 12:14:12,p2.4bpmal@gmail.com,https://drive.google.com/open?id=1RD6PwugnwRo9...,,LUCAS MANOEL DA SILVA,PROJETO,MARIA MARGARETE CORREIA DA SILVA\nJUVENAL MANO...,26/09/1998,,\t3523498-9,SSP/AL,,,Soldado do Tráfico,CLIMA BOM/FRONTEIRA,NÃO,"ROUBO,0012-B/18-0508, JOSÉ RAFAEL FERREIRA DA ...",SIM,06/04/2018,SEMIABERTO,NÃO,,NÃO,NÃO,NÃO,"CONJUNTO JARBAS OITICICA,RIO LARGO - AL","RUA NOSSA SENHORA DA CONCEIÇÃO, N°504, CLIMA BOM","RUA NOSSA SENHORA DA CONCEIÇÃO, N°504, CLIMA BOM",57000-000,-9471995324.0,-3582215093.0,NÃO,NÃO,NÃO,NÃO,NÃO,,,,Outros bens,NÃO,SOLDADO ATIVO DO CV/BONDE DO 99,CV,,,,,"SOLDADO,CV"


In [11]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 231 entries, 0 to 230
Data columns (total 48 columns):
 #   Column                                    Non-Null Count  Dtype  
---  ------                                    --------------  -----  
 0   Carimbo de data/hora                      231 non-null    object 
 1   Endereço de e-mail                        231 non-null    object 
 2   Foto recente                              228 non-null    object 
 3   Fotos das tatuagens                       25 non-null     object 
 4   Nome completo                             230 non-null    object 
 5   Vulgo ou Alcunha                          182 non-null    object 
 6   Filiação                                  229 non-null    object 
 7   Data de nascimento                        228 non-null    object 
 8   CPF                                       197 non-null    float64
 9   RG                                        142 non-null    object 
 10  Órgão expedidor                       

 ### 1.1.2 Acessando o Google Drive

In [12]:
if "google.colab" in sys.modules:

    from google.colab import drive

    # drive.mount("/content/drive")
    drive.mount("/content/drive", force_remount=True)
    %pwd
    %cd '/content/drive/MyDrive/Colab Notebooks/faccoes'
    %pwd
    %ll -a

# **2. Análise da qualidade dos dados**

In [13]:
df.columns

Index(['Carimbo de data/hora', 'Endereço de e-mail', 'Foto recente',
       'Fotos das tatuagens', 'Nome completo', 'Vulgo ou Alcunha', 'Filiação',
       'Data de nascimento', 'CPF', 'RG', 'Órgão expedidor', 'CNH',
       'UF da CNH', 'Função na facção ', 'Área de atuação ',
       'Área(s) que já atuou', 'BOs', 'Registro na SERIS como reeducando ',
       'Período como reeducando (em caso de SIM)', 'Situação jurídica ',
       'Alvo da SSPAL', 'Qual Operação foi Alvo', 'Ocorrências de destaque ',
       'Pena em Presídio Federal', 'Qual Presídio e Estado', 'Endereço Atual',
       'Endereço Anterior', 'Endereço de algum familiar', 'CEP Atual',
       'Latitude', 'Longitude', 'Tornozeleira', 'ID da Redes Sociais',
       'Registro de homízio', 'Informações de homízidio', 'Parentes no Crime',
       'Informações de Parentes criminosos', 'Nome Completo do Conjugue',
       'Tempo com o Conjugue', 'Tipos dos Bens', 'Descrição dos Bens',
       'Observações', 'Qual à Facção', 'Bairro Atua

## 2.1 Análise de dados ausentes

In [14]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 231 entries, 0 to 230
Data columns (total 48 columns):
 #   Column                                    Non-Null Count  Dtype  
---  ------                                    --------------  -----  
 0   Carimbo de data/hora                      231 non-null    object 
 1   Endereço de e-mail                        231 non-null    object 
 2   Foto recente                              228 non-null    object 
 3   Fotos das tatuagens                       25 non-null     object 
 4   Nome completo                             230 non-null    object 
 5   Vulgo ou Alcunha                          182 non-null    object 
 6   Filiação                                  229 non-null    object 
 7   Data de nascimento                        228 non-null    object 
 8   CPF                                       197 non-null    float64
 9   RG                                        142 non-null    object 
 10  Órgão expedidor                       

In [15]:
df.isna().sum()

Carimbo de data/hora                          0
Endereço de e-mail                            0
Foto recente                                  3
Fotos das tatuagens                         206
Nome completo                                 1
Vulgo ou Alcunha                             49
Filiação                                      2
Data de nascimento                            3
CPF                                          34
RG                                           89
Órgão expedidor                             116
CNH                                         189
UF da CNH                                   220
Função na facção                             15
Área de atuação                              11
Área(s) que já atuou                        140
BOs                                          58
Registro na SERIS como reeducando            70
Período como reeducando (em caso de SIM)    181
Situação jurídica                            73
Alvo da SSPAL                           

### 2.1.1 Colunas númericas

In [16]:
df.columns = column_names

In [17]:
numerical_cols = df.describe().columns
categorical_cols = [i for i in column_names if i not in numerical_cols]

In [18]:
numerical_cols

Index(['A9'], dtype='object')

### 2.1.2 Colunas categóricas

In [19]:
categorical_cols

['A1',
 'A2',
 'A3',
 'A4',
 'A5',
 'A6',
 'A7',
 'A8',
 'A10',
 'A11',
 'A12',
 'A13',
 'A14',
 'A15',
 'A16',
 'A17',
 'A18',
 'A19',
 'A20',
 'A21',
 'A22',
 'A23',
 'A24',
 'A25',
 'A26',
 'A27',
 'A28',
 'A29',
 'A30',
 'A31',
 'A32',
 'A33',
 'A34',
 'A35',
 'A36',
 'A37',
 'A38',
 'A39',
 'A40',
 'A41',
 'A42',
 'A43',
 'A44',
 'A45',
 'A46',
 'A47',
 'A48']

# **3. Analises exploratória dos dados**

## *3.1. Análise da distribuição dos dados*

### 3.1.1. Dados categóricos

### 3.1.2. Dados numéricos

# **4. Engenharia de Dados**


In [20]:
df.A5 = df.A5.str.upper()
df.A6 = df.A6.str.upper()
df.A7 = df.A7.str.upper()
df.A13 = df.A13.str.upper()
df.A14 = df.A14.str.upper()
df.A15 = df.A15.str.upper()
df.A16 = df.A16.str.upper()
df.A20 = df.A20.str.upper()
df.A22 = df.A22.str.upper()
df.A33 = df.A33.str.upper()
df.A37 = df.A37.str.upper()
df.A38 = df.A38.str.upper()
df.A39 = df.A39.str.upper()
df.A40 = df.A40.str.upper()
df.A43 = df.A43.str.upper()

In [21]:
df_faccoes = df.drop(["A1", "A2"], axis=1)

In [22]:
# df_faccoes.head(5)

In [23]:
df_faccoes.columns

Index(['A3', 'A4', 'A5', 'A6', 'A7', 'A8', 'A9', 'A10', 'A11', 'A12', 'A13',
       'A14', 'A15', 'A16', 'A17', 'A18', 'A19', 'A20', 'A21', 'A22', 'A23',
       'A24', 'A25', 'A26', 'A27', 'A28', 'A29', 'A30', 'A31', 'A32', 'A33',
       'A34', 'A35', 'A36', 'A37', 'A38', 'A39', 'A40', 'A41', 'A42', 'A43',
       'A44', 'A45', 'A46', 'A47', 'A48'],
      dtype='object')

In [24]:
df_faccoes.describe()

Unnamed: 0,A9
count,197.0
mean,19160690028.24873
std,21195061053.95906
min,348271107.0
25%,9499739475.0
50%,11865177431.0
75%,14806419443.0
max,85214124520.0


## 4.1 _Análise das colunas_

### 4.1.0 _Coluna A11_


In [25]:
print(df_faccoes.groupby("A8").size())

A8
01/02/1999    2
01/04/1983    1
01/04/1986    1
01/04/1993    1
01/04/1996    1
01/04/2000    1
01/05/1989    1
01/11/2005    1
01/12/1997    1
02/02/1998    1
02/06/1995    1
02/07/1994    1
02/07/1995    1
02/08/2006    1
02/09/1992    1
03/02/1998    1
03/03/2003    1
03/06/1991    1
03/06/1998    1
03/07/1999    1
03/09/1990    1
03/09/1992    1
03/11/1988    1
03/11/1989    1
04/01/2000    1
04/03/1995    1
04/04/1998    1
04/05/2000    1
04/05/2002    1
04/05/2004    1
04/08/2000    1
04/09/1991    1
04/12/1994    1
05/05/1999    1
05/06/1988    1
05/06/1990    1
05/06/2005    1
05/08/2004    1
05/09/1991    1
05/10/1996    1
05/12/1990    1
06/01/1982    1
06/01/2001    1
06/04/1989    1
06/04/1999    1
06/05/1996    1
06/05/2003    1
06/08/1984    1
06/10/2004    1
07/02/1993    1
07/02/2004    1
07/05/1992    1
07/06/1984    1
07/06/2003    1
07/11/2003    1
08/01/2000    3
08/03/2000    1
08/05/2001    1
08/06/1997    1
08/08/2004    1
08/10/2003    1
08/12/1989    1
09/01

### 4.1.1 _Coluna A11_


In [26]:
# print(df_faccoes.groupby("A11").size())

In [27]:
df_faccoes.A11.replace(
    {
        "Al": "SSPAL",
        "AL": "SSPAL",
        "SPP SSPAL": "SSPAL",
        "SPP AL": "SSPAL",
        "SSP": "SSPAL",
        "SSP - SP": "SSPSP",
        "SSP - RN": "SSPRN",
        "SSP AL": "SSPAL",
        "SSP al": "SSPAL",
        "SSP-AL": "SSPAL",
        "SSp-AL": "SSPAL",
        "Ssp al": "SSPAL",
        "SSP/AL": "SSPAL",
        "ssp/al": "SSPAL",
        "SSP RN": "SSPRN",
        "SSp-AL ": "SSPAL",
        "SSP-AL ": "SSPAL",
        "SS´AL": "SSPAL",
        "SSP/GO": "SSPGO",
        "SSP/AL": "SSPAL",
    },
    regex=False,
    inplace=True,
)

In [28]:
# print(df_faccoes.groupby("A11").size())

### 4.1.2 _Coluna A13_


In [29]:
print(df_faccoes.groupby("A13").size())

A13
AL    10
SE     1
dtype: int64


In [30]:
df_faccoes.A13.replace(
    {
        "ALAGOAS": "AL",
        "UF DA CNH": "",
        "X-X-X-X": "",
    },
    regex=False,
    inplace=True,
)

In [31]:
print(df_faccoes.groupby("A13").size())

A13
AL    10
SE     1
dtype: int64


### 4.1.3 _Coluna A14_


In [32]:
print(df_faccoes.groupby("A14").size())

A14
BRAÇO ARMADO               1
BRAÇO DIREITO              4
CHEFE/LÍDER               56
DISCIPLINA                 1
DISTRIBUIDOR/LOGÍSTICA    12
FINANCEIRO                 3
GERENTE                   37
OUTROS                     1
PAIOL/GUARDA-ROUPAS        4
SOLDADO DO TRÁFICO        74
VENDEDOR                  23
dtype: int64


### 4.1.4 _Coluna A15_


In [33]:
print(df_faccoes.groupby("A15").size())

A15
 CLIMA BOM/FRONTEIRA, CONJUNTO JARBAS OITICICA, CONJUNTO ANTÔNIO LINS (RIO LARGO) E LOTEAMENTO PALMAR NO RIO NOVO                                       1
11º BPM                                                                                                                                                 9
1A PONTE VALE DO REGINALDO                                                                                                                              1
9ª CPM/I - CORURIPE-AL                                                                                                                                  1
ALAMEDAS DA PAJUÇARA                                                                                                                                    2
ALAMEDAS PAJUÇARA                                                                                                                                       1
ALTO DO SÃO MIGUEL, RIO LARGO                                           

### 4.1.5 _Coluna A16_


In [34]:
print(df_faccoes.groupby("A16").size())

A16
11º BPM - 10ª CPM/I - 3º BPM                                                                                                                               1
ALTO DO GINÁSIO                                                                                                                                            1
APENAS ATUA EM MARECHAL DEODORO                                                                                                                            1
APENAS NA BARRA DE SÃO MIGUEL                                                                                                                              1
ARAPIRACA                                                                                                                                                  2
ARAPIRACA/AL (SENDO ORIUNDO DO BAIRRO PRIMAVERA) E NA REGIÃO DE METROPOLITANA DE \nARACAJU E NOSSA SENHORA DO SOCORRO/SE E PARTE DE PE.                    1
ATALAIA;  MACEIÓ (CIDADE UNIVERSITÁRIA)               

In [35]:
print(df_faccoes.groupby("A22").size())

A22
CELEBRIDADE                                                                                                                                                                                                                                                                                          1
EM 22 DE MARÇO DE 2024 ALVO DE MANDADO DE BUSCA E APREENSÃO                                                                                                                                                                                                                                          1
ENVIADO RELINT A DINT PARA POSSÍVEL OPERAÇÃO                                                                                                                                                                                                                                                         1
HOMICIDIO GILHO SGT ROSA                                                                                       

### 4.1.6 Coluna A26, A27 e A28

In [36]:
print(df_faccoes.groupby("A26").size())

A26
 COJUNTO VILLAGE CAMPESTRE II,RUA SANTA LUZIA QD 36 Nº 209,CIDADE UNIVERSITÁRIA,MACEIÓ/AL                                                                                                                           1
 RUA SÃO JOÃO 62 LEVADA                                                                                                                                                                                             1
 Rodovia AL 101 Sul, QD A, n° 22. (vila em frente ao material de construção gago lopes)                                                                                                                             1
 Rua Amilton de Barros soltinho, nº 1068 Jatiúica                                                                                                                                                                   1
 Rua da Rodagem, n° 72                                                                                                                      

In [37]:
print(df_faccoes.groupby("A27").size())

A27
 RUA ARRUADO DOS SANTOS, POVOADO TUQUANDUBA, MARECHAL DEODORO - AL .                                  1
 Rua do bequinho, Macaco Molhado, S/N , Coruripe-AL, Cep: 57230-000                                   1
ALTO DA BOA VISTA - CONJ ADELIA LIRA 10  MARAGOGI                                                     1
CONJ SAO SEBASTIAO, SN - JOSE PAULINO- ATALAIA- AL                                                    1
CONJ. CIDADE SORRISO, QD. CB, N°5                                                                     1
CONJUNTO  JOSE CARLOS, QD E, N° 31                                                                    1
Conjunto Barnabé Toledo                                                                               1
Conjunto Barnabé Toledo, Marechal Deodoro                                                             1
Desconhecido                                                                                          1
ENDEREÇO EM VIÇOSA O QUAL NÃO FOI POSSÍVEL IDENTIFICAR      

In [38]:
print(df_faccoes.groupby("A28").size())

A28
BAIRRO BARRO PRETO 3, RUA PROJETADA B, CASA S/N - CORURIPE – AL. \nCEP: 57.230-000.                                                                                                                                         1
CASA DA MÃE: TRAVESSA DIEGUES JÚNIOR, 90 A, FEITOSA, MACEIÓ, \nAL                                                                                                                                                           1
CJ PROFESSOR PAULO BANDEIRA , 1 , QD 19 CEP:\n57086-306 BENEDITO BENTES - MACEIO - AL\n(fatura da equatorial do mês 03/2024 no nome da mãe)                                                                                 1
CJ RESIDENCIAL JORGE QUINTELA , S/N , BL 46 AP\n104 CP 90 CS 80 POS 02 CD JORGE QUINTELA CEP:\n57000-000 BENEDITO BENTES - MACEIO - AL\n(Endereço cadastrado na equatorial no nome da mãe, desde 10/23 não gera consumo)    1
Casa da mãe: rua da saudade, 50A- Jacintinho                                                                

#### 4.1.6.1 Usando Google Maps

In [39]:
endereco_atual = (
    df_faccoes["A26"]
    + ", "
    + df_faccoes["A44"]
    + ", "
    + df_faccoes["A45"]
    + ", "
    + df_faccoes["A46"]
)
endereco_anterior = df_faccoes["A27"]
endereco_familiares = df_faccoes["A28"]

In [40]:
import googlemaps
from datetime import datetime

gmaps = googlemaps.Client(key="AIzaSyDIZiZOJVo3BYameibLFeroFLs5MKxeB58")

In [41]:
endereco_atual.head(5)

0    NaN
1    NaN
2    NaN
3    NaN
4    NaN
dtype: object

In [42]:
# Inicializando 'geocode_result_atual' como uma lista de listas vazias
geocode_result_atual = [[] for _ in range(len(endereco_atual))]

for i in range(len(endereco_atual)):
    if (
        endereco_atual[i]
        and endereco_atual[i] != ""
        and endereco_atual[i] != ""
        and endereco_atual[i] is not None
    ):
        geocode_result_atual[i].append(gmaps.geocode(endereco_atual[i]))
    else:
        geocode_result_atual[i].append("")

In [43]:
print(len(geocode_result_atual))

231


In [44]:
# geocode_result_atual

In [45]:
# transformar lista do Google Maps em dicionário
dicionario = {
    i: sublista[0] for i, sublista in enumerate(geocode_result_atual) if sublista
}
# print(dicionario)

In [46]:
# print(type(dicionario))

In [47]:
# print(len(dicionario))

In [48]:
lat_atual = []
lng_atual = []
for i in range(len(dicionario)):
    if dicionario[i] and dicionario[i][0] != "[]" and dicionario[i][0] != "":
        lat_atual.append(dicionario[i][0]["geometry"]["location"]["lat"])
        lng_atual.append(dicionario[i][0]["geometry"]["location"]["lng"])
    else:
        lat_atual.append(0)
        lng_atual.append(0)

In [49]:
print(len(lat_atual))

231


In [50]:
print(len(lng_atual))

231


In [51]:
df_faccoes["lat_atual"] = lat_atual
df_faccoes["lng_atual"] = lng_atual

In [52]:
# df_faccoes.info()

In [53]:
# from google.colab import data_table

# data_table.enable_dataframe_formatter()

In [54]:
path_faccoes = "./dados/"
path_faccoes_shapes = "./shapes_files/"


#### 4.1.6.1 Teste no Mapa

In [55]:
# Importe a biblioteca
import folium
import geopandas as gpd


if "google.colab" in sys.modules:

    # Locais
    path_faccoes = "/content/drive/MyDrive/Colab Notebooks/faccoes/"

    # Locais das camadas (shapefiles) do IBGE, NEAC e etc

    # ibge
    path_arq_ibge_brmi = (
        path_faccoes + "shapes_files/BR_Microrregioes_2022/BR_Microrregioes_2022.shp"
    )
    path_arq_ibge_brrg = (
        path_faccoes + "shapes_files/BR_RG_Imediatas_2022/BR_RG_Imediatas_2022.shp"
    )
    path_arq_ibge_br_mun = (
        path_faccoes + "shapes_files/BR_Municipios_2022/BR_Municipios_2022.shp"
    )
    path_arq_ibge_br_uf = path_faccoes + "shapes_files/BR_UF_2022/BR_UF_2022.shp"

    # neac
    path_arq_neac_pmal = (
        path_faccoes + "shapes_files/areas_batalhoes_pmal/µras das Unidades_PMAL.shp"
    )

    # Alagoas em dados
    path_arq_ad_mun = (
        path_faccoes + "shapes_files/al_municipios_2022/AL_Municipios_2022.shp"
    )

    # Camada de terceiros
    path_arq_br_mun = path_faccoes + "shapes_files/municipio.json"

    # Pontos de localização dos faccionados
    pontos = df_faccoes[["lat_atual", "lng_atual"]].apply(lambda x: list(x), axis=1)

    # Calcule o centro das coordenadas
    # l = len(pontos)
    # l1=0
    # l2=0

    # for index,r in enumerate(pontos):
    #     if r != None:
    #       l1 = (pontos[index][0]+l1)
    #       l2 = (pontos[index][1]+l2)
    # centro = [l1/l,l2/l]

    # # Eliminas os  Nan e criar [0,0]
    # centro = [0 if np.isnan(x) else x for x in centro]

    # Centro das coordenadas no nordeste
    centro_nordeste = [-8.885072, -41.176758]

    # definindo tamanho de visualização do mapa
    f = folium.Figure(width=1200, height=400)

    # Mapa
    m = folium.Map(location=centro_nordeste, zoom_start=5).add_to(f)

    # Carregar os shapefiles e converter para GeoJSON
    # gdf = gpd.read_file(path_arq_br_mun)
    # gdf_json = gdf.to_json()

    # folium.GeoJson(
    #     gdf_json,
    #     name='br-mu-geojson'
    # ).add_to(m)

    # Carregar os shapefiles e converter para GeoJSON
    # gdf = gpd.read_file(path_arq_ibge_br_uf)
    # gdf_json = gdf.to_json()

    # folium.GeoJson(
    #     gdf_json,
    #     name='uf-br-geojson'
    # ).add_to(m)

    # gdf1 = gpd.read_file(path_arq_ibge_br_mun)
    # gdf1_json = gdf1.to_json()

    # folium.GeoJson(
    #     gdf1_json,
    #     name='municipios-br-geojson'
    # ).add_to(m)

    gdf2 = gpd.read_file(path_arq_ad_mun)
    gdf2_json = gdf2.to_json()

    folium.GeoJson(gdf2_json, name="municipios-al-ad-geojson").add_to(m)

    gdf3 = gpd.read_file(path_arq_neac_pmal)
    gdf3_json = gdf3.to_json()

    folium.GeoJson(gdf3_json, name="pm-unidade-al-geojson").add_to(m)

    # Inserir localizações no mapaaker)
    # Substitua NaNs por 0 em cada sublista de 'pontos'
    pontos = [[0 if np.isnan(y) else y for y in x] for x in pontos]

    pontos = [valor for valor in pontos if valor != 0]

    popup_view = df_faccoes

    for index, r in enumerate(pontos):
        if pontos[index] != [0, 0]:
            folium.Marker(
                pontos[index],
                icon=folium.Icon(color="red", icon="home"),
                popup=(
                    "FACCIONADO: <br> {} <br> FOTO 1 <br> {} <br> FOTO 2 <br> {} <br> BAIRRO: {}".format(
                        popup_view.loc[index, ["A5"]],
                        popup_view.loc[index, ["A3"]],
                        popup_view.loc[index, ["A4"]],
                        popup_view.loc[index, ["A44"]],
                    )
                ),
                # popup = ('Ponto{} da lista'.format(index))
            ).add_to(m)
    # linhas
    # folium.PolyLine(pontos, color='red').add_to(m)
    # visualizar mapa
    # Adicionar um controle de camadas ao mapa para alternar entre as camadas
    folium.LayerControl().add_to(m)
    # Apresentar o Mapa
    m
    # salvar o mapa
    m.save(path_faccoes + "index.html")

In [56]:
# gdf2.head()

In [57]:
# df_faccoes.to_csv('/content/drive/MyDrive/Colab Notebooks/faccoes/faccoes.csv', index=False)
df_facionados = df_faccoes.copy()

# Defina a primeira linha como cabeçalho
df_facionados = df_facionados.drop(df_facionados.index[0])
df_facionados.to_csv(path_faccoes + "faccionados.csv", index=False)

# **5. Resumir o conjunto de dados**


## 5.1 Neo4j

In [58]:
df_faccoes.head(5)

Unnamed: 0,A3,A4,A5,A6,A7,A8,A9,A10,A11,A12,A13,A14,A15,A16,A17,A18,A19,A20,A21,A22,A23,A24,A25,A26,A27,A28,A29,A30,A31,A32,A33,A34,A35,A36,A37,A38,A39,A40,A41,A42,A43,A44,A45,A46,A47,A48,lat_atual,lng_atual
0,https://drive.google.com/open?id=1s1cpbkt6wqv1...,,KAYO NASCIMENTO DE MAGALHÃES,CABRA/ 99,MICHELINE GOMES DE MAGALHÃES E ANTÔNIO SÉRGIO ...,08/01/2000,12514121493.0,40840859,SSPAL,,,FINANCEIRO,,JARBAS OITICICA (RIO LARGO) E ACAMPAMENTO DAND...,SUPOSTO AUTOR DE ROUBO - 11442841-00/2015/2704...,SIM,,FORAGIDO,SIM,,,NÃO,,Complexo do Alemão/RJ,,"R. NOSSA SENHORA DA CONCEICAO , 504 , CEP:\n57...",,-22860294.0,-43273285.0,NÃO,,SIM,Informações que está homiziado no Complexo do ...,NÃO,,AMALIA NATALIA DE LIMA SANTOS,5 A 10 ANOS,,,,NI,,,,,Atua no financeiro da cúpula de Alagoas da fac...,0.0,0.0
1,https://drive.google.com/open?id=1_KcAyEB2pc7U...,https://drive.google.com/open?id=1-_qEifQW0BVH...,JOSÉ MARIANO DOS SANTOS,RATO,MARIA JOSEFA DOS SANTOS E MÁRIO PEREIRA DOS SA...,20/05/1986,9246079477.0,,,,,BRAÇO DIREITO,,,CUMPRIMENTO DE MANDADO DE PRISÃO - 09246079477...,SIM,,FORAGIDO,SIM,,,,,"Rua Yacatan, nº 95, Inhauma, Rio de Janeiro, C...","e Rua Canitar, 625, Inhauma, Rio de Janeiro/RJ...",,,-2286601688.0,-4327394383.0,NÃO,,SIM,Informações que encontra-se homiziado no Compl...,SIM,ESPOSA TEM REGISTRO NA SERIS COMO REEDUCANDO,SARA JULICELIA DO NASCIMENTO NOBERTO,15 A 20 ANOS,EMPRESAS,"SARA MAKE UP, 43881885000198, SARA JULICELIA D...",,NI,,,,,Braço direito do líder da facção em Alagoas,0.0,0.0
2,quinzinho - Thais Lima.jpg,cicatriz - Thais Lima.jpg,GIVALDO BARBOSA DE FRANÇA,QUINZINHO,MARLY ROSA BARBOSA DE FRANÇA E JOSÉ LOPES DE F...,13/04/1981,7275481405.0,1999001021061,SSPAL,4110193167.0,AL,CHEFE/LÍDER,,,SUPOSTO AUTOR DE DIREÇÃO PERIGOSA DE VEÍCULO E...,SIM,,FORAGIDO,SIM,,Suspeito de ameaçar secretário de Segurança Pú...,SIM,,Complexo do Alemão/RJ,,,,-22860294.0,-43273285.0,NÃO,,SIM,Informações que está homiziado junto com outra...,SIM,"A ESPOSA, MARIA CÉLIA DA SILVA, TEM CADASTRO N...",MARIA CÉLIA DA SILVA,15 A 20 ANOS,VEÍCULOS,,,NI,,,,,"Liderança da facção na parte baixa de Maceió, ...",0.0,0.0
3,https://drive.google.com/open?id=1iSR7mQPMKSBk...,,JOSÉ ERIVALDO DA PAZ,ÍNDIO,MARIA HELENA DA PAZ E ANTONIO FERNANDES DA PAZ,19/11/1990,9482616413.0,33582840,SSPAL,5310496230.0,SE,CHEFE/LÍDER,,ARAPIRACA/AL (SENDO ORIUNDO DO BAIRRO PRIMAVER...,SUPOSTO AUTOR DE HOMICÍDIO SIMPLES - 1023524...,SIM,,LIBERADO ATRAVÉS DE ALVARÁ,SIM,,"Acusado de torturar, mutilar e matar o próprio...",,,,"RUA ESMERALDO DA SILVA, 578, CASA, TABOCAS, 49...","R. ROSENDO MAIA , 603 , CEP: 57310-520\nBRASIL...",,,,NÃO,,SIM,Tem endereço da CNH cadastrado no Estado de SE...,SIM,\nO IRMÃO JOSÉ ALDERIVAN DA PAZ TEM BO DE CUMP...,,,,,,NI,,,,,Vice liderança da facção em Arapiraca e respon...,0.0,0.0
4,https://drive.google.com/open?id=1RD6PwugnwRo9...,,LUCAS MANOEL DA SILVA,PROJETO,MARIA MARGARETE CORREIA DA SILVA\nJUVENAL MANO...,26/09/1998,,\t3523498-9,SSPAL,,,SOLDADO DO TRÁFICO,CLIMA BOM/FRONTEIRA,NÃO,"ROUBO,0012-B/18-0508, JOSÉ RAFAEL FERREIRA DA ...",SIM,06/04/2018,SEMIABERTO,NÃO,,NÃO,NÃO,NÃO,"CONJUNTO JARBAS OITICICA,RIO LARGO - AL","RUA NOSSA SENHORA DA CONCEIÇÃO, N°504, CLIMA BOM","RUA NOSSA SENHORA DA CONCEIÇÃO, N°504, CLIMA BOM",57000-000,-9471995324.0,-3582215093.0,NÃO,NÃO,NÃO,NÃO,NÃO,,,,OUTROS BENS,NÃO,SOLDADO ATIVO DO CV/BONDE DO 99,CV,,,,,"SOLDADO,CV",0.0,0.0


In [59]:
df_faccoes.to_csv(path_faccoes + "faccionados.csv", index=True)

In [60]:
column_names = [
    # "data_hora_cadastro",
    # "email_analista",
    "foto_recente",
    "fotos_tatuagens",
    "nome_completo",
    "vulgo_alcunha",
    "filiacao",
    "data_nascimento",
    "cpf",
    "rg",
    "orgao_expedidor",
    "cnh",
    "uf_cnh",
    "faccao_funcao",
    "area_atuacao",
    "area_que_ja_atuou",
    "bos",
    "registro_como_reeducando",
    "período_como_reeducando",
    "situacao_juridica",
    "alvo_sspal",
    "qual_operacao_foi_alvo",
    "ocorrencias_destaque",
    "pena_presidio_federal",
    "qual_presidio_estado",
    "endereco_atual",
    "endereco_anterior",
    "endereco_familiar",
    "cep",
    "latitude_cadastro",
    "logitude_cadastro",
    "tornozeleira",
    "redes_sociais",
    "registro_homizio",
    "informacoes_homizidio",
    "parentes_crime",
    "informacoes_parentes_criminosos",
    "nome_completo_conjugue",
    "tempo_conjugue",
    "tipos_bens",
    "descricao_bens",
    "observacoes",
    "faccao",
    "bairro_atual",
    "cidade_atual",
    "uf_atual",
    "tipo_rede_social",
    "historico",
    "latitude_atual",
    "longitude_atual",
]

In [61]:
df_neo4j = df_faccoes.copy()
df_neo4j.columns = column_names

In [62]:
df_neo4j.columns

Index(['foto_recente', 'fotos_tatuagens', 'nome_completo', 'vulgo_alcunha',
       'filiacao', 'data_nascimento', 'cpf', 'rg', 'orgao_expedidor', 'cnh',
       'uf_cnh', 'faccao_funcao', 'area_atuacao', 'area_que_ja_atuou', 'bos',
       'registro_como_reeducando', 'período_como_reeducando',
       'situacao_juridica', 'alvo_sspal', 'qual_operacao_foi_alvo',
       'ocorrencias_destaque', 'pena_presidio_federal', 'qual_presidio_estado',
       'endereco_atual', 'endereco_anterior', 'endereco_familiar', 'cep',
       'latitude_cadastro', 'logitude_cadastro', 'tornozeleira',
       'redes_sociais', 'registro_homizio', 'informacoes_homizidio',
       'parentes_crime', 'informacoes_parentes_criminosos',
       'nome_completo_conjugue', 'tempo_conjugue', 'tipos_bens',
       'descricao_bens', 'observacoes', 'faccao', 'bairro_atual',
       'cidade_atual', 'uf_atual', 'tipo_rede_social', 'historico',
       'latitude_atual', 'longitude_atual'],
      dtype='object')

In [63]:
# Supondo que 'df' é o seu DataFrame
df_neo4j = df_neo4j.drop(df.index[0])

In [64]:
df_neo4j.head()

Unnamed: 0,foto_recente,fotos_tatuagens,nome_completo,vulgo_alcunha,filiacao,data_nascimento,cpf,rg,orgao_expedidor,cnh,uf_cnh,faccao_funcao,area_atuacao,area_que_ja_atuou,bos,registro_como_reeducando,período_como_reeducando,situacao_juridica,alvo_sspal,qual_operacao_foi_alvo,ocorrencias_destaque,pena_presidio_federal,qual_presidio_estado,endereco_atual,endereco_anterior,endereco_familiar,cep,latitude_cadastro,logitude_cadastro,tornozeleira,redes_sociais,registro_homizio,informacoes_homizidio,parentes_crime,informacoes_parentes_criminosos,nome_completo_conjugue,tempo_conjugue,tipos_bens,descricao_bens,observacoes,faccao,bairro_atual,cidade_atual,uf_atual,tipo_rede_social,historico,latitude_atual,longitude_atual
1,https://drive.google.com/open?id=1_KcAyEB2pc7U...,https://drive.google.com/open?id=1-_qEifQW0BVH...,JOSÉ MARIANO DOS SANTOS,RATO,MARIA JOSEFA DOS SANTOS E MÁRIO PEREIRA DOS SA...,20/05/1986,9246079477.0,,,,,BRAÇO DIREITO,,,CUMPRIMENTO DE MANDADO DE PRISÃO - 09246079477...,SIM,,FORAGIDO,SIM,,,,,"Rua Yacatan, nº 95, Inhauma, Rio de Janeiro, C...","e Rua Canitar, 625, Inhauma, Rio de Janeiro/RJ...",,,-2286601688.0,-4327394383.0,NÃO,,SIM,Informações que encontra-se homiziado no Compl...,SIM,ESPOSA TEM REGISTRO NA SERIS COMO REEDUCANDO,SARA JULICELIA DO NASCIMENTO NOBERTO,15 A 20 ANOS,EMPRESAS,"SARA MAKE UP, 43881885000198, SARA JULICELIA D...",,NI,,,,,Braço direito do líder da facção em Alagoas,0.0,0.0
2,quinzinho - Thais Lima.jpg,cicatriz - Thais Lima.jpg,GIVALDO BARBOSA DE FRANÇA,QUINZINHO,MARLY ROSA BARBOSA DE FRANÇA E JOSÉ LOPES DE F...,13/04/1981,7275481405.0,1999001021061,SSPAL,4110193167.0,AL,CHEFE/LÍDER,,,SUPOSTO AUTOR DE DIREÇÃO PERIGOSA DE VEÍCULO E...,SIM,,FORAGIDO,SIM,,Suspeito de ameaçar secretário de Segurança Pú...,SIM,,Complexo do Alemão/RJ,,,,-22860294.0,-43273285.0,NÃO,,SIM,Informações que está homiziado junto com outra...,SIM,"A ESPOSA, MARIA CÉLIA DA SILVA, TEM CADASTRO N...",MARIA CÉLIA DA SILVA,15 A 20 ANOS,VEÍCULOS,,,NI,,,,,"Liderança da facção na parte baixa de Maceió, ...",0.0,0.0
3,https://drive.google.com/open?id=1iSR7mQPMKSBk...,,JOSÉ ERIVALDO DA PAZ,ÍNDIO,MARIA HELENA DA PAZ E ANTONIO FERNANDES DA PAZ,19/11/1990,9482616413.0,33582840,SSPAL,5310496230.0,SE,CHEFE/LÍDER,,ARAPIRACA/AL (SENDO ORIUNDO DO BAIRRO PRIMAVER...,SUPOSTO AUTOR DE HOMICÍDIO SIMPLES - 1023524...,SIM,,LIBERADO ATRAVÉS DE ALVARÁ,SIM,,"Acusado de torturar, mutilar e matar o próprio...",,,,"RUA ESMERALDO DA SILVA, 578, CASA, TABOCAS, 49...","R. ROSENDO MAIA , 603 , CEP: 57310-520\nBRASIL...",,,,NÃO,,SIM,Tem endereço da CNH cadastrado no Estado de SE...,SIM,\nO IRMÃO JOSÉ ALDERIVAN DA PAZ TEM BO DE CUMP...,,,,,,NI,,,,,Vice liderança da facção em Arapiraca e respon...,0.0,0.0
4,https://drive.google.com/open?id=1RD6PwugnwRo9...,,LUCAS MANOEL DA SILVA,PROJETO,MARIA MARGARETE CORREIA DA SILVA\nJUVENAL MANO...,26/09/1998,,\t3523498-9,SSPAL,,,SOLDADO DO TRÁFICO,CLIMA BOM/FRONTEIRA,NÃO,"ROUBO,0012-B/18-0508, JOSÉ RAFAEL FERREIRA DA ...",SIM,06/04/2018,SEMIABERTO,NÃO,,NÃO,NÃO,NÃO,"CONJUNTO JARBAS OITICICA,RIO LARGO - AL","RUA NOSSA SENHORA DA CONCEIÇÃO, N°504, CLIMA BOM","RUA NOSSA SENHORA DA CONCEIÇÃO, N°504, CLIMA BOM",57000-000,-9471995324.0,-3582215093.0,NÃO,NÃO,NÃO,NÃO,NÃO,,,,OUTROS BENS,NÃO,SOLDADO ATIVO DO CV/BONDE DO 99,CV,,,,,"SOLDADO,CV",0.0,0.0
5,https://drive.google.com/open?id=1ZhY_gzeO0EEq...,,VICTOR EMANUEL OLIVEIRA DOS SANTOS,VULGO DA CRUZ,WILMA DOS SANTOS SILVA\n\n,12/02/2000,16744894471.0,4127499-7,SSPAL,,,SOLDADO DO TRÁFICO,"CLIMA BOM, ROSANE COLLOR",,"TRÁFICO DE DROGAS, 102615/2021",SIM,04/10/2021,SEMIABERTO,NÃO,NÃO,NÃO,NÃO,NÃO,,"RUA MÔNACO, CLIMA BOM, N° 156","RUA MÔNACO, CLIMA BOM, N° 156",57000000,-9577453063.0,-3579058316.0,NÃO,@EMANUELVINNY ; VULGO DA CRUZ,NÃO,NÃO,NÃO,NÃO,JULIANA DA SILVA,,VEÍCULOS,,,NI,,,,,SOLDADO,0.0,0.0


In [65]:
print(df_neo4j.groupby("faccao_funcao").size())

faccao_funcao
BRAÇO ARMADO               1
BRAÇO DIREITO              4
CHEFE/LÍDER               56
DISCIPLINA                 1
DISTRIBUIDOR/LOGÍSTICA    12
FINANCEIRO                 2
GERENTE                   37
OUTROS                     1
PAIOL/GUARDA-ROUPAS        4
SOLDADO DO TRÁFICO        74
VENDEDOR                  23
dtype: int64


## 5.2 Categorizar as colunas

In [66]:
nomes = df_neo4j[["nome_completo", "vulgo_alcunha", "cpf", "rg", "cnh"]].copy()
fotos = df_neo4j[["foto_recente", "fotos_tatuagens"]].copy()
faccao = df_neo4j[["faccao"]].copy()
funcao = df_neo4j[["faccao_funcao"]].copy()
area_atuacao = df_neo4j[["area_atuacao"]].copy()
ja_atuou = df_neo4j[["area_que_ja_atuou"]].copy()
filiacao = df_neo4j[["filiacao", "data_nascimento"]].copy()
alvo_sspal = df_neo4j[["alvo_sspal", "qual_operacao_foi_alvo"]].copy()
reeducando = df_neo4j[["registro_como_reeducando", "período_como_reeducando"]].copy()
conjugue = df_neo4j[["nome_completo_conjugue", "tempo_conjugue", "uf_atual"]].copy()
endereco_anterior = df_neo4j[["endereco_anterior"]].copy()
endereco_familiar = df_neo4j[["endereco_familiar"]].copy()
endereco_atual = df_neo4j[
    ["endereco_atual", "bairro_atual", "cidade_atual", "uf_atual"]
].copy()
bairro = df_neo4j[["bairro_atual"]].copy()
cidade = df_neo4j[["cidade_atual"]].copy()
uf = df_neo4j[["uf_atual"]].copy()
cep = df_neo4j[["cep"]].copy()
coordenadas = df_neo4j[["latitude_atual", "longitude_atual"]].copy()
analises_vinculos = df_neo4j[
    [
        "nome_completo",
        "vulgo_alcunha",
        "faccao",
        "faccao_funcao",
        "bairro_atual",
        "cidade_atual",
        "uf_atual",
        "area_atuacao",
    ]
].copy()

### 5.2.1 Analisando cada arquivo

## 5.3 Salvando os arquivos .CLS

In [67]:
# df_neo4j.to_csv(path_faccoes + "faccionados.csv", index=True)
df_neo4j.to_csv(path_faccoes + "faccionados_neo4j_00.csv", index=True)
# csvs desmembrados
nomes.to_csv(path_faccoes + "nomes.csv", index=True)
fotos.to_csv(path_faccoes + "fotos.csv", index=True)
faccao.to_csv(path_faccoes + "faccao.csv", index=True)
funcao.to_csv(path_faccoes + "funcao.csv", index=True)
area_atuacao.to_csv(path_faccoes + "area_atuacao.csv", index=True)
ja_atuou.to_csv(path_faccoes + "ja_atuou.csv", index=True)
filiacao.to_csv(path_faccoes + "filiacao.csv", index=True)
alvo_sspal.to_csv(path_faccoes + "alvo_sspal.csv", index=True)
reeducando.to_csv(path_faccoes + "reeducando.csv", index=True)
conjugue.to_csv(path_faccoes + "conjugue.csv", index=True)
endereco_anterior.to_csv(path_faccoes + "endereco_anterior.csv", index=True)
endereco_familiar.to_csv(path_faccoes + "endereco_familiar.csv", index=True)
endereco_atual.to_csv(path_faccoes + "endereco_atual.csv", index=True)
bairro.to_csv(path_faccoes + "bairro.csv", index=True)
cidade.to_csv(path_faccoes + "cidade.csv", index=True)
uf.to_csv(path_faccoes + "uf.csv", index=True)
cep.to_csv(path_faccoes + "cep.csv", index=True)
coordenadas.to_csv(path_faccoes + "coordenadas.csv", index=True)

# analises de vinculos
analises_vinculos.to_csv(path_faccoes + "analises_vinculos.csv", index=True)

In [68]:
analises_vinculos.to_csv("faccionados_analise_vinculos.csv", index=False)

# **6. Visualização de Dados**


# **7. Treinamento**


# **8. Aprendizado**


# **9. Resultados:**
