# Contexto da Análise

Acredito que a pratica faz a perfeição, então, desde que comecei a gostar e aprender sobre analise dados decide que colocaria em pratica o que estou aprendendo. Então, essa analise assim como as outras do meu repositório são meramente para fins de aprendizado e de expor meu trabalho para quem se interessa em aprender comigo ou pelo meu trabalho.

Para isso, a princípio sempre usarei dados abertos fornecidos por governos, universidades e sites especializados nesse quesito como Kaggle.

Em relação ao conjunto de dados que escolhi para esta análise uma tecnologia que tem se tornado cada vez mais importante para uso profissional e também para entretenimento: os drones.

Hoje em dia grades empresas fazem uso de drones para monitorar seus processos e a produção, instituições como a polícia e o exército os usam para monitorar áreas de risco, empresas montam grandes shows luminosos e pessoas utilizam para se divertir. Como consequência desse grande "boom" na aquisição de drones é cada vez mais necessário que os órgãos responsáveis fiscalizem essa prática, e por isso essa análise é uma excelente forma de entender como essa fiscalização está sendo feita e também conhecer um pouco mais da utilização deles no Brasil.

### A fonte dados foi atualizada pela ultima vez em 2019, então os dados podem estar desatualizados.

### Fonte: https://dados.gov.br/dataset/aeronaves-drones-cadastrados

In [1]:
import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
import seaborn as sns
import warnings

warnings.filterwarnings("ignore", category=FutureWarning)

%reload_ext watermark
%watermark -a "Paulo Henrique Pinto" --iversions

Author: Paulo Henrique Pinto

seaborn   : 0.11.1
pandas    : 1.2.4
matplotlib: 3.2.1



## Importando o conjunto de dados

In [2]:
# Carregando os dados

dataset = pd.read_csv("SISANT.csv", sep= ';',
                      encoding = 'utf-8',
                      engine = 'python',
                      decimal = ".",
                      error_bad_lines=False,
                      warn_bad_lines=False)

In [3]:
# Prmeira visualização dos dados 
dataset.head(10) 

Unnamed: 0,CodigoAeronave,DataValidade,Operador,CPF/CNPJ,TipoUso,Fabricante,Modelo,NumeroSerie,PesoMaximoDecolagem,CidadeEstado,RamoAtividade
0,PP- 40211550,05/05/2023,Companhia de inteligência urbana e servicos S/A,40.211.550/0001-74,Não Recreativo,DJI,Phantom 4 Pro,11UDH38R710533,1.38,Fortaleza-CE,Aerolevantamento - Aerofotogrametria
1,PP-000000001,26/03/2023,JUORDAN GUSS PEDRONI,080.XXX.XXX-60,Não Recreativo,DJI,Mavic,08qde2r01204xu,1.0,Colatina-ES,Aerocinematografia
2,PP-000000003,05/04/2023,NORTHON,809.XXX.XXX-04,Não Recreativo,DJI,Phantom 3,P78DCJ120605,1.31,Cuiabá-MT,Aerocinematografia
3,PP-000000005,04/11/2022,AGENCIA NACIONAL DE MINERACAO,29.406.625/0001-30,Não Recreativo,DJI,Phantom 4,07DDD7E0B10508,1.3,Brasília-DF,Órgãos de Fiscalização - Entidades Estatais
4,PP-000000006,24/11/2021,EDER AUGUSTO CAMPOS,007.XXX.XXX-74,Não Recreativo,DJI,Mavic,163DFBG001YT23,0.9,Matozinhos-MG,Aerolevantamento - Aerofotogrametria
5,PP-000000007,29/01/2022,KANA FILMES E PRODUCOES LTDA.,09.491.939/0001-70,Não Recreativo,DJI,Mavic,08QUE5H0010FRJ,1.0,São Paulo-SP,Aerocinematografia
6,PP-000000008,05/02/2022,EDUARD SOMMERFELD,027.XXX.XXX-16,Não Recreativo,DJI,Mavic,1SZDGCE1127EOT,0.24,Balneário Piçarras-SC,
7,PP-000000010,29/05/2023,NOVARUM SKY TECNOLOGIA LTDA - ME,20.986.498/0001-10,Não Recreativo,MIKROKOPTER,MK Okto XL 6S12,5917,7.35,Florianópolis-SC,Aeroinspeção
8,PP-000000014,04/04/2023,Ailton jesus de oliveira,994.XXX.XXX-04,Não Recreativo,DJI,Phantom 3,P5AUDI060100,2.0,Ibiporã-PR,Aerocinematografia
9,PP-000000019,24/11/2021,VANIA PATRICIA BARBOSA,356.XXX.XXX-31,Não Recreativo,DJI,DJI Mavic 2 Pro,163CG7LR0A0A4Z,2.0,Araraquara-SP,


In [4]:
# Analisando a quantidade de registros presentes na tabela
dataset.shape

(88130, 11)

In [5]:
# Analisando mais a fundo os tipos de dados presentes na tabela
dataset.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 88130 entries, 0 to 88129
Data columns (total 11 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   CodigoAeronave       88130 non-null  object 
 1   DataValidade         88130 non-null  object 
 2   Operador             88130 non-null  object 
 3   CPF/CNPJ             88130 non-null  object 
 4   TipoUso              88130 non-null  object 
 5   Fabricante           88127 non-null  object 
 6   Modelo               88127 non-null  object 
 7   NumeroSerie          88003 non-null  object 
 8   PesoMaximoDecolagem  88130 non-null  float64
 9   CidadeEstado         88130 non-null  object 
 10  RamoAtividade        31220 non-null  object 
dtypes: float64(1), object(10)
memory usage: 7.4+ MB


## Limpeza e Tratamento dos dados

In [6]:
# Como algumas colunas do dataset não vão ser "uteis" nessa análise eu optei por retirá-las.
# Para não perder as informações originais do conjunto de dados, vou utilizar uma "copia" dos dados

new_dataset = dataset

new_dataset.drop(columns=['CodigoAeronave', 'DataValidade', 'CPF/CNPJ', 'NumeroSerie', 'PesoMaximoDecolagem'], inplace=True)

In [7]:
# Verificando se existe algum dado nulo
new_dataset.isnull().sum()

Operador             0
TipoUso              0
Fabricante           3
Modelo               3
CidadeEstado         0
RamoAtividade    56910
dtype: int64

In [8]:
# Como a coluna RamoAtividade tem a maioria dos dados faltantes eu preferi nomea-los como "não declarados".
new_dataset['RamoAtividade'].fillna('Não Declarado', inplace = True)

In [9]:
# Removendo agora apenas os registros nulos
# A diferença aqui é que como são pouquissimos registros nulos eu preferi manter a coluna e remover apenas os registros

new_dataset.dropna(subset=['Fabricante', 'Modelo'], inplace = True) 

In [10]:
# Confirmação que todos os registros são não-nulos
new_dataset.isnull().sum()

Operador         0
TipoUso          0
Fabricante       0
Modelo           0
CidadeEstado     0
RamoAtividade    0
dtype: int64

In [11]:
# Esses é o resultado da limpeza dos dados e são eles que vou usar para a análise
dataset.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 88127 entries, 0 to 88129
Data columns (total 6 columns):
 #   Column         Non-Null Count  Dtype 
---  ------         --------------  ----- 
 0   Operador       88127 non-null  object
 1   TipoUso        88127 non-null  object
 2   Fabricante     88127 non-null  object
 3   Modelo         88127 non-null  object
 4   CidadeEstado   88127 non-null  object
 5   RamoAtividade  88127 non-null  object
dtypes: object(6)
memory usage: 4.7+ MB


## Análise Exploratória

### Tipo de uso

In [12]:
# Quantidade de cada um dos atributos da variavel TipoUso
new_dataset.TipoUso.value_counts()

Recreativo        50940
Não Recreativo    37187
Name: TipoUso, dtype: int64

In [13]:
# Porcentagem de cada um dos atributos da variavel TipoUso

(new_dataset.TipoUso.value_counts() / new_dataset.TipoUso.value_counts().sum()) * 100

Recreativo        57.802943
Não Recreativo    42.197057
Name: TipoUso, dtype: float64

### Operador

In [14]:
# Informação de cada operador e quantidade de drones de cada um
new_dataset.Operador.value_counts().head(10)

CONFEDERACAO BRASILEIRA DE AEROMODELISMO       661
DOUGLASS RIBEIRO CABRAL FAGUNDES               483
VALE S.A.                                      205
POLICIA MILITAR DO ESTADO DE SAO PAULO         160
MINISTERIO DA JUSTICA E SEGURANCA PUBLICA      150
Copel Distribuição                             119
POLICIA MILITAR DO ESTADO DE SANTA CATARINA    113
POLICIA MILITAR DO ESTADO DE MINAS GERAIS      107
MAGIC DRONE SHOW DE LUZES                      101
VISUALFARM PRODUCOES LTDA                      100
Name: Operador, dtype: int64

### Fabricante

In [15]:
# Os 10 fabricantes com mais drones registrados pelos operadores e a quantidade de cada um deles 
new_dataset.Fabricante.value_counts().head(10)

DJI                                74258
FIMI                                1260
Hubsan                               955
PARROT                               948
Xiaomi                               720
BEIJING FIMI TECHNOLOGY CO. LTD      440
Fabricação própria                   367
Eachine                              249
Xiaomi Fími x8 se                    244
XMOBOTS                              216
Name: Fabricante, dtype: int64

In [16]:
# Porcentagem 10 fabricantes com mais drones registrado pelos operadores
((new_dataset.Fabricante.value_counts()/new_dataset.Fabricante.value_counts().sum())*100).head(10)

DJI                                84.262485
FIMI                                1.429755
Hubsan                              1.083663
PARROT                              1.075720
Xiaomi                              0.817003
BEIJING FIMI TECHNOLOGY CO. LTD     0.499279
Fabricação própria                  0.416444
Eachine                             0.282547
Xiaomi Fími x8 se                   0.276873
XMOBOTS                             0.245101
Name: Fabricante, dtype: float64

### Modelo

In [17]:
# Os 10 modelos com mais drones registrados pelos operadores e a quantidade de cada um deles 
new_dataset.Modelo.value_counts().head(10)

Mavic            27829
Phantom 3         7071
Spark             6171
Phantom 4 Pro     5929
Phantom 4         5162
MINI 2            2899
Mavic Mini        1969
DJI Mini 2        1623
Mavic 2 Pro       1517
Mavic Air 2       1438
Name: Modelo, dtype: int64

In [18]:
# Porcentagem dos 10 modelos com mais drones registrado pelos operadores
((new_dataset.Modelo.value_counts() / new_dataset.Modelo.value_counts().sum())*100).head(10)

Mavic            31.578290
Phantom 3         8.023648
Spark             7.002394
Phantom 4 Pro     6.727791
Phantom 4         5.857456
MINI 2            3.289571
Mavic Mini        2.234276
DJI Mini 2        1.841660
Mavic 2 Pro       1.721379
Mavic Air 2       1.631736
Name: Modelo, dtype: float64

### Local

In [19]:
# Os 10 cidades com mais drones registrados pelos operadores e a quantidade de cada um deles
new_dataset.CidadeEstado.value_counts().head(10)

São Paulo-SP         10197
Rio de Janeiro-RJ     5245
Brasília-DF           2923
Belo Horizonte-MG     2703
Curitiba-PR           2252
Salvador-BA           1428
Porto Alegre-RS       1214
Fortaleza-CE          1110
Goiânia-GO            1021
Campinas-SP            997
Name: CidadeEstado, dtype: int64

In [20]:
# Porcentagem das 10 cidades com mais drones registrados pelos operadores
(new_dataset.CidadeEstado.value_counts() / new_dataset.CidadeEstado.value_counts().sum()*100).head(10)

São Paulo-SP         11.570801
Rio de Janeiro-RJ     5.951638
Brasília-DF           3.316804
Belo Horizonte-MG     3.067164
Curitiba-PR           2.555403
Salvador-BA           1.620389
Porto Alegre-RS       1.377557
Fortaleza-CE          1.259546
Goiânia-GO            1.158555
Campinas-SP           1.131322
Name: CidadeEstado, dtype: float64

### Ramo de Atividade

In [21]:
# Ramo de atividade dos drones registrados
new_dataset.RamoAtividade.value_counts()

Não Declarado                                              56907
Aerofotografia                                             10260
Aerocinematografia                                          9117
Aeroinspeção                                                3167
Aerolevantamento - Aerofotogrametria                        2726
Aeroagrícola                                                1934
Segurança Pública e/ou Defesa Civil                         1889
Aeropublicidade – Exposição de letreiros luminosos           609
Órgãos de Fiscalização - Entidades Estatais                  558
Aerorreportagem                                              551
Aerolevantamento - Aeroprospecção                            130
Combate a Incêndio                                           114
Aerodemonstração                                              94
Operação com carga externa                                    49
Aeropublicidade – Reboque de faixa                            12
Aeropublicidade – Inscriç

In [22]:
# Porcentagem do Ramo de atividade dos drones registrados
(new_dataset.RamoAtividade.value_counts() / new_dataset.RamoAtividade.value_counts().sum())*100

Não Declarado                                              64.573854
Aerofotografia                                             11.642289
Aerocinematografia                                         10.345297
Aeroinspeção                                                3.593677
Aerolevantamento - Aerofotogrametria                        3.093263
Aeroagrícola                                                2.194560
Segurança Pública e/ou Defesa Civil                         2.143497
Aeropublicidade – Exposição de letreiros luminosos          0.691048
Órgãos de Fiscalização - Entidades Estatais                 0.633177
Aerorreportagem                                             0.625234
Aerolevantamento - Aeroprospecção                           0.147514
Combate a Incêndio                                          0.129359
Aerodemonstração                                            0.106664
Operação com carga externa                                  0.055602
Aeropublicidade – Reboque de faixa

## Conclusão

1. Analisando o papel dos órgãos fiscalizadores do governo, especificamente ANAC, eu vejo a forma de como os registros são realizados é tanto que falha e pode prejudicar a fiscalização. É notório que há uma falta de padronização no preenchimento dos dados, tanto que, em alguns casos não parece os dados são confusos. Um exemplo disso é que mais da metade dos registros não tem ramo de atividade e a variável peso máximo de decolagem não é confiável, já que, fazendo uma pesquisa rápida verifica-se algumas inconformidades com o que diz o fabricante.
Outro ponto é que a última atualização do conjunto de dados é de 2019 e para uma tecnologia nova e que ganha cada vez mais adeptos, esses dados deveriam ser atualizados no mínimo anualmente.


2. Falando agora sobre o uso dos drones, apesar de ser uma "disputa" equilibrada o uso recreativo deles é maioria (57,80%), o que prova que é uma tecnologia que caiu nas graças da população.


3. Olhando para os operadores que registram esses drones, podemos tirar algumas informações interessantes:
    - Um dos operadores que seria obvio ser um dos líderes em registros realmente confirmou essa tendência, que é a Confederação brasileira de Aeromodelismo.
    - Como eu mencionei, os dados são um pouco confusos e uma amostra disso é que o segundo lugar da lista é uma pessoa fica com mais de 400 drones. Porém ao verificar a lista mais detalhadamente e pesquisando mais na internet eu fiquei com a impressão que pode haver algum erro no registro da pessoa que cadastrou o drone ou que no mínimo a informação presente no registro é pouco relevante, no sentido de que não passa a informação que deveria.
    - Outro ponto interessante é notar quantos modelos as policias militares e civil detém, algo que não é tão surpreendente, mas que não paramos para pensar normalmente.


4. Quando paramos para olhar os fabricantes dos drones registrados é interessante notar que a empresa DJI tem um domínio gigantesco do mercado de drones com 84,26% dos modelos e se analisarmos só os 10 fabricantes com mais drones a domínio cresce mais ainda e vai para 93,22%.


5. De forma parecida em relação aos modelos, há uma predominância de três modelos e suas variantes: Mavic, Spark e Phantom.


6. Outro fato relevante é em relação ao local onde os drones foram registrados, sendo que, como já era de se esperar a uma grande concentração deles registrados em capitais e em grandes cidades. Destaque também para a liderança tranquila dos estados da região sudeste, como São Paulo e Rio de Janeiro com o primeiro e segundos lugares e Belo Horizonte em quarto lugar.


7. Em relação ao ramo de atividade um fato interessante, mas um tanto estranho é que 64,57% dos drones registrados não tem uma informação declarada. Isso é estranho porque pode deixar margens para má interpretação.


Por fim, espera-se que na próxima atualização com os registros o governo e a ANAC tragam mais dados e que sejam mais organizados, mais padronizados e que levem a menos dubiedade. Obviamente por ser um mercado novo ainda se está construindo meios de fiscalização para esses drones, porém, é necessário haja uma evolução nesse sentido.