# Projeto 01 - Análise exploratória sobre a quantidade de drones registrados no Brasil de Março/2019 a Set/2021

### Contexto

Toda Aeronave Remotamente Tripulada ou RPAS (Remotely Piloted Aircreft System), comumente conhecidos como Drones, devem possuir um registro junto ao SISANT - Sistema de Aeronaves Não Tripulada.

O SISANT é parte integrante da ANAC - A Agência Nacional de Aviação Civil (ANAC), uma das agências reguladoras federais do País criada para regular e fiscalizar as atividades da aviação civil e a infraestrutura aeronáutica e aeroportuária no Brasil. 

Instituída em 2005, começou a atuar em 2006 substituindo o Departamento de Aviação Civil (DAC). É uma autarquia federal de regime especial e está vinculada à Secretaria de Aviação Civil da Presidência da República. As ações da ANAC se enquadram nas atividades de certificação, fiscalização, normatização e representação institucional.

Todas os RPAS seja para usos recreativos ou para usos não recreativos devem ter seu registro junto ao SISANT e qualquer voo deve ser solicitado previamente ao SARPAS, sistema esse desenvolvido pelo DECEA (Departamento de Controle do Espaço Aéreo) para solicitação de acesso ao Espaço Aéreo Brasileiro por Aeronaves Não Tripuladas.


### Nosso Objetivo

Através do presente banco de dados obter informações sobre:

1) Quantas aeronaves foram registrados no período de Março/2019 a Setembro/2021?
2) Quantas aeronaves foram registradas em nome de pessoas jurídicas?
3) Quantas aeronaves foram registradas em nome de pessoas físicas?
4) Qual o fabricante e o modelo com maior número de registros no período?
5) Quais os 5 Estados com maior índice de registros?
6) Quais os 5 Estados com menor índice de registros?
7) Quais os principais ramos de atividade onde os drones são utilizados, de acordo com a classificação do próprio SISANT?


### O que temos disponível, inspirações e créditos

As bases de dados foram retiradas do Portal Brasileiro de Dados Abertos: https://dados.gov.br/dataset/aeronaves-drones-cadastrados

Informações adicionais existentes no site:

Fonte dos dados: https://anac.gov.br/acesso-a-informacao/dados-abertos
Autor: Gerência Técnica de Normas Operacionais (GTNO/GNOS/SPO)
Mantenedor: Gerência Técnica de Normas Operacionais (GTNO/GNOS/SPO)
Última Atualização: 9 de Setembro de 2021, 18:35 (UTC-03:00)
Criado em: 22 de Março de 2019, 14:37 (UTC-03:00)


### Importar Bibliotecas e Bases de Dados

In [4]:
import pandas as pd

In [35]:
drones_df = pd.read_csv('SISANT.csv', encoding="latin1", sep=';', engine='python', skiprows=1)
display(drones_df)

Unnamed: 0,Código Aeronave,Data Validade,Operador,CPF/CNPJ,Tipo Uso,Fabricante,Modelo,Número de serie,Peso máximo de decolagem (Kg),Cidade-Estado,Ramo de atividade
0,PP- 11082012,05/01/2024,Matias Cherem Dala Stella,077.XXX.XXX-06,Não Recreativo,DJI,Mavic,08QCE7C0120QNU,0.74,Curitiba-PR,Aerocinematografia
1,PP- 26534803,07/04/2024,WANDERLEI,181.XXX.XXX-38,Não Recreativo,DJI,Mavic 2 Pro,163dG6G00170Y0,9,São Paulo-SP,Aerofotografia
2,PP- 35041299,03/01/2024,FRANCISCO GABRIEL,673.XXX.XXX-87,Não Recreativo,DJI,Mavic,3YTBJAB,0.12,Salvador-BA,Aeroinspeção
3,PP- 40211550,05/05/2023,Companhia de inteligência urbana e servicos S/A,40.211.550/0001-74,Não Recreativo,DJI,Phantom 4 Pro,11UDH38R710533,1.38,Fortaleza-CE,Aerolevantamento - Aerofotogrametria
4,PP-000000001,26/03/2023,JUORDAN GUSS PEDRONI,080.XXX.XXX-60,Não Recreativo,DJI,Mavic,08qde2r01204xu,1,Colatina-ES,Aerocinematografia
...,...,...,...,...,...,...,...,...,...,...,...
93686,PR-999999966,12/08/2023,João Marcos Gigliotti,381.XXX.XXX-29,Recreativo,FIMI,FIMI X8 MINI,123456789,0.25,Araraquara-SP,
93687,PR-999999980,22/06/2022,Thomas Oliver Waluszek,297.XXX.XXX-00,Recreativo,Multilaser,BIRD,ML-ES255SA,0.5,São Paulo-SP,
93688,PR-999999990,18/03/2022,RODRIGO COSTA MONTEIRO,048.XXX.XXX-51,Recreativo,DJI,Phantom 4 Pro,oaxce8doa30687,1.38,São Paulo-SP,
93689,PR-999999994,09/03/2023,Nicholas Maximino Gontijo Corradi,095.XXX.XXX-01,Recreativo,FIMI,X8 SE 2020,FMWRJ03A6,1.25,Sabará-MG,


### Se tivermos muitas colunas, já vamos identificar quais colunas podem ser excluidas

- No presente projeto algumas colunas de nossa base de dados não são necessárias para a análise alvo do presente projeto, sendo assim colunas como: Código da Aeronave, Número de Série, Peso Máximo de Decolgaem (Kg) serão excluidas;

- A coluna 'Operador' também será excluida visando preservar os nomes das pessoas físicas e jurídicas, mesmo esse banco de dados sendo público.

In [46]:
#drones_df = drones_df.drop('Código Aeronave', axis=1)
#drones_df = drones_df.drop('Operador', axis=1)
drones_df = drones_df.drop('Número de serie', axis=1)
drones_df = drones_df.drop('Peso máximo de decolagem (Kg)', axis=1)
display(drones_df)

Unnamed: 0,Data Validade,CPF/CNPJ,Tipo Uso,Fabricante,Modelo,Cidade-Estado,Ramo de atividade
0,05/01/2024,077.XXX.XXX-06,Não Recreativo,DJI,Mavic,Curitiba-PR,Aerocinematografia
1,07/04/2024,181.XXX.XXX-38,Não Recreativo,DJI,Mavic 2 Pro,São Paulo-SP,Aerofotografia
2,03/01/2024,673.XXX.XXX-87,Não Recreativo,DJI,Mavic,Salvador-BA,Aeroinspeção
3,05/05/2023,40.211.550/0001-74,Não Recreativo,DJI,Phantom 4 Pro,Fortaleza-CE,Aerolevantamento - Aerofotogrametria
4,26/03/2023,080.XXX.XXX-60,Não Recreativo,DJI,Mavic,Colatina-ES,Aerocinematografia
...,...,...,...,...,...,...,...
93686,12/08/2023,381.XXX.XXX-29,Recreativo,FIMI,FIMI X8 MINI,Araraquara-SP,
93687,22/06/2022,297.XXX.XXX-00,Recreativo,Multilaser,BIRD,São Paulo-SP,
93688,18/03/2022,048.XXX.XXX-51,Recreativo,DJI,Phantom 4 Pro,São Paulo-SP,
93689,09/03/2023,095.XXX.XXX-01,Recreativo,FIMI,X8 SE 2020,Sabará-MG,


### Tratar Valores Faltantes ou Nulos

In [72]:
#verificar a quantidade total de linhas e colunas do meu dataframe
drones_df.shape

(93691, 7)

In [71]:
#definição da quantidade de Nan nas rows
faltantes = drones_df.isnull().sum()
print(faltantes)

#definição da quantidade de Nan nas rows só que em porcentagem
faltantes_porcentagem = drones_df.isnull().sum() / len(drones_df['Data Validade'])*100
print()
print(faltantes_porcentagem)

Data Validade            0
CPF/CNPJ                 0
Tipo Uso                 0
Fabricante               4
Modelo                   4
Cidade-Estado           12
Ramo de atividade    59620
dtype: int64

Data Validade         0.000000
CPF/CNPJ              0.000000
Tipo Uso              0.000000
Fabricante            0.004269
Modelo                0.004269
Cidade-Estado         0.012808
Ramo de atividade    63.634714
dtype: float64


In [81]:
#fazer uma modificação dos valore NaN por outros valores dentro da tabela sem precisar excluir
drones_df['Ramo de atividade'].fillna('Não informado', inplace=True)
drones_df['Fabricante'].fillna('Não informado', inplace=True)
drones_df['Modelo'].fillna('Não informado', inplace=True)
drones_df['Cidade-Estado'].fillna('Não informado', inplace=True)
display(drones_df)

Unnamed: 0,Data Validade,CPF/CNPJ,Tipo Uso,Fabricante,Modelo,Cidade-Estado,Ramo de atividade
0,2024-01-05,077.XXX.XXX-06,Não Recreativo,DJI,Mavic,Curitiba-PR,Aerocinematografia
1,2024-04-07,181.XXX.XXX-38,Não Recreativo,DJI,Mavic 2 Pro,São Paulo-SP,Aerofotografia
2,2024-01-03,673.XXX.XXX-87,Não Recreativo,DJI,Mavic,Salvador-BA,Aeroinspeção
3,2023-05-05,40.211.550/0001-74,Não Recreativo,DJI,Phantom 4 Pro,Fortaleza-CE,Aerolevantamento - Aerofotogrametria
4,2023-03-26,080.XXX.XXX-60,Não Recreativo,DJI,Mavic,Colatina-ES,Aerocinematografia
...,...,...,...,...,...,...,...
93686,2023-08-12,381.XXX.XXX-29,Recreativo,FIMI,FIMI X8 MINI,Araraquara-SP,Não informado
93687,2022-06-22,297.XXX.XXX-00,Recreativo,Multilaser,BIRD,São Paulo-SP,Não informado
93688,2022-03-18,048.XXX.XXX-51,Recreativo,DJI,Phantom 4 Pro,São Paulo-SP,Não informado
93689,2023-03-09,095.XXX.XXX-01,Recreativo,FIMI,X8 SE 2020,Sabará-MG,Não informado


In [82]:
#Rodando novamente a linha de cópido para saber se existem novos valores não preenchido na tabela
faltantes = drones_df.isnull().sum()
print(faltantes)

Data Validade        0
CPF/CNPJ             0
Tipo Uso             0
Fabricante           0
Modelo               0
Cidade-Estado        0
Ramo de atividade    0
dtype: int64


### Verificar Tipos de Dados em cada coluna

In [83]:
drones_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 93691 entries, 0 to 93690
Data columns (total 7 columns):
 #   Column             Non-Null Count  Dtype         
---  ------             --------------  -----         
 0   Data Validade      93691 non-null  datetime64[ns]
 1   CPF/CNPJ           93691 non-null  object        
 2   Tipo Uso           93691 non-null  object        
 3   Fabricante         93691 non-null  object        
 4   Modelo             93691 non-null  object        
 5   Cidade-Estado      93691 non-null  object        
 6   Ramo de atividade  93691 non-null  object        
dtypes: datetime64[ns](1), object(6)
memory usage: 5.0+ MB


In [84]:
#alterar a coluna da 'Data Validade" em uma data renocnhecida pelo Python
drones_df['Data Validade'] = pd.to_datetime(drones_df['Data Validade'], format='%d/%m/%Y')
display(drones_df)
drones_df.info()

Unnamed: 0,Data Validade,CPF/CNPJ,Tipo Uso,Fabricante,Modelo,Cidade-Estado,Ramo de atividade
0,2024-01-05,077.XXX.XXX-06,Não Recreativo,DJI,Mavic,Curitiba-PR,Aerocinematografia
1,2024-04-07,181.XXX.XXX-38,Não Recreativo,DJI,Mavic 2 Pro,São Paulo-SP,Aerofotografia
2,2024-01-03,673.XXX.XXX-87,Não Recreativo,DJI,Mavic,Salvador-BA,Aeroinspeção
3,2023-05-05,40.211.550/0001-74,Não Recreativo,DJI,Phantom 4 Pro,Fortaleza-CE,Aerolevantamento - Aerofotogrametria
4,2023-03-26,080.XXX.XXX-60,Não Recreativo,DJI,Mavic,Colatina-ES,Aerocinematografia
...,...,...,...,...,...,...,...
93686,2023-08-12,381.XXX.XXX-29,Recreativo,FIMI,FIMI X8 MINI,Araraquara-SP,Não informado
93687,2022-06-22,297.XXX.XXX-00,Recreativo,Multilaser,BIRD,São Paulo-SP,Não informado
93688,2022-03-18,048.XXX.XXX-51,Recreativo,DJI,Phantom 4 Pro,São Paulo-SP,Não informado
93689,2023-03-09,095.XXX.XXX-01,Recreativo,FIMI,X8 SE 2020,Sabará-MG,Não informado


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 93691 entries, 0 to 93690
Data columns (total 7 columns):
 #   Column             Non-Null Count  Dtype         
---  ------             --------------  -----         
 0   Data Validade      93691 non-null  datetime64[ns]
 1   CPF/CNPJ           93691 non-null  object        
 2   Tipo Uso           93691 non-null  object        
 3   Fabricante         93691 non-null  object        
 4   Modelo             93691 non-null  object        
 5   Cidade-Estado      93691 non-null  object        
 6   Ramo de atividade  93691 non-null  object        
dtypes: datetime64[ns](1), object(6)
memory usage: 5.0+ MB


### Análise Exploratória dos dados consolidados