In [5]:
FILE_ENCODING = "ISO-8859-1"
FILE_NAME = "SISANT.csv"
FILE_URL = 'http://sistemas.anac.gov.br/dadosabertos/Aeronaves/drones%20cadastrados/SISANT.csv'

import pandas as pd
import requests
from io import BytesIO, StringIO
from requests.packages.urllib3.exceptions import InsecureRequestWarning
from pathlib import Path
import codecs

print('Step 1 - Reading data')

# If the source file is not present, then request from the data source
if not Path(FILE_NAME).is_file():
    print('Disabling insecure request warnings...')
    requests.packages.urllib3.disable_warnings(InsecureRequestWarning)
    print('Requesting data from source...')
    r = requests.get(FILE_URL, verify=False)
    print('Writing data to file...')
    f = codecs.open(FILE_NAME, "w", FILE_ENCODING)
    f.write(r.content)
    f.close()

print('Reading file content...')
content = Path(FILE_NAME).read_text(encoding = FILE_ENCODING)

print('Creating dataframe...')
df = pd.read_csv(StringIO(content[23:]))

df = df[[
    "Data Validade",
    "Operador",
    "CPF/CNPJ",
    "Tipo Uso",
    "Fabricante",
    "Modelo",
    "Número de serie",
    "Peso máximo de decolagem (Kg)",
    "Cidade-Estado",
    "Ramo de atividade"
]]

df.columns = [
    "licenca_data_validade",
    "operador_nome",
    "operador_cpf_cnpj",
    "licenca_tipo_uso",
    "fabricante_nome",
    "modelo_nome",
    "drone_n_serie",
    "drone_peso_max",
    "operador_cidade_estado",
    "ramo_nome"
]

print('Step 1 - Done!')

Step 1 - Reading data
Reading file content...
Creating dataframe...
Step 1 - Done!


In [6]:
# SQL utilities

DB_NAME = "tp2.db"

import sqlite3

def exec_sql(sql):
    global DB_NAME
    conn = sqlite3.connect(DB_NAME)
    cur = conn.cursor()                               
    cur.execute(sql)
    rows = cur.fetchall()
    conn.commit()
    conn.close()
    return rows

def exec_many_sql(sql, data):
    global DB_NAME
    conn = sqlite3.connect(DB_NAME)
    cur = conn.cursor()                               
    cur.executemany(sql, data)
    rows = cur.fetchall()
    conn.commit()
    conn.close()
    return rows

def toggle_foreign_keys(enable = True):
    exec_sql("PRAGMA foreign_keys = %d" % (1 if enable else 0))
    
def create_table(tbl_name, fields):
    exec_sql("DROP TABLE IF EXISTS %s" % tbl_name)
    exec_sql("CREATE TABLE %s (%s)" % (tbl_name, ','.join(fields)))

def find_record(tbl_name, condition):
    return exec_sql("SELECT * FROM %s WHERE %s" % (tbl_name, condition))[0]

def insert_record(tbl_name, columns, values):
    exec_sql("INSERT INTO %s (%s) VALUES (%s)" % (tbl_name, ','.join(columns), values))

In [7]:
print('Step 2 - Creating tables...\n')

print('Creating table "operador"...')
create_table("operador", [
    "operador_id INT AUTO INCREMENT"
    "cpf_cnpj VARCHAR(50)",
    "nome VARCHAR(200)",
    "cidade_estado VARCHAR(50)",
    "PRIMARY KEY (operador_id)"
])
print('Done!\n')

print('Creating table "fabricante"...')
create_table("fabricante", [
    "fabricante_id INT AUTO INCREMENT",
    "nome VARCHAR(200)",
    "PRIMARY KEY (fabricante_id)"
])
print('Done!\n')

print('Creating table "modelo"...')
create_table("modelo", [
    "modelo_id INT AUTO INCREMENT",
    "nome VARCHAR(200)",
    "fabricante_id INT",
    "PRIMARY KEY (modelo_id)",
    "FOREIGN KEY (fabricante_id) REFERENCES fabricante(fabricante_id)"
])
print('Done!\n')

print('Creating table "ramo"...')
create_table("ramo", [
    "ramo_id INT AUTO INCREMENT",
    "nome VARCHAR(200)",
    "PRIMARY KEY (ramo_id)"
])
print('Done!\n')

print('Creating table "drone"...')
create_table("drone", [
    "n_serie VARCHAR(50)",
    "peso_max FLOAT",
    "ramo_id INT",
    "modelo_id INT",
    "PRIMARY KEY (n_serie)",
    "FOREIGN KEY (ramo_id) REFERENCES ramo(ramo_id)",
    "FOREIGN KEY (modelo_id) REFERENCES modelo(modelo_id)"
])
print('Done!\n')

print('Creating table "licenca"...')
create_table("licenca", [
    "operador_id VARCHAR(50)",
    "n_serie VARCHAR(50)",
    "tipo_uso VARCHAR(50) NOT NULL",
    "data_validade DATE NOT NULL",
    "PRIMARY KEY (operador_id, n_serie)",
    "FOREIGN KEY (operador_id) REFERENCES operador(operador_id)",
    "FOREIGN KEY (n_serie) REFERENCES drone(n_serie)"
])
print('Done!\n')

print('Step 2 - Done!')

Step 2 - Creating tables...

Creating table "operador"...


OperationalError: database is locked

In [None]:
def create_operador(row):
    if not find_record("operador", "nome = %s" % row["operador_nome"]):
        insert_record("operador", ["cpf_cnpj", "nome", "cidade_estado"], [
            row["operador_cpf_cnpj"],
            row["operador_nome"],
            row["operador_cidade_estado"]
        ])
        
def create_fabricante(row):
    if not find_record("fabricante", "nome = %s" % row["fabricante_nome"]):
        insert_record("fabricante", ["nome"], [
            row["fabricante_nome"]
        ])

def create_modelo(row):
    fabricante_id = find_record("fabricante", "nome = %s" % row["fabricante_nome"])["fabricante_id"]
    if not find_record("modelo", "nome = %s" % row["modelo_nome"]):
        insert_record("modelo", ["nome"], [
            row["modelo_nome"],
            fabricante_id
        ])
        
def create_ramo(row):
    if not find_record("ramo", "nome = %s" % row["ramo_nome"]):
        insert_record("ramo", ["nome"], [
            row["ramo_nome"]
        ])
        
def create_drone(row):
    ramo_id = find_record("ramo", "nome = %s" % row["ramo_nome"])["ramo_id"]
    modelo_id = find_record("modelo", "nome = %s" % row["modelo_nome"])["modelo_id"]
    if not find_record("drone", "n_serie = %s" % row["drone_n_serie"]):
        insert_record("drone", ["n_serie", "peso_max", "ramo_id", "modelo_id"], [
            row["drone_n_serie"],
            row["drone_peso_max"],
            ramo_id,
            modelo_id,
        ])
        
def create_licenca(row):
    operador_id = find_record("operador", "nome = %s" % row["operador_nome"])["operador_id"]
    n_serie = find_record("drone", "n_serie = %s" % row["drone_n_serie"])["n_serie"]
    if not find_record("licenca", "operador_id = %s" % (operador_id, n_serie)):
        insert_record("licenca", ["operador_id", "n_serie", "tipo_uso", "data_validade"], [
            operador_id,
            n_serie,
            row["licenca_tipo_uso"],
            row["licenca_data_validade"],
        ])

def create_records(row):
    create_operador(row)
    create_fabricante(row)
    create_modelo(row)
    create_ramo(row)
    create_drone(row)
    create_licenca(row)

print('Step 3 - Creating records...')

toggle_foreign_keys(False)

for index, row in df.iterrows():
    create_records(row)

toggle_foreign_keys(True)

print('Step 3 - Done!')