# Add extra information to DRZ auction results

Query to the open data dataset of the RDW.

It may take a while (10 min) to query all auction results.
- - - - 

### User variables


In [1]:
Date = '2019-03' # yyyy-mm

### Modules and functions

In [2]:
import pandas as pd

# to keep api key hidden import this from sub dir
import assets.hidden_api_keys as hidden_api_keys

# base url
apiurl = 'https://opendata.rdw.nl/resource/m9d7-ebf2.json?$$app_token=' + hidden_api_keys.socrata_apptoken + '&'

def get_json_from_api(url,reg,c=0):
    
    '''Get json object from api'''
    
    import time

    c+=1
    try:
        df=pd.read_json(url + 'kenteken=' + reg.replace('-','').upper()).to_dict()
    except:
        if c > 10:
            print(url,reg)
            raise 
        else:
            print('pause 2 sec and try again!')
            time.sleep(2)
            df = get_json_from_api(url,reg,c)
    
    return df
    
# get_json_from_api(apiurl,'61-sf-FG')

### Load auction results

In [3]:
file_name = '../data/drz-data-{}.pkl'.format(Date)
print(file_name)
drz = pd.read_pickle(file_name)

../data/drz-data-2019-03.pkl


### query rdw

In [4]:
# see what lots have a Dutch registration (license number).
hasReg = (~drz.Reg.isnull()) & (drz.Reg != 'onbekend') & (drz.Reg != '') & (~drz.LotType.isin([
    'Vaartuig',
    'Jetski',
    'Sloep',
    'Speedboot',
    'Vaartuig (Type onbekend)',
    'Motorvaartuig met opbouw (Pleziervaartuig)',
    'Aanhangwagen',
]))

# make a copy and add info
rdw = drz.copy()
rdw["rdwinfo"]=None

In [5]:
def get_query_url(api_url, regs, token=hidden_api_keys.socrata_apptoken):
    '''construct query url'''
    
    # convert list to string
    reg_list = ''.join(["'{}', ".format(r.replace('-','').upper()) for r in regs])
    reg_list = reg_list[0:-2] # remove trailing ', '
    q = api_url + '?$$app_token=' + token + '&$where='
    # add escaped soql
    q += urllib.parse.quote('kenteken in(' + reg_list + ')')
    return q

In [6]:
import urllib

# do main api first to get other possible apis
api_name = 'api_gekentekende_voertuigen'
api_url = 'https://opendata.rdw.nl/resource/m9d7-ebf2.json'
regs = rdw.loc[hasReg,'Reg'].values

# query data base
dfs = list()
q = get_query_url(api_url,regs)
dfs.append(pd.read_json(q))
dfs[0].set_index('kenteken', inplace=True)
dfs[0].tail()

# query other available apis
for api_name in [c for c in dfs[0].columns if c.startswith('api')]:
    print(api_name)
    for api_url in dfs[0][api_name].unique():
        print(api_url)
        q = get_query_url(api_url,regs)
        df0 = pd.read_json(q)
        df0.columns.name = api_name
        if df0.shape[0] != 0:
            df0.set_index('kenteken', inplace=True)
        if api_name == 'api_gekentekende_voertuigen_assen':
            df0 = pd.pivot(df0, columns='as_nummer')
            df0 = df0.reorder_levels([1,0], axis='columns').sort_index(axis='columns', level=0)

        elif api_name == 'api_gekentekende_voertuigen_brandstof':
            df0 = pd.pivot(df0, columns='brandstof_volgnummer')
            df0 = df0.reorder_levels([1,0], axis='columns').sort_index(axis='columns', level=0)

        elif api_name == 'api_gekentekende_voertuigen_carrosserie':
            df0 = pd.pivot(df0, columns='carrosserie_volgnummer')
            df0 = df0.reorder_levels([1,0], axis='columns').sort_index(axis='columns', level=0)
        elif api_name == 'api_gekentekende_voertuigen_carrosserie_specifiek':
            df0 = pd.pivot(df0, columns='carrosserie_volgnummer')
            df0 = df0.reorder_levels([1,0], axis='columns').sort_index(axis='columns', level=0)

        display(df0.tail())
        dfs.append(df0)
        
        
df = pd.concat(dfs, axis='columns', sort=False)


api_gekentekende_voertuigen_assen
https://opendata.rdw.nl/resource/3huj-srit.json


as_nummer,1,1,1,1,1,1,1,2,2,2,2,2,2,2
api_gekentekende_voertuigen_assen,aangedreven_as,aantal_assen,hefas,plaatscode_as,spoorbreedte,technisch_toegestane_maximum_aslast,wettelijk_toegestane_maximum_aslast,aangedreven_as,aantal_assen,hefas,plaatscode_as,spoorbreedte,technisch_toegestane_maximum_aslast,wettelijk_toegestane_maximum_aslast
kenteken,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2
TZBT99,,2.0,,,137.0,740.0,740.0,,2.0,,,140.0,730.0,730.0
V718FB,,2.0,N,V,174.0,1600.0,1600.0,,2.0,N,A,173.0,1760.0,1760.0
VG420S,J,2.0,N,V,151.0,,1080.0,N,2.0,N,A,156.0,,1050.0
XG037X,,2.0,,V,150.0,905.0,905.0,,2.0,,A,151.0,1045.0,1045.0
XPJJ71,,2.0,,,137.0,625.0,625.0,,2.0,,,134.0,700.0,700.0


api_gekentekende_voertuigen_brandstof
https://opendata.rdw.nl/resource/8ys7-d773.json


brandstof_volgnummer,1,1,1,1,1,1,1,1,1,1,...,2,2,2,2,2,2,2,2,2,2
api_gekentekende_voertuigen_brandstof,brandstof_omschrijving,brandstofverbruik_buiten,brandstofverbruik_gecombineerd,brandstofverbruik_stad,co2_uitstoot_gecombineerd,co2_uitstoot_gewogen,emissiecode_omschrijving,geluidsniveau_rijdend,geluidsniveau_stationair,milieuklasse_eg_goedkeuring_licht,...,co2_uitstoot_gewogen,emissiecode_omschrijving,geluidsniveau_rijdend,geluidsniveau_stationair,milieuklasse_eg_goedkeuring_licht,nettomaximumvermogen,nominaal_continu_maximumvermogen,roetuitstoot,toerental_geluidsniveau,uitstoot_deeltjes_licht
kenteken,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2,Unnamed: 15_level_2,Unnamed: 16_level_2,Unnamed: 17_level_2,Unnamed: 18_level_2,Unnamed: 19_level_2,Unnamed: 20_level_2,Unnamed: 21_level_2
V718FB,Diesel,,,,221.0,,Euro 4,,,,...,,,,,,,,,,
VG420S,Diesel,4.4,4.8,5.4,125.0,,Euro 5,72.0,77.0,715/2007*630/2012L,...,,,,,,,,,,
VZBL90,Diesel,,,,,,,,,,...,,,,,,,,,,
XG037X,Benzine,6.2,8.4,12.1,203.0,,Euro 4,73.0,85.0,70/220*2003/76B,...,,,,,,,,,,
XPJJ71,Benzine,4.7,5.5,6.9,130.0,,Euro 2,71.0,81.0,70/220*1996/69,...,,,,,,,,,,


api_gekentekende_voertuigen_carrosserie
https://opendata.rdw.nl/resource/vezc-m2t6.json


carrosserie_volgnummer,1,1
api_gekentekende_voertuigen_carrosserie,carrosserietype,type_carrosserie_europese_omschrijving
kenteken,Unnamed: 1_level_2,Unnamed: 2_level_2
V718FB,BB,Bestelwagen
VG420S,BB,Bestelwagen
VZBL90,BA,Vrachtwagen
XG037X,AD,Coupe
XPJJ71,AB,Hatchback


api_gekentekende_voertuigen_carrosserie_specifiek
https://opendata.rdw.nl/resource/jhie-znh9.json


carrosserie_volgnummer,1,1,1
api_gekentekende_voertuigen_carrosserie_specifiek,carrosserie_voertuig_nummer_code_volgnummer,carrosserie_voertuig_nummer_europese_omschrijving,carrosseriecode
kenteken,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2
99WHJX,1,Voor vervoer boten,21
V718FB,1,Gesloten opbouw,3
VG420S,1,Gesloten opbouw,3


api_gekentekende_voertuigen_voertuigklasse
https://opendata.rdw.nl/resource/kmfi-hrps.json


api_gekentekende_voertuigen_voertuigklasse


In [7]:
df['TimeStamp'] = pd.to_datetime('now').strftime('%Y%m%d')


# rdw['rdwinfo'] = df


### Saving

In [None]:
file_name = '../data/rdw-data-{}.pkl'.format(Date)
print(file_name)
rdw.to_pickle(file_name)