In [1]:
import pandas as pd

In [28]:
#functions

from warnings import warn

import numpy as np
import pandas as pd

def multilabel_sample(y, size=1000, min_count=5, seed=None):
    """ Takes a matrix of binary labels `y` and returns
        the indices for a sample of size `size` if
        `size` > 1 or `size` * len(y) if size =< 1.
        The sample is guaranteed to have > `min_count` of
        each label.
    """
    try:
        if (np.unique(y).astype(int) != np.array([0, 1])).all():
            raise ValueError()
    except (TypeError, ValueError):
        raise ValueError('multilabel_sample only works with binary indicator matrices')

    if (y.sum(axis=0) < min_count).any():
        raise ValueError('Some classes do not have enough examples. Change min_count if necessary.')

    if size <= 1:
        size = np.floor(y.shape[0] * size)

    if y.shape[1] * min_count > size:
        msg = "Size less than number of columns * min_count, returning {} items instead of {}."
        warn(msg.format(y.shape[1] * min_count, size))
        size = y.shape[1] * min_count

    rng = np.random.RandomState(seed if seed is not None else np.random.randint(1))

    if isinstance(y, pd.DataFrame):
        choices = y.index
        y = y.values
    else:
        choices = np.arange(y.shape[0])

    sample_idxs = np.array([], dtype=choices.dtype)

    # first, guarantee > min_count of each label
    for j in range(y.shape[1]):
        label_choices = choices[y[:, j] == 1]
        label_idxs_sampled = rng.choice(label_choices, size=min_count, replace=False)
        sample_idxs = np.concatenate([label_idxs_sampled, sample_idxs])

    sample_idxs = np.unique(sample_idxs)

    # now that we have at least min_count of each, we can just random sample
    sample_count = int(size - sample_idxs.shape[0])

    # get sample_count indices from remaining choices
    remaining_choices = np.setdiff1d(choices, sample_idxs)
    remaining_sampled = rng.choice(remaining_choices,
                                   size=sample_count,
                                   replace=False)

    return np.concatenate([sample_idxs, remaining_sampled])


def multilabel_sample_dataframe(df, labels, size, min_count=5, seed=None):
    """ Takes a dataframe `df` and returns a sample of size `size` where all
        classes in the binary matrix `labels` are represented at
        least `min_count` times.
    """
    idxs = multilabel_sample(labels, size=size, min_count=min_count, seed=seed)
    return df.loc[idxs]


def multilabel_train_test_split(X, Y, size, min_count=5, seed=None):
    """ Takes a features matrix `X` and a label matrix `Y` and
        returns (X_train, X_test, Y_train, Y_test) where all
        classes in Y are represented at least `min_count` times.
    """
    index = Y.index if isinstance(Y, pd.DataFrame) else np.arange(Y.shape[0])

    test_set_idxs = multilabel_sample(Y, size=size, min_count=min_count, seed=seed)
    train_set_idxs = np.setdiff1d(index, test_set_idxs)

    test_set_mask = index.isin(test_set_idxs)
    train_set_mask = ~test_set_mask

    return (X[train_set_mask], X[test_set_mask], Y[train_set_mask], Y[test_set_mask])

In [104]:
df = pd.read_csv('TK2010_revised.csv')
df = df[['gemeente','Partij']]

In [105]:
df.head(10)

Unnamed: 0,gemeente,Partij
0,'s-Gravenhage,PVDA
1,'s-Hertogenbosch,VVD
2,Aa en Hunze,PVDA
3,Aalburg,SGP
4,Aalsmeer,VVD
5,Aalten,CDA
6,Abcoude,VVD
7,Achtkarspelen,CDA
8,Alblasserdam,PVDA
9,Albrandswaard,VVD


In [15]:
df1 = pd.read_csv('2010.csv',sep='\t')
df1 = df1.rename(columns={"Regio's": "gemeente"})

In [16]:
df1.head()

Unnamed: 0,Perioden,gemeente,Bevolking/Bevolkingssamenstelling op 1 januari/Totale bevolking (aantal),Bevolking/Bevolkingssamenstelling op 1 januari/Geslacht/Mannen (aantal),Bevolking/Bevolkingssamenstelling op 1 januari/Geslacht/Vrouwen (aantal),Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/Jonger dan 5 jaar (aantal),Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/5 tot 10 jaar (aantal),Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/10 tot 15 jaar (aantal),Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/15 tot 20 jaar (aantal),Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/20 tot 25 jaar (aantal),...,Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Bevolkingsgroei. relatief (per 1 000 inwoners),Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Gemiddeld aantal inwoners (aantal),Bevolking/Particuliere huishoudens/Particuliere huishoudens/Totaal aantal particuliere huishoudens (aantal),Bevolking/Particuliere huishoudens/Particuliere huishoudens/Eenpersoonshuishoudens (aantal),Bevolking/Particuliere huishoudens/Particuliere huishoudens/Huishoudens zonder kinderen (aantal),Bevolking/Particuliere huishoudens/Particuliere huishoudens/Huishoudens met kinderen (aantal),Bevolking/Particuliere huishoudens/Particuliere huishoudens. relatief/Eenpersoonshuishoudens (%),Bevolking/Particuliere huishoudens/Particuliere huishoudens. relatief/Huishoudens zonder kinderen (%),Bevolking/Particuliere huishoudens/Particuliere huishoudens. relatief/Huishoudens met kinderen (%),Bevolking/Particuliere huishoudens/Gemiddelde huishoudensgrootte (personen per 1 huishouden)
0,2007,Aa en Hunze,25563.0,12653.0,12910.0,1330.0,1600.0,1599.0,1409.0,838.0,...,1.4,25580.5,10595.0,2631.0,4141.0,3823.0,24.8,39.1,36.1,2.37
1,2008,Aa en Hunze,25598.0,12668.0,12930.0,1289.0,1605.0,1572.0,1487.0,838.0,...,3.0,25636.5,10671.0,2706.0,4128.0,3837.0,25.4,38.7,36.0,2.36
2,2009,Aa en Hunze,25675.0,12763.0,12912.0,1228.0,1604.0,1595.0,1504.0,851.0,...,-4.4,25619.0,10783.0,2795.0,4149.0,3839.0,25.9,38.5,35.6,2.34
3,2010,Aa en Hunze,25563.0,12685.0,12878.0,1188.0,1564.0,1660.0,1482.0,823.0,...,8.7,25674.0,10829.0,2822.0,4212.0,3795.0,26.1,38.9,35.0,2.34
4,2007,Aalburg,12293.0,6156.0,6137.0,827.0,958.0,958.0,871.0,784.0,...,7.6,12339.5,4289.0,860.0,1298.0,2131.0,20.1,30.3,49.7,2.84


In [61]:
df3 = pd.merge(df,df1, on='gemeente')
df3.columns



NUMBER = ['Bevolking/Bevolkingssamenstelling op 1 januari/Totale bevolking (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Geslacht/Mannen (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Geslacht/Vrouwen (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/Jonger dan 5 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/5 tot 10 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/10 tot 15 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/15 tot 20 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/20 tot 25 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/25 tot 45 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/45 tot 65 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/65 tot 80 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/80 jaar of ouder (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen. relatief/Jonger dan 5 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen. relatief/5 tot 10 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen. relatief/10 tot 15 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen. relatief/15 tot 20 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen. relatief/20 tot 25 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen. relatief/25 tot 45 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen. relatief/45 tot 65 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen. relatief/65 tot 80 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen. relatief/80 jaar of ouder (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Demografische druk/Totale druk (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Demografische druk/Groene druk (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Demografische druk/Grijze druk (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Totale bevolking/Ongehuwd (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Totale bevolking/Gehuwd (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Totale bevolking/Gescheiden (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Totale bevolking/Verweduwd (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Inwoners 15 jaar of ouder (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Ongehuwd (in % van  inwoners 15 jaar of ouder)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Gehuwd (in % van  inwoners 15 jaar of ouder)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Gescheiden (in % van  inwoners 15 jaar of ouder)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Verweduwd (in % van  inwoners 15 jaar of ouder)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Nederlandse achtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Totaal met migratieachtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Westerse migratieachtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Totaal niet-westerse migratieachtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Marokko (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/(voormalige) Nederlandse Antillen. Aruba (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Suriname (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Turkije (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Overig niet-westerse migratieachtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond. relatief/Nederlandse achtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond. relatief/Met migratieachtergrond/Totaal met migratieachtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond. relatief/Met migratieachtergrond/Westerse migratieachtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond. relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Totaal niet-westerse migratieachtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond. relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Marokko (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond. relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/(voormalige) Nederlandse Antillen. Aruba (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond. relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Suriname (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond. relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Turkije (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond. relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Overig niet-westerse migratieachtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Zeer sterk stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Sterk stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Matig stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Weinig stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Niet stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Bevolkingsdichtheid (aantal inwoners per km²)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Geboorte (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Geboorte. relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Sterfte (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Sterfte. relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Geboorteoverschot (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Geboorteoverschot. relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Nieuwvormingen (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Ziekten van hart en vaatstelsel (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Ziekten van ademhalingsstelsel (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Uitwendige doodsoorzaken (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Overige doodsoorzaken (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Vestiging uit andere gemeente (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Vertrek naar andere gemeente (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Binnenlands migratiesaldo (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Binnenlands migratiesaldo. relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Verhuismobiliteit. relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Immigratie en emigratie/Immigratie (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Immigratie en emigratie/Emigratie (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Immigratie en emigratie/Migratiesaldo (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Immigratie en emigratie/Migratiesaldo. relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Inwoners op 31 december (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Bevolkingsgroei (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Bevolkingsgroei. relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Gemiddeld aantal inwoners (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens/Totaal aantal particuliere huishoudens (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens/Eenpersoonshuishoudens (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens/Huishoudens zonder kinderen (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens/Huishoudens met kinderen (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens. relatief/Eenpersoonshuishoudens (%)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens. relatief/Huishoudens zonder kinderen (%)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens. relatief/Huishoudens met kinderen (%)',
        
       'Bevolking/Particuliere huishoudens/Gemiddelde huishoudensgrootte (personen per 1 huishouden)']


NUMBER1 = ['Bevolking/Bevolkingssamenstelling op 1 januari/Totale bevolking (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Geslacht/Mannen (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Geslacht/Vrouwen (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/Jonger dan 5 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/5 tot 10 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/10 tot 15 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/15 tot 20 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/20 tot 25 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/25 tot 45 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/45 tot 65 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/65 tot 80 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/80 jaar of ouder (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/Jonger dan 5 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/5 tot 10 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/10 tot 15 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/15 tot 20 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/20 tot 25 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/25 tot 45 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/45 tot 65 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/65 tot 80 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/80 jaar of ouder (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Demografische druk/Totale druk (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Demografische druk/Groene druk (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Demografische druk/Grijze druk (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Totale bevolking/Ongehuwd (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Totale bevolking/Gehuwd (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Totale bevolking/Gescheiden (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Totale bevolking/Verweduwd (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Inwoners 15 jaar of ouder (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Ongehuwd (in % van  inwoners 15 jaar of ouder)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Gehuwd (in % van  inwoners 15 jaar of ouder)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Gescheiden (in % van  inwoners 15 jaar of ouder)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Verweduwd (in % van  inwoners 15 jaar of ouder)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Nederlandse achtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Totaal met migratieachtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Westerse migratieachtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Totaal niet-westerse migratieachtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Marokko (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/(voormalige) Nederlandse Antillen, Aruba (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Suriname (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Turkije (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Overig niet-westerse migratieachtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Nederlandse achtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Totaal met migratieachtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Westerse migratieachtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Totaal niet-westerse migratieachtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Marokko (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/(voormalige) Nederlandse Antillen, Aruba (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Suriname (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Turkije (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Overig niet-westerse migratieachtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Zeer sterk stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Sterk stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Matig stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Weinig stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Niet stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Bevolkingsdichtheid (aantal inwoners per km²)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Geboorte (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Geboorte, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Sterfte (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Sterfte, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Geboorteoverschot (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Geboorteoverschot, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Nieuwvormingen (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Ziekten van hart en vaatstelsel (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Ziekten van ademhalingsstelsel (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Uitwendige doodsoorzaken (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Overige doodsoorzaken (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Vestiging uit andere gemeente (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Vertrek naar andere gemeente (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Binnenlands migratiesaldo (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Binnenlands migratiesaldo, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Verhuismobiliteit, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Immigratie en emigratie/Immigratie (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Immigratie en emigratie/Emigratie (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Immigratie en emigratie/Migratiesaldo (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Immigratie en emigratie/Migratiesaldo, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Inwoners op 31 december (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Bevolkingsgroei (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Bevolkingsgroei, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Gemiddeld aantal inwoners (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens/Totaal aantal particuliere huishoudens (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens/Eenpersoonshuishoudens (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens/Huishoudens zonder kinderen (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens/Huishoudens met kinderen (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens, relatief/Eenpersoonshuishoudens (%)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens, relatief/Huishoudens zonder kinderen (%)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens, relatief/Huishoudens met kinderen (%)',
       'Bevolking/Particuliere huishoudens/Gemiddelde huishoudensgrootte (personen per 1 huishouden)']

In [103]:
# Import classifiers
from sklearn.linear_model import LogisticRegression
from sklearn.multiclass import OneVsRestClassifier


# Create the new DataFrame: numeric_data_only
numeric_data_only = df3[NUMBER].fillna(-1000)


# Get labels and convert to dummy variables: label_dummies
label_dummies = pd.get_dummies(df3['Partij'])

# Create training and test sets





# Instantiate the classifier: clf
clf = OneVsRestClassifier(LogisticRegression())

# Fit the classifier to the training data
clf.fit(X_train,y_train)

# Print the accuracy
print("Accuracy: {}".format(clf.score(X_test, y_test)))

      Bevolking/Bevolkingssamenstelling op 1 januari/Totale bevolking (aantal)  \
2                                              137775.0                          
3                                              139607.0                          
8                                               12293.0                          
9                                               12386.0                          
15                                              29187.0                          
16                                              27570.0                          
22                                               8680.0                          
25                                              28088.0                          
33                                              22453.0                          
36                                              94174.0                          
39                                              93861.0                          
42              

Accuracy: 0.6268882175226587


In [102]:
holdout = pd.read_csv('Holdout.csv',index_col=0, sep='\t')

holdout = holdout.rename(columns={"Regio's": "gemeente"})




# Generate predictions: predictions
predictions = clf.predict(holdout[NUMBER].fillna(-1000))



# Format predictions in DataFrame: prediction_df
prediction_df = pd.DataFrame(columns=pd.get_dummies(df3['Partij']).columns,
                             index=holdout.gemeente,
                             data=predictions)





# Save prediction_df to csv
#prediction_df.to_csv('predictions.csv')



TypeError: score() missing 1 required positional argument: 'y'

In [None]:
NUMBER1 = ['Bevolking/Bevolkingssamenstelling op 1 januari/Totale bevolking (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Geslacht/Mannen (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Geslacht/Vrouwen (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/Jonger dan 5 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/5 tot 10 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/10 tot 15 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/15 tot 20 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/20 tot 25 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/25 tot 45 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/45 tot 65 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/65 tot 80 jaar (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen/80 jaar of ouder (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/Jonger dan 5 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/5 tot 10 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/10 tot 15 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/15 tot 20 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/20 tot 25 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/25 tot 45 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/45 tot 65 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/65 tot 80 jaar (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Leeftijdsgroepen, relatief/80 jaar of ouder (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Demografische druk/Totale druk (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Demografische druk/Groene druk (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Leeftijd/Demografische druk/Grijze druk (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Totale bevolking/Ongehuwd (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Totale bevolking/Gehuwd (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Totale bevolking/Gescheiden (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Totale bevolking/Verweduwd (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Inwoners 15 jaar of ouder (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Ongehuwd (in % van  inwoners 15 jaar of ouder)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Gehuwd (in % van  inwoners 15 jaar of ouder)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Gescheiden (in % van  inwoners 15 jaar of ouder)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Burgerlijke staat/Bevolking 15 jaar of ouder/Verweduwd (in % van  inwoners 15 jaar of ouder)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Nederlandse achtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Totaal met migratieachtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Westerse migratieachtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Totaal niet-westerse migratieachtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Marokko (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/(voormalige) Nederlandse Antillen, Aruba (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Suriname (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Turkije (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond/Met migratieachtergrond/Niet-westerse migratieachtergrond/Overig niet-westerse migratieachtergrond (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Nederlandse achtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Totaal met migratieachtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Westerse migratieachtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Totaal niet-westerse migratieachtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Marokko (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/(voormalige) Nederlandse Antillen, Aruba (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Suriname (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Turkije (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Migratieachtergrond/Migratieachtergrond, relatief/Met migratieachtergrond/Niet-westerse migratieachtergrond/Overig niet-westerse migratieachtergrond (%)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Zeer sterk stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Sterk stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Matig stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Weinig stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Stedelijkheidsklasse/Niet stedelijk (aantal)',
       'Bevolking/Bevolkingssamenstelling op 1 januari/Bevolkingsdichtheid (aantal inwoners per km²)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Geboorte (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Geboorte, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Sterfte (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Sterfte, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Geboorteoverschot (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Geboorteoverschot, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Nieuwvormingen (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Ziekten van hart en vaatstelsel (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Ziekten van ademhalingsstelsel (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Uitwendige doodsoorzaken (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Geboorte en sterfte/Doodsoorzaken/Overige doodsoorzaken (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Vestiging uit andere gemeente (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Vertrek naar andere gemeente (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Binnenlands migratiesaldo (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Binnenlands migratiesaldo, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Verhuizingen/Verhuismobiliteit, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Immigratie en emigratie/Immigratie (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Immigratie en emigratie/Emigratie (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Immigratie en emigratie/Migratiesaldo (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Immigratie en emigratie/Migratiesaldo, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Inwoners op 31 december (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Bevolkingsgroei (aantal)',
       'Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Bevolkingsgroei, relatief (per 1 000 inwoners)',
       'Bevolking/Bevolkingsontwikkeling/Bevolkingsgroei/Gemiddeld aantal inwoners (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens/Totaal aantal particuliere huishoudens (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens/Eenpersoonshuishoudens (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens/Huishoudens zonder kinderen (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens/Huishoudens met kinderen (aantal)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens, relatief/Eenpersoonshuishoudens (%)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens, relatief/Huishoudens zonder kinderen (%)',
       'Bevolking/Particuliere huishoudens/Particuliere huishoudens, relatief/Huishoudens met kinderen (%)',
       'Bevolking/Particuliere huishoudens/Gemiddelde huishoudensgrootte (personen per 1 huishouden)']

In [97]:
pr = pd.read_csv('predictions.csv')
pr.head()

Unnamed: 0,gemeente,CDA,PVDA,PVV,SGP,SP,VVD
0,Aa en Hunze,0,1,0,0,0,0
1,Aa en Hunze,0,1,0,0,0,0
2,Aa en Hunze,0,1,0,0,0,0
3,Aa en Hunze,0,1,1,0,1,0
4,Aa en Hunze,0,1,0,1,0,1
