In [1]:
%load_ext autoreload
%autoreload 2

This is an example of how to use the 'generator' and 'utils' modules to create a pandas dataframe of test data.

In [2]:
import pandas as pd
import generator
from typing import Callable

Load the sample data into pandas and check the data type of each column. The types gives an indication of the types of variables to generate for test data.

In [3]:
path = './sample_data/sample_input.xlsx'
sample_df = pd.read_excel(path)
sample_df.dtypes

Factuurnr.                            int64
Naam                                 object
Deb.nr.                               int64
Omschrijving factuur                 object
Boekstuk                     datetime64[ns]
Vervalt                      datetime64[ns]
Factuur                             float64
Saldo                               float64
Factuurreferentie                   float64
Aanmaningen                           int64
Vervaldagen                           int64
Factuur Gbl.                          int64
Aut. bet./inc.                        int64
IBAN-nr.                            float64
Incassomachtiging vereist             int64
Dossier                               int64
Betaaltermijnen                       int64
Betaalwijze                         float64
Factuurstatus                        object
dtype: object

In [4]:
NUM_ROWS = 10

def prepare_values(function: Callable, num_prepared: int = NUM_ROWS) -> list:
    return [function() for _ in range(num_prepared)]

In [5]:
table_dict = {
    "Factuurnr.": generator.factuurnummer,
    "Naam": generator.name,
    "Deb.nr.": generator.debnummer, 
    'Omschrijving factuur': generator.omschrijving, 
    'Boekstuk': generator.boekstuk,
    'Vervalt': generator.vervalt, 
    'Factuur': generator.factuur,
    'Saldo': generator.factuur, 
    'Factuurreferentie': generator.debnummer, 
    'Aanmaningen': generator.debnummer,
    'Vervaldagen': generator.debnummer, 
    'Factuur Gbl.': generator.debnummer, 
    'Aut. bet./inc.': generator.debnummer, 
    'IBAN-nr.': generator.iban,
    'Incassomachtiging vereist': generator.debnummer, 
    'Dossier': generator.debnummer, 
    'Betaaltermijnen': generator.debnummer, 
    'Betaalwijze': generator.debnummer,  
    'Factuurstatus': generator.factuurstatus,
}

columns = list(table_dict.keys())
df = pd.DataFrame(columns=columns)

In [6]:
for key, function in table_dict.items():
    df[key] = prepare_values(function)

In [9]:
gen_path = './generated_data/gen_data_v1.xlsx'
df.to_excel(gen_path, engine='openpyxl', index=False)