## NBA-handreiking 1141: data-analyse bij de controle

Dit memo is afgeleid van de bij JOINSON&amp;SPICE intern gehanteerde templates. We verstrekken dit als voorbeeld voor cursisten, en hanteren daarbij de stappen van de [NBA Handreiking 1141](https://www.nba.nl/wet-en-regelgeving/gedrags-en-beroepsregels/nba-handreiking-1141/). Dit memo is niet volledig maar is bedoeld als vastlegging, om in samenloop met de Handreiking te hanteren.

Door de stappen van de handreiking te implementeren kun je op dossierniveau aantonen dat je met deze analyse hebt voldaan aan de standaarden.

Kenmerkend aan dit Notebook is dat zowel de documentatie als de (Python) analyse hier bij elkaar komen. Zo kan de accountant effectief samenwerken met data specialisten of programmeurs.

# Doel van de analyse

Het doel van deze analyse is zekerheid te krijgen bij de volgende posten en beweringen:
* Volledigheid en afgrenzing van de opbrengstverantwoording
* Waardering van de debiteuren

Om dit doel te bereiken zal een vergelijking worden opgesteld tussen de volgende datasets:
1. Grootboekdata van het verkoopdagboek (GL transactieregels)
2. ... (specifiek maken)

Met behulp van Python worden hierop vervolgens de volgende analyses uitgevoerd:
* Bijv. verbandscontrole
* Bijv. outlier analyse
* Bijv. gegevensgerichte cijferanalyse

We zullen deze analyse in de volgende hoofstukken verder documenteren en uitvoeren. Voor het uitvoeren van de analyse wordt gebruik gemaakt van Python code die in het notebook is opgenomen. Zodoende is de analyse reproduceerbaar en kan deze worden herhaald bij een nieuwe dataset. Bovendien kan de code door een (voldoende ervaren) accountant worden gereviewed om de kwaliteit te borgen.

# Voorbereiding van de analyse

In [None]:

import pandas as pd
import numpy as np

# Voor de meer ervaren data-analisten: 
# Voor het overzicht van dit Notebook kan het slim zijn om logica naar een apart .py bestand te verplaatsen. 
# Schrijf bijvoorbeeld enkele functies en importeer deze in dit Notebook. Zo blijft het notebook goed leesbaar.

## 1. Het verkrijgen van de data en het vastellen van de betrouwbaarheid

Op grond van Standaard 500, paragraaf 7 dient de accountant te overwegen in welke mate de informatie die als controle-informatie wordt gebruikt relevant en betrouwbaar is. 

*Suggestie: Zie bijlage 2 van de NBA-handreiking 1141 voor een voorbeeld van een vastlegging van de betrouwbaarheid van de data.*

### Relevantie

**Relevantie gaat vooral over de logische samenhang met, of invloed op, het doel van de controlemaatregel en, in voorkomend geval, de bewering in kwestie (Zie Standaard 500, Par. A27).**

We hebben de analyse opgezet zoals hierboven beschreven. De analyse is daarmee relevant voor het doel van de controlemaatregel en de beweringen in kwestie. 

*Suggestie 1: neem hier een korte beschrijving op van de analyse en de relatie met de beweringen. Waarom worden bepaalde beweringen geraakt met deze dataset?*

*Suggestie 2: Beschrijf hier de verschillende datasets. Houdt daarbij ook rekening met de granulariteit. Is data bijvoorbeeld geaggregeerd of op detailniveau beschikbaar?*


### Betrouwbaarheid
**De betrouwbaarheid van digitale data wordt veelal aangeduid als data-integriteit.**

Om de betrouwbaarheid van de dataset te toetsen zullen we de volgende controles uitvoeren:

* Berekenen van controletotalen en aansluiten op het grootboek
* Uitvoeren van diverse controles op de datakwaliteit (bijv. ontbrekende velden, extreme waarden)
* Het zelfstandig ophalen en verwerken (ETL) van de data, rechtstreeks uit de brontabel

Wij verwijzen verder naar de conclusies van de door ons uitgevoerde IT Audit. De onderzochte GITC's en IT Dependencies dragen bij aan de betrouwbaarheid van de data. We steunen wel/niet op de GITC's, en voerden daarom wel/niet aanvullende data-controles uit.

### Uitgevoerde Python analyses voor betrouwbaarheid

In [None]:
# Todo: controletotalen berekenen en aansluiten


In [None]:
# Todo: analyse datakwaliteit (bijv. ontbrekende waarden)

In [None]:
# Todo: etc..

## 2. Hoe resulteert data-analyse in voldoende en geschikte controle-informatie?

Dit hoofdstuk moet specifiek worden geschreven obv de gekozen aanpak. Enkele tips/suggesties:
* Als de analyse geschikt is op het **verkrijgen van voldoende zekerheid** (c.q. bevestigende controle-informatie cf hoofdstuk 6.2 van de hanreiking) dan wordt vaak gewerkt met IST en SOLL, of (in data-termen) Observed (IST) en Expected (SOLL). De code hieronder zal dan stapsgewijs een SOLL-positie opbouwen, en die vervolgens met de IST vergelijken. Het gaat hier vaak om aansluitingen tussen verschillende bestanden/dasets, en is vooral sterk als er externe/betrouwbare bronnen zijn die als SOLL kunnen dienen.
* Een andere veelgebruikte methode is het 'falsifieren' van mogelijke risico's (hoofdstuk 6.3 van de hanreiking). Door een lijst van "What could go wrong"'s te definieren, kunnen deze vervolgens worden gefalsifieerd. Een voorbeeld kan zijn: 'er zijn geen kortingen gegeven groter dan 10% van het factuurtotaal'. Met behulp van Python code wordt de korting per factuur berekend, en kan de accountant rapporteren of de hypothese gefalsifieerd is. Nadeel van deze aanpak is dat vaak niet alle (theoretisch mogelijke) risico's te bedenken zijn.

In [None]:
# Todo: opbouwen van IST en SOLL, of falsifieren van mogelijke fouten.


## 3. Hoe gaat de accountants om met de uitkomsten van data-analyse?

De in de Hanreiking genoemde stappen zijn:
1. Het definieren van een norm
2. Nader onderzoek van geconstateerde afwijkingen

In [None]:
# Todo: berekenen en evalueren van de resultaten op basis van bijv. de IST en SOLL

Indien tijdens de analyse afwijkingen of onverwachte patronen zijn gevonden, dienen deze te worden onderzocht. De handreiking geeft in hoofdstuk 7.2 een aantal suggesties.

Neem hier een conclusie op waarom de uitgevoerde werkzaamheden leiden tot de conclusie dat er voldoende zekerheid is gekregen, conform de beschrijving in stap 1.

## 4. Documentatie van de data-analyse werkzaamheden
1. Documentatie uitgevoerde data-analyse
2. Welke data bewaart de accountant