Joris Joppe edited this page Aug 4, 2018 · 17 revisions

rda logo

Analytics Library

Je bent beland op de Wiki van het Analytics Library project. Het open source initiatief voor data-analyse in het domein van accountants en fiscalisten. Als jij hier mee bezig bent en je wilt graag kennis delen met gelijkgestemden, dan ben je op de luiste plek beland. Hieronder vind je een aantal aandachtsgebieden maar als je eerst van gedachten wilt wisselen met de organisatoren, stuur dan een mailtje naar info@analyticslibrary.nl met je contactgevens. Dan nemen we z.s.m. contact me je op.

Vaardig met IDEA?

Dan ben je op de juiste plek beland. Alhoewel er al zeker gewerkt is aan IDEA, staat er nog vrij weinig online.. Werk aan de winkel dus met:

  • beschrijven hoe analyse scripts het beste gedeeld kunnen worden via github
  • beschrijven hoe andere IDEA gebruikers gebruik kunnen maken van die analyses (zie bijvoorbeeld)
  • Bepalen en beschrijven welke conventies wenselijk zijn. Hier is wellicht al een best practice voor zie hier ook een voorbeeld)
  • Scripts uitwerken. Er zijn al ongeveer 30 functionele beschrijvingen die je zou kunnen uitwerken voor IDEA. Het lijkt logisch om de eerder genoemden stappen uit te werken alvorens diep in de scripts te duiken.

ACL Pro?

Voor ACL is al best wel een aantal analyses uitgewerkt. Dit was op basis van een generiek importscript. Daar zat de crux - na overleg met de belastingdienst blijkt dat hun importscript voor auditfiles veel beter is. Het grote verschil is overigens dat het script van de BD alle tabellen uit de auditfile aan elkaar koppelt zodat er 1 grote tabel ontstaat. Dit voorkomt dat je in elk analyse script tabellen moet joinen of relaten voor het juiste inzicht. Het lijkt dan ook zinvol om dit importscript te gebruiken voor de Analytics Library (dit is goedgekeurd). Het is mijn plan om dit nog voor aanvang van de dag gereed te hebben en kun je dat hier vinden. Vervolgens:

  • zou het goed zijn om bestaande ACL scripts om te bouwen naar het datamodel dat volgt uit het nieuwe importscript (als je wilt weten welke scripts er al zijn, kijk dan hier of browse de wiki
  • reeds gedocumenteerde functionele beschrijvingen worden omgezet in ACL scripts. Dit zijn alle reeds beschreven analyses die nog niet zijn uitgewerkt (en waar dus nog geen link naar het ACL script is opgenomen).
  • scripts bouwen voor nieuwe analyses die op 7 december zelf worden bedacht.

Kom je voor PowerBI

New kid on the block maar voor mij een grote onbekende. Gelukkig zijn Robert Stamsnijder, Olaf de Vriend en Guido Leenders er al mee in de weer geweest. Haak bij hen aan en maak er iets moois van. Er staat een PBIX in de repository. Dit is een goede basis schat ik in. Wat volgens mij nog bedacht moet worden is hoe je een dergelijk bestand op een goede manier in versiebeheer krijgt en daar op termijn 30, 40 of 50 analyses aan toe kunt voegen.

Lavastorm en Easy2analyse

Zullen naar verwachting niet breed vertegenwoordigd zijn. De goede mensen van FACET Accountants en van ITRiskControl hebben al wel ongeveer 30 scripts toegevoegd aan de repository. ALs het je ding is, kun je daar op voortborduren.

R, Python, SQL en andere obscure talen

Er is een beginnetje gemaakt voor SQL door de goede mensen van invantive die ook aanwezig zullen zijn. Ik snap het niet maar zij wel dus haak aan als het je interesse heeft. Voor de rest: doe je ding maar hou er rekening mee dat dingen bij voorkeur met andere gedeeld worden. Als je dus iets gaat uitwerken voor Lotus-1-2-3, dan is dat geweldig maar ben je waarschijnlijk de enige die het ooit gaat gebruiken. In dat geval is open source vrij zinloos.

Salarissen jouw ding?

Er is ook nog zoiets als het auditfile salarissen (XAS). WE denken dat er qua controle en advies veel waarde in zit dus zeker ook iets om op te nemen in de library.

Kan je niks maar heb je verstand van accountancy

Dan ben je waarschijnlijk zeer waardevol in uitdenken van analyses die nuttig zijn voor de fiscale, controle of samenstelpraktijk. Dat moet leiden tot een functioneel ontwerp dat duidelijk genoeg is voor een data-analist om uit te werken. De simpele opmerking 'validatie van BTW nummers' als idee volstaat niet. Je zult dan ook moeten documenteren wat de validatieregels zijn. Dus alleen ideeën zijn goed maar er is extra koffie en een koek voor mensen die zo'n idee ook omzetten naar een functionele beschrijving.

  • Daar hebben we een template voor gemaakt die je kunt hanteren (zie bijvoorbeeld). Je mag dit ook in bijvoorbeeld Word documenteren, als de structuur maar gevolgd wordt. Dit kan dan later online gezet worden.
  • Overigens is het dan wel handig om geen dingen uit te denken die we al gedocumenteerd heb. Je krijgt daar een goed beeld van via de overzichtspagina

Referentiegrootboekschema

Adoptie van RGS groeit maar is nog zeker niet optimaal. Als je een auditfile tegen komt zonder RGS, is er vast een handige manier om de RGS-labeling toe te voegen. Zeker als je dit met machine learning zou kunnen doen. Met analys.io heb ik, Joris Joppe ervaring met RGS labeling dus schiet me aan als je hiermee aan de slag zou willen.

Resources

Ontwikkelen werkt het beste als je ook iets hebt om mee te werken.

  • We hebben een aantal auditfiles mogen ontvangen die kun je hier downloaden. Let op dit zijn niet allemaal Versie 3.2 auditfiles.
  • Een andere standaard die we hopelijk veelvuldig gaan gebruiken is het referentiegrootboekschema. Versie 3.0 is net definitief gemaakt en kun hier vinden.
Clone this wiki locally
You can’t perform that action at this time.
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session.
Press h to open a hovercard with more details.