In [1]:
from arelle import ModelManager, Cntlr, ModelFormulaObject, ModelXbrl, ViewFileFormulae, XbrlConst, ViewFileRenderedGrid
from arelle import RenderingEvaluator

import pandas as pd
import numpy as np
import os
from os.path import join
import re
import ast
import sys
#from Evaluator import Evaluator
import src
import data_patterns

In [2]:
RULES_PATH = join('..', 'solvency2-rules')
FILENAME_RULES = '2020-01-22 Set aanvullende controleregels Solvency II_tcm46-387021.xlsx'

## Construct test Solvency 2 instance (put here your own data)

In [3]:
RESULTS_PATH = join('..', 'results')
DATA_PATH = join('..', 'data')

In [4]:
df = pd.DataFrame()
df.index.name = "index"
files = [f for f in os.listdir(RESULTS_PATH) if os.path.isfile(join(RESULTS_PATH, f)) if f[-6:]=='pickle']
for file in files:
    new_df = pd.read_pickle(join(RESULTS_PATH, file))
    new_df.columns = [col.upper() for col in new_df.columns]
    if list(new_df.index) == [0]: # without z-axis for now
        for col in new_df.columns:
            if col not in df.columns:
                df[col] = new_df[col]
    else:
        for col in new_df.columns:
            if col not in df.columns:
                # we only pick the first line in the z-axis column
                df.loc[0, col] = new_df.iloc[0, new_df.columns.get_loc(col)]
        df.loc[0, new_df.index.name] = new_df.index[0]
df = df.astype(object)

In [5]:
df.head()

Unnamed: 0_level_0,"E.01.01.16.01,EC0020","E.01.01.16.01,EC0030","E.01.01.16.01,EC0040","E.01.01.16.01,EC0050","E.01.01.16.01,EC0060","E.01.01.16.01,EC0010","E.02.01.16.01,EC0010","E.02.01.16.01,ER0050","E.03.01.16.01,EC0020","E.03.01.16.01,ER0030",...,"SR.27.01.01.28,R2421,C0781","T.99.01.01.01,C0050","T.99.01.01.01,C0060","T.99.01.01.01,C0070","T.99.01.01.01,C0080","T.99.01.01.01,C0090","T.99.01.01.01,C0100","T.99.01.01.01,C0110","T.99.01.01.01,C0120","T.99.01.01.01,C0010"
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
0,"IRAN, ISLAMIC REPUBLIC OF",s2c_CU:SCR,4594460.0,778090000.0,948777000.0,1,362888000.0,Pension entitlements,840734000.0,Home country,...,0,bpfy aq nmai jr,938006000.0,svvf vvzwwn,1999-10-10 00:00:00,80290,796320,0.6436,True,1


## Create simple taxonomy based on instance

In [6]:
df_taxo = pd.DataFrame(columns = ['datapoint', 'template', 'row', 'column', 'dtype'])
for idx, col in enumerate(df.columns):
    df_taxo.loc[idx, "datapoint"] = col.upper()
    df_taxo.loc[idx, "template"] = col[0:13].upper()
    df_taxo.loc[idx, "row"] = col[14:19].upper()
    df_taxo.loc[idx, "column"] = col[20:25].upper()
    df_taxo.loc[idx, "dtype"] = df.dtypes[idx]
df_taxo.head(5)

# for now we only use the list of templates in the instance
instance_templates = list(df_taxo.loc[:, 'template'].unique())
del df_taxo

## Read DNBs Additional Validation Rules

In [7]:
df_rules = pd.read_excel(join(RULES_PATH, FILENAME_RULES), header = 1)
df_rules = df_rules.set_index('ControleRegelCode')
df_rules = df_rules.drop('S.28.01_129', axis = 0) # double line, should be removed
df_rules = df_rules.drop('S.01.03_110', axis = 0) # double line, should be removed
df_rules.fillna("", inplace = True)

## Parse formulas

In [8]:
evaluator = src.evaluator.Evaluator(df, df_rules, instance_templates)

In [9]:
evaluator.transform_rules()

In [10]:
evaluator.evaluate_rules()

Unnamed: 0_level_0,pattern_id,cluster,pattern_def,support,exceptions,confidence,pattern status,encodings,pandas co,pandas ex,xbrl co,xbrl ex,Error message
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1
0,S.01.01_112,0,"IF {'S.01.01.02.01,R0580,C0010'} = 'REPORTED' ...",0,0,0,DNB,{},"df[(df['S.01.01.02.01,R0580,C0010']=='REPORTED...","df[(df['S.01.01.02.01,R0580,C0010']=='REPORTED...",,,
1,S.01.01_113,0,"{'S.01.01.02.01,R0590,C0010'} != 'REPORTED '",0,0,0,DNB,{},"df[(df['S.01.01.02.01,R0590,C0010']!='REPORTED...","df[~(df['S.01.01.02.01,R0590,C0010']!='REPORTE...",,,
2,S.01.02_102,0,"{'S.01.02.01.01,R0050,C0010'} = 'NETHERLANDS'",0,0,0,DNB,{},"df[(df['S.01.02.01.01,R0050,C0010']=='NETHERLA...","df[~(df['S.01.02.01.01,R0050,C0010']=='NETHERL...",,,
3,S.01.02_104,0,"{'S.01.02.01.01,R0070,C0010'} = 'DUTCH' | {'S....",0,0,0,DNB,{},"df[((df['S.01.02.01.01,R0070,C0010']=='DUTCH')...","df[~((df['S.01.02.01.01,R0070,C0010']=='DUTCH'...",,,
4,S.01.02_110,0,"{'S.01.02.01.01,R0100,C0010'} = 'REGULAR REPOR...",0,0,0,DNB,{},"df[(df['S.01.02.01.01,R0100,C0010']=='REGULAR ...","df[~(df['S.01.02.01.01,R0100,C0010']=='REGULAR...",,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...
1519,S.31.01_105,0,"IF {'S.31.01.01.02,C0160'} != ' ' THEN {'S.31....",0,0,0,DNB,{},"df[(df['S.31.01.01.02,C0160']!=' ') & (df['S.3...","df[(df['S.31.01.01.02,C0160']!=' ') & ~(df['S....",,,
1520,S.31.01_107,0,"IF {'S.31.01.01.02,C0160'} != ' ' THEN {'S.31....",0,0,0,DNB,{},"df[(df['S.31.01.01.02,C0160']!=' ') & (df['S.3...","df[(df['S.31.01.01.02,C0160']!=' ') & ~(df['S....",,,
1521,S.31.01_111,0,"IF {'S.31.01.01.02,C0160'} != ' ' & {'S.31.01....",0,0,0,DNB,{},"df[((df['S.31.01.01.02,C0160']!=' ') & (df['S....","df[((df['S.31.01.01.02,C0160']!=' ') & (df['S....",,,
1522,S.31.01_112,0,"IF {'S.31.01.01.02,C0160'} != ' ' & {'S.31.01....",0,0,0,DNB,{},"df[((df['S.31.01.01.02,C0160']!=' ') & (df['S....","df[((df['S.31.01.01.02,C0160']!=' ') & (df['S....",,,


In [11]:
miner = data_patterns.PatternMiner(df_patterns = evaluator.df_patterns)
results = miner.analyze(df)

0
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.01.01.02.01,R0590,C0010'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.01.01.02.01,R0580,C0010'}">
S.01.01.02.01,R0590,C0010 S.01.01.02.01,R0580,C0010
1
[]
None S.01.01.02.01,R0590,C0010
2
[0]
None S.01.02.01.01,R0050,C0010
3
[0]
None S.01.02.01.01,R0070,C0010
4
[0]
None S.01.02.01.01,R0100,C0010
5
[]
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.01.03.01.01,C0060'}">
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.01.03.01.01,C0040'}">
S.01.03.01.01,C0060 S.01.03.01.01,C0040
6
[]
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.01.03.01.01,C0070'}">
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.01.03.01.01,C0040'}">
S.01.03.01.01,C0070 S.01.03.01.01,C0040
7
[]
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.01.03.01.01,C0080'}">
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.01.03.01.01,C0040'}">
S.01.03.01.01,C0080 S.01.03.01.01,C0040
8
[]
HERE
<_sre.SRE_Match object; span=(1

HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.01.01,R0550,C0200'}">
S.05.01.01.01,R0700,C0060 S.05.01.01.01,R0550,C0200
141
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.01.01,R0700,C0070'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.01.01,R0550,C0200'}">
S.05.01.01.01,R0700,C0070 S.05.01.01.01,R0550,C0200
142
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.01.01,R0700,C0080'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.01.01,R0550,C0200'}">
S.05.01.01.01,R0700,C0080 S.05.01.01.01,R0550,C0200
143
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.01.01,R0700,C0090'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.01.01,R0550,C0200'}">
S.05.01.01.01,R0700,C0090 S.05.01.01.01,R0550,C0200
144
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.01.01,R0700,C0100'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.01.01,R0550,C0200'}">
S.05.01.01.01,R0700,C0100 

[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.02.01,R0550,C0010'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.02.01,R0110,C0200'}">
<_sre.SRE_Match object; span=(36, 65), match="{'S.05.01.02.01,R0310,C0080'}">
S.05.01.02.01,R0550,C0010 ['S.05.01.02.01,R0110,C0200', 'S.05.01.02.01,R0310,C0080']
179
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.02.01,R0550,C0010'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.02.01,R0110,C0200'}">
<_sre.SRE_Match object; span=(36, 65), match="{'S.05.01.02.01,R0310,C0090'}">
S.05.01.02.01,R0550,C0010 ['S.05.01.02.01,R0110,C0200', 'S.05.01.02.01,R0310,C0090']
180
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.02.01,R0550,C0010'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.05.01.02.01,R0110,C0200'}">
<_sre.SRE_Match object; span=(36, 65), match="{'S.05.01.02.01,R0310,C0100'}">
S.05.01.02.01,R0550,C0010 ['S.05.01.02.01,R0110,C0200', 'S.05.01.02.01,R0310,C0100']
18

[]
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.10.01.01.01,C0130'}">
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.10.01.01.01,C0180'}">
S.10.01.01.01,C0130 S.10.01.01.01,C0180
216
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.01.01,R0100,C0020'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.01.01,R0030,C0020'}">
S.12.01.01.01,R0100,C0020 S.12.01.01.01,R0030,C0020
217
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.01.01,R0100,C0020'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.01.01,R0030,C0030'}">
S.12.01.01.01,R0100,C0020 S.12.01.01.01,R0030,C0030
218
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.01.01,R0100,C0020'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.01.01,R0030,C0040'}">
S.12.01.01.01,R0100,C0020 S.12.01.01.01,R0030,C0040
219
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.01.01,R0100,C0020'}">
HERE
<_sre.SRE_Match object; span=(1, 30), matc

HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.02.01,R0100,C0020'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.02.01,R0030,C0100'}">
S.12.01.02.01,R0100,C0020 S.12.01.02.01,R0030,C0100
267
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.02.01,R0100,C0020'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.02.01,R0030,C0150'}">
S.12.01.02.01,R0100,C0020 S.12.01.02.01,R0030,C0150
268
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.02.01,R0100,C0020'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.02.01,R0030,C0160'}">
S.12.01.02.01,R0100,C0020 S.12.01.02.01,R0030,C0160
269
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.02.01,R0100,C0020'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.02.01,R0030,C0170'}">
S.12.01.02.01,R0100,C0020 S.12.01.02.01,R0030,C0170
270
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.12.01.02.01,R0100,C0020'}">
HERE
<_sre.SRE_Match objec

[0]
463
[0]
464
[0]
465
[0]
466
[0]
467
[0]
468
[0]
469
[0]
470
[0]
471
[0]
472
[0]
473
[0]
474
[0]
475
[0]
476
[0]
477
[0]
478
[0]
479
[0]
480
[0]
481
[0]
482
[0]
483
[0]
484
[0]
485
[0]
486
[0]
487
[0]
488
[0]
489
[0]
490
[0]
491
[0]
492
[0]
493
[0]
494
[0]
495
[0]
496
[0]
497
[0]
498
[0]
499
[0]
500
[0]
501
[0]
502
[0]
503
[0]
504
[0]
505
[0]
506
[0]
507
[0]
508
[0]
509
[0]
510
[0]
511
[0]
512
[0]
513
[0]
514
[0]
515
[0]
516
[0]
517
[0]
518
[0]
519
[0]
520
[0]
521
[0]
522
[0]
523
[0]
524
[0]
525
[]
526
[0]
527
[0]
528
[]
529
[0]
530
[]
531
[0]
532
[]
533
[0]
534
[0]
535
[0]
536
[0]
537
[0]
538
[0]
539
[0]
540
[0]
541
[0]
542
[0]
543
[0]
544
[0]
545
[0]
546
[0]
547
[0]
548
[0]
549
[]
550
[]
551
[]
552
[]
553
[0]
554
[0]
555
[0]
556
[0]
557
[0]
558
[0]
559
[0]
560
[0]
561
[0]
562
[0]
563
[0]
564
[0]
565
[0]
566
[0]
567
[0]
568
[0]
569
[0]
570
[0]
571
[0]
572
[0]
573
[0]
574
[0]
575
[0]
576
[0]
577
[0]
578
[0]
579
[0]
580
[0]
581
[0]
582
[0]
583
[0]
584
[0]
585
[0]
586
[0]
587
[0]
588


792
[]
793
[]
794
[]
795
[]
HERE
<_sre.SRE_Match object; span=(2, 31), match="{'S.26.04.01.09,R0010,C0010'}">
<_sre.SRE_Match object; span=(59, 88), match="{'S.26.04.01.09,R0010,C0010'}">
HERE
<_sre.SRE_Match object; span=(2, 31), match="{'S.26.04.01.01,R0100,C0060'}">
<_sre.SRE_Match object; span=(38, 67), match="{'S.26.04.01.01,R0100,C0080'}">
['S.26.04.01.09,R0010,C0010', 'S.26.04.01.09,R0010,C0010'] ['S.26.04.01.01,R0100,C0060', 'S.26.04.01.01,R0100,C0080']
796
[]
HERE
<_sre.SRE_Match object; span=(2, 31), match="{'S.26.04.01.09,R0050,C0010'}">
<_sre.SRE_Match object; span=(59, 88), match="{'S.26.04.01.09,R0050,C0010'}">
HERE
<_sre.SRE_Match object; span=(2, 31), match="{'S.26.04.01.01,R0400,C0060'}">
<_sre.SRE_Match object; span=(38, 67), match="{'S.26.04.01.01,R0400,C0080'}">
['S.26.04.01.09,R0050,C0010', 'S.26.04.01.09,R0050,C0010'] ['S.26.04.01.01,R0400,C0060', 'S.26.04.01.01,R0400,C0080']
797
[]
HERE
<_sre.SRE_Match object; span=(2, 31), match="{'S.26.04.01.09,R0060,C0010'}">


[0]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1260,C0240'}">
<_sre.SRE_Match object; span=(31, 60), match="{'S.27.01.01.04,R1260,C0230'}">
<_sre.SRE_Match object; span=(61, 90), match="{'S.27.01.01.04,R1340,C0220'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1340,C0220'}">
['S.27.01.01.04,R1260,C0240', 'S.27.01.01.04,R1260,C0230', 'S.27.01.01.04,R1340,C0220'] S.27.01.01.04,R1340,C0220
1050
[0]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1260,C0240'}">
<_sre.SRE_Match object; span=(31, 60), match="{'S.27.01.01.04,R1260,C0230'}">
<_sre.SRE_Match object; span=(61, 90), match="{'S.27.01.01.04,R1350,C0220'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1350,C0220'}">
['S.27.01.01.04,R1260,C0240', 'S.27.01.01.04,R1260,C0230', 'S.27.01.01.04,R1350,C0220'] S.27.01.01.04,R1350,C0220
1051
[0]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1260,C0240'}">
<_sre.SRE_Match object; span

HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1260,C0240'}">
<_sre.SRE_Match object; span=(31, 60), match="{'S.27.01.01.04,R1260,C0230'}">
<_sre.SRE_Match object; span=(61, 90), match="{'S.27.01.01.04,R1530,C0220'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1530,C0220'}">
['S.27.01.01.04,R1260,C0240', 'S.27.01.01.04,R1260,C0230', 'S.27.01.01.04,R1530,C0220'] S.27.01.01.04,R1530,C0220
1069
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1260,C0240'}">
<_sre.SRE_Match object; span=(31, 60), match="{'S.27.01.01.04,R1260,C0230'}">
<_sre.SRE_Match object; span=(61, 90), match="{'S.27.01.01.04,R1540,C0220'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1540,C0220'}">
['S.27.01.01.04,R1260,C0240', 'S.27.01.01.04,R1260,C0230', 'S.27.01.01.04,R1540,C0220'] S.27.01.01.04,R1540,C0220
1070
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1260,C0240'}">
<_sre.SRE_Match object; span=(31, 

[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1550,C0240'}">
<_sre.SRE_Match object; span=(31, 60), match="{'S.27.01.01.04,R1260,C0230'}">
<_sre.SRE_Match object; span=(61, 90), match="{'S.27.01.01.04,R1620,C0220'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0220'}">
['S.27.01.01.04,R1550,C0240', 'S.27.01.01.04,R1260,C0230', 'S.27.01.01.04,R1620,C0220'] S.27.01.01.04,R1620,C0220
1107
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1560,C0240'}">
<_sre.SRE_Match object; span=(31, 60), match="{'S.27.01.01.04,R1260,C0230'}">
<_sre.SRE_Match object; span=(61, 90), match="{'S.27.01.01.04,R1620,C0220'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0220'}">
['S.27.01.01.04,R1560,C0240', 'S.27.01.01.04,R1260,C0230', 'S.27.01.01.04,R1620,C0220'] S.27.01.01.04,R1620,C0220
1108
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1570,C0240'}">
<_sre.SRE_Match object; span=(3

[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0240'}">
<_sre.SRE_Match object; span=(31, 60), match="{'S.27.01.01.04,R1390,C0230'}">
<_sre.SRE_Match object; span=(61, 90), match="{'S.27.01.01.04,R1620,C0220'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0220'}">
['S.27.01.01.04,R1620,C0240', 'S.27.01.01.04,R1390,C0230', 'S.27.01.01.04,R1620,C0220'] S.27.01.01.04,R1620,C0220
1127
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0240'}">
<_sre.SRE_Match object; span=(31, 60), match="{'S.27.01.01.04,R1400,C0230'}">
<_sre.SRE_Match object; span=(61, 90), match="{'S.27.01.01.04,R1620,C0220'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0220'}">
['S.27.01.01.04,R1620,C0240', 'S.27.01.01.04,R1400,C0230', 'S.27.01.01.04,R1620,C0220'] S.27.01.01.04,R1620,C0220
1128
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0240'}">
<_sre.SRE_Match object; span=(3

HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0240'}">
<_sre.SRE_Match object; span=(31, 60), match="{'S.27.01.01.04,R1590,C0230'}">
<_sre.SRE_Match object; span=(61, 90), match="{'S.27.01.01.04,R1620,C0220'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0220'}">
['S.27.01.01.04,R1620,C0240', 'S.27.01.01.04,R1590,C0230', 'S.27.01.01.04,R1620,C0220'] S.27.01.01.04,R1620,C0220
1147
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0240'}">
<_sre.SRE_Match object; span=(31, 60), match="{'S.27.01.01.04,R1600,C0230'}">
<_sre.SRE_Match object; span=(61, 90), match="{'S.27.01.01.04,R1620,C0220'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0220'}">
['S.27.01.01.04,R1620,C0240', 'S.27.01.01.04,R1600,C0230', 'S.27.01.01.04,R1620,C0220'] S.27.01.01.04,R1620,C0220
1148
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0240'}">
<_sre.SRE_Match object; span=(31, 

[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0240'}">
<_sre.SRE_Match object; span=(31, 60), match="{'S.27.01.01.04,R1620,C0230'}">
<_sre.SRE_Match object; span=(61, 90), match="{'S.27.01.01.04,R1520,C0220'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1520,C0220'}">
['S.27.01.01.04,R1620,C0240', 'S.27.01.01.04,R1620,C0230', 'S.27.01.01.04,R1520,C0220'] S.27.01.01.04,R1520,C0220
1176
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0240'}">
<_sre.SRE_Match object; span=(31, 60), match="{'S.27.01.01.04,R1620,C0230'}">
<_sre.SRE_Match object; span=(61, 90), match="{'S.27.01.01.04,R1530,C0220'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1530,C0220'}">
['S.27.01.01.04,R1620,C0240', 'S.27.01.01.04,R1620,C0230', 'S.27.01.01.04,R1530,C0220'] S.27.01.01.04,R1530,C0220
1177
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.04,R1620,C0240'}">
<_sre.SRE_Match object; span=(3

[0]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1630,C0330'}">
<_sre.SRE_Match object; span=(32, 61), match="{'S.27.01.01.05,R1630,C0320'}">
<_sre.SRE_Match object; span=(62, 91), match="{'S.27.01.01.05,R1700,C0310'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1700,C0310'}">
['S.27.01.01.05,R1630,C0330', 'S.27.01.01.05,R1630,C0320', 'S.27.01.01.05,R1700,C0310'] S.27.01.01.05,R1700,C0310
1195
[0]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1630,C0330'}">
<_sre.SRE_Match object; span=(32, 61), match="{'S.27.01.01.05,R1630,C0320'}">
<_sre.SRE_Match object; span=(62, 91), match="{'S.27.01.01.05,R1701,C0310'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1701,C0310'}">
['S.27.01.01.05,R1630,C0330', 'S.27.01.01.05,R1630,C0320', 'S.27.01.01.05,R1701,C0310'] S.27.01.01.05,R1701,C0310
1196
[0]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1630,C0330'}">
<_sre.SRE_Match object; span

HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1730,C0330'}">
<_sre.SRE_Match object; span=(32, 61), match="{'S.27.01.01.05,R1630,C0320'}">
<_sre.SRE_Match object; span=(62, 91), match="{'S.27.01.01.05,R1940,C0310'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1940,C0310'}">
['S.27.01.01.05,R1730,C0330', 'S.27.01.01.05,R1630,C0320', 'S.27.01.01.05,R1940,C0310'] S.27.01.01.05,R1940,C0310
1232
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1740,C0330'}">
<_sre.SRE_Match object; span=(32, 61), match="{'S.27.01.01.05,R1630,C0320'}">
<_sre.SRE_Match object; span=(62, 91), match="{'S.27.01.01.05,R1940,C0310'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1940,C0310'}">
['S.27.01.01.05,R1740,C0330', 'S.27.01.01.05,R1630,C0320', 'S.27.01.01.05,R1940,C0310'] S.27.01.01.05,R1940,C0310
1233
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1750,C0330'}">
<_sre.SRE_Match object; span=(32, 

['S.27.01.01.05,R1920,C0330', 'S.27.01.01.05,R1630,C0320', 'S.27.01.01.05,R1940,C0310'] S.27.01.01.05,R1940,C0310
1251
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1930,C0330'}">
<_sre.SRE_Match object; span=(32, 61), match="{'S.27.01.01.05,R1630,C0320'}">
<_sre.SRE_Match object; span=(62, 91), match="{'S.27.01.01.05,R1940,C0310'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1940,C0310'}">
['S.27.01.01.05,R1930,C0330', 'S.27.01.01.05,R1630,C0320', 'S.27.01.01.05,R1940,C0310'] S.27.01.01.05,R1940,C0310
1252
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1940,C0330'}">
<_sre.SRE_Match object; span=(32, 61), match="{'S.27.01.01.05,R1630,C0320'}">
<_sre.SRE_Match object; span=(62, 91), match="{'S.27.01.01.05,R1940,C0310'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1940,C0310'}">
['S.27.01.01.05,R1940,C0330', 'S.27.01.01.05,R1630,C0320', 'S.27.01.01.05,R1940,C0310'] S.27.01.01.05,R1940,C0310
12

[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1940,C0330'}">
<_sre.SRE_Match object; span=(32, 61), match="{'S.27.01.01.05,R1940,C0320'}">
<_sre.SRE_Match object; span=(62, 91), match="{'S.27.01.01.05,R1640,C0310'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1640,C0310'}">
['S.27.01.01.05,R1940,C0330', 'S.27.01.01.05,R1940,C0320', 'S.27.01.01.05,R1640,C0310'] S.27.01.01.05,R1640,C0310
1287
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1940,C0330'}">
<_sre.SRE_Match object; span=(32, 61), match="{'S.27.01.01.05,R1940,C0320'}">
<_sre.SRE_Match object; span=(62, 91), match="{'S.27.01.01.05,R1641,C0310'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1641,C0310'}">
['S.27.01.01.05,R1940,C0330', 'S.27.01.01.05,R1940,C0320', 'S.27.01.01.05,R1641,C0310'] S.27.01.01.05,R1641,C0310
1288
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1940,C0330'}">
<_sre.SRE_Match object; span=(3

HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1940,C0330'}">
<_sre.SRE_Match object; span=(32, 61), match="{'S.27.01.01.05,R1940,C0320'}">
<_sre.SRE_Match object; span=(62, 91), match="{'S.27.01.01.05,R1930,C0310'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1930,C0310'}">
['S.27.01.01.05,R1940,C0330', 'S.27.01.01.05,R1940,C0320', 'S.27.01.01.05,R1930,C0310'] S.27.01.01.05,R1930,C0310
1318
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1940,C0330'}">
<_sre.SRE_Match object; span=(32, 61), match="{'S.27.01.01.05,R1940,C0320'}">
<_sre.SRE_Match object; span=(62, 91), match="{'S.27.01.01.05,R1940,C0310'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.27.01.01.05,R1940,C0310'}">
['S.27.01.01.05,R1940,C0330', 'S.27.01.01.05,R1940,C0320', 'S.27.01.01.05,R1940,C0310'] S.27.01.01.05,R1940,C0310
1319
[0]
S.27.01.01.03,R1030,C0150 S.27.01.01.03,R1030,C0170
1320
[]
None S.27.01.01.03,R1240,C0130
1321
[]
None S.27.01.01.

HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.28.01.01.02,R0110,C0030'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.28.01.01.02,R0110,C0020'}">
<_sre.SRE_Match object; span=(39, 68), match="{'S.05.01.01.01,R0110,C0100'}">
<_sre.SRE_Match object; span=(71, 100), match="{'S.05.01.01.01,R0120,C0100'}">
S.28.01.01.02,R0110,C0030 ['S.28.01.01.02,R0110,C0020', 'S.05.01.01.01,R0110,C0100', 'S.05.01.01.01,R0120,C0100']
1467
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.28.01.01.02,R0120,C0030'}">
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.28.01.01.02,R0120,C0020'}">
<_sre.SRE_Match object; span=(39, 68), match="{'S.05.01.01.01,R0110,C0110'}">
<_sre.SRE_Match object; span=(71, 100), match="{'S.05.01.01.01,R0120,C0110'}">
S.28.01.01.02,R0120,C0030 ['S.28.01.01.02,R0120,C0020', 'S.05.01.01.01,R0110,C0110', 'S.05.01.01.01,R0120,C0110']
1468
[]
HERE
<_sre.SRE_Match object; span=(1, 30), match="{'S.28.01.01.02,R0130,C0030'}">
HERE
<_sre.SRE_Match object; spa

[]
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.30.01.01.01,C0150'}">
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.30.01.01.01,C0050'}">
S.30.01.01.01,C0150 S.30.01.01.01,C0050
1498
[]
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.30.01.01.01,C0160'}">
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.30.01.01.01,C0050'}">
S.30.01.01.01,C0160 S.30.01.01.01,C0050
1499
[]
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.30.01.01.01,C0170'}">
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.30.01.01.01,C0050'}">
S.30.01.01.01,C0170 S.30.01.01.01,C0050
1500
[]
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.30.01.01.01,C0180'}">
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.30.01.01.01,C0050'}">
S.30.01.01.01,C0180 S.30.01.01.01,C0050
1501
[]
HERE
<_sre.SRE_Match object; span=(2, 25), match="{'S.30.01.01.02,C0230'}">
HERE
<_sre.SRE_Match object; span=(1, 24), match="{'S.30.01.01.02,C0220'}">
S.30.01.01.02,C0230 S.30.01.01.02,C0220
1502


In [17]:
miner.df_patterns[miner.df_patterns['Error message']!='']

Unnamed: 0_level_0,pattern_id,cluster,pattern_def,support,exceptions,confidence,pattern status,encodings,pandas co,pandas ex,xbrl co,xbrl ex,Error message
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1
293,S.15.01_105,0,"IF {'S.15.01.01.01,C0040'}!=' ' THEN {'S.15.01...",,,,DNB,{},"df[(df['S.15.01.01.01,C0040']!=' ') & (df['S.1...","df[(df['S.15.01.01.01,C0040']!=' ') & ~(df['S....",,,unorderable types: str() > int()
294,S.15.01_107,0,"IF {'S.15.01.01.01,C0040'}!=' ' THEN {'S.15.01...",,,,DNB,{},"df[(df['S.15.01.01.01,C0040']!=' ') & (df['S.1...","df[(df['S.15.01.01.01,C0040']!=' ') & ~(df['S....",,,unorderable types: str() > int()
1508,S.30.03_102,0,"IF {'S.30.03.01.01,C0060'} = 'OTHER THAN NON-T...",,,,DNB,{},"df[(df['S.30.03.01.01,C0060']=='OTHER THAN NON...","df[(df['S.30.03.01.01,C0060']=='OTHER THAN NON...",,,unorderable types: str() > int()
1509,S.30.03_103,0,"IF {'S.30.03.01.01,C0060'} = 'OTHER THAN NON-T...",,,,DNB,{},"df[(df['S.30.03.01.01,C0060']=='OTHER THAN NON...","df[(df['S.30.03.01.01,C0060']=='OTHER THAN NON...",,,unorderable types: str() > int()


In [13]:
results['pattern_def'].iloc[1]

"IF {'S.01.03.01.01,C0040'}!=' ' THEN {'S.01.03.01.01,C0060'}!=' '"

In [19]:
results[results['P values'] == '']

Unnamed: 0_level_0,result_type,pattern_id,cluster,support,exceptions,confidence,pattern_def,P values,Q values
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
0,True,S.23.01_108,0,1.0,0.0,1.0,"{'S.23.01.01.01,R0640,C0010'} = {'S.23.01.01.0...",,BUG
0,True,S.23.01_108,0,1.0,0.0,1.0,"{'S.23.01.01.01,R0640,C0010'} = {'S.23.01.01.0...",,BUG
0,True,S.23.01_108,0,1.0,0.0,1.0,"{'S.23.01.01.01,R0640,C0010'} = {'S.23.01.01.0...",,BUG
0,True,S.23.01_108,0,1.0,0.0,1.0,"{'S.23.01.01.01,R0640,C0010'} = {'S.23.01.01.0...",,BUG
0,True,S.23.01_108,0,1.0,0.0,1.0,"{'S.23.01.01.01,R0640,C0010'} = {'S.23.01.01.0...",,BUG
...,...,...,...,...,...,...,...,...,...
0,True,S.28.01_100,0,0.0,1.0,0.0,"{'S.28.01.01.01,R0010,C0010'} = MAX(0, {'S.28....",,BUG
0,True,S.28.01_101,0,0.0,1.0,0.0,"{'S.28.01.01.03,R0200,C0040'} = MAX(0,(MAX(0, ...",,BUG
0,True,S.28.01_103,0,0.0,1.0,0.0,"{'S.28.01.01.05,R0300,C0070'} = {'S.28.01.01.0...",,BUG
0,True,S.28.01_109,0,0.0,1.0,0.0,"{'S.28.01.01.05,R0340,C0070'} = MIN(MAX({'S.28...",,BUG


In [15]:
miner.df_data.loc[0,'S.05.01.02.01,R0550,C0200']

771780647.23

In [16]:
miner.df_patterns[miner.df_patterns['pattern_def'] =='IF {"S.05.01.02.01,R0110,C0200"} <> 0|{"S.05.01.02.01,R0310,C0200"}<>0 THEN {"S.05.01.02.01,R0550,C0200"}<>0']

Unnamed: 0_level_0,pattern_id,cluster,pattern_def,support,exceptions,confidence,pattern status,encodings,pandas co,pandas ex,xbrl co,xbrl ex,Error message
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1
