# Generate few shot splits

In [1]:
import json
import random
import os
from PIL import Image
from itertools import product
from tqdm import tqdm
import math
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
from collections import Counter

from domain import SYM2PROG, Program, NULL_VALUE, FEWSHOT_OPERATORS, FEWSHOT_NUMBERS
import sys
from helper import *

In [2]:
split2sym = {}
for split in splits:
    sym_set = {k:Iterator(v) for k,v in json.load(open('sym_%s.json'%split)).items()}
    split2sym[split] = sym_set

In [3]:
fewshot_nums = FEWSHOT_NUMBERS
fewshot_ops = FEWSHOT_OPERATORS
fewshot_concepts = fewshot_nums + fewshot_ops
op2precedence.update({'a': op2precedence['+'], 'b': op2precedence['+'], 'c': op2precedence['*'], 'd': op2precedence['*']})
sym2arity.update({x: 0 for x in fewshot_nums})
sym2arity.update({x: 2 for x in fewshot_ops})
functions = [lambda: 11, lambda: 12,
             lambda x,y: max(x, y), lambda x,y: min(x, y), 
             lambda x,y: math.ceil((x+y)/2), lambda x,y: math.ceil(2*x*y/(x+y)) if x+y != 0 else None]
programs = [Program(f) for f in functions]
SYM2PROG.update(dict(zip(fewshot_concepts, programs)))

In [4]:
min_num = 0
max_num = 10
num_list = list(map(str, range(min_num, max_num)))
op_list = ['+', '-', '*', '/']
lps = '('
rps = ')'

def enumerate_expression(n_op):
    if n_op == 0:
        return [[x] for x in num_list]
    
    expressions = []
    
    arity = 1
    ops = [op for op in op_list if sym2arity[op] == arity]
    inputs = enumerate_expression(n_op-1)
    expressions.extend(product(ops, inputs))
    
    arity = 2
    ops = [op for op in op_list if sym2arity[op] == arity]
    inputs = []
    for i in range(n_op):
        input_1 = enumerate_expression(i)
        input_2 = enumerate_expression(n_op - 1 - i)
        inputs.extend(product(input_1, input_2))
    expressions.extend(product(ops, inputs))
    
    expressions = [flatten(x) for x in expressions]
    return expressions

def sample_one_expr(n_op):
    if n_op == 0:
        return [random.choice(num_list)]
    op = random.choice(op_list)
    if sym2arity[op] == 1:
        return [op] + sample_one_expr(n_op-1)
    else:
        i = random.randint(0, n_op-1)
        j = n_op - 1 - i
        return [op] + sample_one_expr(i) + sample_one_expr(j)

def sample_expression(sym, n_op, n_instances, min_value=0, max_value=float('inf'), res_max_ratio=1.0):
    max_ins_res = int(n_instances * res_max_ratio)
    res2n_ins = {}
    expressions = []
    with tqdm(total=n_instances) as pbar:
        while len(expressions) < n_instances:
            expr = sample_one_expr(n_op)
            if expr in expressions:
                continue
            head = parse_prefix(expr)
            res, res_all = eval_expr(expr, head)
            if not res:
                continue
            if res not in res2n_ins:
                res2n_ins[res] = 0
            if res2n_ins[res] >= max_ins_res:
                continue
            
            max_res = max([x for x in res_all if x is not None])
            if max_res >= min_value and max_res <= max_value and sym in expr:
                expressions.append(expr)
                res2n_ins[res] += 1
                pbar.update(1)
    return expressions

def generate_expression(sym, n_op, n_instances, min_value=0, max_value=float('inf'), res_max_ratio=1.0):
    if n_op <= 2:
        expressions = []
        for expr in enumerate_expression(n_op):
            head = parse_prefix(expr)
            res, res_all = eval_expr(expr, head)
            if res is not None:
                max_res = max([x for x in res_all if x is not None])
                if max_res >= min_value and max_res <= max_value and sym in expr:
                    expressions.append(expr)
    else:
        assert n_instances is not None
        expressions = sample_expression(sym, n_op, n_instances, min_value, max_value, res_max_ratio)
    random.shuffle(expressions)
    expressions = expressions[:n_instances]
    
    temp = []
    for expr in expressions:
        expr = prefix2infix(expr)
        head = parse_infix(expr)
        res, res_all = eval_expr(expr, head)
        if res is not None:
            temp.append((expr, head, res, res_all))
    
    return temp

In [5]:
fs2dataset = {}
for i, fs in enumerate(fewshot_concepts):
    random.seed(12306)
    max_op = 20
    max_op_train = 10
    max_value_train = 100
    max_value_test = 10000
    n_train = 100
    n_test = 100
    n_val = 10
    res_max_ratio = 0.05
    train_exprs = []
    val_exprs = []
    test_exprs = []
    
    if fs in fewshot_nums:
        num_list.append(fs)
    if fs in fewshot_ops:
        op_list.append(fs)
    print(num_list)
    print(op_list)
    
    # generate symbolic expression
    for n_op in range(max_op + 1):
        train_exprs_i = []
        val_exprs_i = []
        test_exprs_i = []
        
        if not (fs in fewshot_ops and n_op == 0):
            if n_op > max_op_train:
                n_train = 0
            expressions = generate_expression(fs, n_op, n_train + n_val + n_test, 
                                        max_value=max_value_train, res_max_ratio=res_max_ratio)
            if len(expressions) < n_train:
                print('there are not enough expressions for train set. Repeat them.')
                expressions = expressions * (n_train // len(expressions) + 1)
                expressions = expressions[:n_train]



            # split 'I'
            if n_train > 0:
                train_exprs_i.extend(expressions[:n_train])
                val_exprs_i.extend(expressions[:min(n_train, n_val)])
                test_exprs_i.extend(expressions[:min(n_train, n_test)])

            # split 'SS' or 'LS'
            val_exprs_i.extend(expressions[n_train:n_train+n_val])
            test_exprs_i.extend(expressions[n_train+n_val:])

            # split 'SL' or 'LL'
            expressions = generate_expression(fs, n_op, n_val + n_test,
                            min_value=max_value_train+1, max_value=max_value_test, res_max_ratio=res_max_ratio)
            val_exprs_i.extend(expressions[:n_val])
            test_exprs_i.extend(expressions[n_val:n_val+n_test])

        print(n_op, len(train_exprs_i), len(val_exprs_i), len(test_exprs_i))
        train_exprs.append(train_exprs_i)
        val_exprs.append(val_exprs_i)
        test_exprs.append(test_exprs_i)

    split2exprs = {'train': train_exprs, 'val': val_exprs, 'test': test_exprs}
    print([(k, sum([len(x) for x in v])) for k, v in split2exprs.items()])
    
    split2dataset = {}
    for split in splits:
        sym_set = split2sym[split]
        exprs = split2exprs[split]
        dataset = []
        idx = 0
        for n_op, expr_list in enumerate(exprs):
            for e in expr_list:
                if split in ['val', 'test']:
                    if e[0] in train_exprs:
                        evaluation = 'I'
                    else:
                        max_value = max([x for x in e[3] if x is not None])
                        evaluation = 'S' if n_op <= max_op_train else 'L'
                        evaluation += 'S' if max_value <= max_value_train else 'L'

                img_paths = generate_img_paths(e[0], sym_set)
                sample = {'id': '%s_%08d'%(split, idx), 'img_paths':img_paths, 
                      'expr': e[0], 'head': e[1], 'res': e[2], 'res_all': e[3]}
                if split in ['val', 'test']:
                    sample['eval'] = evaluation
                idx += 1
                dataset.append(sample)
        split2dataset[split] = dataset
        if split == 'train':
            train_exprs = {x['expr'] for x in dataset}
        print(split, len(dataset))
    
    counts = sorted(Counter([x['eval'] for x in split2dataset['test']]).items())
    total_count = sum([c for _, c in counts])
    counts = [(k, v, round(v/total_count*100, 2)) for k, v in counts]
    print(counts)
    
    if fs in fewshot_nums:
        num_list.remove(fs)
    if fs in fewshot_ops:
        op_list.remove(fs)
    fs2dataset[fs] = split2dataset

json.dump(fs2dataset, open('fewshot_dataset.json', 'w'))

['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'x']
['+', '-', '*', '/']
there are not enough expressions for train set. Repeat them.
0 100 10 100
there are not enough expressions for train set. Repeat them.
1 100 11 100


100%|███████████████████████████████████████| 210/210 [00:00<00:00, 4523.11it/s]
 68%|███████████████████████████▉             | 75/110 [00:00<00:00, 735.74it/s]

2 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 739.08it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 3170.90it/s]
 77%|███████████████████████████████▋         | 85/110 [00:00<00:00, 844.36it/s]

3 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 781.48it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2393.96it/s]
 65%|██████████████████████████▊              | 72/110 [00:00<00:00, 714.58it/s]

4 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 680.78it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2518.49it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

5 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 728.00it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1988.09it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

6 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 904.59it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1629.53it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

7 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 773.96it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1655.00it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

8 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 732.60it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1321.94it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

9 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 656.86it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1142.90it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

10 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 657.46it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 933.92it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

11 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 684.37it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 872.52it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

12 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 621.65it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 873.81it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

13 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 642.13it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 680.27it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

14 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 587.05it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 578.32it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

15 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 596.85it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 684.95it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

16 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 470.27it/s]
 49%|████████████████████▏                    | 54/110 [00:00<00:00, 533.57it/s]

17 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 436.81it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 518.56it/s]
 45%|██████████████████▎                      | 49/110 [00:00<00:00, 482.51it/s]

18 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 421.02it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 571.27it/s]
 49%|████████████████████▏                    | 54/110 [00:00<00:00, 521.38it/s]

19 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 461.54it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 456.69it/s]


20 0 20 200
[('train', 1100), ('val', 491), ('test', 4900)]
train 1100
val 491
test 4900
[('I', 1100, 22.45), ('LL', 1000, 20.41), ('LS', 1000, 20.41), ('SL', 900, 18.37), ('SS', 900, 18.37)]
['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'y']
['+', '-', '*', '/']
there are not enough expressions for train set. Repeat them.
0 100 10 100
there are not enough expressions for train set. Repeat them.
1 100 13 100


100%|███████████████████████████████████████| 210/210 [00:00<00:00, 3461.98it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 823.20it/s]

2 100 30 300



100%|███████████████████████████████████████| 210/210 [00:00<00:00, 3168.40it/s]
 75%|██████████████████████████████▉          | 83/110 [00:00<00:00, 827.77it/s]

3 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 827.88it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2663.87it/s]
 70%|████████████████████████████▋            | 77/110 [00:00<00:00, 759.78it/s]

4 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 716.45it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2461.69it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

5 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 847.74it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2086.58it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

6 100 30 300


100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1028.72it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1786.08it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

7 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 943.07it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1705.18it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

8 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 793.57it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1393.88it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

9 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 863.04it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1247.35it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

10 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 725.12it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1053.02it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

11 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 801.42it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 879.16it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

12 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 717.03it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 965.41it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

13 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 671.22it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 816.35it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

14 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 633.24it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 704.04it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

15 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 638.97it/s]
 96%|██████████████████████████████████████▌ | 106/110 [00:00<00:00, 518.48it/s]

16 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 515.13it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 622.77it/s]
 64%|██████████████████████████               | 70/110 [00:00<00:00, 685.30it/s]

17 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 512.02it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 601.97it/s]
 43%|█████████████████▌                       | 47/110 [00:00<00:00, 457.88it/s]

18 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 485.39it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 587.55it/s]
 45%|██████████████████▋                      | 50/110 [00:00<00:00, 495.78it/s]

19 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 396.36it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 480.76it/s]


20 0 20 200
[('train', 1100), ('val', 493), ('test', 4900)]
train 1100
val 493
test 4900
[('I', 1100, 22.45), ('LL', 1000, 20.41), ('LS', 1000, 20.41), ('SL', 900, 18.37), ('SS', 900, 18.37)]
['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
['+', '-', '*', '/', 'a']
0 0 0 0
1 100 10 100


100%|███████████████████████████████████████| 210/210 [00:00<00:00, 7542.03it/s]
 33%|█████████████▍                           | 36/110 [00:00<00:00, 349.20it/s]

2 100 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 205.95it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 7894.35it/s]
 45%|██████████████████▋                      | 50/110 [00:00<00:00, 490.95it/s]

3 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 478.22it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 5506.74it/s]
 59%|████████████████████████▏                | 65/110 [00:00<00:00, 646.55it/s]

4 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 592.11it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 4989.91it/s]
 66%|███████████████████████████▏             | 73/110 [00:00<00:00, 720.22it/s]

5 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 722.12it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 4296.18it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 816.79it/s]

6 100 30 300



100%|███████████████████████████████████████| 210/210 [00:00<00:00, 4528.30it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 862.07it/s]
  0%|                                                   | 0/210 [00:00<?, ?it/s]

7 100 30 300
8 100 30 300


100%|███████████████████████████████████████| 210/210 [00:00<00:00, 3908.14it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 867.86it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 3159.48it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 848.42it/s]

9 100 30 300



100%|███████████████████████████████████████| 110/110 [00:00<00:00, 2522.67it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 835.79it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

10 100 30 300
11 0 20 200


100%|███████████████████████████████████████| 110/110 [00:00<00:00, 2608.93it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 850.80it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1910.82it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 891.67it/s]

12 0 20 200



100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1860.29it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 897.54it/s]

13 0 20 200



100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1912.54it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 813.33it/s]

14 0 20 200



100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1562.21it/s]
 71%|█████████████████████████████            | 78/110 [00:00<00:00, 766.24it/s]

15 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 725.26it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1279.35it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

16 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 935.86it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1184.48it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

17 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 785.71it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1177.75it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

18 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 806.10it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 882.45it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

19 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 752.03it/s]


20 0 20 200
[('train', 1000), ('val', 470), ('test', 4700)]
train 1000
val 470
test 4700
[('I', 1000, 21.28), ('LL', 1000, 21.28), ('LS', 1000, 21.28), ('SL', 800, 17.02), ('SS', 900, 19.15)]
['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
['+', '-', '*', '/', 'b']
0 0 0 0
1 100 10 100


100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2520.52it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

2 100 20 200


100%|████████████████████████████████████████| 110/110 [00:01<00:00, 107.55it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2303.47it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

3 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 216.07it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2589.97it/s]
 26%|██████████▊                              | 29/110 [00:00<00:00, 278.67it/s]

4 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 281.56it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1874.46it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

5 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 360.29it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1992.66it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

6 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 400.11it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1821.05it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

7 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 362.50it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1781.54it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

8 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 361.10it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1570.72it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

9 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 356.78it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1169.09it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

10 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 391.43it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1341.70it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

11 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 409.95it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 882.86it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

12 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 338.06it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 921.59it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

13 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 358.04it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 746.55it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

14 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 376.18it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 750.70it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

15 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 379.91it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 650.68it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

16 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 312.36it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 644.73it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

17 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 297.05it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 567.08it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

18 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 221.83it/s]
 63%|█████████████████████████▋               | 69/110 [00:00<00:00, 680.58it/s]

19 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 490.38it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 246.96it/s]


20 0 20 200
[('train', 1000), ('val', 470), ('test', 4700)]
train 1000
val 470
test 4700
[('I', 1000, 21.28), ('LL', 1000, 21.28), ('LS', 1000, 21.28), ('SL', 800, 17.02), ('SS', 900, 19.15)]
['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
['+', '-', '*', '/', 'c']
0 0 0 0
1 100 10 100


100%|███████████████████████████████████████| 210/210 [00:00<00:00, 4538.07it/s]
 22%|████████▉                                | 24/110 [00:00<00:00, 232.82it/s]

2 100 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 176.20it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 4629.33it/s]
 36%|██████████████▉                          | 40/110 [00:00<00:00, 399.40it/s]

3 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 407.82it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 4337.35it/s]
 47%|███████████████████▍                     | 52/110 [00:00<00:00, 518.70it/s]

4 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 525.96it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 3626.93it/s]
 69%|████████████████████████████▎            | 76/110 [00:00<00:00, 753.18it/s]

5 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 713.83it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 3794.97it/s]
 65%|██████████████████████████▍              | 71/110 [00:00<00:00, 701.86it/s]

6 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 685.69it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 3562.98it/s]
 66%|███████████████████████████▏             | 73/110 [00:00<00:00, 728.63it/s]

7 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 731.25it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2959.08it/s]
 71%|█████████████████████████████            | 78/110 [00:00<00:00, 774.55it/s]

8 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 679.63it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2930.80it/s]
 63%|█████████████████████████▋               | 69/110 [00:00<00:00, 681.46it/s]

9 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 731.68it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 2497.12it/s]
 66%|███████████████████████████▏             | 73/110 [00:00<00:00, 721.66it/s]

10 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 679.27it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 2219.59it/s]
 77%|███████████████████████████████▋         | 85/110 [00:00<00:00, 845.22it/s]

11 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 746.97it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1826.85it/s]
 70%|████████████████████████████▋            | 77/110 [00:00<00:00, 768.85it/s]

12 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 671.59it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1669.89it/s]
 72%|█████████████████████████████▍           | 79/110 [00:00<00:00, 788.49it/s]

13 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 686.49it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1570.83it/s]
 75%|██████████████████████████████▉          | 83/110 [00:00<00:00, 825.00it/s]

14 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 706.35it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1338.43it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

15 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 614.82it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1274.84it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

16 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 700.45it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1234.33it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

17 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 685.43it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 900.36it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

18 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 563.39it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1024.55it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

19 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 492.01it/s]


20 0 20 200
[('train', 1000), ('val', 470), ('test', 4700)]
train 1000
val 470
test 4700
[('I', 1000, 21.28), ('LL', 1000, 21.28), ('LS', 1000, 21.28), ('SL', 800, 17.02), ('SS', 900, 19.15)]
['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
['+', '-', '*', '/', 'd']
0 0 0 0
there are not enough expressions for train set. Repeat them.
1 100 10 100


100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2448.73it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

2 100 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 137.03it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 3408.43it/s]
 25%|██████████▍                              | 28/110 [00:00<00:00, 274.20it/s]

3 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 273.53it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2717.19it/s]
 36%|██████████████▉                          | 40/110 [00:00<00:00, 369.87it/s]

4 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 285.27it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2560.98it/s]
 39%|████████████████                         | 43/110 [00:00<00:00, 428.13it/s]

5 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 383.18it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2691.05it/s]
 42%|█████████████████▏                       | 46/110 [00:00<00:00, 443.48it/s]

6 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 453.95it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1845.79it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

7 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 436.12it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 2016.20it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

8 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 471.78it/s]
100%|███████████████████████████████████████| 210/210 [00:00<00:00, 1799.38it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

9 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 526.44it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1360.02it/s]
 45%|██████████████████▎                      | 49/110 [00:00<00:00, 485.59it/s]

10 100 30 300


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 471.64it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1266.92it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

11 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 494.56it/s]
100%|███████████████████████████████████████| 110/110 [00:00<00:00, 1061.34it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

12 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 413.82it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 884.41it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

13 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 406.54it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 794.32it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

14 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 363.48it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 766.09it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

15 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 349.56it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 713.18it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

16 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 362.61it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 591.90it/s]
  0%|                                                   | 0/110 [00:00<?, ?it/s]

17 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 369.53it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 540.70it/s]

18 0 20 200



100%|████████████████████████████████████████| 110/110 [00:00<00:00, 275.55it/s]
 58%|███████████████████████▊                 | 64/110 [00:00<00:00, 619.69it/s]

19 0 20 200


100%|████████████████████████████████████████| 110/110 [00:00<00:00, 486.10it/s]
100%|████████████████████████████████████████| 110/110 [00:00<00:00, 370.57it/s]


20 0 20 200
[('train', 1000), ('val', 470), ('test', 4700)]
train 1000
val 470
test 4700
[('I', 1000, 21.28), ('LL', 1000, 21.28), ('LS', 1000, 21.28), ('SL', 800, 17.02), ('SS', 900, 19.15)]
