In [1]:
import sympy as sp
from sympy import symbols
import random
import re
from tqdm import tqdm

NUM_EXPR = 400000

# Define the symbols
a, b, c, d = symbols('a b c d')

VARIABLES = ['a', 'b', 'c', 'd']
OPERANDS = VARIABLES + ['0', '1']  # Use strings instead of symbols
OPERATORS = ['+', '-', '*']


def remove_single_letter_parentheses(expression):
    # Use regex to find single letters surrounded by parentheses and remove the outermost ones
    return re.sub(r'\((\s*[a-zA-Z0-9]\s*)\)', r'\1', expression)

def canonicalize_numeric_expression(expr_str):
    is_numeric = False
    if len([x for x in VARIABLES if x in expr_str]) == 0:
        is_numeric = True
    if is_numeric:
        return str(sp.sympify(expr_str))
    else:
        return expr_str

def generate_expression(depth=1):
    if depth == 0 or random.random() < 0.333:
        return random.choice(OPERANDS)  # Return variable name as a string
    else:
        left = generate_expression(depth - 1)
        right = generate_expression(depth - 1)
        op = random.choice(OPERATORS)
        expr = f'({left}) {op} ({right})'
        canon_expr = canonicalize_numeric_expression(expr)
        return remove_single_letter_parentheses(canon_expr)

# Generate multiple expressions
print("Generating raw expressions...")
expr_strs = []
for i in tqdm(range(5*NUM_EXPR)):
    depth = 3
    rand_num = random.random()
    if rand_num < 0.5:
        depth = 1
    elif rand_num < 0.2:
        depth = 2
    expr_strs.append(generate_expression(depth))

expr_strs = set(expr_strs)
print(len(expr_strs), "expressions generated")

# Convert strings to SymPy expressions and print them
expressions = []
for expr_str in tqdm(expr_strs):
    expr = eval(expr_str)
    expressions.append((expr_str, expr))
    if len(expressions) % 10000 == 0:
        print(len(expressions))
        print(expr_str)
        display(expr)
    if len(expressions) >= NUM_EXPR:
        break


Generating raw expressions...


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2000000/2000000 [00:39<00:00, 50682.30it/s]


478661 expressions generated


  2%|██▉                                                                                                                                                          | 8775/478661 [00:00<00:24, 18945.28it/s]

10000
((b + d) + (d * c)) * ((a * a) - (1 - c))


(a**2 + c - 1)*(b + c*d + d)

  4%|██████▏                                                                                                                                                     | 18939/478661 [00:01<00:23, 19825.00it/s]

20000
((d - a) - (b - b)) * ((b + c) + 1)


(-a + d)*(b + c + 1)

  6%|█████████▌                                                                                                                                                  | 29261/478661 [00:01<00:21, 20533.10it/s]

30000
((c * 1) * (0 + d)) * (d - (a * b))


c*d*(-a*b + d)

  8%|████████████▊                                                                                                                                               | 39496/478661 [00:02<00:23, 18542.70it/s]

40000
((d - 0) + c) * ((1 + a) - 1)


a*(c + d)

 10%|████████████████▏                                                                                                                                           | 49688/478661 [00:02<00:21, 20057.17it/s]

50000
((c - a) - (0 - b)) + ((c - 0) * (c * 1))


-a + b + c**2 + c

 13%|███████████████████▌                                                                                                                                        | 59944/478661 [00:03<00:20, 20305.85it/s]

60000
(b + 0) - ((b - a) * 1)


a

 14%|██████████████████████▏                                                                                                                                     | 68205/478661 [00:03<00:21, 18934.88it/s]

70000
((d - b) + (b * c)) + (d * (c + d))


b*c - b + d*(c + d) + d

 16%|█████████████████████████▌                                                                                                                                  | 78444/478661 [00:04<00:19, 20016.49it/s]

80000
((a + d) * (a - 0)) + (0 - d)


a*(a + d) - d

 19%|████████████████████████████▉                                                                                                                               | 88714/478661 [00:04<00:19, 20316.60it/s]

90000
((0 * c) * (a * 1)) - ((a * 0) * (a - 0))


0

 21%|████████████████████████████████▎                                                                                                                           | 98958/478661 [00:05<00:19, 19429.86it/s]

100000
((c - 1) * (c - 1)) - (0 + c)


-c + (c - 1)**2

 23%|███████████████████████████████████▎                                                                                                                       | 109175/478661 [00:05<00:18, 20111.38it/s]

110000
((0 * a) - a) * (d * (c * c))


-a*c**2*d

 25%|██████████████████████████████████████▋                                                                                                                    | 119432/478661 [00:06<00:21, 17063.40it/s]

120000
((d + d) + 1) - b


-b + 2*d + 1

 27%|█████████████████████████████████████████▉                                                                                                                 | 129580/478661 [00:06<00:17, 19694.29it/s]

130000
((d - b) + a) - b


a - 2*b + d

 29%|█████████████████████████████████████████████▎                                                                                                             | 139878/478661 [00:07<00:16, 20270.79it/s]

140000
((b + d) - (1 * b)) * ((a * b) * c)


a*b*c*d

 31%|███████████████████████████████████████████████▉                                                                                                           | 148207/478661 [00:07<00:16, 20640.19it/s]

150000
((d * d) - (a - d)) * (c - (a - d))


(-a + c + d)*(-a + d**2 + d)

 33%|███████████████████████████████████████████████████▎                                                                                                       | 158528/478661 [00:08<00:16, 18992.66it/s]

160000
((d - c) + (d - 0)) + ((c - 1) * a)


a*(c - 1) - c + 2*d

 35%|██████████████████████████████████████████████████████▋                                                                                                    | 168908/478661 [00:08<00:15, 20390.67it/s]

170000
a - ((a * c) + c)


-a*c + a - c

 37%|██████████████████████████████████████████████████████████                                                                                                 | 179304/478661 [00:09<00:14, 20800.69it/s]

180000
((1 * c) * a) + (a - 0)


a*c + a

 40%|█████████████████████████████████████████████████████████████▍                                                                                             | 189619/478661 [00:09<00:18, 15756.70it/s]

190000
1 + ((1 * c) * 0)


1

 42%|████████████████████████████████████████████████████████████████▋                                                                                          | 199928/478661 [00:10<00:14, 19603.58it/s]

200000
((c * a) + (1 + c)) * (c + 1)


(c + 1)*(a*c + c + 1)

 43%|███████████████████████████████████████████████████████████████████▍                                                                                       | 208070/478661 [00:10<00:13, 20160.83it/s]

210000
(a - c) + (0 - c)


a - 2*c

 46%|██████████████████████████████████████████████████████████████████████▋                                                                                    | 218347/478661 [00:11<00:12, 20235.43it/s]

220000
((b - c) + (b + a)) * (d * (d + b))


d*(b + d)*(a + 2*b - c)

 48%|██████████████████████████████████████████████████████████████████████████                                                                                 | 228632/478661 [00:11<00:12, 20355.19it/s]

230000
(c * 0) - (c - 0)


-c

 50%|█████████████████████████████████████████████████████████████████████████████▎                                                                             | 238742/478661 [00:12<00:16, 14620.75it/s]

240000
1 * ((a * b) - (c + b))


a*b - b - c

 52%|████████████████████████████████████████████████████████████████████████████████▌                                                                          | 248966/478661 [00:13<00:12, 19110.46it/s]

250000
(d * b) * (1 + (d - d))


b*d

 54%|███████████████████████████████████████████████████████████████████████████████████▉                                                                       | 259260/478661 [00:13<00:10, 20400.45it/s]

260000
((d * d) - (1 - b)) - b


d**2 - 1

 56%|███████████████████████████████████████████████████████████████████████████████████████▎                                                                   | 269533/478661 [00:14<00:10, 20208.57it/s]

270000
(0 * (c - 0)) + ((1 + c) * (a * 1))


a*(c + 1)

 58%|██████████████████████████████████████████████████████████████████████████████████████████▌                                                                | 279774/478661 [00:14<00:09, 20284.05it/s]

280000
((b * b) - c) * (1 * (a - a))


0

 60%|█████████████████████████████████████████████████████████████████████████████████████████████▎                                                             | 288031/478661 [00:14<00:09, 20291.81it/s]

290000
c * ((a + a) + 0)


2*a*c

 62%|████████████████████████████████████████████████████████████████████████████████████████████████▌                                                          | 298089/478661 [00:15<00:11, 15223.52it/s]

300000
b * ((b * c) + (0 - b))


b*(b*c - b)

 64%|███████████████████████████████████████████████████████████████████████████████████████████████████▉                                                       | 308492/478661 [00:16<00:08, 19634.15it/s]

310000
0 * (0 - (a * b))


0

 67%|███████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                   | 318804/478661 [00:16<00:07, 20434.57it/s]

320000
((b - b) - (a + 0)) * (0 * (c + b))


0

 69%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                | 329231/478661 [00:17<00:07, 20766.30it/s]

330000
(0 - (b * b)) * ((d - 0) + (b - c))


-b**2*(b - c + d)

 71%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                             | 339669/478661 [00:17<00:06, 20411.06it/s]

340000
(1 - a) + ((a * b) - d)


a*b - a - d + 1

 73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                         | 349840/478661 [00:18<00:06, 20163.20it/s]

350000
((b * d) * (a + d)) + ((a - b) + (c - c))


a + b*d*(a + d) - b

 75%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                       | 358121/478661 [00:18<00:05, 20640.25it/s]

360000
((a + c) * d) * ((1 + c) - (c - 1))


2*d*(a + c)

 77%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                   | 368633/478661 [00:19<00:08, 13535.76it/s]

370000
(b * 1) * ((1 - d) - 0)


b*(1 - d)

 79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                | 378738/478661 [00:19<00:05, 18671.05it/s]

380000
((a * d) - (-1)) + ((d + c) + d)


a*d + c + 2*d + 1

 81%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                             | 388927/478661 [00:20<00:04, 20100.33it/s]

390000
((0 - b) + (d * c)) - ((d - 1) - (c + c))


-b + c*d + 2*c - d + 1

 83%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                         | 399301/478661 [00:20<00:03, 20709.27it/s]

400000
(0 - b) * ((b * b) * (d * 1))


-b**3*d

 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                         | 399999/478661 [00:20<00:04, 19177.31it/s]


In [None]:
from tqdm import tqdm
import sympy as sp
import random

NUM_VALUE_SET = 10

# Define the symbols
a, b, c, d = sp.symbols('a b c d')

# Define your SymPy expression
# For example, let's assume the expression is:
#expr = (a) * (c - d) + a * d

# Generate multiple sets of real values
value_sets = []

for _ in range(NUM_VALUE_SET):
    # Generate random real numbers for a, b, c, d
    # You can adjust the range as needed
    a_val = random.uniform(-10, 10)
    b_val = random.uniform(-10, 10)
    c_val = random.uniform(-10, 10)
    d_val = random.uniform(-10, 10)
    # Create a dictionary of values
    values = {'a': a_val, 'b': b_val, 'c': c_val, 'd': d_val}
    value_sets.append(values)

expr_values = {}

for i in tqdm(range(len(expressions))):
    expr_str, expr = expressions[i]
    is_numeric = False
    if not ('a' in expr_str or 'b' in expr_str or 'c' in expr_str or 'd' in expr_str):
        is_numeric = True
    # Evaluate the expression at each set of values
    vals = []
    for i, values in enumerate(value_sets):
        # Substitute the values into the expression
        if not is_numeric:
            expr_value = expr.subs(values)
            # Evaluate the numerical result
            val = expr_value.evalf()
        else:
            val = float(expr)
        vals.append(val)
        #print(f"Set {i+1}: a={values['a']:.2f}, b={values['b']:.2f}, c={values['c']:.2f}, d={values['d']:.2f}, Expression Value = {expr_value:.4f}")
    expr_values[expr_str] = vals
    if len(expr_values) % 100000 == 0:
        display(expr)
        print(vals)


 25%|███████████████████████████████████████▍                                                                                                                      | 99971/400000 [05:23<14:11, 352.23it/s]

-c + (c - 1)**2

 25%|███████████████████████████████████████▎                                                                                                                     | 100041/400000 [05:23<15:09, 329.86it/s]

[47.9445055649141, 43.0993448440499, 22.4640817639506, 31.6186160475676, 4.23967367534827, 49.5781080532419, 98.5527575421110, 35.1735479263439, 42.4016435275785, 0.408155938122027]


 50%|██████████████████████████████████████████████████████████████████████████████▍                                                                              | 199980/400000 [10:53<09:55, 336.01it/s]

(c + 1)*(a*c + c + 1)

 50%|██████████████████████████████████████████████████████████████████████████████▌                                                                              | 200050/400000 [10:53<10:00, 333.15it/s]

[129.214432729026, -39.5405587516272, -149.196873600020, -352.280991615055, 0.878316361954931, -3.67151029296407, 392.391576573382, 89.6486960417835, 819.998339319942, 2.79101884911419]


 75%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                       | 299996/400000 [16:28<04:36, 362.20it/s]

b*(b*c - b)

 75%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                       | 300068/400000 [16:28<04:55, 337.63it/s]

[-96.0841614927850, -58.7108097993840, 197.372046787824, 123.574488388819, -1.30716712283967, -428.646542654690, -277.915091765666, 48.5471595894542, 5.46237431262582, -43.9477261363075]


 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 395225/400000 [21:47<00:14, 318.37it/s]

In [40]:
import pickle

#fout = open("datasets/expr_values_20241102.pkl", "wb")
fout = open("datasets/test_values.pkl", "wb")
pickle.dump(expressions, fout)
pickle.dump(value_sets, fout)
pickle.dump(expr_values, fout)
fout.close()

In [21]:
# import pickle

# fin = open("datasets/test_expr_values.pkl", "rb")
# expressions = pickle.load(fin)
# value_sets = pickle.load(fin)
# expr_values = pickle.load(fin)
# fin.close()

In [41]:
expressions[0:30]

[('((a - 1) - (a * b)) + (d * a)', -a*b + a*d + a - 1),
 ('((a + 1) + (a * 1)) + c', 2*a + c + 1),
 ('((a * a) * (d - a)) - ((1 - a) + 0)', a**2*(-a + d) + a - 1),
 ('(a * (a - 1)) + ((a * b) + 0)', a*b + a*(a - 1)),
 ('((c + c) - 1) * (c * (d - 0))', c*d*(2*c - 1)),
 ('((d - c) - (c - d)) * ((0 - c) + (a + a))', (2*a - c)*(-2*c + 2*d)),
 ('((b - a) * d) + ((b - b) - (d + b))', -b + d*(-a + b) - d),
 ('(b + a) * (d + (0 + c))', (a + b)*(c + d)),
 ('((c * 1) * 1) * 0', 0),
 ('(0 - (b - d)) - c', -b - c + d),
 ('((b * c) * (b + b)) + (a - 1)', a + 2*b**2*c - 1),
 ('((a + a) - (1 - d)) * 0', 0),
 ('((c * c) - (c - a)) * ((0 * c) * (b + a))', 0),
 ('((d - c) + 1) + (d + (d + b))', b - c + 3*d + 1),
 ('((0 - c) * (d - c)) - ((c - b) + 2)', b - c*(-c + d) - c - 2),
 ('(0 + a) - ((c * 1) - 0)', a - c),
 ('((a - b) - d) - ((d - b) * (b * b))', a - b**2*(-b + d) - b - d),
 ('(0 * b) - ((0 + d) * d)', -d**2),
 ('2 * ((1 - c) + (d - a))', -2*a - 2*c + 2*d + 2),
 ('((b * 0) - 1) + ((b - b) - (c * 

In [52]:
import itertools
from tqdm import tqdm
from collections import defaultdict

MAX_NUM_EXPR_PER_VALUE_SET = 64


# # Example expr_values dictionary
# # Replace this with your actual data
# expr_values = {
#     # SymPy expressions as keys (using strings for simplicity)
#     'expr1': [1.0, 2.0, 3.0, 4.0, 5.0, 16.0, 17.0, 18.0, 9.0, 10.0],
#     'expr2': [0.0, 2.0, 3.0, 4.0, 5.0, 16.0, 17.0, 18.0, 19.0, 10.0],
#     'expr3': [1.0, 2.0, 3.0, 4.0, 5.0, 16.0, 17.0, 18.0, 19.0, 20.0],
#     'expr4': [11.0, 12.0, 13.0, 14.0, 15.0, 6.0, 7.0, 8.0, 9.0, 10.0],
#     'expr5': [1.0, 2.0, 3.0, 4.0, 25.0, 26.0, 27.0, 28.0, 29.0, 30.0],
#     # Add more expressions as needed
# }

def variable_name_generator():
    import string
    letters = string.ascii_lowercase
    n = 0
    while True:
        s = ''
        n_copy = n
        while True:
            s = letters[n_copy % 26] + s
            n_copy = n_copy // 26 - 1
            if n_copy < 0:
                break
        yield s
        n += 1

def canonicalize_expression(expr):
    mapping = {}
    result = ''
    var_gen = variable_name_generator()

    for char in expr:
        if char.isalpha():
            if char not in mapping:
                mapping[char] = next(var_gen)
            result += mapping[char]
        else:
            result += char

    return result

def canonicalize_expression_pair(pair):
    new_str = pair[0] + '#' + pair[1]
    new_str = canonicalize_expression(new_str)
    return tuple(new_str.split('#'))

def find_overlapping_pairs(expr_values, value_size, min_overlap):
    # Step 1: Create a mapping from signatures to expressions
    signature_map = defaultdict(set)

    # Function to generate signatures and update the signature_map
    def generate_signatures(expr_key, values_list):
        positions = list(range(len(values_list)))  # Positions from 0 to 9
        # Generate subsets of positions of sizes 8, 9, and 10
        for r in range(min_overlap, value_size+1):
            position_subsets = itertools.combinations(positions, r)
            for pos_subset in position_subsets:
                # Extract values at the selected positions
                value_subset = tuple((pos, values_list[pos]) for pos in pos_subset)
                # Use the value_subset as a signature
                signature_map[value_subset].add(expr_key)

    # Populate the signature_map
    print("Generating signatures of expressions")
    for expr_key, values_list in tqdm(expr_values.items()):
        generate_signatures(expr_key, values_list)

    # Step 2: Find all pairs of expressions sharing at least 8 common values at the same positions
    result_pairs = set()

    print("Checking signatures")
    for signature, expr_set in tqdm(signature_map.items()):
        if len(expr_set) > 1:
            # Generate all unique pairs of expressions
            expr_list = list(expr_set)
            expr_list = sorted(expr_list, key=len)[0:MAX_NUM_EXPR_PER_VALUE_SET]
            for i in range(len(expr_list)):
                for j in range(i + 1, len(expr_list)):
                    pair = tuple(sorted([expr_list[i], expr_list[j]], key=len, reverse=True))
                    pair = canonicalize_expression_pair(pair)
                    result_pairs.add(pair)

    # Step 3: Output the pairs
    #print("Expressions sharing at least 8 common values at the same positions:")
    #for pair in sorted(result_pairs):
    #    print(f"{pair[0]} and {pair[1]}")
        
    return result_pairs

equiv_pairs = find_overlapping_pairs(expr_values, 10, 8)
equiv_pairs = sorted(equiv_pairs, key=lambda pair: len(str(pair[0])) + len(str(pair[1])))

Generating signatures of expressions


100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 100000/100000 [00:34<00:00, 2915.67it/s]


Checking signatures


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 1463142/1463142 [01:26<00:00, 16834.71it/s]


In [74]:
from collections import defaultdict

def create_shortening_mappings(pairs):
    mapping = defaultdict(set)
    for e1, e2 in pairs:
        if len(e1) > len(e2):
            mapping[e1].add(e2)
        if len(e1) < len(e2):
            mapping[e2].add(e1)
    return mapping
            
def find_parentheses_substrings(s):
    stack = []
    substrings = []
    for i, c in enumerate(s):
        if c == '(':
            stack.append(i)
        elif c == ')':
            if stack:
                j = stack.pop()
                substrings.append(s[j:i+1])
            else:
                # Handle unmatched closing parenthesis if necessary
                pass
    return substrings

def shorten_expr(expr, mapping):
    output = []
    #if expr in mapping:
    #    output.extend(mapping[expr])
    parentheses_exprs = find_parentheses_substrings(expr)
    for parentheses_expr in parentheses_exprs:
        sub_expr = parentheses_expr[1:-1]
        if sub_expr in mapping:
            for short_expr in mapping[sub_expr]:
                if len(short_expr) > 2:
                    new_expr = expr.replace(parentheses_expr, '(' + short_expr + ')')
                else:
                    new_expr = expr.replace(parentheses_expr, short_expr)
                output.append(new_expr)
    return output

def repeated_shorten_expr(expr, mapping):
    attempts = 5
    while attempts > 0:
        shorted_exprs = shorten_expr(expr, mapping)
        if len(shorted_exprs) == 0:
            break
        else:
            expr = min(shorted_exprs, key=len)
            attempts -= 1
    is_numeric = False
    if len([x for x in VARIABLES if x in expr]) == 0:
        is_numeric = True
    if is_numeric:
        return str(sp.sympify(expr))
    else:
        return expr

mapping = create_shortening_mappings(equiv_pairs)
shortened_pairs = set()
for e1, e2 in tqdm(equiv_pairs):
    shortened_e1 = repeated_shorten_expr(e1, mapping)
    shortened_e2 = repeated_shorten_expr(e2, mapping)
    shortened_e1, shortened_e2 = canonicalize_expression_pair((shortened_e1, shortened_e2))
    if shortened_e1 != shortened_e2:
        shortened_pairs.add(tuple(sorted([shortened_e1, shortened_e2], key=lambda x: (-len(x), x))))

shortened_pairs = sorted(shortened_pairs, key=lambda pair: len(str(pair[0])) + len(str(pair[1])))

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 650245/650245 [00:05<00:00, 116276.83it/s]


In [75]:
shortened_pairs[0:300]

[('0 + a', 'a'),
 ('a * 1', 'a'),
 ('a * 0', '0'),
 ('a + 0', 'a'),
 ('0 * a', '0'),
 ('1 * a', 'a'),
 ('a - a', '0'),
 ('a - 0', 'a'),
 ('2 + a', 'a + 2'),
 ('a * 0', 'b - b'),
 ('3 * a', 'a * 3'),
 ('a + 0', 'a - 0'),
 ('0 * a', 'a * 0'),
 ('0 * a', 'a - a'),
 ('a * 1', 'a + 0'),
 ('0 * b', 'a * 0'),
 ('a * 1', 'a - 0'),
 ('0 * b', 'a - a'),
 ('1 * a', 'a * 1'),
 ('0 * a', '0 * b'),
 ('a * 0', 'b * 0'),
 ('0 + a', 'a * 1'),
 ('1 + a', 'a + 1'),
 ('0 * a', 'b - b'),
 ('1 * a', 'a + 0'),
 ('0 + a', '1 * a'),
 ('0 * a', 'b * 0'),
 ('a * 2', 'a + a'),
 ('a - a', 'b - b'),
 ('1 * a', 'a - 0'),
 ('a + b', 'b + a'),
 ('0 + a', 'a + 0'),
 ('a * 0', 'a - a'),
 ('0 + a', 'a - 0'),
 ('2 * a', 'a + a'),
 ('2 * a', 'a * 2'),
 ('a * b', 'b * a'),
 ('a - a', 'b * 0'),
 ('1 - (a - a)', '1'),
 ('(a + 2) * 0', '0'),
 ('(0 - a) * 0', '0'),
 ('a * (b - b)', '0'),
 ('0 * (0 - a)', '0'),
 ('a - (a - 1)', '1'),
 ('(a + 1) - a', '1'),
 ('(a * 0) * 0', '0'),
 ('0 * (a * 0)', '0'),
 ('(a - a) + 1', '1'),
 ('(