Install dependencies

In [None]:
!pip install -U autora
!pip install -U equation-tree

Collecting equation-tree
  Obtaining dependency information for equation-tree from https://files.pythonhosted.org/packages/bc/2c/2236986c6f2acc278c1f003349e1824b8ec60f6d340bcae4726ceba0a4bd/equation_tree-0.0.4-py3-none-any.whl.metadata
  Downloading equation_tree-0.0.4-py3-none-any.whl.metadata (2.1 kB)
Downloading equation_tree-0.0.4-py3-none-any.whl (29 kB)
Installing collected packages: equation-tree
  Attempting uninstall: equation-tree
    Found existing installation: equation-tree 0.0.3
    Uninstalling equation-tree-0.0.3:
      Successfully uninstalled equation-tree-0.0.3
Successfully installed equation-tree-0.0.4


# Imports

In [None]:
from equation_tree import sample
from equation_tree.prior import DEFAULT_PRIOR_FUNCTIONS, DEFAULT_PRIOR_OPERATORS, \
    structure_prior_from_max_depth
import pprint

For convenience, we can create a prior from the depth. We could also construct a prior per hand.

In [None]:
structure_prior = structure_prior_from_max_depth(5)
pprint.pprint(structure_prior)

{'[0, 1, 1, 2, 2]': 0.06666666666666667,
 '[0, 1, 1, 2, 3]': 0.06666666666666667,
 '[0, 1, 1, 2]': 0.06666666666666667,
 '[0, 1, 1]': 0.06666666666666667,
 '[0, 1, 2, 1, 2]': 0.06666666666666667,
 '[0, 1, 2, 1]': 0.06666666666666667,
 '[0, 1, 2, 2, 1]': 0.06666666666666667,
 '[0, 1, 2, 2, 3]': 0.06666666666666667,
 '[0, 1, 2, 2]': 0.06666666666666667,
 '[0, 1, 2, 3, 1]': 0.06666666666666667,
 '[0, 1, 2, 3, 2]': 0.06666666666666667,
 '[0, 1, 2, 3, 3]': 0.06666666666666667,
 '[0, 1, 2, 3, 4]': 0.06666666666666667,
 '[0, 1, 2, 3]': 0.06666666666666667,
 '[0, 1, 2]': 0.06666666666666667}


Here, we also use default priors for functions

In [None]:
pprint.pprint(DEFAULT_PRIOR_FUNCTIONS)

{'abs': 0.14285714285714285,
 'cos': 0.14285714285714285,
 'exp': 0.14285714285714285,
 'log': 0.14285714285714285,
 'sin': 0.14285714285714285,
 'sqrt': 0.14285714285714285,
 'tan': 0.14285714285714285}


And default priors for operators

In [None]:
pprint.pprint(DEFAULT_PRIOR_OPERATORS)

{'*': 0.2, '+': 0.2, '-': 0.2, '/': 0.2, '^': 0.2}


We also need a prior for the feautres

In [None]:
feature_prior = {'constants': .3, 'variables': .7}

The full prior is a dictionary with the function, operator, structure and feature priors.

In [None]:
prior = {'functions': DEFAULT_PRIOR_FUNCTIONS, 'operators': DEFAULT_PRIOR_OPERATORS, 'structures': structure_prior, 'features': feature_prior}
pprint.pprint(prior)

{'features': {'constants': 0.3, 'variables': 0.7},
 'functions': {'abs': 0.14285714285714285,
               'cos': 0.14285714285714285,
               'exp': 0.14285714285714285,
               'log': 0.14285714285714285,
               'sin': 0.14285714285714285,
               'sqrt': 0.14285714285714285,
               'tan': 0.14285714285714285},
 'operators': {'*': 0.2, '+': 0.2, '-': 0.2, '/': 0.2, '^': 0.2},
 'structures': {'[0, 1, 1, 2, 2]': 0.06666666666666667,
                '[0, 1, 1, 2, 3]': 0.06666666666666667,
                '[0, 1, 1, 2]': 0.06666666666666667,
                '[0, 1, 1]': 0.06666666666666667,
                '[0, 1, 2, 1, 2]': 0.06666666666666667,
                '[0, 1, 2, 1]': 0.06666666666666667,
                '[0, 1, 2, 2, 1]': 0.06666666666666667,
                '[0, 1, 2, 2, 3]': 0.06666666666666667,
                '[0, 1, 2, 2]': 0.06666666666666667,
                '[0, 1, 2, 3, 1]': 0.06666666666666667,
                '[0, 1, 2, 3, 2]': 

We can now sample equations. We need two additional arguments: `n`: How many samples, `max_num_variables`: How many input variables do the equations have maximally.

In [None]:
equation_sample = sample(n=10, prior=prior, max_num_variables=3)

  "log": lambda a: np.log(a),
  "sqrt": lambda a: np.sqrt(a),
  "^": lambda a, b: a**b,
Processing: 100%|██████████| 10/10 [00:00<00:00, 57.64iteration/s]


We print the equations

In [None]:
pprint.pprint([e.sympy_expr for e in equation_sample])

[exp(tan(exp(x_1))),
 log(sin(x_1 - x_2)),
 tan(x_1**(c_1/2)),
 Abs(sqrt(x_1)),
 cos(Abs(x_1)/x_2),
 log(x_1)/4,
 sqrt(x_1) + exp(x_1),
 cos(c_1 + exp(x_1)),
 x_1**x_2,
 sin(Abs(x_1)/x_2)]


And we can also get frequencies (including conditionals) from the list of equations

In [None]:
from equation_tree.analysis import get_frequencies
freq = get_frequencies(equation_sample)
pprint.pprint(freq)

{'depth': {1: 0.1, 2: 0.3, 3: 0.6},
 'features': {'constants': 0.16666666666666666,
              'variables': 0.8333333333333334},
 'function_conditionals': {'abs': {'features': {'constants': 0.0,
                                                'variables': 1.0},
                                   'functions': {'sqrt': 1.0},
                                   'operators': {}},
                           'cos': {'features': {'constants': 0, 'variables': 0},
                                   'functions': {},
                                   'operators': {'+': 0.5, '/': 0.5}},
                           'exp': {'features': {'constants': 0.0,
                                                'variables': 1.0},
                                   'functions': {'tan': 1.0},
                                   'operators': {}},
                           'log': {'features': {'constants': 0.0,
                                                'variables': 1.0},
                                  

These frequencies have the same format as the priors, so we can use them to sample new equations

In [None]:
equation_sample_ = sample(10, freq, 3)

Processing: 100%|██████████| 10/10 [00:00<00:00, 128.45iteration/s]


In [None]:
freq_ = get_frequencies(equation_sample_)
pprint.pprint(freq_)


{'depth': {2: 0.3, 3: 0.7},
 'features': {'constants': 0.0625, 'variables': 0.9375},
 'function_conditionals': {'abs': {'features': {'constants': 0.0,
                                                'variables': 1.0},
                                   'functions': {'sqrt': 1.0},
                                   'operators': {'-': 0.5, '/': 0.5}},
                           'exp': {'features': {'constants': 0, 'variables': 0},
                                   'functions': {'tan': 1.0},
                                   'operators': {'-': 1.0}},
                           'log': {'features': {'constants': 0.0,
                                                'variables': 1.0},
                                   'functions': {},
                                   'operators': {'/': 1.0}},
                           'sin': {'features': {'constants': 0, 'variables': 0},
                                   'functions': {},
                                   'operators': {'-': 1.0}},
    