**teneva_research: power**

Исследование поэлементного возведения TT-тензоров в степень

---

# Установка и импорт модулей

In [1]:
import numpy as np
import teneva # Используется версия 0.11.4!
from time import perf_counter as tpc

# Подготовка тензоров

Мы рассматриваем только те модельные функции, для которых известна явная форма TT-ядер и которые имеют минимум в нуле (поскольку мы берем нечетное число узлов сетки, то мульти-индекс тензора попадет точно в оптимум):

In [2]:
func_names = ['Alpine', 'Rastrigin', 'Rosenbrock', 'Schwefel']
           # 'Exponential' - min и max перепутаны, пока отложил
           # 'Grienwank' - плохо работает ;(
d          = 100       # Размерность функции
n          = 2**6 + 1  # Число узлов сетки
data       = []

Для каждой функции мы:
- Явно строим ее TT-ядра
- Находим максимальное по модулю значение $y_{max}$, используя "optima_tt"
- Вычитаем из TT-тензора $y_{max}$ без округления (теперь в начале координат функция имеет минимум, который одновременно является максимальным по модулю значением)
- Сохраняем значение полученного TT-тензора в начале координат как референсное

In [3]:
for func in teneva.func_demo_all(d, names=func_names):
    func.set_grid(n, kind='uni')
    
    t = tpc()
    func.cores()
    t = tpc() - t
    
    y_max = teneva.optima_tt_max(func.Y)[-1]
    func.Y = teneva.sub(func.Y, y_max)
    
    i = teneva.poi_to_ind(func.x_min, func.a, func.b, func.n)
    y = teneva.get(func.Y, i)
    data.append({'name': func.name, 'Y': func.Y, 'i': i, 'y': y})

    text = ''
    text += func.name + ' '*max(0, 12-len(func.name)) + '| '
    text += f'r = {teneva.erank(func.Y):-6.2f} | '
    text += f'y = {y:-24.7f} | '
    text += f't = {t:-8.3f} | '
    print(text)

Alpine      | r =   3.00 | y =             -864.0927477 | t =    2.411 | 
Rastrigin   | r =   3.00 | y =            -3999.1547013 | t =    2.462 | 
Rosenbrock  | r =   4.00 | y =          -386680.6600335 | t =    3.230 | 
Schwefel    | r =   3.00 | y =           -83775.8442853 | t =    2.291 | 


# Явное возведение в степень

Будем возводить тензор в степень s, округляя результат после каждой операции и дополнительно нормируя тензор (мы сохраняем все промежуточные нормировки и используем их при вычислении итогового результата), также найдем индекс оптимума (максимума по модулю) для тензора, возведенного в степень, и оценим ошибку (берем значение исходного тензора в найденном мульти-индексе и смотрим на отклонение от точного значения).

In [11]:
def power_mul(Y, s, e_trunc):
    Z = teneva.copy(Y)
    p = 1.
    for _ in range(s-1):
        Z = teneva.mul(Z, Y)
        Z = teneva.truncate(Z, e_trunc)
        p_curr = teneva.norm(Z)
        Z = teneva.mul(Z, 1./p_curr)
        Z = teneva.truncate(Z, e_trunc)
        p *= p_curr
    return Z, p

In [21]:
def run(data, s, power, e_trunc=1.E-12, name='MUL'):
    print('-'*103 + f'\n-> RUN {name}  | d = {d:-3d}, n = {n:-5d}, power = {s:-2d}, e_trunc = {e_trunc:-7.1e}\n' + '-'*103)
    
    for item in data:
        t = tpc()
        Z, p = power(item['Y'], s, e_trunc)
        t = tpc() - t

        z = teneva.get(Z, item['i'])
        z = (z * p)**(1./s)
        
        e_val = abs(abs(item['y']) - abs(z))
        
        i_opt = teneva.optima_tt_max(Z, k=10)[0]
        y_opt = teneva.get(item['Y'], i_opt)
        e_opt = abs(item['y'] - y_opt)

        text = ''
        text += item['name'] + ' '*max(0, 12-len(item['name'])) + '| '
        text += f'e val = {e_val:7.1e} | '
        text += f'e opt = {e_opt:7.1e} | '
        text += f'r full = {teneva.erank(item["Y"])**s:-10.1f} | '
        text += f'r real = {teneva.erank(Z):-5.1f} | '
        text += f't = {t:-8.3f} | '
        print(text)

In [22]:
run(data, 8, power_mul)

-------------------------------------------------------------------------------------------------------
-> RUN MUL  | d = 100, n =    65, power =  8, e_trunc = 1.0e-12
-------------------------------------------------------------------------------------------------------
Alpine      | e val = 7.6e-04 | e opt = 0.0e+00 | r full =     6561.0 | r real =   5.8 | t =    0.678 | 
Rastrigin   | e val = 5.0e-02 | e opt = 0.0e+00 | r full =     6561.0 | r real =   5.9 | t =    0.711 | 
Rosenbrock  | e val = 8.8e-03 | e opt = 8.3e+01 | r full =    65536.0 | r real =  18.1 | t =   10.826 | 
Schwefel    | e val = 4.1e+00 | e opt = 0.0e+00 | r full =     6561.0 | r real =   5.9 | t =    0.673 | 


# Возведение в степень с использованием `cross_act`

In [31]:
def power_act(Y, s, e_trunc, act_e=1.E-8, act_nswp=5, act_r=1, act_dr=2, act_dr2=0):
    def f(X):
        return np.prod(X, axis=1)
        
    Z = teneva.copy(Y)
    p = 1.
    for _ in range(s-1):
        R = teneva.tensor_rand(teneva.shape(Y), r=act_r)
        Z = teneva.cross_act(f, [Z, Y], R,
            e=act_e, nswp=act_nswp, r=9999, dr=act_dr, dr2=act_dr2, log=False)
        Z = teneva.truncate(Z, e=e_trunc)
        p_curr = teneva.norm(Z)
        Z = teneva.mul(Z, 1./p_curr)
        Z = teneva.truncate(Z, e_trunc)
        p *= p_curr
    return Z, p

In [32]:
run(data, 8, power_act)

-------------------------------------------------------------------------------------------------------
-> RUN MUL  | d = 100, n =    65, power =  8, e_trunc = 1.0e-12
-------------------------------------------------------------------------------------------------------
Alpine      | e val = 7.6e-05 | e opt = 0.0e+00 | r full =     6561.0 | r real =   6.6 | t =    8.041 | 
Rastrigin   | e val = 3.0e-02 | e opt = 0.0e+00 | r full =     6561.0 | r real =   7.2 | t =    7.360 | 
Rosenbrock  | e val = 9.7e+00 | e opt = 9.2e+01 | r full =    65536.0 | r real =  13.0 | t =   16.531 | 
Schwefel    | e val = 6.6e+00 | e opt = 0.0e+00 | r full =     6561.0 | r real =   7.6 | t =    7.345 | 


# Возведение сразу в большую степень с использованием `cross_act`

In [35]:
def power_act2(Y, s, e_trunc, act_e=1.E-8, act_nswp=5, act_r=1, act_dr=2, act_dr2=0):
    def f(X):
        return np.prod(X, axis=1)

    R = teneva.tensor_rand(teneva.shape(Y), r=act_r)
    Z = teneva.cross_act(f, [Y]*s, R,
        e=act_e, nswp=act_nswp, r=9999, dr=act_dr, dr2=act_dr2, log=False)
    Z = teneva.truncate(Z, e=e_trunc)
    return Z, 1.

In [36]:
run(data, 8, power_act2)

-------------------------------------------------------------------------------------------------------
-> RUN MUL  | d = 100, n =    65, power =  8, e_trunc = 1.0e-12
-------------------------------------------------------------------------------------------------------
Alpine      | e val = 2.3e-03 | e opt = 0.0e+00 | r full =     6561.0 | r real =   6.3 | t =    2.156 | 
Rastrigin   | e val = 1.5e-08 | e opt = 0.0e+00 | r full =     6561.0 | r real =   6.6 | t =    1.437 | 
Rosenbrock  | e val = 7.6e-02 | e opt = 8.3e+01 | r full =    65536.0 | r real =  13.0 | t =    3.142 | 
Schwefel    | e val = 2.3e-06 | e opt = 0.0e+00 | r full =     6561.0 | r real =   6.7 | t =    2.123 | 


---