**teneva_research: power**

Исследование поэлементного возведения TT-тензоров в степень

---

# Установка и импорт модулей

In [1]:
import numpy as np
import teneva # Используется версия 0.11.4!
from time import perf_counter as tpc

# 1. Явное умножение, мелкая сетка, малая степень

## Подготовка TT-тензора для анализа

Рассмотрим $d$ мерную функцию Schwefel на равномерной сетке с $n$ узлами по каждой моде и операцию возведения в степень $s$.

In [2]:
d    = 4
n    = 2**10 + 1
s    = 4
func = teneva.FuncDemoSchwefel(d)
func.set_grid(n, kind='uni')

**Note**: *Мы берем нечетное число узлов сетки, для того, чтобы пространственная точка "x=0" (в которой большинство функций имеет оптимум) точно ложилась на сетку.*

Мы можем построить явно TT-ядра для этой функции.

In [3]:
func.cores()
Y0 = func.Y

teneva.show(Y0)

  1025 1025 1025 1025 
   / \  / \  / \  / \ 
  1    2    2    2    1  



Мы знаем точный глобальный минимум функции, и мы можем вычислить значение TT-тензора в ближайшем к нему мульти-индексе.

In [4]:
x_min_real = func.x_min
y_min_real = func.y_min

i_min_appr = teneva.poi_to_ind(x_min_real, func.a, func.b, func.n)

y_min_appr = teneva.get(Y0, i_min_appr)

print(i_min_appr) # Мульти-индекс, соответствующий x_min_real
print(x_min_real)
print(y_min_real) # Точное значение минимума
print(y_min_appr) # Значение TT-тензора в i_min_real

[943 943 943 943]
[420.9687 420.9687 420.9687 420.9687]
0.0
0.002545912405821582


Точка, соответствующая "оптимальному" мульти-индексу тензора:

In [5]:
x_min_appr = teneva.ind_to_poi(i_min_appr, func.a, func.b, func.n)
x_min_appr

array([420.8984375, 420.8984375, 420.8984375, 420.8984375])

**Note**: *Как можем видеть, на выбранной сетке ошибка составляет около `0.0025`. Брать более густую сетку мы не будем, поскольку в этом случае дальнейший код (включая `optima_tt`) будет отчаянно тормозить.*

Применим базовый "optima_tt" метод.

In [6]:
i_min0, y_min0, i_max0, y_max0 = teneva.optima_tt(Y0, k=10)
print(i_min0, y_min0)
print(i_max0, y_max0)

[943 943 943 943] 0.002545912405821582
[81 81 81 81] 3351.860654087594


**Note**: *Как можем видеть, `optima_tt` находит в данном случае точный оптимум TT-тензора.*

Для последующего анализа, вычтем из функции максимальное значение, чтобы минимум стал также и максимальным по модулю элементом. Мы не будем делать округление, чтобы сохранить точность минимума.

In [7]:
Y0 = teneva.sub(Y0, y_max0)
y_min_real -= y_max0
y_min_appr -= y_max0

teneva.show(Y0)

  1025 1025 1025 1025 
   / \  / \  / \  / \ 
  1    3    3    3    1  



Проверим результат "optima_tt" на обновленном TT-тензоре.

In [8]:
i_min, y_min, i_max, y_max = teneva.optima_tt(Y0, k=10)
print(i_min, y_min, y_min+y_max0)
print(i_max, y_max, y_max+y_max0)

[943 943 943 943] -3351.858108175187 0.0025459124067310768
[81 81 81 81] 9.094947017729282e-13 3351.860654087595


**Note**: *Как можем видеть, `optima_tt` находит по-прежнему точный оптимум TT-тензора.*

Таким образом, **теперь мы рассматриваем** смещенный тензор "Y0", имеющий минимальное значение "y_min_appr" в мульти-индексе "i_min_appr", которое также является и максимальным по модулю значением.

In [9]:
print(f'Min multi-index         :', i_min_appr)
print(f'Min value shifted (abs) : {abs(y_min_appr):-16.6f}')
print(f'Min value               : {y_min_appr + y_max0:-16.6f}')
print(f'Rank                    : {teneva.erank(Y0):-16.1f}')
print(f'TT-tensor Y0            :')
teneva.show(Y0)

Min multi-index         : [943 943 943 943]
Min value shifted (abs) :      3351.858108
Min value               :         0.002546
Rank                    :              3.0
TT-tensor Y0            :
  1025 1025 1025 1025 
   / \  / \  / \  / \ 
  1    3    3    3    1  



## Простое возведение в степень

Мы можем явно умножить заданный TT-тензор поэлементно сам на себя, используя операцию "mul" в TT-формате.

In [10]:
Z1 = Y0.copy()
for _ in range(s-1):
    Z1 = teneva.mul(Z1, Y0)

y_opt = teneva.get(Z1, i_min_appr)**(1./s)

print(f'Rank expected   : {teneva.erank(Y0)**s:-16.1f}')
print(f'Rank            : {teneva.erank(Z1):-16.1f}')
print(f'Opt value       : {y_opt:-16.6f}')
print(f'TT-tensor Z1    :')
teneva.show(Z1)

Rank expected   :             81.0
Rank            :             81.0
Opt value       :      3351.858108
TT-tensor Z1    :
  1025 1025 1025 1025 
   / \  / \  / \  / \ 
  1   81   81   81    1  



Проверим возможность округления результата.

In [11]:
for e in range(16, 0, -1):
    e = 10**(-e)
    Z2 = teneva.truncate(Z1, e)
    y_min = teneva.get(Z2, i_min_appr)**(1./s)
    err = abs(abs(y_min) - abs(y_min_appr))
    r = teneva.erank(Z2)
    print(f'e trunc = {e:-7.1e} | rank = {r:-6.2f} | e y_min = {err:-7.1e}')

e trunc = 1.0e-16 | rank =  27.43 | e y_min = 7.6e-11
e trunc = 1.0e-15 | rank =  27.43 | e y_min = 7.6e-11
e trunc = 1.0e-14 | rank =  27.43 | e y_min = 7.6e-11
e trunc = 1.0e-13 | rank =  27.43 | e y_min = 7.6e-11
e trunc = 1.0e-12 | rank =  26.62 | e y_min = 7.5e-11
e trunc = 1.0e-11 | rank =  21.86 | e y_min = 2.6e-11
e trunc = 1.0e-10 | rank =  11.92 | e y_min = 2.4e-10
e trunc = 1.0e-09 | rank =   6.45 | e y_min = 4.7e-11
e trunc = 1.0e-08 | rank =   5.00 | e y_min = 7.1e-11
e trunc = 1.0e-07 | rank =   5.00 | e y_min = 7.1e-11
e trunc = 1.0e-06 | rank =   5.00 | e y_min = 7.1e-11
e trunc = 1.0e-05 | rank =   4.00 | e y_min = 4.7e-02
e trunc = 1.0e-04 | rank =   4.00 | e y_min = 4.7e-02
e trunc = 1.0e-03 | rank =   3.00 | e y_min = 1.7e+00
e trunc = 1.0e-02 | rank =   2.00 | e y_min = 3.1e+01
e trunc = 1.0e-01 | rank =   1.00 | e y_min = 2.7e+02


**Note**: *Как можно видеть, в данном случае мы можем округлить результат даже до ранга "5" без существенной потери точности.*

Проверим результат посредством явного округления до данного ранга "5".

In [12]:
e = 1.E-20
Z2 = teneva.truncate(Z1, e, r=5)
y_min = teneva.get(Z2, i_min_appr)**(1./s)
err = abs(abs(y_min) - abs(y_min_appr))
r = teneva.erank(Z2)
print(f'e trunc = {e:-7.1e} | rank = {r:-6.2f} | e y_min = {err:-7.1e}')

e trunc = 1.0e-20 | rank =   5.00 | e y_min = 7.1e-11


## Простое возведение в степень различных функций

Повторим вышеприведенный расчет для всех функций, для которых известна явная форма TT-ядер. Мы будем искать точность округления результата возведения в степень, при которой обеспечивается отклонение значения в мульти-индексе оптимума для результата не более чем на "err_ok=1.E-6" относительно исходного тензора.

In [13]:
def find_trunc(Z1, s, i_min_appr, y_min_appr, err_ok=1.E-6):
    # Находим точность округления "e", при которой абсолютная ошибка
    # оптимума не более, чем "err_ok":
    for e in range(20):
        e = 10**(-e)
        Z2 = teneva.truncate(Z1, e)
        y_min = teneva.get(Z2, i_min_appr)**(1./s)
        err = abs(abs(y_min) - abs(y_min_appr))
        if err <= err_ok:
            return Z2, e
    return Z2, -1

In [14]:
for func in teneva.func_demo_all(d, only_with_cores=True, only_with_min=True, only_with_min_x=True):
    t = tpc()
    
    func.set_grid(n, kind='uni')
    func.cores()
    Y0 = func.Y
    
    x_min_real = func.x_min
    y_min_real = func.y_min
    
    i_min_appr = teneva.poi_to_ind(x_min_real, func.a, func.b, func.n)
    y_min_appr = teneva.get(Y0, i_min_appr)
    dy0 = abs(y_min_real-y_min_appr)
    
    i_min0, y_min0, i_max0, y_max0 = teneva.optima_tt(Y0, k=10)
    dy1 = abs(y_min_appr-y_min0)

    Y0 = teneva.sub(Y0, y_max0)
    y_min_real -= y_max0
    y_min_appr -= y_max0

    Z1 = Y0.copy()
    for _ in range(s-1):
        Z1 = teneva.mul(Z1, Y0)

    Z2, e = find_trunc(Z1, s, i_min_appr, y_min_appr)
    y_opt = teneva.get(Z2, i_min_appr)**(1./s)
    dy2 = abs(abs(y_min_appr) - abs(y_opt))
    r = teneva.erank(Z2)

    text = ''
    text += func.name + ' '*max(0, 12-len(func.name)) + '| '
    text += f'dy0 = {dy0:7.1e} | '
    text += f'dy1 = {dy1:7.1e} | '
    text += f'dy2 = {dy2:7.1e} | '
    text += f'r full = {teneva.erank(Y0)**s:-6.2f} | '
    text += f'r real = {r:-6.2f} | '
    text += f'e trunc = {e:-7.1e} | '
    text += f't work = {tpc()-t:-9.4f} | '
    print(text)

Alpine      | dy0 = 0.0e+00 | dy1 = 0.0e+00 | dy2 = 3.9e-13 | r full =  81.00 | r real =   5.00 | e trunc = 1.0e-07 | t work =   13.1198 | 
Exponential | dy0 = 0.0e+00 | dy1 = 0.0e+00 | dy2 = 2.5e-08 | r full =  16.00 | r real =   4.00 | e trunc = 1.0e-06 | t work =    1.0493 | 
Grienwank   | dy0 = 0.0e+00 | dy1 = 0.0e+00 | dy2 = 2.7e-06 | r full = 256.00 | r real =  97.16 | e trunc = -1.0e+00 | t work =  549.8700 | 
Qing        | dy0 = 7.2e-01 | dy1 = 0.0e+00 | dy2 = 3.8e-02 | r full =  81.00 | r real =  28.44 | e trunc = -1.0e+00 | t work =   32.2545 | 
Rastrigin   | dy0 = 0.0e+00 | dy1 = 0.0e+00 | dy2 = 4.2e-11 | r full =  81.00 | r real =   5.00 | e trunc = 1.0e-06 | t work =   11.7471 | 
Rosenbrock  | dy0 = 0.0e+00 | dy1 = 4.5e-01 | dy2 = 2.6e-07 | r full = 256.00 | r real =  13.07 | e trunc = 1.0e-09 | t work =  271.9155 | 
Schwefel    | dy0 = 2.5e-03 | dy1 = 0.0e+00 | dy2 = 7.1e-11 | r full =  81.00 | r real =   5.00 | e trunc = 1.0e-06 | t work =   12.6906 | 


**Note**: *Как можно видеть, в большинстве случаев возможно очень существенное округление результата возведения в степень без значительной потери точности оптимума. Однако для функций Grienwank и Qing не удалось найти подходящее округление (обеспечивающее отклонение оптимума не более чем на "1.E-6".*

**Note**: *Результаты имеют следующий смысл. Дискретный TT-тензор имеет в мульти-индексе, ближайшем к оптимуму, отклонение значения относительно реального оптимума функции на "dy0". Метод "optima_tt" находит оптимум с ошибкой "dy1" относительно значения тензора, а возведение в степень с округлением ведет к ошибке "dy2" относительно значения тензора, при этом "r real" - это ранг округленного тензора, "r full" - исходный ранг результата возведения в степень, а "e trunc" - использованная точность округления.*

# 2. Явное умножение, большая степень

Рассмотрим только те функции, которые имеют оптимум в нуле. Подготовим набор TT-тензоров для возведения в степень.

In [6]:
d    = 100       # Размерность функции
n    = 2**6 + 1  # Число узлов сетки
data = []

for func in teneva.func_demo_all(d, names=['Alpine', 'Exponential', 'Rastrigin', 'Rosenbrock', 'Schwefel']):
    func.set_grid(n, kind='uni')
    
    t = tpc()
    func.cores()
    t = tpc() - t
    
    y_max = teneva.optima_tt(func.Y, k=10)[-1]
    func.Y = teneva.sub(func.Y, y_max)
    i = teneva.poi_to_ind(func.x_min, func.a, func.b, func.n)
    y = teneva.get(func.Y, i)
    data.append({'name': func.name, 'Y': func.Y, 'i': i, 'y': y})

    text = ''
    text += func.name + ' '*max(0, 12-len(func.name)) + '| '
    text += f'r = {teneva.erank(func.Y):-6.2f} | '
    text += f'y = {y:-24.7f} | '
    text += f't = {t:-8.3f} | '
    print(text)

Alpine      | r =   3.00 | y =             -864.0927477 | t =    3.017 | 
Exponential | r =   2.00 | y =               -1.0000000 | t =    1.778 | 
Rastrigin   | r =   3.00 | y =            -3999.1547013 | t =    2.413 | 
Rosenbrock  | r =   4.00 | y =          -386680.6600335 | t =    3.418 | 
Schwefel    | r =   3.00 | y =           -83775.8442853 | t =    2.285 | 


Будем возводить в степень, округляя результат **после каждой операции**. Мы пробуем разные значения степени (s).

In [7]:
def run(data, s, e_trunc=1.E-12):
    print('-'*90 + f'\n-> RUN MUL  | d = {d:-3d}     | n = {n:-5d}           | power = {s:-2d}         | e_trunc = {e_trunc:-7.1e}')
    
    for item in data:
        t = tpc()
        Z = item['Y'].copy()
        for _ in range(s-1):
            Z = teneva.mul(Z, item['Y'])
            Z = teneva.truncate(Z, e_trunc)
        t = tpc() - t

        z = teneva.get(Z, item['i'])**(1./s)
        e = abs(abs(item['y']) - abs(z))

        text = ''
        text += item['name'] + ' '*max(0, 12-len(item['name'])) + '| '
        text += f'e = {e:7.1e} | '
        text += f'r full = {teneva.erank(item["Y"])**s:-10.1f} | '
        text += f'r real = {teneva.erank(Z):-9.1f} | '
        text += f't = {t:-8.3f}      | '
        print(text)

In [8]:
for s in [2, 4, 6, 8, 10]:
    run(data, s)

------------------------------------------------------------------------------------------
-> RUN MUL  | d = 100     | n =    65           | power =  2         | e_trunc = 1.0e-12
Alpine      | e = 6.3e-12 | r full =        9.0 | r real =       4.8 | t =    0.044      | 
Exponential | e = 1.9e-13 | r full =        4.0 | r real =       1.0 | t =    0.023      | 
Rastrigin   | e = 1.5e-11 | r full =        9.0 | r real =       4.9 | t =    0.037      | 
Rosenbrock  | e = 1.2e-09 | r full =       16.0 | r real =       8.5 | t =    0.074      | 
Schwefel    | e = 6.8e-09 | r full =        9.0 | r real =       4.8 | t =    0.041      | 
------------------------------------------------------------------------------------------
-> RUN MUL  | d = 100     | n =    65           | power =  4         | e_trunc = 1.0e-12
Alpine      | e = 8.1e-08 | r full =       81.0 | r real =       5.8 | t =    0.160      | 
Exponential | e = 9.7e-14 | r full =       16.0 | r real =       1.0 | t =    0.063     

# 3. Возведение в степень с использованием `cross_act`

Проверим эффективность применения для расматриваемой задачи возведения в степень специализированного метода "cross_act" для выполнения операций с TT-тензорами. Мы будем использовать набор TT-тензоров, построенный в предыдущем разделе.

In [11]:
def run_cross_act(data, s, e_trunc=1.E-12, act_e=1.E-12, act_nswp=10, act_r=1, act_dr=2, act_dr2=1):
    print('-'*90 + f'\n-> RUN ACT  | d = {d:-3d}     | n = {n:-5d}           | power = {s:-2d}         | e_trunc = {e_trunc:-7.1e}')
    
    for item in data:
        def f(X):
            return np.prod(X, axis=1)
    
        t = tpc()
        Z = teneva.tensor_rand(teneva.shape(item['Y']), r=act_r)
        Z = teneva.cross_act(f, [item['Y']]*s, Z,
            e=act_e, nswp=act_nswp, r=9999, dr=act_dr, dr2=act_dr2, log=False)
        Z = teneva.truncate(Z, e=e_trunc)
        t = tpc() - t
        
        z = teneva.get(Z, item['i'])**(1./s)
        e = abs(abs(item['y']) - abs(z))

        text = ''
        text += item['name'] + ' '*max(0, 12-len(item['name'])) + '| '
        text += f'e = {e:7.1e} | '
        text += f'r full = {teneva.erank(item["Y"])**s:-10.1f} | '
        text += f'r real = {teneva.erank(Z):-9.1f} | '
        text += f't = {t:-8.3f}      | '
        print(text)

In [12]:
for s in [2, 4, 6, 8, 10]:
    run_cross_act(data, s, act_e=1.E-12, act_nswp=10, act_r=1, act_dr=2, act_dr2=1)

------------------------------------------------------------------------------------------
-> RUN ACT  | d = 100     | n =    65           | power =  2         | e_trunc = 1.0e-12
Alpine      | e = 2.8e-11 | r full =        9.0 | r real =       4.1 | t =    0.508      | 
Exponential | e = 1.3e-15 | r full =        4.0 | r real =       1.0 | t =    0.452      | 
Rastrigin   | e = 3.4e-11 | r full =        9.0 | r real =       4.1 | t =    0.477      | 
Rosenbrock  | e = 2.7e-06 | r full =       16.0 | r real =       7.1 | t =    0.863      | 
Schwefel    | e = 4.4e-11 | r full =        9.0 | r real =       4.2 | t =    0.499      | 
------------------------------------------------------------------------------------------
-> RUN ACT  | d = 100     | n =    65           | power =  4         | e_trunc = 1.0e-12
Alpine      | e = 1.0e-03 | r full =       81.0 | r real =       6.0 | t =    0.940      | 
Exponential | e = 1.1e-16 | r full =       16.0 | r real =       1.0 | t =    0.524     

In [13]:
for s in [2, 4, 6, 8, 10]:
    run_cross_act(data, s, act_e=1.E-12, act_nswp=10, act_r=3, act_dr=3, act_dr2=0)

------------------------------------------------------------------------------------------
-> RUN ACT  | d = 100     | n =    65           | power =  2         | e_trunc = 1.0e-12
Alpine      | e = 1.1e-12 | r full =        9.0 | r real =       4.8 | t =    0.650      | 
Exponential | e = 4.4e-16 | r full =        4.0 | r real =       1.0 | t =    0.568      | 
Rastrigin   | e = 1.0e-10 | r full =        9.0 | r real =       4.8 | t =    0.646      | 
Rosenbrock  | e = 1.8e-06 | r full =       16.0 | r real =       7.7 | t =    0.888      | 
Schwefel    | e = 4.1e-09 | r full =        9.0 | r real =       4.8 | t =    0.655      | 
------------------------------------------------------------------------------------------
-> RUN ACT  | d = 100     | n =    65           | power =  4         | e_trunc = 1.0e-12
Alpine      | e = 3.3e-06 | r full =       81.0 | r real =       6.8 | t =    0.849      | 
Exponential | e = 6.7e-16 | r full =       16.0 | r real =       1.0 | t =    0.673     

In [16]:
for s in [2, 4, 6, 8, 10]:
    run_cross_act(data, s, act_e=1.E-10, act_nswp=10, act_r=3, act_dr=4, act_dr2=2)

------------------------------------------------------------------------------------------
-> RUN ACT  | d = 100     | n =    65           | power =  2         | e_trunc = 1.0e-12
Alpine      | e = 2.4e-12 | r full =        9.0 | r real =       5.6 | t =    0.856      | 
Exponential | e = 2.2e-16 | r full =        4.0 | r real =       1.0 | t =    0.653      | 
Rastrigin   | e = 6.1e-11 | r full =        9.0 | r real =       5.6 | t =    0.783      | 
Rosenbrock  | e = 1.2e-06 | r full =       16.0 | r real =       8.5 | t =    0.938      | 
Schwefel    | e = 4.3e-09 | r full =        9.0 | r real =       5.5 | t =    0.706      | 
------------------------------------------------------------------------------------------
-> RUN ACT  | d = 100     | n =    65           | power =  4         | e_trunc = 1.0e-12
Alpine      | e = 9.3e-07 | r full =       81.0 | r real =       7.2 | t =    0.879      | 
Exponential | e = 7.8e-16 | r full =       16.0 | r real =       1.0 | t =    0.734     

---