# Modeling of Pope tensors with e3nn
We demonstrate that e3nn can learn operations that are equivalent to preprocessing proposed by Ling et al. in Reynolds averaged turbulence modelling using deep neural networks with embedded invariance - an approach still prevalent in turbulence closure modeling.

First, we randomly create tensors, which we will later interpret as S and R tensors.

In [1]:
import e3nn
import torch

In [2]:
# Create random variables that represent different cases of velocity grad
gradU = (torch.rand(90000).reshape(-1, 3, 3)*2)-1
# Compute S and R
S = (gradU + gradU.transpose(2, 1))/2 # S = (gradU + gradU.T)/2
R = (gradU - gradU.transpose(2, 1))/2 # R = (gradU - gradU.T)/2

For any pair of R and S, we can compute the tensor T9 from Pope et al. as follows.

In [3]:
# Get T(9) through symbolic computation
Ssq = torch.einsum('bij, bjk -> bik', S, S) # b is the batch dimension for the matrix multiplication ij, jk -> ik
Rsq = torch.einsum('bij, bjk -> bik', R, R)
RsqSsq = torch.einsum('bij, bjk -> bik', Rsq, Ssq)
SsqRsq = torch.einsum('bij, bjk -> bik', Ssq, Rsq)
trSsqRsq = torch.einsum('bij, bij -> b', SsqRsq, SsqRsq)
T9 = RsqSsq + RsqSsq - (torch.eye(3)[None, :, :] * trSsqRsq[:, None, None])

In [4]:
T9.shape

torch.Size([10000, 3, 3])

Notably, the computation of T9 demands all of the operations used for basis tensors: matrix multiplication of tensors, taking trace of a tensor and addition/subtraction.

We create a custom e3nn-based architecture with atomic operations that can reflect those operations. Note that every layer in this model has just enough memory to store different stages of computation as shown in fig. 3 of our paper.

In [5]:
# Define the minimal architecture to achieve the same result on cartesian tensors
from torch.nn import Module
from e3nn.io import CartesianTensor
from e3nn import o3

class T9Model(Module):
    def __init__(self):
        super(T9Model, self).__init__()
        # CartesianTensor objects are not trainable and will serve for transition between Cartesian and spherical space
        self.ct = CartesianTensor('ij') # a class to represent gradU as 1x0e + 1x1e + 1x2e Irrep tensors
        self.sct = CartesianTensor('ij=ji') # a class to represent a symmetric tensor as 1x0e + 1x2e
        self.act = CartesianTensor('ij=-ji') # a class to represent a skew-symmetric tensor as 1x1e
        # We could use two CartesianTensor interfaces to separately transform S and R.
        # Instead, we will directly decompose the full velocity gradient tensor gradU into irreps, which is equivalent
        # self.ctS = CartesianTensor('ij=ji')
        
        # We prepare the TensorProduct layers that, in the spherical space, will learn operations homeomorphic to Cartesian matrix multiplication
        # We also prepare a Linear layer to handle the summation
        self.tp1 = o3.FullyConnectedTensorProduct('0e + 2e', '0e + 2e', '0e + 1e + 2e') # the output irreps are determined by transformation properties of Ssq and Rsq under rotation
        self.tp1a = o3.FullyConnectedTensorProduct('1e', '1e', '0e + 1e + 2e')
        self.tp2 = o3.FullyConnectedTensorProduct('0e + 1e + 2e', '0e + 1e + 2e', '0e + 1e + 2e')
        self.tp2a = o3.FullyConnectedTensorProduct('0e + 1e + 2e', '0e + 1e + 2e', '0e + 1e + 2e')
        self.tp3 = o3.FullyConnectedTensorProduct('0e + 1e + 2e', '0e + 1e + 2e', '0e')
        self.lin = o3.Linear('0e + 1e + 2e + 0e + 1e + 2e + 0e', '0e + 1e + 2e')
        
        # The variables below will be filled with cached values to accelerate the forward call - this is just a technicality of e3nn.io.CartesianTensor
        self.rtp = None
        self.srtp = None
        self.artp = None

    def configure_optimizers(self):
        optimizer = optim.Adam(self.parameters(), lr=self.lr)
        return optimizer

    def forward(self, x):
        if self.rtp is None:
            self.rtp = self.ct.reduced_tensor_products(torch.tensor([0., 1., 2.], device=x.device))
        if self.srtp is None:
            self.srtp = self.sct.reduced_tensor_products(torch.tensor([0., 1., 2.], device=x.device))
        if self.artp is None:
            self.artp = self.act.reduced_tensor_products(torch.tensor([0., 1., 2.], device=x.device))
         
        # Transformation from Cartesian space
        x_sym = self.sct.from_cartesian(x, rtp=self.srtp) # get S
        x_asym = self.act.from_cartesian(x, rtp=self.artp) # get R
        #x_spher = self.ct.from_cartesian(x, rtp=self.rtp) This is how we would decompose gradU in a single step
        x1 = self.tp1(x_sym, x_sym) # (Train to) compute S^2 (or equivalently descriptive variable)
        x1a = self.tp1a(x_asym, x_asym) # (Train to) comput R^2 (or equivalently descriptive variable)
        x2 = self.tp2(x1, x1a)
        x2a = self.tp2a(x1, x1a)
        x2tr = self.tp3(x2, x2a)
        out = self.lin(torch.cat([x2, x2a, x2tr], dim=1))
        #out = self.lin(x2)
        
        # Transformation back to Cartesian space
        out_cart = self.ct.to_cartesian(out, rtp=self.rtp)
        return out_cart

We demonstrate that the proposed simplistic architecture can perform the operation equivalent to computation of Pope's 9th tensor, even though the variables are encoded in the spherical space. The two cells below involve training with moderate learning rate, with the first one employing weight decay to sparsify the randomly-initialized parameters of e3nn operations.

The architecture we defined contains 49 trainable parameters, yet fits the 10 000 datapoints easily. Ultimately, it shall be validated on the test set of 100 000 datapoints. We argue that the number of examples does not matter, as the network can model the operations used in Pope's preprocessing.

Conversely, e3nn-based architectures, as proposed in the paper, can learn operations equivalent to those employed by tensor basis approach, making our proposed model a superset of TBNN. One has to note, however, we did not emphasize exactly matching to Pope's tensor basis: in our main model, e3nn operations are intertwined with nonlinear activation functions. Our approach is more akin to typical design of neural networks: nonlinear activation functions, batch normalization and inference distributed among different neurons make for a more amicable ground for training than symbolic operations devised by Pope.

In [6]:
from tqdm import tqdm
import torch.nn.functional as F
from torch.optim import Adam
from torch.utils.data import DataLoader, TensorDataset
model = T9Model()
model.train()
loader = DataLoader(TensorDataset(gradU, T9), batch_size=16)
optimizer = Adam(model.parameters(), lr=10e-4, weight_decay=1e-7)
scheduler = torch.optim.lr_scheduler.StepLR(optimizer, step_size=1, gamma=0.97)
epochs = 20
device = torch.device('cuda') if torch.cuda.is_available() else torch.device('cpu')

print(f'Number of model params: {sum(p.numel() for p in model.parameters())}')
for i in range(epochs):
    error = 0
    steps = 0
    for batch in tqdm(loader, total=len(loader)):
        x, y = batch
        optimizer.zero_grad()
        out = model(x)
        loss = F.mse_loss(out, y)
        loss.backward()
        optimizer.step()
        error += loss.detach()
        steps += 1
    print(f'Epoch {i}; total error: {error}, average: {error/steps}')
    scheduler.step()



Number of model params: 49


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:25<00:00, 24.05it/s]


Epoch 0; total error: 217.21981811523438, average: 0.34755170345306396


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:24<00:00, 26.01it/s]


Epoch 1; total error: 65.14458465576172, average: 0.1042313352227211


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:21<00:00, 29.32it/s]


Epoch 2; total error: 27.848548889160156, average: 0.04455767944455147


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 74.46it/s]


Epoch 3; total error: 9.522029876708984, average: 0.015235248021781445


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 74.00it/s]


Epoch 4; total error: 6.692614555358887, average: 0.01070818305015564


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 72.27it/s]


Epoch 5; total error: 5.9685516357421875, average: 0.009549682959914207


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.25it/s]


Epoch 6; total error: 5.544824600219727, average: 0.008871719241142273


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.29it/s]


Epoch 7; total error: 5.252945899963379, average: 0.008404713124036789


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.21it/s]


Epoch 8; total error: 5.02335262298584, average: 0.008037364110350609


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.19it/s]


Epoch 9; total error: 4.823119163513184, average: 0.007716990541666746


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.28it/s]


Epoch 10; total error: 4.634026527404785, average: 0.007414442487061024


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.63it/s]


Epoch 11; total error: 4.443302631378174, average: 0.007109284400939941


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 68.13it/s]


Epoch 12; total error: 4.240302562713623, average: 0.006784484256058931


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.12it/s]


Epoch 13; total error: 4.015425205230713, average: 0.0064246803522109985


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.26it/s]


Epoch 14; total error: 3.7599422931671143, average: 0.006015907507389784


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.58it/s]


Epoch 15; total error: 3.466522455215454, average: 0.005546435713768005


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 72.21it/s]


Epoch 16; total error: 3.1302218437194824, average: 0.0050083547830581665


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.91it/s]


Epoch 17; total error: 2.7500176429748535, average: 0.004400028381496668


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.78it/s]


Epoch 18; total error: 2.330662965774536, average: 0.003729060757905245


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.55it/s]

Epoch 19; total error: 1.8846261501312256, average: 0.0030154017731547356





In [7]:
optimizer = Adam(model.parameters(), lr=1e-4)
epochs = 100
for i in range(epochs):
    error = 0
    steps = 0
    for batch in tqdm(loader, total=len(loader)):
        x, y = batch
        optimizer.zero_grad()
        out = model(x)
        loss = F.mse_loss(out, y)
        loss.backward()
        optimizer.step()
        error += loss.detach()
        steps += 1
    print(f'Epoch {i}; total error: {error}, average: {error/steps}')

100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.21it/s]


Epoch 0; total error: 1.5647218227386475, average: 0.002503554802387953


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.54it/s]


Epoch 1; total error: 1.4653446674346924, average: 0.002344551496207714


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.89it/s]


Epoch 2; total error: 1.3768370151519775, average: 0.0022029392421245575


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.98it/s]


Epoch 3; total error: 1.2898499965667725, average: 0.002063760068267584


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.57it/s]


Epoch 4; total error: 1.203642725944519, average: 0.0019258284009993076


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.13it/s]


Epoch 5; total error: 1.1180906295776367, average: 0.001788945053704083


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.25it/s]


Epoch 6; total error: 1.0332834720611572, average: 0.0016532535664737225


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.90it/s]


Epoch 7; total error: 0.9494291543960571, average: 0.0015190866542980075


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.23it/s]


Epoch 8; total error: 0.86679607629776, average: 0.0013868737732991576


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.82it/s]


Epoch 9; total error: 0.7857008576393127, average: 0.00125712133012712


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.50it/s]


Epoch 10; total error: 0.7065061926841736, average: 0.0011304098879918456


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.76it/s]


Epoch 11; total error: 0.6296116709709167, average: 0.001007378683425486


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.65it/s]


Epoch 12; total error: 0.5554447770118713, average: 0.0008887116564437747


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.64it/s]


Epoch 13; total error: 0.48446354269981384, average: 0.000775141641497612


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.02it/s]


Epoch 14; total error: 0.4171470105648041, average: 0.0006674352334812284


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 68.98it/s]


Epoch 15; total error: 0.35398367047309875, average: 0.0005663738702423871


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.13it/s]


Epoch 16; total error: 0.2954530417919159, average: 0.0004727248742710799


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.18it/s]


Epoch 17; total error: 0.2420281022787094, average: 0.0003872449742630124


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.02it/s]


Epoch 18; total error: 0.19412460923194885, average: 0.0003105993673671037


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.46it/s]


Epoch 19; total error: 0.15209147334098816, average: 0.00024334635236300528


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.16it/s]


Epoch 20; total error: 0.11616438627243042, average: 0.00018586301303002983


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 68.11it/s]


Epoch 21; total error: 0.0864189863204956, average: 0.00013827037764713168


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.03it/s]


Epoch 22; total error: 0.06271977722644806, average: 0.000100351644505281


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.82it/s]


Epoch 23; total error: 0.044686466455459595, average: 7.149834709707648e-05


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.81it/s]


Epoch 24; total error: 0.031665388494729996, average: 5.066462108516134e-05


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.56it/s]


Epoch 25; total error: 0.02276994287967682, average: 3.643190939328633e-05


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.92it/s]


Epoch 26; total error: 0.01698444038629532, average: 2.7175105060450733e-05


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.47it/s]


Epoch 27; total error: 0.013325301930308342, average: 2.1320483938325197e-05


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.03it/s]


Epoch 28; total error: 0.010982010513544083, average: 1.7571217540535145e-05


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.52it/s]


Epoch 29; total error: 0.009381860494613647, average: 1.5010977222118527e-05


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 66.42it/s]


Epoch 30; total error: 0.008173348382115364, average: 1.3077357834845316e-05


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.86it/s]


Epoch 31; total error: 0.007172274403274059, average: 1.1475639439595398e-05


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.30it/s]


Epoch 32; total error: 0.006298263091593981, average: 1.0077221304527484e-05


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.47it/s]


Epoch 33; total error: 0.005521154962480068, average: 8.833848369249608e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.50it/s]


Epoch 34; total error: 0.004828622564673424, average: 7.725796422164422e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.11it/s]


Epoch 35; total error: 0.004211737774312496, average: 6.738780484738527e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 68.57it/s]


Epoch 36; total error: 0.0036618246231228113, average: 5.858919394086115e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.91it/s]


Epoch 37; total error: 0.0031702746637165546, average: 5.072439307696186e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.64it/s]


Epoch 38; total error: 0.0027297409251332283, average: 4.3675854612956755e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.37it/s]


Epoch 39; total error: 0.0023343164939433336, average: 3.7349063859437592e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.03it/s]


Epoch 40; total error: 0.001979157095775008, average: 3.1666513677919284e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.57it/s]


Epoch 41; total error: 0.0016609224257990718, average: 2.6574759885988897e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.74it/s]


Epoch 42; total error: 0.0013767621712759137, average: 2.202819587182603e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.28it/s]


Epoch 43; total error: 0.0011248053051531315, average: 1.7996884480453446e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.45it/s]


Epoch 44; total error: 0.0009033898240886629, average: 1.4454236634264817e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.78it/s]


Epoch 45; total error: 0.0007115166517905891, average: 1.1384266827008105e-06


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.36it/s]


Epoch 46; total error: 0.0005479436949826777, average: 8.76709918884444e-07


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.14it/s]


Epoch 47; total error: 0.0004113060131203383, average: 6.580896183550067e-07


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.20it/s]


Epoch 48; total error: 0.0002998184063471854, average: 4.797094561581616e-07


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.69it/s]


Epoch 49; total error: 0.00021118226868566126, average: 3.378916346719052e-07


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.90it/s]


Epoch 50; total error: 0.0001424491492798552, average: 2.2791863329985063e-07


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.74it/s]


Epoch 51; total error: 9.038710413733497e-05, average: 1.4461936359566607e-07


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.99it/s]


Epoch 52; total error: 5.284218423184939e-05, average: 8.454749433894904e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.42it/s]


Epoch 53; total error: 2.7719184799934737e-05, average: 4.43506955605244e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.18it/s]


Epoch 54; total error: 1.2298241927055642e-05, average: 1.967718787909689e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.90it/s]


Epoch 55; total error: 6.606576334888814e-06, average: 1.0570522235298085e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.41it/s]


Epoch 56; total error: 1.9581029846449383e-06, average: 3.1329647764977153e-09


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.93it/s]


Epoch 57; total error: 1.1888087101397105e-06, average: 1.902094037831148e-09


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.88it/s]


Epoch 58; total error: 2.9502270990633406e-06, average: 4.720363211418999e-09


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.49it/s]


Epoch 59; total error: 1.1016543794539757e-05, average: 1.7626470949494433e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.02it/s]


Epoch 60; total error: 2.0335048134256795e-07, average: 3.253607661068969e-10


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.63it/s]


Epoch 61; total error: 9.364626748720184e-06, average: 1.498340296279821e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.47it/s]


Epoch 62; total error: 1.1118609108962119e-05, average: 1.7789774986454177e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.16it/s]


Epoch 63; total error: 6.547182692884235e-06, average: 1.047549247346069e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.20it/s]


Epoch 64; total error: 3.303886842331849e-06, average: 5.286219018074689e-09


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.77it/s]


Epoch 65; total error: 1.2303614767006366e-06, average: 1.968578411393196e-09


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.62it/s]


Epoch 66; total error: 1.9973484086222015e-05, average: 3.1957576140939636e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.59it/s]


Epoch 67; total error: 1.2725233489163656e-07, average: 2.0360373109706842e-10


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.93it/s]


Epoch 68; total error: 9.91241086012451e-06, average: 1.5859857427358293e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.91it/s]


Epoch 69; total error: 9.157039130514022e-06, average: 1.465126242550241e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.99it/s]


Epoch 70; total error: 6.877798455207085e-07, average: 1.100447732937937e-09


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.09it/s]


Epoch 71; total error: 8.691300536156632e-06, average: 1.3906080731374004e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.14it/s]


Epoch 72; total error: 3.310824922664324e-06, average: 5.297319916053311e-09


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.01it/s]


Epoch 73; total error: 8.496232112520374e-06, average: 1.3593971281977701e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 72.58it/s]


Epoch 74; total error: 5.7972515605797525e-06, average: 9.275602508296288e-09


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.04it/s]


Epoch 75; total error: 8.82750373421004e-06, average: 1.4124005964788466e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 68.45it/s]


Epoch 76; total error: 9.423144547326956e-06, average: 1.5077031179089317e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.40it/s]


Epoch 77; total error: 7.0979801591875e-08, average: 1.1356768303549813e-10


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.30it/s]


Epoch 78; total error: 9.182195753965061e-06, average: 1.469151289512638e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 68.48it/s]


Epoch 79; total error: 1.128370513470145e-05, average: 1.805392813025719e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.72it/s]


Epoch 80; total error: 1.6924138890317408e-06, average: 2.7078621567255823e-09


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.92it/s]


Epoch 81; total error: 1.688497832219582e-05, average: 2.7015964576548868e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.40it/s]


Epoch 82; total error: 3.146580596080639e-08, average: 5.034529043657088e-11


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.17it/s]


Epoch 83; total error: 1.287756094825454e-05, average: 2.06040979833233e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 69.90it/s]


Epoch 84; total error: 4.5427941586240195e-06, average: 7.268470714194564e-09


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.53it/s]


Epoch 85; total error: 7.514837307098787e-06, average: 1.2023739337507777e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.47it/s]


Epoch 86; total error: 8.014973900571931e-06, average: 1.282395789559132e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.34it/s]


Epoch 87; total error: 3.671100898827717e-07, average: 5.873761477204198e-10


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.01it/s]


Epoch 88; total error: 1.0864769137697294e-05, average: 1.7383630535050543e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 71.32it/s]


Epoch 89; total error: 1.0413441486889496e-05, average: 1.6661505952697553e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.48it/s]


Epoch 90; total error: 3.452671307968558e-06, average: 5.524273927193235e-09


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.55it/s]


Epoch 91; total error: 6.3691832110635005e-06, average: 1.0190692734113327e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.34it/s]


Epoch 92; total error: 9.480259905103594e-06, average: 1.5168415856692263e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 69.05it/s]


Epoch 93; total error: 1.104106104321545e-06, average: 1.7665697793489699e-09


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 73.01it/s]


Epoch 94; total error: 1.0549593753239606e-05, average: 1.6879349473697403e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 68.77it/s]


Epoch 95; total error: 1.0076464604935609e-05, average: 1.612234257208911e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:09<00:00, 68.76it/s]


Epoch 96; total error: 3.023300223503611e-07, average: 4.837280576097669e-10


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.71it/s]


Epoch 97; total error: 8.7444295786554e-06, average: 1.3991087399745084e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.69it/s]


Epoch 98; total error: 1.3035785741521977e-05, average: 2.0857257254647266e-08


100%|████████████████████████████████████████████████████████████████████████████████| 625/625 [00:08<00:00, 70.04it/s]

Epoch 99; total error: 5.050282652518945e-06, average: 8.080451863179405e-09





We verify that this minimalist architecture is just applicable to larger (100 thousand) portion of never-seen randomly generated examples.

In [9]:
# Create a bigger test set
gradU = (torch.rand(900000).reshape(-1, 3, 3)*2)-1
#gradU = (torch.rand(9000000).reshape(-1, 3, 3))
# Compute S and R
S = (gradU + gradU.transpose(2, 1))/2 # S = (gradU + gradU.T)/2
R = (gradU - gradU.transpose(2, 1))/2 # R = (gradU - gradU.T)/2

# Get T(9) through symbolic computation
Ssq = torch.einsum('bij, bjk -> bik', S, S) # b is the batch dimension for the matrix multiplication ij, jk -> ik
Rsq = torch.einsum('bij, bjk -> bik', R, R)
RsqSsq = torch.einsum('bij, bjk -> bik', Rsq, Ssq)
SsqRsq = torch.einsum('bij, bjk -> bik', Ssq, Rsq)
trSsqRsq = torch.einsum('bij, bij -> b', SsqRsq, SsqRsq)
T9 = RsqSsq + RsqSsq - (torch.eye(3)[None, :, :] * trSsqRsq[:, None, None])

test_loader = DataLoader(TensorDataset(gradU, T9), batch_size=64)

model.eval()
error = 0
steps = 0
trues = []
preds = []
for batch in tqdm(test_loader, total=len(test_loader)):
    x, y = batch
    out = model(x)
    loss = F.mse_loss(out, y)
    error += loss.detach()
    steps += 1
    # let's also express the testing error in terms of r^2 - for that 
    trues.append(y.reshape(-1))
    preds.append(out.detach().reshape(-1))
trues = torch.cat(trues)
preds = torch.cat(preds)
print(f'Test epoch; total error: {error}, average: {error/steps}')

100%|█████████████████████████████████████████████████████████████████████████████| 1563/1563 [00:09<00:00, 165.52it/s]

Test epoch; total error: 5.057370966454755e-09, average: 3.23568190470358e-12





In [13]:
def r2_score(y_true, y_pred):
    ss_res = torch.sum((y_true - y_pred) ** 2)
    y_true_mean = torch.mean(y_true)
    ss_tot = torch.sum((y_true - y_true_mean) ** 2)
    r2 = 1 - ss_res / ss_tot
    return r2.item()
print(np.array(r2_score(trues, preds)))

1.0


In [None]:
sum(p.numel() for p in model.parameters())

In [None]:
def e3_operations(x_sym, x_asym):
    x1 = model.tp1(x_sym, x_sym)
    x1a = model.tp1a(x_asym, x_asym)
    x2 = model.tp2(x1, x1a)
    x2a = model.tp2a(x1, x1a)
    x2tr = model.tp3(x2, x2a)
    out = model.lin(torch.cat([x2, x2a, x2tr], dim=1))
    return out

from e3nn.util.test import equivariance_error
model.eval()
for batch in test_loader:
    x, y = batch
    err = equivariance_error(
        e3_operations,
        args_in=[model.sct.from_cartesian(x, rtp=model.srtp), model.act.from_cartesian(x, rtp=model.artp)],
        irreps_in=['0e + 2e', '1e'],
        irreps_out=['0e + 1e + 2e']
    )
    break
print(err)