In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
from mlelec.data.dataset import precomputed_molecules, MoleculeDataset, MLDataset
import torch
from ase.io import read
import ase
from mlelec.models.linear import LinearTargetModel

In [3]:
h_data = MoleculeDataset(mol_name='water_1000', frame_slice=slice(0,10), data_path = 'examples/data/water_1000/sto-3g', aux_path = 'examples/data/water_1000/sto-3g', device='cuda', aux=['overlap', 'orbitals']) #frames =frames, frame_slice=':4', target_data={'fock': h}, aux=['overlap', 'orbitals'],aux_data = {'overlap': over, 'orbitals':orbs }
h_ml = MLDataset(molecule_data=h_data, device ='cuda')

Loading structures
examples/data/water_1000/sto-3g/fock.hickle


In [4]:
# h_ml._shuffle(random_seed=5381)
# h_ml._split_indices(train_frac=0.7, val_frac=0.2)

In [5]:
for f in h_ml.structures:
    f.pbc = False

## training on a tiny dataset for now 

In [7]:
linmod = LinearTargetModel(dataset = h_ml, metrics = "l2_loss", nlayers = 1, nout = 1, nhidden = 10, bias = False, device = 'cuda')


Computing features with default hypers
cuda:0 cuda
MLP(
  (mlp): Sequential(
    (0): Linear(in_features=256, out_features=10, bias=False)
    (1): Linear(in_features=10, out_features=1, bias=False)
  )
)
cuda:0 cuda
MLP(
  (mlp): Sequential(
    (0): Linear(in_features=256, out_features=10, bias=False)
    (1): Linear(in_features=10, out_features=1, bias=False)
  )
)
cuda:0 cuda
MLP(
  (mlp): Sequential(
    (0): Linear(in_features=384, out_features=10, bias=False)
    (1): Linear(in_features=10, out_features=1, bias=False)
  )
)
cuda:0 cuda
MLP(
  (mlp): Sequential(
    (0): Linear(in_features=256, out_features=10, bias=False)
    (1): Linear(in_features=10, out_features=1, bias=False)
  )
)
cuda:0 cuda
MLP(
  (mlp): Sequential(
    (0): Linear(in_features=384, out_features=10, bias=False)
    (1): Linear(in_features=10, out_features=1, bias=False)
  )
)
cuda:0 cuda
MLP(
  (mlp): Sequential(
    (0): Linear(in_features=256, out_features=10, bias=False)
    (1): Linear(in_features=10,

In [8]:
optimizer = torch.optim.Adam(linmod.parameters(), lr=0.01)
for epoch in range(100):
    loss = linmod.forward()
    loss.backward()
    optimizer.step()

    if epoch%10 == 0:
        print(torch.sqrt(loss.detach()))

cuda:0 cuda:0
tensor(69.3377, device='cuda:0', dtype=torch.float64)
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
tensor(64.0011, device='cuda:0', dtype=torch.float64)
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
tensor(54.5849, device='cuda:0', dtype=torch.float64)
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
tensor(43.9524, device='cuda:0', dtype=torch.float64)
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
tensor(37.2064, device='cuda:0', dtype=torch.float64)
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
cuda:0 cuda:0
tensor(22.7818, 

The default features and model is quite bad - so no wonder losses are high

## Predictions

In [10]:
linmod.forward()
fock = linmod.reconstructed_tensor
print(fock.shape)
print(fock.dtype)

cuda:0 cuda:0
torch.Size([10, 7, 7])
torch.float32


In [12]:
fock = fock.type(torch.float64)

## plugging in predicted fock matrix into pyscfad

In [13]:

import os
os.environ['PYSCFAD_BACKEND']='torch'

import torch
from pyscf import gto

from pyscfad import numpy as np
from pyscfad import ops
from pyscfad.ml.scf import hf
import pyscf.pbc.tools.pyscf_ase as pyscf_ase


Using PyTorch backend.




In [17]:

mol = gto.Mole()
mol.atom = pyscf_ase.ase_atoms_to_pyscf(h_ml.structures[0])
mol.basis = 'sto-3g'
mol.build()
fock = linmod.reconstructed_tensor[0].type(torch.float64)


mf = hf.SCF(mol)

mo_energy, mo_coeff = mf.eig(fock, s = torch.eye(fock.shape[-1], dtype = fock.dtype))
mo_occ = mf.get_occ(mo_energy) # get_occ returns a numpy array
mo_occ = ops.convert_to_tensor(mo_occ)


In [18]:
fock.dtype

torch.float64

In [19]:

dm1 = mf.make_rdm1(mo_coeff, mo_occ)
dip = mf.dip_moment(dm=dm1)
dip_norm = np.linalg.norm(dip)
dip_norm.backward()
print(fock.grad)

Dipole moment(X, Y, Z, Debye):  2.58983,  2.45573,  0.05366


None


  print(fock.grad)


In [20]:
mocc = mo_coeff[:, mo_occ>0]
dm = np.dot(mocc*mo_occ[mo_occ>0], mocc.T)

In [21]:
print(mocc.dtype)
print(mo_occ[mo_occ>0].dtype)

torch.float64
torch.float64


In [22]:
print(mocc.conj().T.dtype)

torch.float64
