plainerman
diff --git a/‎notebooks/models.py
Lines changed: 93 additions & 0 deletions b/‎notebooks/models.py
Lines changed: 93 additions & 0 deletions
diff --git a/‎notebooks/tps_gaussian.ipynb
Lines changed: 244 additions & 155 deletions b/‎notebooks/tps_gaussian.ipynb
Lines changed: 244 additions & 155 deletions
diff --git a/‎notebooks/tps_gaussian_2nd.ipynb
Lines changed: 0 additions & 627 deletions b/‎notebooks/tps_gaussian_2nd.ipynb
Lines changed: 0 additions & 627 deletions
diff --git a/‎notebooks/vf.py
Lines changed: 32 additions & 0 deletions b/‎notebooks/vf.py
Lines changed: 32 additions & 0 deletions
@@ -0,0 +1,93 @@
+import jax
+import jax.numpy as jnp
+from flax import linen as nn
+
+interp = jax.vmap(jnp.interp, in_axes=(None, None, 1))
+
+class Interpolant(nn.Module):
+  T: float
+  A: float
+  B: float
+  ndim: int
+  n_points: int = 100
+  @nn.compact
+  def __call__(self, t):
+    t = t/self.T
+    ndim = self.ndim
+    t_grid = jnp.linspace(0,1,self.n_points)
+    S_0 = jnp.log(1e-2)*jnp.eye(ndim)
+    S_0_vec = S_0[jnp.tril_indices(ndim)]
+    mu_params = self.param('mu_params', lambda rng: jnp.linspace(A[0], B[0], self.n_points)[1:-1])
+    S_params = self.param('S_params', lambda rng: jnp.linspace(S_0_vec, S_0_vec, self.n_points)[1:-1])
+    y_grid = jnp.concatenate([self.A, mu_params, self.B])
+    S_grid = jnp.concatenate([S_0_vec[None,:], S_params, S_0_vec[None,:]])
+
+    @jax.vmap
+    def get_tril(v):
+      a = jnp.zeros((ndim,ndim))
+      a = a.at[jnp.tril_indices(ndim)].set(v)
+      return a
+
+    mu = interp(t.flatten(), t_grid, y_grid).T
+    S = interp(t.flatten(), t_grid, S_grid).T
+    S = get_tril(S)
+    S = jnp.tril(2*jax.nn.sigmoid(S) - 1.0, k=-1) + jnp.eye(ndim)[None,...]*jnp.exp(S)
+    return mu, S
+
+class MLPfull(nn.Module):
+  T: float
+  A: float
+  B: float
+  ndim: int
+  xi_0: float = 1e-2
+  @nn.compact
+  def __call__(self, t):
+    t = t/self.T
+    ndim = self.ndim
+    h_mu = (1-t)*self.A + t*self.B
+    S_0 = self.xi_0*jnp.eye(ndim)
+    S_0 = S_0[None,...]
+    h_S = (1-2*t*(1-t))[...,None]*S_0
+    h = jnp.hstack([h_mu, h_S.reshape(-1,ndim*ndim), t])
+    h = nn.Dense(256)(h)
+    h = nn.swish(h)
+    h = nn.Dense(256)(h)
+    h = nn.swish(h)
+    h = nn.Dense(256)(h)
+    h = nn.swish(h)
+    h = nn.Dense(ndim + ndim*(ndim+1)//2)(h)
+    mu = h_mu + (1-t)*t*h[:,:ndim]
+
+    @jax.vmap
+    def get_tril(v):
+      a = jnp.zeros((ndim,ndim))
+      a = a.at[jnp.tril_indices(ndim)].set(v)
+      return a
+    # S = h[:,ndim:].reshape(-1,ndim,ndim)
+    S = get_tril(h[:,ndim:])
+    S = jnp.tril(2*jax.nn.sigmoid(S) - 1.0, k=-1) + jnp.eye(ndim)[None,...]*jnp.exp(S)
+    S = h_S + 2*((1-t)*t)[...,None]*S
+    return mu, S
+  
+class MLPdiag(nn.Module):
+  T: float
+  A: float
+  B: float
+  ndim: int
+  xi_0: float = 1e-4
+  @nn.compact
+  def __call__(self, t):
+    t = t/self.T
+    ndim = self.ndim
+    h_mu = (1-t)*self.A + t*self.B
+    h = jnp.hstack([h_mu, t])
+    h = nn.Dense(256)(h)
+    h = nn.swish(h)
+    h = nn.Dense(256)(h)
+    h = nn.swish(h)
+    h = nn.Dense(256)(h)
+    h = nn.swish(h)
+    h = nn.Dense(2*ndim)(h)
+    mu = h_mu + (1-t)*t*h[:,:ndim]
+    sigma = (1-t)*self.xi_0 + t*self.xi_0 + (1-t)*t*jnp.exp(h[:,ndim:])
+    return mu, sigma
@@ -0,0 +1,32 @@
+import jax
+import jax.numpy as jnp
+
+def get_parameterization_fn(params, state):
+  gauss_params = lambda _t: state.apply_fn(params, _t)
+  def dgauss_paramsdt(_t):
+    _gauss_params = lambda _t: jax.tree.map(lambda _a: _a.sum(0), gauss_params(_t))
+    return jax.tree.map(lambda a: a.squeeze().T, jax.jacrev(_gauss_params)(_t))
+  return gauss_params, dgauss_paramsdt
+
+def v_t_diag(_eps, _t, params, state):
+  gauss_params, dgauss_paramsdt = get_parameterization_fn(params, state)
+  _eps = _eps.squeeze()
+  mu_t_val, s_val = gauss_params(_t)
+  dmudt_val, dsdt_val = dgauss_paramsdt(_t)
+  _x = mu_t_val + jnp.sqrt(s_val)*_eps
+  dlogdx = -_eps/jnp.sqrt(s_val)
+  u_t = dmudt_val - 0.5*dlogdx*dsdt_val
+  out = (u_t - drift(_x)) + 0.5*(xi**2)*dlogdx.squeeze()
+  return out
+
+def v_t_full(_eps, _t, params, state):
+  gauss_params, dgauss_paramsdt = get_parameterization_fn(params, state)
+  mu_t_val, S_t_val = gauss_params(_t)
+  dmudt_val, dSdt_val = dgauss_paramsdt(_t)
+  _x = mu_t_val + jax.lax.batch_matmul(S_t_val, _eps).squeeze()
+  dlogdx = -jax.scipy.linalg.solve_triangular(jnp.transpose(S_t_val, (0,2,1)), _eps)
+  dSigmadt = jax.lax.batch_matmul(dSdt_val, jnp.transpose(S_t_val, (0,2,1)))
+  dSigmadt += jax.lax.batch_matmul(S_t_val, jnp.transpose(dSdt_val, (0,2,1)))
+  u_t = dmudt_val - 0.5*jax.lax.batch_matmul(dSigmadt, dlogdx).squeeze()
+  out = (u_t - drift(_x)) + 0.5*(xi**2)*dlogdx.squeeze()
+  return out