pyro-ppl · eb8680 · Dec 21, 2020 · Dec 17, 2020 · Dec 17, 2020 · Dec 17, 2020
diff --git a/pyro/contrib/funsor/infer/__init__.py b/pyro/contrib/funsor/infer/__init__.py
@@ -6,4 +6,4 @@
 from .elbo import ELBO  # noqa: F401
 from .trace_elbo import JitTrace_ELBO, Trace_ELBO  # noqa: F401
 from .tracetmc_elbo import JitTraceTMC_ELBO, TraceTMC_ELBO  # noqa: F401
-from .traceenum_elbo import JitTraceEnum_ELBO, TraceEnum_ELBO  # noqa: F401
+from .traceenum_elbo import JitTraceEnum_ELBO, TraceEnum_ELBO, TraceMarkovEnum_ELBO  # noqa: F401
diff --git a/pyro/contrib/funsor/infer/traceenum_elbo.py b/pyro/contrib/funsor/infer/traceenum_elbo.py
@@ -18,8 +18,11 @@ def terms_from_trace(tr):
     # data structure containing densities, measures, scales, and identification
     # of free variables as either product (plate) variables or sum (measure) variables
     terms = {"log_factors": [], "log_measures": [], "scale": to_funsor(1.),
-             "plate_vars": frozenset(), "measure_vars": frozenset()}
+             "plate_vars": frozenset(), "measure_vars": frozenset(), "plate_to_step": dict()}
     for name, node in tr.nodes.items():
+        # add markov dimensions to the plate_to_step dictionary
+        if node["type"] == "markov_chain":
+            terms["plate_to_step"][node["name"]] = node["value"]
         if node["type"] != "sample" or type(node["fn"]).__name__ == "_Subsample":
             continue
         # grab plate dimensions from the cond_indep_stack
@@ -39,9 +42,72 @@ def terms_from_trace(tr):
         # grab the log-density, found at all sites except those that are not replayed
         if node["is_observed"] or not node.get("replay_skipped", False):
             terms["log_factors"].append(node["funsor"]["log_prob"])
+    # add plate dimensions to the plate_to_step dictionary
+    terms["plate_to_step"].update({plate: terms["plate_to_step"].get(plate, {}) for plate in terms["plate_vars"]})
     return terms
 
 
+@copy_docs_from(_OrigTraceEnum_ELBO)
+class TraceMarkovEnum_ELBO(ELBO):
+
+    def differentiable_loss(self, model, guide, *args, **kwargs):
+
+        # get batched, enumerated, to_funsor-ed traces from the guide and model
+        with plate(size=self.num_particles) if self.num_particles > 1 else contextlib.ExitStack(), \
+                enum(first_available_dim=(-self.max_plate_nesting-1) if self.max_plate_nesting else None):
+            guide_tr = trace(guide).get_trace(*args, **kwargs)
+            model_tr = trace(replay(model, trace=guide_tr)).get_trace(*args, **kwargs)
+
+        # extract from traces all metadata that we will need to compute the elbo
+        guide_terms = terms_from_trace(guide_tr)
+        model_terms = terms_from_trace(model_tr)
+
+        # guide side enumeration is not supported
+        if any(guide_terms["plate_to_step"].values()):
+            raise NotImplementedError("TraceMarkovEnum_ELBO does not yet support guide side Markov enumeration")
+
+        # build up a lazy expression for the elbo
+        with funsor.interpreter.interpretation(funsor.terms.lazy):
+            # identify and contract out auxiliary variables in the model with partial_sum_product
+            contracted_factors, uncontracted_factors = [], []
+            for f in model_terms["log_factors"]:
+                if model_terms["measure_vars"].intersection(f.inputs):
+                    contracted_factors.append(f)
+                else:
+                    uncontracted_factors.append(f)
+            # incorporate the effects of subsampling and handlers.scale through a common scale factor
+            markov_dims = frozenset({
+                    plate for plate, step in model_terms["plate_to_step"].items() if step})
+            contracted_costs = [model_terms["scale"] * f for f in funsor.sum_product.modified_partial_sum_product(
+                funsor.ops.logaddexp, funsor.ops.add,
+                model_terms["log_measures"] + contracted_factors,
+                plate_to_step=model_terms["plate_to_step"],
+                eliminate=model_terms["measure_vars"] | markov_dims
+            )]
+
+            costs = contracted_costs + uncontracted_factors  # model costs: logp
+            costs += [-f for f in guide_terms["log_factors"]]  # guide costs: -logq
+
+            # finally, integrate out guide variables in the elbo and all plates
+            plate_vars = guide_terms["plate_vars"] | model_terms["plate_vars"]
+            elbo = to_funsor(0, output=funsor.Real)
+            for cost in costs:
+                # compute the marginal logq in the guide corresponding to this cost term
+                log_prob = funsor.sum_product.sum_product(
+                    funsor.ops.logaddexp, funsor.ops.add,
+                    guide_terms["log_measures"],
+                    plates=plate_vars,
+                    eliminate=(plate_vars | guide_terms["measure_vars"]) - frozenset(cost.inputs)
+                )
+                # compute the expected cost term E_q[logp] or E_q[-logq] using the marginal logq for q
+                elbo_term = funsor.Integrate(log_prob, cost, guide_terms["measure_vars"] & frozenset(cost.inputs))
+                elbo += elbo_term.reduce(funsor.ops.add, plate_vars & frozenset(cost.inputs))
+
+        # evaluate the elbo, using memoize to share tensor computation where possible
+        with funsor.memoize.memoize():
+            return -to_data(funsor.optimizer.apply_optimizer(elbo))
+
+
 @copy_docs_from(_OrigTraceEnum_ELBO)
 class TraceEnum_ELBO(ELBO):
 

diff --git a/tests/contrib/funsor/test_vectorized_markov.py b/tests/contrib/funsor/test_vectorized_markov.py
@@ -11,10 +11,11 @@
 # put all funsor-related imports here, so test collection works without funsor
 try:
     import funsor
+    from funsor.testing import assert_close
     import pyro.contrib.funsor
     from pyroapi import distributions as dist
     funsor.set_backend("torch")
-    from pyroapi import handlers, pyro, pyro_backend
+    from pyroapi import handlers, pyro, pyro_backend, infer
 except ImportError:
     pytestmark = pytest.mark.skip(reason="funsor is not installed")
 
@@ -280,25 +281,24 @@ def model_7(data, history, vectorized):
     (model_7, torch.ones((5, 4), dtype=torch.long), "wxy", 1),
     (model_7, torch.ones((50, 4), dtype=torch.long), "wxy", 1),
 ])
-def test_vectorized_markov(model, data, var, history, use_replay):
-
-    with pyro_backend("contrib.funsor"), \
-            handlers.enum():
-        # sequential trace
-        trace = handlers.trace(model).get_trace(data, history, False)
+def test_enumeration(model, data, var, history, use_replay):
+
+    with pyro_backend("contrib.funsor"):
+        with handlers.enum():
+            # sequential trace
+            trace = handlers.trace(model).get_trace(data, history, False)
+            # vectorized trace
+            vectorized_trace = handlers.trace(model).get_trace(data, history, True)
+            if use_replay:
+                vectorized_trace = handlers.trace(
+                        handlers.replay(model, trace=vectorized_trace)).get_trace(data, history, True)
 
         # sequential factors
         factors = list()
         for i in range(data.shape[-2]):
             for v in var:
                 factors.append(trace.nodes["{}_{}".format(v, i)]["funsor"]["log_prob"])
 
-        # vectorized trace
-        vectorized_trace = handlers.trace(model).get_trace(data, history, True)
-        if use_replay:
-            vectorized_trace = handlers.trace(
-                    handlers.replay(model, trace=vectorized_trace)).get_trace(data, history, True)
-
         # vectorized factors
         vectorized_factors = list()
         for i in range(history):
@@ -315,7 +315,7 @@ def test_vectorized_markov(model, data, var, history, use_replay):
 
         # assert correct factors
         for f1, f2 in zip(factors, vectorized_factors):
-            funsor.testing.assert_close(f2, f1.align(tuple(f2.inputs)))
+            assert_close(f2, f1.align(tuple(f2.inputs)))
 
         # assert correct step
         actual_step = vectorized_trace.nodes["time"]["value"]
@@ -382,12 +382,18 @@ def model_8(weeks_data, days_data, history, vectorized):
     (model_8, torch.ones(3), torch.zeros(9), "xy", "wz", 1),
     (model_8, torch.ones(30), torch.zeros(50), "xy", "wz", 1),
 ])
-def test_vectorized_markov_multi(model, weeks_data, days_data, vars1, vars2, history, use_replay):
+def test_enumeration_multi(model, weeks_data, days_data, vars1, vars2, history, use_replay):
 
-    with pyro_backend("contrib.funsor"), \
-            handlers.enum():
-        # sequential factors
-        trace = handlers.trace(model).get_trace(weeks_data, days_data, history, False)
+    with pyro_backend("contrib.funsor"):
+        with handlers.enum():
+            # sequential factors
+            trace = handlers.trace(model).get_trace(weeks_data, days_data, history, False)
+
+            # vectorized trace
+            vectorized_trace = handlers.trace(model).get_trace(weeks_data, days_data, history, True)
+            if use_replay:
+                vectorized_trace = handlers.trace(
+                    handlers.replay(model, trace=vectorized_trace)).get_trace(weeks_data, days_data, history, True)
 
         factors = list()
         # sequential weeks factors
@@ -399,12 +405,6 @@ def test_vectorized_markov_multi(model, weeks_data, days_data, vars1, vars2, his
             for v in vars2:
                 factors.append(trace.nodes["{}_{}".format(v, j)]["funsor"]["log_prob"])
 
-        # vectorized trace
-        vectorized_trace = handlers.trace(model).get_trace(weeks_data, days_data, history, True)
-        if use_replay:
-            vectorized_trace = handlers.trace(
-                    handlers.replay(model, trace=vectorized_trace)).get_trace(weeks_data, days_data, history, True)
-
         vectorized_factors = list()
         # vectorized weeks factors
         for i in range(history):
@@ -435,7 +435,7 @@ def test_vectorized_markov_multi(model, weeks_data, days_data, vars1, vars2, his
 
         # assert correct factors
         for f1, f2 in zip(factors, vectorized_factors):
-            funsor.testing.assert_close(f2, f1.align(tuple(f2.inputs)))
+            assert_close(f2, f1.align(tuple(f2.inputs)))
 
         # assert correct step
 
@@ -457,3 +457,122 @@ def test_vectorized_markov_multi(model, weeks_data, days_data, vars1, vars2, his
 
         assert actual_weeks_step == expected_weeks_step
         assert actual_days_step == expected_days_step
+
+
+def guide_empty(data, history, vectorized):
+    pass
+
+
+@pytest.mark.parametrize("model,guide,data,history", [
+    (model_0, guide_empty, torch.rand(3, 5, 4), 1),
+    (model_1, guide_empty, torch.rand(5, 4), 1),
+    (model_2, guide_empty, torch.ones((5, 4), dtype=torch.long), 1),
+    (model_3, guide_empty, torch.ones((5, 4), dtype=torch.long), 1),
+    (model_4, guide_empty, torch.ones((5, 4), dtype=torch.long), 1),
+    (model_5, guide_empty, torch.ones((5, 4), dtype=torch.long), 2),
+    (model_6, guide_empty, torch.rand(5, 4), 1),
+    (model_6, guide_empty, torch.rand(100, 4), 1),
+    (model_7, guide_empty, torch.ones((5, 4), dtype=torch.long), 1),
+    (model_7, guide_empty, torch.ones((50, 4), dtype=torch.long), 1),
+])
+def test_model_enumerated_elbo(model, guide, data, history):
+    pyro.clear_param_store()
+
+    with pyro_backend("contrib.funsor"):
+        if history > 1:
+            pytest.xfail(reason="TraceMarkovEnum_ELBO does not yet support history > 1")
+
+        elbo = infer.TraceEnum_ELBO(max_plate_nesting=4)
+        expected_loss = elbo.loss_and_grads(model, guide, data, history, False)
+        expected_grads = (value.grad for name, value in pyro.get_param_store().named_parameters())
+
+        vectorized_elbo = infer.TraceMarkovEnum_ELBO(max_plate_nesting=4)
+        actual_loss = vectorized_elbo.loss_and_grads(model, guide, data, history, True)
+        actual_grads = (value.grad for name, value in pyro.get_param_store().named_parameters())
+
+        assert_close(actual_loss, expected_loss)
+        for actual_grad, expected_grad in zip(actual_grads, expected_grads):
+            assert_close(actual_grad, expected_grad)
+
+
+def guide_empty_multi(weeks_data, days_data, history, vectorized):
+    pass
+
+
+@pytest.mark.parametrize("model,guide,weeks_data,days_data,history", [
+    (model_8, guide_empty_multi, torch.ones(3), torch.zeros(9), 1),
+    (model_8, guide_empty_multi, torch.ones(30), torch.zeros(50), 1),
+])
+def test_model_enumerated_elbo_multi(model, guide, weeks_data, days_data, history):
+    pyro.clear_param_store()
+
+    with pyro_backend("contrib.funsor"):
+
+        elbo = infer.TraceEnum_ELBO(max_plate_nesting=4)
+        expected_loss = elbo.loss_and_grads(model, guide, weeks_data, days_data, history, False)
+        expected_grads = (value.grad for name, value in pyro.get_param_store().named_parameters())
+
+        vectorized_elbo = infer.TraceMarkovEnum_ELBO(max_plate_nesting=4)
+        actual_loss = vectorized_elbo.loss_and_grads(model, guide, weeks_data, days_data, history, True)
+        actual_grads = (value.grad for name, value in pyro.get_param_store().named_parameters())
+
+        assert_close(actual_loss, expected_loss)
+        for actual_grad, expected_grad in zip(actual_grads, expected_grads):
+            assert_close(actual_grad, expected_grad)
+
+
+def model_10(data, vectorized):
+    init_probs = torch.tensor([0.5, 0.5])
+    transition_probs = pyro.param("transition_probs",
+                                  torch.tensor([[0.75, 0.25], [0.25, 0.75]]),
+                                  constraint=constraints.simplex)
+    emission_probs = pyro.param("emission_probs",
+                                torch.tensor([[0.75, 0.25], [0.25, 0.75]]),
+                                constraint=constraints.simplex)
+    x = None
+    markov_loop = \
+        pyro.vectorized_markov(name="time", size=len(data)) if vectorized \
+        else pyro.markov(range(len(data)))
+    for i in markov_loop:
+        probs = init_probs if x is None else transition_probs[x]
+        x = pyro.sample("x_{}".format(i), dist.Categorical(probs))
+        pyro.sample("y_{}".format(i), dist.Categorical(emission_probs[x]), obs=data[i])
+
+
+def guide_10(data, vectorized):
+    init_probs = torch.tensor([0.5, 0.5])
+    transition_probs = pyro.param("transition_probs",
+                                  torch.tensor([[0.75, 0.25], [0.25, 0.75]]),
+                                  constraint=constraints.simplex)
+    x = None
+    markov_loop = \
+        pyro.vectorized_markov(name="time", size=len(data)) if vectorized \
+        else pyro.markov(range(len(data)))
+    for i in markov_loop:
+        probs = init_probs if x is None else transition_probs[x]
+        x = pyro.sample("x_{}".format(i), dist.Categorical(probs),
+                        infer={"enumerate": "parallel"})
+
+
+@pytest.mark.parametrize("model,guide,data,", [
+    (model_10, guide_10, torch.ones(5)),
+])
+def test_guide_enumerated_elbo(model, guide, data):
+    pyro.clear_param_store()
+
+    with pyro_backend("contrib.funsor"):
+        with pytest.raises(
+                NotImplementedError,
+                match="TraceMarkovEnum_ELBO does not yet support guide side Markov enumeration"):
+
+            elbo = infer.TraceEnum_ELBO(max_plate_nesting=4)
+            expected_loss = elbo.loss_and_grads(model, guide, data, False)
+            expected_grads = (value.grad for name, value in pyro.get_param_store().named_parameters())
+
+            vectorized_elbo = infer.TraceMarkovEnum_ELBO(max_plate_nesting=4)
+            actual_loss = vectorized_elbo.loss_and_grads(model, guide, data, True)
+            actual_grads = (value.grad for name, value in pyro.get_param_store().named_parameters())
+
+            assert_close(actual_loss, expected_loss)
+            for actual_grad, expected_grad in zip(actual_grads, expected_grads):
+                assert_close(actual_grad, expected_grad)