feat(Probability): parallel composition of kernels (#19482)

RemyDegenne · RemyDegenne · commit fbe88317752b · 2024-12-11T17:32:05.000Z
Parallel composition of kernels: from `κ : Kernel α β` and `η : Kernel γ δ`, define a kernel `κ ∥ₖ η` from `α × γ` to `β × δ`: `(κ ∥ₖ η) (a, c) = (κ a).prod (η c)`.

From the TestingLowerBounds project.
Co-authored-by: Lorenzo Luccioli



Co-authored-by: Rémy Degenne &lt;remydegenne@gmail.com&gt;
diff --git a/Mathlib.lean b/Mathlib.lean
@@ -4179,6 +4179,7 @@ import Mathlib.Probability.Kernel.Basic
 import Mathlib.Probability.Kernel.Composition.Basic
 import Mathlib.Probability.Kernel.Composition.IntegralCompProd
 import Mathlib.Probability.Kernel.Composition.MeasureCompProd
+import Mathlib.Probability.Kernel.Composition.ParallelComp
 import Mathlib.Probability.Kernel.CondDistrib
 import Mathlib.Probability.Kernel.Condexp
 import Mathlib.Probability.Kernel.Defs
diff --git a/Mathlib/Probability/Kernel/Composition/Basic.lean b/Mathlib/Probability/Kernel/Composition/Basic.lean
@@ -726,6 +726,12 @@ instance IsMarkovKernel.comap (κ : Kernel α β) [IsMarkovKernel κ] (hg : Meas
     IsMarkovKernel (comap κ g hg) :=
   ⟨fun a => ⟨by rw [comap_apply' κ hg a Set.univ, measure_univ]⟩⟩
 
+instance IsZeroOrMarkovKernel.comap (κ : Kernel α β) [IsZeroOrMarkovKernel κ] (hg : Measurable g) :
+    IsZeroOrMarkovKernel (comap κ g hg) := by
+  rcases eq_zero_or_isMarkovKernel κ with rfl | h
+  · simp only [comap_zero]; infer_instance
+  · have := IsMarkovKernel.comap κ hg; infer_instance
+
 instance IsFiniteKernel.comap (κ : Kernel α β) [IsFiniteKernel κ] (hg : Measurable g) :
     IsFiniteKernel (comap κ g hg) := by
   refine ⟨⟨IsFiniteKernel.bound κ, IsFiniteKernel.bound_lt_top κ, fun a => ?_⟩⟩
@@ -802,6 +808,12 @@ instance IsMarkovKernel.prodMkLeft (κ : Kernel α β) [IsMarkovKernel κ] :
 instance IsMarkovKernel.prodMkRight (κ : Kernel α β) [IsMarkovKernel κ] :
     IsMarkovKernel (prodMkRight γ κ) := by rw [Kernel.prodMkRight]; infer_instance
 
+instance IsZeroOrMarkovKernel.prodMkLeft (κ : Kernel α β) [IsZeroOrMarkovKernel κ] :
+    IsZeroOrMarkovKernel (prodMkLeft γ κ) := by rw [Kernel.prodMkLeft]; infer_instance
+
+instance IsZeroOrMarkovKernel.prodMkRight (κ : Kernel α β) [IsZeroOrMarkovKernel κ] :
+    IsZeroOrMarkovKernel (prodMkRight γ κ) := by rw [Kernel.prodMkRight]; infer_instance
+
 instance IsFiniteKernel.prodMkLeft (κ : Kernel α β) [IsFiniteKernel κ] :
     IsFiniteKernel (prodMkLeft γ κ) := by rw [Kernel.prodMkLeft]; infer_instance
 
diff --git a/Mathlib/Probability/Kernel/Composition/ParallelComp.lean b/Mathlib/Probability/Kernel/Composition/ParallelComp.lean
@@ -0,0 +1,118 @@
+/-
+Copyright (c) 2024 Rémy Degenne. All rights reserved.
+Released under Apache 2.0 license as described in the file LICENSE.
+Authors: Rémy Degenne, Lorenzo Luccioli
+-/
+import Mathlib.Probability.Kernel.Composition.Basic
+
+/-!
+
+# Parallel composition of kernels
+
+Two kernels `κ : Kernel α β` and `η : Kernel γ δ` can be applied in parallel to give a kernel
+`κ ∥ₖ η` from `α × γ` to `β × δ`: `(κ ∥ₖ η) (a, c) = (κ a).prod (η c)`.
+
+## Main definitions
+
+* `parallelComp (κ : Kernel α β) (η : Kernel γ δ) : Kernel (α × γ) (β × δ)`: parallel composition
+  of two s-finite kernels. We define a notation `κ ∥ₖ η = parallelComp κ η`.
+  `∫⁻ bd, g bd ∂(κ ∥ₖ η) ac = ∫⁻ b, ∫⁻ d, g (b, d) ∂η ac.2 ∂κ ac.1`
+
+## Main statements
+
+* `parallelComp_comp_copy`: `(κ ∥ₖ η) ∘ₖ (copy α) = κ ×ₖ η`
+* `deterministic_comp_copy`: for a deterministic kernel, copying then applying the kernel to
+  the two copies is the same as first applying the kernel then copying. That is, if `κ` is
+  a deterministic kernel, `(κ ∥ₖ κ) ∘ₖ copy α = copy β ∘ₖ κ`.
+
+## Notations
+
+* `κ ∥ₖ η = ProbabilityTheory.Kernel.parallelComp κ η`
+
+## Implementation notes
+
+Our formalization of kernels is centered around the composition-product: the product and then the
+parallel composition are defined as special cases of the composition-product.
+We could have alternatively used the building blocks of kernels seen as a Markov category:
+composition, parallel composition (or tensor product) and the deterministic kernels `id`, `copy`,
+`swap` and `discard`. The product and composition-product could then be built from these.
+
+-/
+
+open MeasureTheory
+
+open scoped ENNReal
+
+namespace ProbabilityTheory.Kernel
+
+variable {α β γ δ : Type*} {mα : MeasurableSpace α} {mβ : MeasurableSpace β}
+  {mγ : MeasurableSpace γ} {mδ : MeasurableSpace δ}
+
+section ParallelComp
+
+/-- Parallel product of two kernels. -/
+noncomputable
+def parallelComp (κ : Kernel α β) (η : Kernel γ δ) : Kernel (α × γ) (β × δ) :=
+  (prodMkRight γ κ) ×ₖ (prodMkLeft α η)
+
+@[inherit_doc]
+scoped[ProbabilityTheory] infixl:100 " ∥ₖ " => ProbabilityTheory.Kernel.parallelComp
+
+lemma parallelComp_apply (κ : Kernel α β) [IsSFiniteKernel κ]
+    (η : Kernel γ δ) [IsSFiniteKernel η] (x : α × γ) :
+    (κ ∥ₖ η) x = (κ x.1).prod (η x.2) := by
+  rw [parallelComp, prod_apply, prodMkRight_apply, prodMkLeft_apply]
+
+lemma lintegral_parallelComp (κ : Kernel α β) [IsSFiniteKernel κ]
+    (η : Kernel γ δ) [IsSFiniteKernel η]
+    (ac : α × γ) {g : β × δ → ℝ≥0∞} (hg : Measurable g) :
+    ∫⁻ bd, g bd ∂(κ ∥ₖ η) ac = ∫⁻ b, ∫⁻ d, g (b, d) ∂η ac.2 ∂κ ac.1 := by
+  rw [parallelComp, lintegral_prod _ _ _ hg]
+  simp
+
+instance (κ : Kernel α β) (η : Kernel γ δ) : IsSFiniteKernel (κ ∥ₖ η) := by
+  rw [parallelComp]; infer_instance
+
+instance (κ : Kernel α β) [IsFiniteKernel κ] (η : Kernel γ δ) [IsFiniteKernel η] :
+    IsFiniteKernel (κ ∥ₖ η) := by
+  rw [parallelComp]; infer_instance
+
+instance (κ : Kernel α β) [IsMarkovKernel κ] (η : Kernel γ δ) [IsMarkovKernel η] :
+    IsMarkovKernel (κ ∥ₖ η) := by
+  rw [parallelComp]; infer_instance
+
+instance (κ : Kernel α β) [IsZeroOrMarkovKernel κ] (η : Kernel γ δ) [IsZeroOrMarkovKernel η] :
+    IsZeroOrMarkovKernel (κ ∥ₖ η) := by
+  rw [parallelComp]; infer_instance
+
+lemma parallelComp_comp_copy (κ : Kernel α β) [IsSFiniteKernel κ]
+    (η : Kernel α γ) [IsSFiniteKernel η] :
+    (κ ∥ₖ η) ∘ₖ (copy α) = κ ×ₖ η := by
+  ext a s hs
+  simp_rw [prod_apply, comp_apply, copy_apply, Measure.bind_apply hs (Kernel.measurable _)]
+  rw [lintegral_dirac']
+  swap; · exact Kernel.measurable_coe _ hs
+  rw [parallelComp_apply]
+
+lemma swap_parallelComp {κ : Kernel α β} [IsSFiniteKernel κ]
+    {η : Kernel γ δ} [IsSFiniteKernel η] :
+    (swap β δ) ∘ₖ (κ ∥ₖ η) = (η ∥ₖ κ) ∘ₖ (swap α γ) := by
+  rw [parallelComp, swap_prod, parallelComp]
+  ext ac s hs
+  rw [comp_apply, swap_apply, Measure.bind_apply hs (Kernel.measurable _),
+    lintegral_dirac' _ (Kernel.measurable_coe _ hs), prod_apply, prod_apply, prodMkLeft_apply,
+    prodMkLeft_apply, prodMkRight_apply, prodMkRight_apply]
+  rfl
+
+/-- For a deterministic kernel, copying then applying the kernel to the two copies is the same
+as first applying the kernel then copying. -/
+lemma deterministic_comp_copy {f : α → β} (hf : Measurable f) :
+    (Kernel.deterministic f hf ∥ₖ Kernel.deterministic f hf) ∘ₖ Kernel.copy α
+      = Kernel.copy β ∘ₖ Kernel.deterministic f hf := by
+  rw [Kernel.parallelComp_comp_copy, Kernel.deterministic_prod_deterministic,
+    Kernel.copy, Kernel.deterministic_comp_deterministic]
+  rfl
+
+end ParallelComp
+
+end ProbabilityTheory.Kernel