From a78fdbd4386229d40ccbd12f7f488fd56cf203ee Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 23 Jun 2020 09:29:01 -0700
Subject: [PATCH 01/66] add stencil DPC++ skeletons

---
 Cxx11/Makefile                  |   2 +-
 Cxx11/stencil-dpcpp.cc          | 229 ++++++++++++++++++++++++++++++++
 Cxx11/stencil-multigpu-dpcpp.cc | 229 ++++++++++++++++++++++++++++++++
 3 files changed, 459 insertions(+), 1 deletion(-)
 create mode 100644 Cxx11/stencil-dpcpp.cc
 create mode 100644 Cxx11/stencil-multigpu-dpcpp.cc
diff --git a/Cxx11/Makefile b/Cxx11/Makefile
index f0624da81..6c0e08e3e 100644
--- a/Cxx11/Makefile
+++ b/Cxx11/Makefile
@@ -97,7 +97,7 @@ sycl-usm: nstream-sycl-usm nstream-sycl-explicit-usm stencil-sycl-usm transpose-
 
 sycl-explicit: nstream-sycl-explicit transpose-sycl-explicit
 
-dpcpp: nstream-dpcpp nstream-multigpu-dpcpp transpose-dpcpp
+dpcpp: nstream-dpcpp nstream-multigpu-dpcpp stencil-dpcpp stencil-multigpu-dpcpp transpose-dpcpp
 
 tbb: p2p-innerloop-tbb p2p-tbb stencil-tbb transpose-tbb nstream-tbb \
      p2p-hyperplane-tbb p2p-tasks-tbb
diff --git a/Cxx11/stencil-dpcpp.cc b/Cxx11/stencil-dpcpp.cc
new file mode 100644
index 000000000..0dbb5764d
--- /dev/null
+++ b/Cxx11/stencil-dpcpp.cc
@@ -0,0 +1,229 @@
+
+///
+/// Copyright (c) 2013, Intel Corporation
+///
+/// Redistribution and use in source and binary forms, with or without
+/// modification, are permitted provided that the following conditions
+/// are met:
+///
+/// * Redistributions of source code must retain the above copyright
+///       notice, this list of conditions and the following disclaimer.
+/// * Redistributions in binary form must reproduce the above
+///       copyright notice, this list of conditions and the following
+///       disclaimer in the documentation and/or other materials provided
+///       with the distribution.
+/// * Neither the name of Intel Corporation nor the names of its
+///       contributors may be used to endorse or promote products
+///       derived from this software without specific prior written
+///       permission.
+///
+/// THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
+/// "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
+/// LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
+/// FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE
+/// COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
+/// INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+/// BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
+/// LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER
+/// CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
+/// LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN
+/// ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
+/// POSSIBILITY OF SUCH DAMAGE.
+
+//////////////////////////////////////////////////////////////////////
+///
+/// NAME:    Stencil
+///
+/// PURPOSE: This program tests the efficiency with which a space-invariant,
+///          linear, symmetric filter (stencil) can be applied to a square
+///          grid or image.
+///
+/// USAGE:   The program takes as input the linear
+///          dimension of the grid, and the number of iterations on the grid
+///
+///                <progname> <iterations> <grid size>
+///
+///          The output consists of diagnostics to make sure the
+///          algorithm worked, and of timing statistics.
+///
+/// FUNCTIONS CALLED:
+///
+///          Other than standard C functions, the following functions are used in
+///          this program:
+///          wtime()
+///
+/// HISTORY: - Written by Rob Van der Wijngaart, February 2009.
+///          - RvdW: Removed unrolling pragmas for clarity;
+///            added constant to array "in" at end of each iteration to force
+///            refreshing of neighbor data in parallel versions; August 2013
+///            C++11-ification by Jeff Hammond, May 2017.
+///
+//////////////////////////////////////////////////////////////////////
+
+#include "prk_util.h"
+#include "stencil_seq.hpp"
+
+void nothing(const int n, const int t, prk::vector<double> & in, prk::vector<double> & out)
+{
+    std::cout << "You are trying to use a stencil that does not exist.\n";
+    std::cout << "Please generate the new stencil using the code generator\n";
+    std::cout << "and add it to the case-switch in the driver." << std::endl;
+    // n will never be zero - this is to silence compiler warnings.
+    if (n==0 || t==0) std::cout << in.size() << out.size() << std::endl;
+    std::abort();
+}
+
+int main(int argc, char* argv[])
+{
+  std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
+  std::cout << "C++11 Stencil execution on 2D grid" << std::endl;
+
+  //////////////////////////////////////////////////////////////////////
+  // Process and test input parameters
+  //////////////////////////////////////////////////////////////////////
+
+  int iterations, n, radius, tile_size;
+  bool star = true;
+  try {
+      if (argc < 3) {
+        throw "Usage: <# iterations> <array dimension> [<tile_size> <star/grid> <radius>]";
+      }
+
+      // number of times to run the algorithm
+      iterations  = std::atoi(argv[1]);
+      if (iterations < 1) {
+        throw "ERROR: iterations must be >= 1";
+      }
+
+      // linear grid dimension
+      n  = std::atoi(argv[2]);
+      if (n < 1) {
+        throw "ERROR: grid dimension must be positive";
+      } else if (n > prk::get_max_matrix_size()) {
+        throw "ERROR: grid dimension too large - overflow risk";
+      }
+
+      // default tile size for tiling of local transpose
+      tile_size = 32;
+      if (argc > 3) {
+          tile_size = std::atoi(argv[3]);
+          if (tile_size <= 0) tile_size = n;
+          if (tile_size > n) tile_size = n;
+      }
+
+      // stencil pattern
+      if (argc > 4) {
+          auto stencil = std::string(argv[4]);
+          auto grid = std::string("grid");
+          star = (stencil == grid) ? false : true;
+      }
+
+      // stencil radius
+      radius = 2;
+      if (argc > 5) {
+          radius = std::atoi(argv[5]);
+      }
+
+      if ( (radius < 1) || (2*radius+1 > n) ) {
+        throw "ERROR: Stencil radius negative or too large";
+      }
+  }
+  catch (const char * e) {
+    std::cout << e << std::endl;
+    return 1;
+  }
+
+  std::cout << "Number of iterations = " << iterations << std::endl;
+  std::cout << "Grid size            = " << n << std::endl;
+  std::cout << "Tile size            = " << tile_size << std::endl;
+  std::cout << "Type of stencil      = " << (star ? "star" : "grid") << std::endl;
+  std::cout << "Radius of stencil    = " << radius << std::endl;
+
+  auto stencil = nothing;
+  if (star) {
+      switch (radius) {
+          case 1: stencil = star1; break;
+          case 2: stencil = star2; break;
+          case 3: stencil = star3; break;
+          case 4: stencil = star4; break;
+          case 5: stencil = star5; break;
+      }
+  } else {
+      switch (radius) {
+          case 1: stencil = grid1; break;
+          case 2: stencil = grid2; break;
+          case 3: stencil = grid3; break;
+          case 4: stencil = grid4; break;
+          case 5: stencil = grid5; break;
+      }
+  }
+
+  //////////////////////////////////////////////////////////////////////
+  // Allocate space and perform the computation
+  //////////////////////////////////////////////////////////////////////
+
+  auto stencil_time = 0.0;
+
+  prk::vector<double> in(n*n);
+  prk::vector<double> out(n*n);
+
+  {
+    for (int it=0; it<n; it+=tile_size) {
+      for (int jt=0; jt<n; jt+=tile_size) {
+        for (int i=it; i<std::min(n,it+tile_size); i++) {
+          PRAGMA_SIMD
+          for (int j=jt; j<std::min(n,jt+tile_size); j++) {
+            in[i*n+j] = static_cast<double>(i+j);
+            out[i*n+j] = 0.0;
+          }
+        }
+      }
+    }
+
+    for (int iter = 0; iter<=iterations; iter++) {
+
+      if (iter==1) stencil_time = prk::wtime();
+      // Apply the stencil operator
+      stencil(n, tile_size, in, out);
+      // Add constant to solution to force refresh of neighbor data, if any
+      std::transform(in.begin(), in.end(), in.begin(), [](double c) { return c+=1.0; });
+    }
+    stencil_time = prk::wtime() - stencil_time;
+  }
+
+  //////////////////////////////////////////////////////////////////////
+  // Analyze and output results.
+  //////////////////////////////////////////////////////////////////////
+
+  // interior of grid with respect to stencil
+  size_t active_points = static_cast<size_t>(n-2*radius)*static_cast<size_t>(n-2*radius);
+  double norm = 0.0;
+  for (int i=radius; i<n-radius; i++) {
+    for (int j=radius; j<n-radius; j++) {
+      norm += prk::abs(out[i*n+j]);
+    }
+  }
+  norm /= active_points;
+
+  // verify correctness
+  const double epsilon = 1.0e-8;
+  double reference_norm = 2.*(iterations+1.);
+  if (prk::abs(norm-reference_norm) > epsilon) {
+    std::cout << "ERROR: L1 norm = " << norm
+              << " Reference L1 norm = " << reference_norm << std::endl;
+    return 1;
+  } else {
+    std::cout << "Solution validates" << std::endl;
+#ifdef VERBOSE
+    std::cout << "L1 norm = " << norm
+              << " Reference L1 norm = " << reference_norm << std::endl;
+#endif
+    const int stencil_size = star ? 4*radius+1 : (2*radius+1)*(2*radius+1);
+    size_t flops = (2L*(size_t)stencil_size+1L) * active_points;
+    auto avgtime = stencil_time/iterations;
+    std::cout << "Rate (MFlops/s): " << 1.0e-6 * static_cast<double>(flops)/avgtime
+              << " Avg time (s): " << avgtime << std::endl;
+  }
+
+  return 0;
+}
diff --git a/Cxx11/stencil-multigpu-dpcpp.cc b/Cxx11/stencil-multigpu-dpcpp.cc
new file mode 100644
index 000000000..0dbb5764d
--- /dev/null
+++ b/Cxx11/stencil-multigpu-dpcpp.cc
@@ -0,0 +1,229 @@
+
+///
+/// Copyright (c) 2013, Intel Corporation
+///
+/// Redistribution and use in source and binary forms, with or without
+/// modification, are permitted provided that the following conditions
+/// are met:
+///
+/// * Redistributions of source code must retain the above copyright
+///       notice, this list of conditions and the following disclaimer.
+/// * Redistributions in binary form must reproduce the above
+///       copyright notice, this list of conditions and the following
+///       disclaimer in the documentation and/or other materials provided
+///       with the distribution.
+/// * Neither the name of Intel Corporation nor the names of its
+///       contributors may be used to endorse or promote products
+///       derived from this software without specific prior written
+///       permission.
+///
+/// THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
+/// "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
+/// LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
+/// FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE
+/// COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
+/// INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+/// BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
+/// LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER
+/// CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
+/// LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN
+/// ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
+/// POSSIBILITY OF SUCH DAMAGE.
+
+//////////////////////////////////////////////////////////////////////
+///
+/// NAME:    Stencil
+///
+/// PURPOSE: This program tests the efficiency with which a space-invariant,
+///          linear, symmetric filter (stencil) can be applied to a square
+///          grid or image.
+///
+/// USAGE:   The program takes as input the linear
+///          dimension of the grid, and the number of iterations on the grid
+///
+///                <progname> <iterations> <grid size>
+///
+///          The output consists of diagnostics to make sure the
+///          algorithm worked, and of timing statistics.
+///
+/// FUNCTIONS CALLED:
+///
+///          Other than standard C functions, the following functions are used in
+///          this program:
+///          wtime()
+///
+/// HISTORY: - Written by Rob Van der Wijngaart, February 2009.
+///          - RvdW: Removed unrolling pragmas for clarity;
+///            added constant to array "in" at end of each iteration to force
+///            refreshing of neighbor data in parallel versions; August 2013
+///            C++11-ification by Jeff Hammond, May 2017.
+///
+//////////////////////////////////////////////////////////////////////
+
+#include "prk_util.h"
+#include "stencil_seq.hpp"
+
+void nothing(const int n, const int t, prk::vector<double> & in, prk::vector<double> & out)
+{
+    std::cout << "You are trying to use a stencil that does not exist.\n";
+    std::cout << "Please generate the new stencil using the code generator\n";
+    std::cout << "and add it to the case-switch in the driver." << std::endl;
+    // n will never be zero - this is to silence compiler warnings.
+    if (n==0 || t==0) std::cout << in.size() << out.size() << std::endl;
+    std::abort();
+}
+
+int main(int argc, char* argv[])
+{
+  std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
+  std::cout << "C++11 Stencil execution on 2D grid" << std::endl;
+
+  //////////////////////////////////////////////////////////////////////
+  // Process and test input parameters
+  //////////////////////////////////////////////////////////////////////
+
+  int iterations, n, radius, tile_size;
+  bool star = true;
+  try {
+      if (argc < 3) {
+        throw "Usage: <# iterations> <array dimension> [<tile_size> <star/grid> <radius>]";
+      }
+
+      // number of times to run the algorithm
+      iterations  = std::atoi(argv[1]);
+      if (iterations < 1) {
+        throw "ERROR: iterations must be >= 1";
+      }
+
+      // linear grid dimension
+      n  = std::atoi(argv[2]);
+      if (n < 1) {
+        throw "ERROR: grid dimension must be positive";
+      } else if (n > prk::get_max_matrix_size()) {
+        throw "ERROR: grid dimension too large - overflow risk";
+      }
+
+      // default tile size for tiling of local transpose
+      tile_size = 32;
+      if (argc > 3) {
+          tile_size = std::atoi(argv[3]);
+          if (tile_size <= 0) tile_size = n;
+          if (tile_size > n) tile_size = n;
+      }
+
+      // stencil pattern
+      if (argc > 4) {
+          auto stencil = std::string(argv[4]);
+          auto grid = std::string("grid");
+          star = (stencil == grid) ? false : true;
+      }
+
+      // stencil radius
+      radius = 2;
+      if (argc > 5) {
+          radius = std::atoi(argv[5]);
+      }
+
+      if ( (radius < 1) || (2*radius+1 > n) ) {
+        throw "ERROR: Stencil radius negative or too large";
+      }
+  }
+  catch (const char * e) {
+    std::cout << e << std::endl;
+    return 1;
+  }
+
+  std::cout << "Number of iterations = " << iterations << std::endl;
+  std::cout << "Grid size            = " << n << std::endl;
+  std::cout << "Tile size            = " << tile_size << std::endl;
+  std::cout << "Type of stencil      = " << (star ? "star" : "grid") << std::endl;
+  std::cout << "Radius of stencil    = " << radius << std::endl;
+
+  auto stencil = nothing;
+  if (star) {
+      switch (radius) {
+          case 1: stencil = star1; break;
+          case 2: stencil = star2; break;
+          case 3: stencil = star3; break;
+          case 4: stencil = star4; break;
+          case 5: stencil = star5; break;
+      }
+  } else {
+      switch (radius) {
+          case 1: stencil = grid1; break;
+          case 2: stencil = grid2; break;
+          case 3: stencil = grid3; break;
+          case 4: stencil = grid4; break;
+          case 5: stencil = grid5; break;
+      }
+  }
+
+  //////////////////////////////////////////////////////////////////////
+  // Allocate space and perform the computation
+  //////////////////////////////////////////////////////////////////////
+
+  auto stencil_time = 0.0;
+
+  prk::vector<double> in(n*n);
+  prk::vector<double> out(n*n);
+
+  {
+    for (int it=0; it<n; it+=tile_size) {
+      for (int jt=0; jt<n; jt+=tile_size) {
+        for (int i=it; i<std::min(n,it+tile_size); i++) {
+          PRAGMA_SIMD
+          for (int j=jt; j<std::min(n,jt+tile_size); j++) {
+            in[i*n+j] = static_cast<double>(i+j);
+            out[i*n+j] = 0.0;
+          }
+        }
+      }
+    }
+
+    for (int iter = 0; iter<=iterations; iter++) {
+
+      if (iter==1) stencil_time = prk::wtime();
+      // Apply the stencil operator
+      stencil(n, tile_size, in, out);
+      // Add constant to solution to force refresh of neighbor data, if any
+      std::transform(in.begin(), in.end(), in.begin(), [](double c) { return c+=1.0; });
+    }
+    stencil_time = prk::wtime() - stencil_time;
+  }
+
+  //////////////////////////////////////////////////////////////////////
+  // Analyze and output results.
+  //////////////////////////////////////////////////////////////////////
+
+  // interior of grid with respect to stencil
+  size_t active_points = static_cast<size_t>(n-2*radius)*static_cast<size_t>(n-2*radius);
+  double norm = 0.0;
+  for (int i=radius; i<n-radius; i++) {
+    for (int j=radius; j<n-radius; j++) {
+      norm += prk::abs(out[i*n+j]);
+    }
+  }
+  norm /= active_points;
+
+  // verify correctness
+  const double epsilon = 1.0e-8;
+  double reference_norm = 2.*(iterations+1.);
+  if (prk::abs(norm-reference_norm) > epsilon) {
+    std::cout << "ERROR: L1 norm = " << norm
+              << " Reference L1 norm = " << reference_norm << std::endl;
+    return 1;
+  } else {
+    std::cout << "Solution validates" << std::endl;
+#ifdef VERBOSE
+    std::cout << "L1 norm = " << norm
+              << " Reference L1 norm = " << reference_norm << std::endl;
+#endif
+    const int stencil_size = star ? 4*radius+1 : (2*radius+1)*(2*radius+1);
+    size_t flops = (2L*(size_t)stencil_size+1L) * active_points;
+    auto avgtime = stencil_time/iterations;
+    std::cout << "Rate (MFlops/s): " << 1.0e-6 * static_cast<double>(flops)/avgtime
+              << " Avg time (s): " << avgtime << std::endl;
+  }
+
+  return 0;
+}

From 7af1bebf702a5d3b03c028c517353ac6db029fe4 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 23 Jun 2020 11:52:12 -0700
Subject: [PATCH 02/66] cleanup comments

---
 Cxx11/stencil-sycl.cc | 7 +------
 1 file changed, 1 insertion(+), 6 deletions(-)

diff --git a/Cxx11/stencil-sycl.cc b/Cxx11/stencil-sycl.cc
index a375e1f05..9795cc638 100644
--- a/Cxx11/stencil-sycl.cc
+++ b/Cxx11/stencil-sycl.cc
@@ -46,12 +46,6 @@
 ///          The output consists of diagnostics to make sure the
 ///          algorithm worked, and of timing statistics.
 ///
-/// FUNCTIONS CALLED:
-///
-///          Other than standard C functions, the following functions are used in
-///          this program:
-///          wtime()
-///
 /// HISTORY: - Written by Rob Van der Wijngaart, February 2009.
 ///          - RvdW: Removed unrolling pragmas for clarity;
 ///            added constant to array "in" at end of each iteration to force
@@ -298,6 +292,7 @@ int main(int argc, char * argv[])
 
   std::cout << "Number of iterations = " << iterations << std::endl;
   std::cout << "Grid size            = " << n << std::endl;
+  std::cout << "Tile size            = " << tile_size << std::endl;
   std::cout << "Type of stencil      = " << (star ? "star" : "grid") << std::endl;
   std::cout << "Radius of stencil    = " << radius << std::endl;
 

From 684ac413e047f55335ced69c0f2376b4ae794cb8 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 23 Jun 2020 11:53:56 -0700
Subject: [PATCH 03/66] some fixes - GPU broken

---
 Cxx11/stencil-sycl-usm.cc | 20 +++++++++-----------
 1 file changed, 9 insertions(+), 11 deletions(-)

diff --git a/Cxx11/stencil-sycl-usm.cc b/Cxx11/stencil-sycl-usm.cc
index 7224991f0..ba56f9ffe 100644
--- a/Cxx11/stencil-sycl-usm.cc
+++ b/Cxx11/stencil-sycl-usm.cc
@@ -105,25 +105,21 @@ void run(sycl::queue & q, int iterations, size_t n, size_t tile_size, bool star,
   // Allocate space and perform the computation
   //////////////////////////////////////////////////////////////////////
 
-  auto ctx = q.get_context();
-
   double stencil_time(0);
 
   T * out;
 
   try {
 
-    auto dev = q.get_device();
-
-    T * in  = static_cast<T*>(syclx::malloc_shared(n * n * sizeof(T), dev, ctx));
-    out = static_cast<T*>(syclx::malloc_shared(n * n * sizeof(T), dev, ctx));
+    T * in  = static_cast<T*>(syclx::malloc_shared(n * n * sizeof(T), q));
+    out = static_cast<T*>(syclx::malloc_shared(n * n * sizeof(T), q));
 
     q.submit([&](sycl::handler& h) {
-
       h.parallel_for<class init<T>>(sycl::range<2> {n, n}, [=] (sycl::id<2> it) {
           const auto i = it[0];
           const auto j = it[1];
-          in[i*n+j] = static_cast<T>(i+j);
+          in[i*n+j]  = static_cast<T>(i+j);
+          out[i*n+j] = static_cast<T>(0);
       });
     });
     q.wait();
@@ -133,9 +129,9 @@ void run(sycl::queue & q, int iterations, size_t n, size_t tile_size, bool star,
       if (iter==1) stencil_time = prk::wtime();
 
       stencil(q, n, in, out);
+      q.wait();
 
       q.submit([&](sycl::handler& h) {
-        // Add constant to solution to force refresh of neighbor data, if any
         h.parallel_for<class add<T>>(sycl::range<2> {n, n}, sycl::id<2> {0, 0}, [=] (sycl::id<2> it) {
             const auto i = it[0];
             const auto j = it[1];
@@ -146,7 +142,7 @@ void run(sycl::queue & q, int iterations, size_t n, size_t tile_size, bool star,
     }
     stencil_time = prk::wtime() - stencil_time;
 
-    syclx::free(in, ctx);
+    syclx::free(in, q);
   }
   catch (sycl::exception & e) {
     std::cout << e.what() << std::endl;
@@ -178,7 +174,7 @@ void run(sycl::queue & q, int iterations, size_t n, size_t tile_size, bool star,
   }
   norm /= active_points;
 
-  syclx::free(out, ctx);
+  syclx::free(out, q);
 
   // verify correctness
   const double epsilon = 1.0e-8;
@@ -186,6 +182,7 @@ void run(sycl::queue & q, int iterations, size_t n, size_t tile_size, bool star,
   if (prk::abs(norm-reference_norm) > epsilon) {
     std::cout << "ERROR: L1 norm = " << norm
               << " Reference L1 norm = " << reference_norm << std::endl;
+    std::cout << "===================================" << std::endl;
   } else {
     std::cout << "Solution validates" << std::endl;
 #ifdef VERBOSE
@@ -265,6 +262,7 @@ int main(int argc, char * argv[])
 
   std::cout << "Number of iterations = " << iterations << std::endl;
   std::cout << "Grid size            = " << n << std::endl;
+  std::cout << "Tile size            = " << tile_size << std::endl;
   std::cout << "Type of stencil      = " << (star ? "star" : "grid") << std::endl;
   std::cout << "Radius of stencil    = " << radius << std::endl;
 

From d3717be7b60cdcb9e96cb452fedd449eb9c3bcec Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 23 Jun 2020 11:54:22 -0700
Subject: [PATCH 04/66] cleanup

---
 Cxx11/nstream-dpcpp.cc | 11 +++++------
 1 file changed, 5 insertions(+), 6 deletions(-)

diff --git a/Cxx11/nstream-dpcpp.cc b/Cxx11/nstream-dpcpp.cc
index addcbf6f1..e72a14cd5 100644
--- a/Cxx11/nstream-dpcpp.cc
+++ b/Cxx11/nstream-dpcpp.cc
@@ -122,9 +122,10 @@ int main(int argc, char * argv[])
   double * d_A = syclx::malloc_device<double>(length, q);
   double * d_B = syclx::malloc_device<double>(length, q);
   double * d_C = syclx::malloc_device<double>(length, q);
-  q.memcpy(d_A, &(h_A[0]), bytes).wait();
-  q.memcpy(d_B, &(h_B[0]), bytes).wait();
-  q.memcpy(d_C, &(h_C[0]), bytes).wait();
+  q.memcpy(d_A, &(h_A[0]), bytes);
+  q.memcpy(d_B, &(h_B[0]), bytes);
+  q.memcpy(d_C, &(h_C[0]), bytes);
+  q.wait();
 
   double scalar(3);
   {
@@ -133,9 +134,7 @@ int main(int argc, char * argv[])
       if (iter==1) nstream_time = prk::wtime();
 
       q.submit([&](sycl::handler& h) {
-
-        h.parallel_for( sycl::range<1>{length}, [=] (sycl::id<1> it) {
-            const size_t i = it[0];
+        h.parallel_for( sycl::range<1>{length}, [=] (sycl::id<1> i) {
             d_A[i] += d_B[i] + scalar * d_C[i];
         });
       });

From add9e23d2ea0cff9cd7c3098c7c66e987e1729dd Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 23 Jun 2020 11:54:44 -0700
Subject: [PATCH 05/66] workaround Level Zero SPIR detection

---
 Cxx11/prk_sycl.h | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index 6d2b417f8..2335c1c07 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -59,8 +59,8 @@ namespace prk {
 #if ! ( defined(TRISYCL) || defined(__HIPSYCL__) )
             auto device      = q.get_device();
             auto platform    = device.get_platform();
-            std::cout << "SYCL Device:   " << device.get_info<sycl::info::device::name>() << std::endl;
             std::cout << "SYCL Platform: " << platform.get_info<sycl::info::platform::name>() << std::endl;
+            std::cout << "SYCL Device:   " << device.get_info<sycl::info::device::name>() << std::endl;
 #endif
         }
 

From 691938cce9318bac0371dbc70dfb0beb02e4a5a6 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 23 Jun 2020 11:55:03 -0700
Subject: [PATCH 06/66] some fixes - GPU broken

---
 Cxx11/stencil-dpcpp.cc | 121 +++++++++++++++++++++++++----------------
 1 file changed, 74 insertions(+), 47 deletions(-)

diff --git a/Cxx11/stencil-dpcpp.cc b/Cxx11/stencil-dpcpp.cc
index 0dbb5764d..421823e9e 100644
--- a/Cxx11/stencil-dpcpp.cc
+++ b/Cxx11/stencil-dpcpp.cc
@@ -1,6 +1,6 @@
 
 ///
-/// Copyright (c) 2013, Intel Corporation
+/// Copyright (c) 2020, Intel Corporation
 ///
 /// Redistribution and use in source and binary forms, with or without
 /// modification, are permitted provided that the following conditions
@@ -46,12 +46,6 @@
 ///          The output consists of diagnostics to make sure the
 ///          algorithm worked, and of timing statistics.
 ///
-/// FUNCTIONS CALLED:
-///
-///          Other than standard C functions, the following functions are used in
-///          this program:
-///          wtime()
-///
 /// HISTORY: - Written by Rob Van der Wijngaart, February 2009.
 ///          - RvdW: Removed unrolling pragmas for clarity;
 ///            added constant to array "in" at end of each iteration to force
@@ -60,30 +54,32 @@
 ///
 //////////////////////////////////////////////////////////////////////
 
+#include "prk_sycl.h"
 #include "prk_util.h"
-#include "stencil_seq.hpp"
+#include "stencil_sycl.hpp"
 
-void nothing(const int n, const int t, prk::vector<double> & in, prk::vector<double> & out)
+template <typename T>
+void nothing(sycl::queue & q, const size_t n, const T * in, T * out)
 {
     std::cout << "You are trying to use a stencil that does not exist.\n";
     std::cout << "Please generate the new stencil using the code generator\n";
     std::cout << "and add it to the case-switch in the driver." << std::endl;
-    // n will never be zero - this is to silence compiler warnings.
-    if (n==0 || t==0) std::cout << in.size() << out.size() << std::endl;
-    std::abort();
+    prk::Abort();
 }
 
 int main(int argc, char* argv[])
 {
   std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
-  std::cout << "C++11 Stencil execution on 2D grid" << std::endl;
+  std::cout << "C++11/DPC++ Stencil execution on 2D grid" << std::endl;
 
   //////////////////////////////////////////////////////////////////////
   // Process and test input parameters
   //////////////////////////////////////////////////////////////////////
 
-  int iterations, n, radius, tile_size;
+  int iterations;
+  size_t n, tile_size;
   bool star = true;
+  size_t radius = 2;
   try {
       if (argc < 3) {
         throw "Usage: <# iterations> <array dimension> [<tile_size> <star/grid> <radius>]";
@@ -139,16 +135,18 @@ int main(int argc, char* argv[])
   std::cout << "Type of stencil      = " << (star ? "star" : "grid") << std::endl;
   std::cout << "Radius of stencil    = " << radius << std::endl;
 
-  auto stencil = nothing;
+  auto stencil = nothing<double>;
   if (star) {
       switch (radius) {
-          case 1: stencil = star1; break;
-          case 2: stencil = star2; break;
-          case 3: stencil = star3; break;
-          case 4: stencil = star4; break;
-          case 5: stencil = star5; break;
+          case 1: stencil = star1<double>; break;
+          case 2: stencil = star2<double>; break;
+          case 3: stencil = star3<double>; break;
+          case 4: stencil = star4<double>; break;
+          case 5: stencil = star5<double>; break;
       }
-  } else {
+  }
+#if 0
+  else {
       switch (radius) {
           case 1: stencil = grid1; break;
           case 2: stencil = grid2; break;
@@ -157,39 +155,63 @@ int main(int argc, char* argv[])
           case 5: stencil = grid5; break;
       }
   }
+#endif
+
+  sycl::queue q(sycl::default_selector{});
+  prk::SYCL::print_device_platform(q);
 
   //////////////////////////////////////////////////////////////////////
   // Allocate space and perform the computation
   //////////////////////////////////////////////////////////////////////
 
-  auto stencil_time = 0.0;
-
-  prk::vector<double> in(n*n);
-  prk::vector<double> out(n*n);
-
-  {
-    for (int it=0; it<n; it+=tile_size) {
-      for (int jt=0; jt<n; jt+=tile_size) {
-        for (int i=it; i<std::min(n,it+tile_size); i++) {
-          PRAGMA_SIMD
-          for (int j=jt; j<std::min(n,jt+tile_size); j++) {
-            in[i*n+j] = static_cast<double>(i+j);
-            out[i*n+j] = 0.0;
-          }
-        }
-      }
-    }
+  double stencil_time(0);
 
-    for (int iter = 0; iter<=iterations; iter++) {
+  prk::vector<double> h_in(n*n, 0);
+  prk::vector<double> h_out(n*n, 0);
 
-      if (iter==1) stencil_time = prk::wtime();
-      // Apply the stencil operator
-      stencil(n, tile_size, in, out);
-      // Add constant to solution to force refresh of neighbor data, if any
-      std::transform(in.begin(), in.end(), in.begin(), [](double c) { return c+=1.0; });
-    }
-    stencil_time = prk::wtime() - stencil_time;
+  const size_t bytes = n * n * sizeof(double);
+
+  double * d_in  = syclx::malloc_device<double>(n*n, q);
+  double * d_out = syclx::malloc_device<double>(n*n, q);
+  q.wait();
+
+  q.submit([&](sycl::handler& h) {
+    h.parallel_for(sycl::range<2> {n,n}, [=] (sycl::item<2> it) {
+      const auto i = it[0];
+      const auto j = it[1];
+      d_in[i*n+j]  = static_cast<double>(i+j);
+      d_out[i*n+j] = static_cast<double>(0);
+    });
+  });
+  q.wait();
+
+  for (int iter = 0; iter<=iterations; iter++) {
+
+    if (iter==1) stencil_time = prk::wtime();
+
+    // Apply the stencil operator
+    stencil(q, n, d_in, d_out);
+    q.wait();
+
+    // Add constant to solution to force refresh of neighbor data, if any
+    q.submit([&](sycl::handler& h) {
+      h.parallel_for(sycl::range<2> {n,n}, [=] (sycl::item<2> it) {
+        const auto i = it[0];
+        const auto j = it[1];
+        d_in[i*n+j] += static_cast<double>(1);
+      });
+    });
+    q.wait();
   }
+  stencil_time = prk::wtime() - stencil_time;
+
+  q.memcpy(&(h_in[0]),  d_in,  bytes);
+  q.memcpy(&(h_out[0]), d_out, bytes);
+  q.wait();
+
+  syclx::free(d_in, q);
+  syclx::free(d_out,q);
+  q.wait();
 
   //////////////////////////////////////////////////////////////////////
   // Analyze and output results.
@@ -200,7 +222,7 @@ int main(int argc, char* argv[])
   double norm = 0.0;
   for (int i=radius; i<n-radius; i++) {
     for (int j=radius; j<n-radius; j++) {
-      norm += prk::abs(out[i*n+j]);
+      norm += prk::abs(h_out[i*n+j]);
     }
   }
   norm /= active_points;
@@ -211,6 +233,11 @@ int main(int argc, char* argv[])
   if (prk::abs(norm-reference_norm) > epsilon) {
     std::cout << "ERROR: L1 norm = " << norm
               << " Reference L1 norm = " << reference_norm << std::endl;
+    for (int i=0; i<n; i++) {
+      for (int j=0; j<n; j++) {
+          std::cerr << i << "," << j  << " = " << h_in[i*n+j] <<", " << h_out[i*n+j] << "\n";
+      }
+    }
     return 1;
   } else {
     std::cout << "Solution validates" << std::endl;

From b31429beefc8d0284b196529a25579a2eafa9209 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Wed, 24 Jun 2020 08:00:56 -0700
Subject: [PATCH 07/66] undo minor mistake

---
 Cxx11/Makefile | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/Cxx11/Makefile b/Cxx11/Makefile
index 6c0e08e3e..e24b39163 100644
--- a/Cxx11/Makefile
+++ b/Cxx11/Makefile
@@ -128,7 +128,7 @@ cblas: transpose-cblas dgemm-cblas
 
 onemkl: nstream-onemkl dgemm-onemkl dgemm-multigpu-onemkl
 
-oneapi: onemkl dpcpp sycl sycl-usm sycl-explicit sycl-explicit-usm
+oneapi: onemkl dpcpp sycl sycl-usm sycl-explicit
 
 occa: transpose-occa nstream-occa
 

From 583795ddd67370124f7f2cc46b528628d66737da Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Wed, 24 Jun 2020 08:04:59 -0700
Subject: [PATCH 08/66] add transpose multi-GPU DPC++ skeleton

---
 Cxx11/Makefile                    |   2 +-
 Cxx11/transpose-multigpu-dpcpp.cc | 181 ++++++++++++++++++++++++++++++
 2 files changed, 182 insertions(+), 1 deletion(-)
 create mode 100644 Cxx11/transpose-multigpu-dpcpp.cc

diff --git a/Cxx11/Makefile b/Cxx11/Makefile
index e24b39163..a20cdfbb4 100644
--- a/Cxx11/Makefile
+++ b/Cxx11/Makefile
@@ -97,7 +97,7 @@ sycl-usm: nstream-sycl-usm nstream-sycl-explicit-usm stencil-sycl-usm transpose-
 
 sycl-explicit: nstream-sycl-explicit transpose-sycl-explicit
 
-dpcpp: nstream-dpcpp nstream-multigpu-dpcpp stencil-dpcpp stencil-multigpu-dpcpp transpose-dpcpp
+dpcpp: nstream-dpcpp nstream-multigpu-dpcpp stencil-dpcpp stencil-multigpu-dpcpp transpose-dpcpp transpose-multigpu-dpcpp
 
 tbb: p2p-innerloop-tbb p2p-tbb stencil-tbb transpose-tbb nstream-tbb \
      p2p-hyperplane-tbb p2p-tasks-tbb
diff --git a/Cxx11/transpose-multigpu-dpcpp.cc b/Cxx11/transpose-multigpu-dpcpp.cc
new file mode 100644
index 000000000..2dec847f9
--- /dev/null
+++ b/Cxx11/transpose-multigpu-dpcpp.cc
@@ -0,0 +1,181 @@
+///
+/// Copyright (c) 2020, Intel Corporation
+///
+/// Redistribution and use in source and binary forms, with or without
+/// modification, are permitted provided that the following conditions
+/// are met:
+///
+/// * Redistributions of source code must retain the above copyright
+///       notice, this list of conditions and the following disclaimer.
+/// * Redistributions in binary form must reproduce the above
+///       copyright notice, this list of conditions and the following
+///       disclaimer in the documentation and/or other materials provided
+///       with the distribution.
+/// * Neither the name of Intel Corporation nor the names of its
+///       contributors may be used to endorse or promote products
+///       derived from this software without specific prior written
+///       permission.
+///
+/// THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
+/// "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
+/// LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
+/// FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE
+/// COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
+/// INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+/// BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
+/// LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER
+/// CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
+/// LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN
+/// ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
+/// POSSIBILITY OF SUCH DAMAGE.
+
+//////////////////////////////////////////////////////////////////////
+///
+/// NAME:    transpose
+///
+/// PURPOSE: This program measures the time for the transpose of a
+///          column-major stored matrix into a row-major stored matrix.
+///
+/// USAGE:   Program input is the matrix order and the number of times to
+///          repeat the operation:
+///
+///          transpose <matrix_size> <# iterations>
+///
+///          The output consists of diagnostics to make sure the
+///          transpose worked and timing statistics.
+///
+/// HISTORY: Written by  Rob Van der Wijngaart, February 2009.
+///          Converted to C++11 by Jeff Hammond, February 2016 and May 2017.
+///
+//////////////////////////////////////////////////////////////////////
+
+#include "prk_util.h"
+#include "prk_sycl.h"
+
+int main(int argc, char * argv[])
+{
+  std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
+  std::cout << "C++11/DPCT Matrix transpose: B = A^T" << std::endl;
+
+  //////////////////////////////////////////////////////////////////////
+  /// Read and test input parameters
+  //////////////////////////////////////////////////////////////////////
+
+  int iterations;
+  size_t order;
+  try {
+      if (argc < 3) {
+        throw "Usage: <# iterations> <matrix order>";
+      }
+
+      iterations  = std::atoi(argv[1]);
+      if (iterations < 1) {
+        throw "ERROR: iterations must be >= 1";
+      }
+
+      order = std::atoi(argv[2]);
+      if (order <= 0) {
+        throw "ERROR: Matrix Order must be greater than 0";
+      } else if (order > prk::get_max_matrix_size()) {
+        throw "ERROR: matrix dimension too large - overflow risk";
+      }
+  }
+  catch (const char * e) {
+    std::cout << e << std::endl;
+    return 1;
+  }
+
+  std::cout << "Number of iterations  = " << iterations << std::endl;
+  std::cout << "Matrix order          = " << order << std::endl;
+
+  sycl::queue q(sycl::default_selector{});
+  prk::SYCL::print_device_platform(q);
+
+  //////////////////////////////////////////////////////////////////////
+  // Allocate space for the input and transpose matrix
+  //////////////////////////////////////////////////////////////////////
+
+  const size_t nelems = (size_t)order * (size_t)order;
+  const size_t bytes = nelems * sizeof(double);
+  double * h_a = syclx::malloc_host<double>( nelems, q);
+  double * h_b = syclx::malloc_host<double>( nelems, q);
+
+  // fill A with the sequence 0 to order^2-1
+  for (int j=0; j<order; j++) {
+    for (int i=0; i<order; i++) {
+      h_a[j*order+i] = static_cast<double>(order*j+i);
+      h_b[j*order+i] = static_cast<double>(0);
+    }
+  }
+
+  // copy input from host to device
+  double * A = syclx::malloc_device<double>( nelems, q);
+  double * B = syclx::malloc_device<double>( nelems, q);
+  q.memcpy(A, &(h_a[0]), bytes).wait();
+  q.memcpy(B, &(h_b[0]), bytes).wait();
+
+  auto trans_time = 0.0;
+
+  for (int iter = 0; iter<=iterations; iter++) {
+
+      if (iter==1) trans_time = prk::wtime();
+
+      q.submit([&](sycl::handler& h) {
+
+        h.parallel_for( sycl::range<2>{order,order}, [=] (sycl::id<2> it) {
+#if USE_2D_INDEXING
+          sycl::id<2> ij{it[0],it[1]};
+          sycl::id<2> ji{it[1],it[0]};
+          B[ij] += A[ji];
+          A[ji] += (T)1;
+#else
+          B[it[0] * order + it[1]] += A[it[1] * order + it[0]];
+          A[it[1] * order + it[0]] += 1.0;
+#endif
+        });
+      });
+      q.wait();
+  }
+  trans_time = prk::wtime() - trans_time;
+
+  // copy output back to host
+  q.memcpy(&(h_b[0]), B, bytes).wait();
+
+  syclx::free(B, q);
+  syclx::free(A, q);
+
+  //////////////////////////////////////////////////////////////////////
+  /// Analyze and output results
+  //////////////////////////////////////////////////////////////////////
+
+  const double addit = (iterations+1.) * (iterations/2.);
+  double abserr(0);
+  for (int j=0; j<order; j++) {
+    for (int i=0; i<order; i++) {
+      const size_t ij = (size_t)i*(size_t)order+(size_t)j;
+      const size_t ji = (size_t)j*(size_t)order+(size_t)i;
+      const double reference = static_cast<double>(ij)*(1.+iterations)+addit;
+      abserr += prk::abs(h_b[ji] - reference);
+    }
+  }
+
+  syclx::free(h_b, q);
+  syclx::free(h_a, q);
+
+  const auto epsilon = 1.0e-8;
+  if (abserr < epsilon) {
+    std::cout << "Solution validates" << std::endl;
+    auto avgtime = trans_time/iterations;
+    auto bytes = (size_t)order * (size_t)order * sizeof(double);
+    std::cout << "Rate (MB/s): " << 1.0e-6 * (2L*bytes)/avgtime
+              << " Avg time (s): " << avgtime << std::endl;
+  } else {
+    std::cout << "ERROR: Aggregate squared error " << abserr
+              << " exceeds threshold " << epsilon << std::endl;
+    return 1;
+  }
+
+  return 0;
+}
+
+

From 053cb6d621c4e85b666c71f3fe6b3b978652a745 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Mon, 29 Jun 2020 15:43:12 -0700
Subject: [PATCH 09/66] WIP

---
 Cxx11/transpose-multigpu-dpcpp.cc | 72 ++++++++++++++++++++++++-------
 1 file changed, 57 insertions(+), 15 deletions(-)

diff --git a/Cxx11/transpose-multigpu-dpcpp.cc b/Cxx11/transpose-multigpu-dpcpp.cc
index 2dec847f9..a26244496 100644
--- a/Cxx11/transpose-multigpu-dpcpp.cc
+++ b/Cxx11/transpose-multigpu-dpcpp.cc
@@ -63,9 +63,10 @@ int main(int argc, char * argv[])
 
   int iterations;
   size_t order;
+  int use_ngpu = 1;
   try {
       if (argc < 3) {
-        throw "Usage: <# iterations> <matrix order>";
+        throw "Usage: <# iterations> <matrix order> [<use_ngpu>]";
       }
 
       iterations  = std::atoi(argv[1]);
@@ -79,6 +80,15 @@ int main(int argc, char * argv[])
       } else if (order > prk::get_max_matrix_size()) {
         throw "ERROR: matrix dimension too large - overflow risk";
       }
+
+      if (argc > 3) {
+        use_ngpu = std::atoi(argv[3]);
+      }
+
+      if (order % use_ngpu) {
+        std::cerr << "order = " << order << ", device count = " << use_ngpu << std::endl;
+        throw "ERROR: matrix order should be divisible by device count!";
+      }
   }
   catch (const char * e) {
     std::cout << e << std::endl;
@@ -87,34 +97,66 @@ int main(int argc, char * argv[])
 
   std::cout << "Number of iterations  = " << iterations << std::endl;
   std::cout << "Matrix order          = " << order << std::endl;
+  std::cout << "Number of GPUs to use = " << use_ngpu << std::endl;
+
+  std::vector<sycl::queue> qs;
+
+  auto platforms = sycl::platform::get_platforms();
+  for (auto & p : platforms) {
+    auto pname = p.get_info<sycl::info::platform::name>();
+    std::cout << "*Platform: " << pname << std::endl;
+    if ( pname.find("Level-Zero") != std::string::npos) {
+        std::cout << "*Level Zero GPU skipped" << std::endl;
+        break;
+    }
+    if ( pname.find("Intel") == std::string::npos) {
+        std::cout << "*non-Intel skipped" << std::endl;
+        break;
+    }
+    auto devices = p.get_devices();
+    for (auto & d : devices ) {
+        std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
+        if ( d.is_gpu() || d.is_cpu() ) {
+            std::cout << "**Device is CPU or GPU - adding to vector of queues" << std::endl;
+            qs.push_back(sycl::queue(d));
+        }
+    }
+  }
+
+  int haz_ngpu = qs.size();
+  std::cout << "Number of CPUs and GPUs found  = " << haz_ngpu << std::endl;
 
-  sycl::queue q(sycl::default_selector{});
-  prk::SYCL::print_device_platform(q);
+  if (use_ngpu > haz_ngpu) {
+      std::cout << "You cannot use more GPUs (" << use_ngpu << ") than you have (" << haz_ngpu << ")" << std::endl;
+  }
+
+  int ngpus = use_ngpu;
 
   //////////////////////////////////////////////////////////////////////
   // Allocate space for the input and transpose matrix
   //////////////////////////////////////////////////////////////////////
 
-  const size_t nelems = (size_t)order * (size_t)order;
-  const size_t bytes = nelems * sizeof(double);
-  double * h_a = syclx::malloc_host<double>( nelems, q);
-  double * h_b = syclx::malloc_host<double>( nelems, q);
+  double trans_time(0);
+
+  auto h_a = prk::vector<double>(order * order);
+  auto h_b = prk::vector<double>(order * order);
 
   // fill A with the sequence 0 to order^2-1
-  for (int j=0; j<order; j++) {
-    for (int i=0; i<order; i++) {
+  for (size_t j=0; j<order; j++) {
+    for (size_t i=0; i<order; i++) {
       h_a[j*order+i] = static_cast<double>(order*j+i);
       h_b[j*order+i] = static_cast<double>(0);
     }
   }
 
-  // copy input from host to device
-  double * A = syclx::malloc_device<double>( nelems, q);
-  double * B = syclx::malloc_device<double>( nelems, q);
-  q.memcpy(A, &(h_a[0]), bytes).wait();
-  q.memcpy(B, &(h_b[0]), bytes).wait();
+  const size_t bytes = order * order * sizeof(double);
 
-  auto trans_time = 0.0;
+  // copy input from host to device
+  double * A = syclx::malloc_device<double>(order * order, q);
+  double * B = syclx::malloc_device<double>(order * order, q);
+  q.memcpy(A, &(h_a[0]), bytes);
+  q.memcpy(B, &(h_b[0]), bytes);
+  q.wait();
 
   for (int iter = 0; iter<=iterations; iter++) {
 

From 17ff29248fe028ce50e391aeb841084f79be131d Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Mon, 20 Jul 2020 14:31:26 -0700
Subject: [PATCH 10/66] add ignores

---
 .gitignore | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/.gitignore b/.gitignore
index d4e9d72bc..3c78c8721 100644
--- a/.gitignore
+++ b/.gitignore
@@ -166,6 +166,8 @@ Cxx11/dgemm-mpi
 Cxx11/dgemm-sycl
 Cxx11/dgemm-blas-sycl
 Cxx11/dgemm-mkl-sycl
+Cxx11/dgemm-multigpu-onemkl
+Cxx11/dgemm-onemkl
 Cxx11/dgemm-kokkos
 Cxx11/dgemm-kernels-kokkos
 Cxx11/dgemm-raja
@@ -217,6 +219,8 @@ Cxx11/nstream-sycl-usm
 Cxx11/nstream-sycl-explicit
 Cxx11/nstream-sycl-explicit-usm
 Cxx11/nstream-dpcpp
+Cxx11/nstream-multigpu-dpcpp
+Cxx11/nstream-onemkl
 Cxx11/nstream-celerity
 Cxx11/nstream-hpx
 Cxx11/nstream-upcxx

From 9a95639d98d9e1a2dddd850bdfc92cbc7346122f Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Mon, 20 Jul 2020 14:54:59 -0700
Subject: [PATCH 11/66] fix message

---
 Cxx11/transpose-multigpu-dpcpp.cc | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/Cxx11/transpose-multigpu-dpcpp.cc b/Cxx11/transpose-multigpu-dpcpp.cc
index a26244496..215ae23d1 100644
--- a/Cxx11/transpose-multigpu-dpcpp.cc
+++ b/Cxx11/transpose-multigpu-dpcpp.cc
@@ -127,7 +127,7 @@ int main(int argc, char * argv[])
   std::cout << "Number of CPUs and GPUs found  = " << haz_ngpu << std::endl;
 
   if (use_ngpu > haz_ngpu) {
-      std::cout << "You cannot use more GPUs (" << use_ngpu << ") than you have (" << haz_ngpu << ")" << std::endl;
+      std::cout << "You cannot use more CPUs and GPUs (" << use_ngpu << ") than you have (" << haz_ngpu << ")" << std::endl;
   }
 
   int ngpus = use_ngpu;

From 3113c031bde6eca7a78384e5bd1316c5a47cca83 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 12:43:44 -0700
Subject: [PATCH 12/66] add fill, cleanup dead code

---
 Cxx11/prk_util.h | 7 ++++---
 1 file changed, 4 insertions(+), 3 deletions(-)

diff --git a/Cxx11/prk_util.h b/Cxx11/prk_util.h
index 176c1186b..98ea627ef 100644
--- a/Cxx11/prk_util.h
+++ b/Cxx11/prk_util.h
@@ -203,20 +203,17 @@ namespace prk {
         public:
 
             vector(size_t n) {
-                //this->data_ = new T[n];
                 this->data_ = prk::malloc<T>(n);
                 this->size_ = n;
             }
 
             vector(size_t n, T v) {
-                //this->data_ = new T[n];
                 this->data_ = prk::malloc<T>(n);
                 for (size_t i=0; i<n; ++i) this->data_[i] = v;
                 this->size_ = n;
             }
 
             ~vector() {
-                //delete[] this->data_;
                 prk::free<T>(this->data_);
             }
 
@@ -258,6 +255,10 @@ namespace prk {
                 return &(this->data_[this->size_]);
             }
 
+            void fill(T v) {
+                for (size_t i=0; i<this->size_; ++i) this->data_[i] = v;
+            }
+
 #if 0
             T & begin() {
                 return this->data_[0];

From 3d33f2a820218776601a2e099fd7d2cd312f3a92 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 12:44:12 -0700
Subject: [PATCH 13/66] start decomposition

---
 Cxx11/transpose-multigpu-dpcpp.cc | 15 +++++++++++----
 1 file changed, 11 insertions(+), 4 deletions(-)

diff --git a/Cxx11/transpose-multigpu-dpcpp.cc b/Cxx11/transpose-multigpu-dpcpp.cc
index 215ae23d1..adf6c49b3 100644
--- a/Cxx11/transpose-multigpu-dpcpp.cc
+++ b/Cxx11/transpose-multigpu-dpcpp.cc
@@ -95,10 +95,6 @@ int main(int argc, char * argv[])
     return 1;
   }
 
-  std::cout << "Number of iterations  = " << iterations << std::endl;
-  std::cout << "Matrix order          = " << order << std::endl;
-  std::cout << "Number of GPUs to use = " << use_ngpu << std::endl;
-
   std::vector<sycl::queue> qs;
 
   auto platforms = sycl::platform::get_platforms();
@@ -132,6 +128,17 @@ int main(int argc, char * argv[])
 
   int ngpus = use_ngpu;
 
+  if (order % ngpus != 0) {
+      std::cout << "ERROR: matrix order " << order << " should be divisible by # procs" << ngpus << std::endl;
+      return 2;
+  }
+  size_t block_order = order / ngpus;
+
+  std::cout << "Number of GPUs to use = " << use_ngpu << std::endl;
+  std::cout << "Number of iterations  = " << iterations << std::endl;
+  std::cout << "Matrix order          = " << order << std::endl;
+  std::cout << "Block order           = " << block_order << std::endl;
+
   //////////////////////////////////////////////////////////////////////
   // Allocate space for the input and transpose matrix
   //////////////////////////////////////////////////////////////////////

From 74e286bae457bd1b7eb7e5ef68e1f0eab1d0e21d Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 12:44:52 -0700
Subject: [PATCH 14/66] device queues class and related methods

---
 Cxx11/prk_sycl.h | 150 +++++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 150 insertions(+)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index 2335c1c07..599d424c7 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -4,12 +4,17 @@
 #include <cstdlib>
 #include <iostream>
 
+//#include <iterator> // std::distance
+#include <boost/range/adaptor/indexed.hpp>
+
 #include "CL/sycl.hpp"
 
 #ifdef __COMPUTECPP__
 #include "SYCL/experimental/usm.h"
 #endif
 
+#include "prk_util.h" // prk::vector
+
 namespace sycl = cl::sycl;
 
 #ifdef __COMPUTECPP__
@@ -83,6 +88,151 @@ namespace prk {
 #endif
         }
 
+        class queues {
+
+            private:
+                std::vector<sycl::queue> list;
+
+            public:
+                queues(bool use_cpu = true, bool use_gpu = true)
+                {
+                    auto platforms = sycl::platform::get_platforms();
+                    for (auto & p : platforms) {
+                        auto pname = p.get_info<sycl::info::platform::name>();
+                        std::cout << "*Platform: " << pname << std::endl;
+                        if ( pname.find("Level-Zero") != std::string::npos) {
+                            std::cout << "*Level Zero GPU skipped" << std::endl;
+                            break;
+                        }
+                        if ( pname.find("Intel") == std::string::npos) {
+                            std::cout << "*non-Intel skipped" << std::endl;
+                            break;
+                        }
+                        auto devices = p.get_devices();
+                        for (auto & d : devices ) {
+                            std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
+                            if ( d.is_cpu() && use_cpu ) {
+                                std::cout << "**Device is CPU - adding to vector of queues" << std::endl;
+                                list.push_back(sycl::queue(d));
+                            }
+                            if ( d.is_gpu() && use_gpu ) {
+                                std::cout << "**Device is GPU - adding to vector of queues" << std::endl;
+                                list.push_back(sycl::queue(d));
+                            }
+                        }
+                    }
+                }
+
+                int size(void)
+                {
+                    return list.size();
+                }
+
+                void wait(int i)
+                {
+                    list[i].wait();
+                }
+
+                void waitall(void)
+                {
+                    for (auto & i : list) {
+                        i.wait();
+                    }
+                }
+
+                template <typename T>
+                void allocate(std::vector<T*> & device_pointers,
+                              size_t num_elements)
+                {
+                    std::cout << "allocate" << std::endl;
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        device_pointers[i] = syclx::malloc_device<T>(num_elements, v);
+                        std::cout << i << ": " << device_pointers[i] << ", " << num_elements << std::endl;
+                    }
+                }
+
+                template <typename T>
+                void free(std::vector<T*> & device_pointers)
+                {
+                    std::cout << "free" << std::endl;
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        syclx::free(device_pointers[i], v);
+                    }
+                }
+
+                template <typename T>
+                void gather(T * host_pointer,
+                            const std::vector<T*> & device_pointers,
+                            size_t num_elements)
+                {
+                    std::cout << "gather" << std::endl;
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto bytes = num_elements * sizeof(T);
+                        auto target = &host_pointer[i * bytes];
+                        auto source = device_pointers[i];
+                        v.memcpy(target, source, bytes);
+                    }
+                }
+
+                template <typename T>
+                void gather(prk::vector<T> & host_pointer,
+                            const std::vector<T*> & device_pointers,
+                            size_t num_elements)
+                {
+                    std::cout << "gather" << std::endl;
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto bytes = num_elements * sizeof(T);
+                        auto target = &host_pointer[i * bytes];
+                        auto source = device_pointers[i];
+                        v.memcpy(target, source, bytes);
+                    }
+                }
+
+                template <typename T>
+                void scatter(std::vector<T*> & device_pointers,
+                             const T * host_pointer,
+                             size_t num_elements)
+                {
+                    std::cout << "scatter" << std::endl;
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto bytes = num_elements * sizeof(T);
+                        auto target = device_pointers[i];
+                        auto source = &host_pointer[i * bytes];
+                        v.memcpy(target, source, bytes);
+                    }
+                }
+
+                template <typename T>
+                void scatter(std::vector<T*> & device_pointers,
+                             prk::vector<T>  & host_pointer,
+                             size_t num_elements)
+                {
+                    std::cout << "scatter" << std::endl;
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto bytes = num_elements * sizeof(T);
+                        auto target = device_pointers[i];
+                        auto source = &host_pointer[i * bytes];
+                        std::cout << i << ": " << target << ", " << source << std::endl;
+                        v.memcpy(target, source, bytes);
+                    }
+                }
+
+
+
+        };
+
     } // namespace SYCL
 
 } // namespace prk

From da01de4ac8ef2f699ea62c8ee2352dfde4ddde2c Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 12:45:07 -0700
Subject: [PATCH 15/66] use device queues stuff - currently broken

---
 Cxx11/nstream-multigpu-dpcpp.cc | 148 +++++++++++---------------------
 1 file changed, 50 insertions(+), 98 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 5a717683e..99f5d68a3 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -69,12 +69,14 @@ int main(int argc, char * argv[])
   std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
   std::cout << "C++11/DPC++ STREAM triad: A = B + scalar * C" << std::endl;
 
+  auto qs = prk::SYCL::queues();
+
   //////////////////////////////////////////////////////////////////////
   /// Read and test input parameters
   //////////////////////////////////////////////////////////////////////
 
   int iterations;
-  size_t length;
+  size_t length, local_length;
   int use_ngpu = 1;
   try {
       if (argc < 3) {
@@ -94,48 +96,34 @@ int main(int argc, char * argv[])
       if (argc > 3) {
         use_ngpu = std::atoi(argv[3]);
       }
+      if ( use_ngpu > qs.size() ) {
+          std::string error = "You cannot use more devices ("
+                            + std::to_string(use_ngpu)
+                            + ") than you have ("
+                            + std::to_string(qs.size()) + ")";
+          throw error;
+      }
+
+      if (length % use_ngpu != 0) {
+          std::string error = "ERROR: vector length ("
+                            + std::to_string(length)
+                            + ") should be divisible by # procs ("
+                            + std::to_string(use_ngpu) + ")";
+          throw error;
+      }
+      local_length = length / use_ngpu;
   }
   catch (const char * e) {
     std::cout << e << std::endl;
     return 1;
   }
 
+  std::cout << "Number of devices     = " << use_ngpu << std::endl;
   std::cout << "Number of iterations  = " << iterations << std::endl;
   std::cout << "Vector length         = " << length << std::endl;
-  std::cout << "Number of GPUs to use = " << use_ngpu << std::endl;
-
-  std::vector<sycl::queue> qs;
-
-  auto platforms = sycl::platform::get_platforms();
-  for (auto & p : platforms) {
-    auto pname = p.get_info<sycl::info::platform::name>();
-    std::cout << "*Platform: " << pname << std::endl;
-    if ( pname.find("Level-Zero") != std::string::npos) {
-        std::cout << "*Level Zero GPU skipped" << std::endl;
-        break;
-    }
-    if ( pname.find("Intel") == std::string::npos) {
-        std::cout << "*non-Intel skipped" << std::endl;
-        break;
-    }
-    auto devices = p.get_devices();
-    for (auto & d : devices ) {
-        std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
-        if ( d.is_gpu() || d.is_cpu() ) {
-            std::cout << "**Device is CPU or GPU - adding to vector of queues" << std::endl;
-            qs.push_back(sycl::queue(d));
-        }
-    }
-  }
+  std::cout << "Vector length (local) = " << local_length << std::endl;
 
-  int haz_ngpu = qs.size();
-  std::cout << "Number of CPUs and GPUs found  = " << haz_ngpu << std::endl;
-
-  if (use_ngpu > haz_ngpu) {
-      std::cout << "You cannot use more GPUs (" << use_ngpu << ") than you have (" << haz_ngpu << ")" << std::endl;
-  }
-
-  int ngpus = use_ngpu;
+  int np = use_ngpu;
 
   //////////////////////////////////////////////////////////////////////
   // Allocate space and perform the computation
@@ -143,55 +131,26 @@ int main(int argc, char * argv[])
 
   double nstream_time(0);
 
-  const size_t bytes = length * sizeof(double);
+  auto h_A = prk::vector<double>(length, 0);
+  auto h_B = prk::vector<double>(length, 2);
+  auto h_C = prk::vector<double>(length, 2);
 
-  auto h_A = prk::vector<double>(length);
-  auto h_B = prk::vector<double>(length);
-  auto h_C = prk::vector<double>(length);
+  auto d_A = std::vector<double*> (np, nullptr);
+  auto d_B = std::vector<double*> (np, nullptr);
+  auto d_C = std::vector<double*> (np, nullptr);
 
-  for (size_t i=0; i<length; ++i) {
-    h_A[i] = 0;
-    h_B[i] = 2;
-    h_C[i] = 2;
-  }
+  qs.allocate<double>(d_A, local_length);
+  qs.allocate<double>(d_B, local_length);
+  qs.allocate<double>(d_C, local_length);
+  qs.waitall();
 
-  std::vector<size_t> ls(ngpus,0);
-  {
-      const size_t elements_per_gpu = prk::divceil(length, ngpus);
-      for (int g=0; g<ngpus; ++g) {
-          ls[g] = elements_per_gpu;
-      }
-      if (elements_per_gpu * ngpus > length) {
-          ls[ngpus-1] = length - (ngpus-1) * elements_per_gpu;
-      }
-  }
-
-  auto d_A = std::vector<double*> (ngpus, nullptr);
-  auto d_B = std::vector<double*> (ngpus, nullptr);
-  auto d_C = std::vector<double*> (ngpus, nullptr);
-
-  for (int g=0; g<ngpus; ++g) {
-      auto q = qs[g];
-
-      const auto local_length = ls[g];
-      const auto local_bytes = local_length * sizeof(double);
-
-      d_A[g] = syclx::malloc_device<double>(local_length, q);
-      d_B[g] = syclx::malloc_device<double>(local_length, q);
-      d_C[g] = syclx::malloc_device<double>(local_length, q);
-      q.wait();
-
-      const size_t start = (g>0) ? ls[g-1] : 0;
-      const size_t size  = ls[g] * sizeof(double);
-      q.memcpy(d_A[g], &(h_A[start]), size);
-      q.memcpy(d_B[g], &(h_B[start]), size);
-      q.memcpy(d_C[g], &(h_C[start]), size);
-      q.wait();
-  }
+  qs.scatter<double>(d_A, h_A, local_length);
+  qs.scatter<double>(d_B, h_B, local_length);
+  qs.scatter<double>(d_C, h_C, local_length);
+  qs.waitall();
 
-  for (size_t i=0; i<length; ++i) {
-    h_A[i] = -77777777;
-  }
+  // overwrite host buffer with garbage to detect bugs
+  h_A.fill(-77777777);
 
   const double scalar(3);
   {
@@ -199,14 +158,15 @@ int main(int argc, char * argv[])
 
         if (iter==1) nstream_time = prk::wtime();
 
-        for (int g=0; g<ngpus; ++g) {
-            auto q = qs[g];
+#if 0
+        for (int g=0; g<np; ++g) {
+            auto q = qs.list[g];
 
             auto p_A = d_A[g];
             auto p_B = d_B[g];
             auto p_C = d_C[g];
 
-            const size_t size  = ls[g];
+            const size_t size  = local_length;
 
             q.submit([&](sycl::handler& h) {
               h.parallel_for( sycl::range<1>{size}, [=] (sycl::id<1> i) {
@@ -214,27 +174,19 @@ int main(int argc, char * argv[])
               });
             });
         }
-        for (auto & q : qs) {
-            q.wait();
-        }
+        qs.waitall();
+#endif
       }
       nstream_time = prk::wtime() - nstream_time;
   }
 
-  for (int g=0; g<ngpus; ++g) {
-      auto q = qs[g];
+  qs.gather<double>(h_A, d_A, local_length);
+  qs.waitall();
 
-      const size_t start = (g>0) ? ls[g-1] : 0;
-      const size_t size  = ls[g] * sizeof(double);
-
-      q.memcpy(&(h_A[start]), d_A[g], size);
-      q.wait();
-
-      syclx::free(d_C[g], q);
-      syclx::free(d_B[g], q);
-      syclx::free(d_A[g], q);
-      q.wait();
-  }
+  qs.free(d_A);
+  qs.free(d_B);
+  qs.free(d_C);
+  qs.waitall();
 
   //////////////////////////////////////////////////////////////////////
   /// Analyze and output results

From cc311875b89a5205fe78055690947ed5be29dea2 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 14:13:26 -0700
Subject: [PATCH 16/66] trying to fix

---
 Cxx11/nstream-multigpu-dpcpp.cc | 119 ++++++++++++++++++++++++--------
 1 file changed, 89 insertions(+), 30 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 99f5d68a3..d06cee517 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -69,7 +69,32 @@ int main(int argc, char * argv[])
   std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
   std::cout << "C++11/DPC++ STREAM triad: A = B + scalar * C" << std::endl;
 
-  auto qs = prk::SYCL::queues();
+  std::vector<sycl::queue> qs;
+
+  auto platforms = sycl::platform::get_platforms();
+  for (auto & p : platforms) {
+    auto pname = p.get_info<sycl::info::platform::name>();
+    std::cout << "*Platform: " << pname << std::endl;
+    if ( pname.find("Level-Zero") != std::string::npos) {
+        std::cout << "*Level Zero GPU skipped" << std::endl;
+        break;
+    }
+    if ( pname.find("Intel") == std::string::npos) {
+        std::cout << "*non-Intel skipped" << std::endl;
+        break;
+    }
+    auto devices = p.get_devices();
+    for (auto & d : devices ) {
+        std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
+        if ( d.is_gpu() || d.is_cpu() ) {
+            std::cout << "**Device is CPU or GPU - adding to vector of queues" << std::endl;
+            qs.push_back(sycl::queue(d));
+        }
+    }
+  }
+
+  int haz_ngpu = qs.size();
+  std::cout << "Number of CPUs and GPUs found  = " << haz_ngpu << std::endl;
 
   //////////////////////////////////////////////////////////////////////
   /// Read and test input parameters
@@ -123,7 +148,7 @@ int main(int argc, char * argv[])
   std::cout << "Vector length         = " << length << std::endl;
   std::cout << "Vector length (local) = " << local_length << std::endl;
 
-  int np = use_ngpu;
+  int ngpus = use_ngpu;
 
   //////////////////////////////////////////////////////////////////////
   // Allocate space and perform the computation
@@ -131,26 +156,53 @@ int main(int argc, char * argv[])
 
   double nstream_time(0);
 
-  auto h_A = prk::vector<double>(length, 0);
-  auto h_B = prk::vector<double>(length, 2);
-  auto h_C = prk::vector<double>(length, 2);
+  auto h_A = prk::vector<double>(length);
+  auto h_B = prk::vector<double>(length);
+  auto h_C = prk::vector<double>(length);
+
+  for (size_t i=0; i<length; ++i) {
+    h_A[i] = 0;
+    h_B[i] = 2;
+    h_C[i] = 2;
+  }
+
+  std::vector<size_t> ls(ngpus,0);
+  {
+      const size_t elements_per_gpu = prk::divceil(length, ngpus);
+      for (int g=0; g<ngpus; ++g) {
+          ls[g] = elements_per_gpu;
+      }
+      if (elements_per_gpu * ngpus > length) {
+          ls[ngpus-1] = length - (ngpus-1) * elements_per_gpu;
+      }
+  }
+
+  auto d_A = std::vector<double*> (ngpus, nullptr);
+  auto d_B = std::vector<double*> (ngpus, nullptr);
+  auto d_C = std::vector<double*> (ngpus, nullptr);
 
-  auto d_A = std::vector<double*> (np, nullptr);
-  auto d_B = std::vector<double*> (np, nullptr);
-  auto d_C = std::vector<double*> (np, nullptr);
+  for (int g=0; g<ngpus; ++g) {
+      auto q = qs[g];
 
-  qs.allocate<double>(d_A, local_length);
-  qs.allocate<double>(d_B, local_length);
-  qs.allocate<double>(d_C, local_length);
-  qs.waitall();
+      const auto local_length = ls[g];
+      const auto local_bytes = local_length * sizeof(double);
 
-  qs.scatter<double>(d_A, h_A, local_length);
-  qs.scatter<double>(d_B, h_B, local_length);
-  qs.scatter<double>(d_C, h_C, local_length);
-  qs.waitall();
+      d_A[g] = syclx::malloc_device<double>(local_length, q);
+      d_B[g] = syclx::malloc_device<double>(local_length, q);
+      d_C[g] = syclx::malloc_device<double>(local_length, q);
+      q.wait();
 
-  // overwrite host buffer with garbage to detect bugs
-  h_A.fill(-77777777);
+      const size_t start = (g>0) ? ls[g-1] : 0;
+      const size_t size  = ls[g] * sizeof(double);
+      q.memcpy(d_A[g], &(h_A[start]), size);
+      q.memcpy(d_B[g], &(h_B[start]), size);
+      q.memcpy(d_C[g], &(h_C[start]), size);
+      q.wait();
+  }
+
+  for (size_t i=0; i<length; ++i) {
+    h_A[i] = -77777777;
+  }
 
   const double scalar(3);
   {
@@ -158,15 +210,14 @@ int main(int argc, char * argv[])
 
         if (iter==1) nstream_time = prk::wtime();
 
-#if 0
-        for (int g=0; g<np; ++g) {
-            auto q = qs.list[g];
+        for (int g=0; g<ngpus; ++g) {
+            auto q = qs[g];
 
             auto p_A = d_A[g];
             auto p_B = d_B[g];
             auto p_C = d_C[g];
 
-            const size_t size  = local_length;
+            const size_t size  = ls[g];
 
             q.submit([&](sycl::handler& h) {
               h.parallel_for( sycl::range<1>{size}, [=] (sycl::id<1> i) {
@@ -174,19 +225,27 @@ int main(int argc, char * argv[])
               });
             });
         }
-        qs.waitall();
-#endif
+        for (auto & q : qs) {
+            q.wait();
+        }
       }
       nstream_time = prk::wtime() - nstream_time;
   }
 
-  qs.gather<double>(h_A, d_A, local_length);
-  qs.waitall();
+  for (int g=0; g<ngpus; ++g) {
+      auto q = qs[g];
+
+      const size_t start = (g>0) ? ls[g-1] : 0;
+      const size_t size  = ls[g] * sizeof(double);
 
-  qs.free(d_A);
-  qs.free(d_B);
-  qs.free(d_C);
-  qs.waitall();
+      q.memcpy(&(h_A[start]), d_A[g], size);
+      q.wait();
+
+      syclx::free(d_C[g], q);
+      syclx::free(d_B[g], q);
+      syclx::free(d_A[g], q);
+      q.wait();
+  }
 
   //////////////////////////////////////////////////////////////////////
   /// Analyze and output results

From 18931c4d029aa4eb84bc578b2c8ee2957cb6da45 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 14:13:48 -0700
Subject: [PATCH 17/66] trying to fix

---
 Cxx11/nstream-multigpu-dpcpp.cc | 11 +----------
 1 file changed, 1 insertion(+), 10 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index d06cee517..391b417f5 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -166,16 +166,7 @@ int main(int argc, char * argv[])
     h_C[i] = 2;
   }
 
-  std::vector<size_t> ls(ngpus,0);
-  {
-      const size_t elements_per_gpu = prk::divceil(length, ngpus);
-      for (int g=0; g<ngpus; ++g) {
-          ls[g] = elements_per_gpu;
-      }
-      if (elements_per_gpu * ngpus > length) {
-          ls[ngpus-1] = length - (ngpus-1) * elements_per_gpu;
-      }
-  }
+  std::vector<size_t> ls(ngpus,local_length);
 
   auto d_A = std::vector<double*> (ngpus, nullptr);
   auto d_B = std::vector<double*> (ngpus, nullptr);

From 5351212238e8456dde8b17366bfeafd78274fd11 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 14:15:44 -0700
Subject: [PATCH 18/66] trying to fix

---
 Cxx11/nstream-multigpu-dpcpp.cc | 17 ++++++-----------
 1 file changed, 6 insertions(+), 11 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 391b417f5..b2a981b30 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -156,15 +156,9 @@ int main(int argc, char * argv[])
 
   double nstream_time(0);
 
-  auto h_A = prk::vector<double>(length);
-  auto h_B = prk::vector<double>(length);
-  auto h_C = prk::vector<double>(length);
-
-  for (size_t i=0; i<length; ++i) {
-    h_A[i] = 0;
-    h_B[i] = 2;
-    h_C[i] = 2;
-  }
+  auto h_A = prk::vector<double>(length, 0);
+  auto h_B = prk::vector<double>(length, 2);
+  auto h_C = prk::vector<double>(length, 2);
 
   std::vector<size_t> ls(ngpus,local_length);
 
@@ -225,13 +219,14 @@ int main(int argc, char * argv[])
 
   for (int g=0; g<ngpus; ++g) {
       auto q = qs[g];
-
       const size_t start = (g>0) ? ls[g-1] : 0;
       const size_t size  = ls[g] * sizeof(double);
-
       q.memcpy(&(h_A[start]), d_A[g], size);
       q.wait();
+  }
 
+  for (int g=0; g<ngpus; ++g) {
+      auto q = qs[g];
       syclx::free(d_C[g], q);
       syclx::free(d_B[g], q);
       syclx::free(d_A[g], q);

From 945f87fc1a04d872fea486700d630a6bd1dd6605 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 15:36:08 -0700
Subject: [PATCH 19/66] working with inlined methods

---
 Cxx11/nstream-multigpu-dpcpp.cc | 114 ++++++++++++++++++++++++++------
 1 file changed, 94 insertions(+), 20 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index b2a981b30..716615044 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -148,7 +148,7 @@ int main(int argc, char * argv[])
   std::cout << "Vector length         = " << length << std::endl;
   std::cout << "Vector length (local) = " << local_length << std::endl;
 
-  int ngpus = use_ngpu;
+  int np = use_ngpu;
 
   //////////////////////////////////////////////////////////////////////
   // Allocate space and perform the computation
@@ -160,49 +160,96 @@ int main(int argc, char * argv[])
   auto h_B = prk::vector<double>(length, 2);
   auto h_C = prk::vector<double>(length, 2);
 
-  std::vector<size_t> ls(ngpus,local_length);
+  auto d_A = std::vector<double*> (np, nullptr);
+  auto d_B = std::vector<double*> (np, nullptr);
+  auto d_C = std::vector<double*> (np, nullptr);
 
-  auto d_A = std::vector<double*> (ngpus, nullptr);
-  auto d_B = std::vector<double*> (ngpus, nullptr);
-  auto d_C = std::vector<double*> (ngpus, nullptr);
-
-  for (int g=0; g<ngpus; ++g) {
+#if 0
+  for (int g=0; g<np; ++g) {
       auto q = qs[g];
-
-      const auto local_length = ls[g];
       const auto local_bytes = local_length * sizeof(double);
-
       d_A[g] = syclx::malloc_device<double>(local_length, q);
       d_B[g] = syclx::malloc_device<double>(local_length, q);
       d_C[g] = syclx::malloc_device<double>(local_length, q);
       q.wait();
+  }
+#else
+  auto list(qs);
+  for (const auto & l : list | boost::adaptors::indexed(0) ) {
+      auto i = l.index();
+      auto v = l.value();
+      d_A[i] = syclx::malloc_device<double>(local_length, v);
+      d_B[i] = syclx::malloc_device<double>(local_length, v);
+      d_C[i] = syclx::malloc_device<double>(local_length, v);
+  }
+  for (auto & i : list) {
+      i.wait();
+  }
+#endif
 
-      const size_t start = (g>0) ? ls[g-1] : 0;
-      const size_t size  = ls[g] * sizeof(double);
+#if 0
+  for (int g=0; g<np; ++g) {
+      auto q = qs[g];
+      const size_t start = local_length * g;
+      const size_t size  = local_length * sizeof(double);
       q.memcpy(d_A[g], &(h_A[start]), size);
       q.memcpy(d_B[g], &(h_B[start]), size);
       q.memcpy(d_C[g], &(h_C[start]), size);
-      q.wait();
   }
-
-  for (size_t i=0; i<length; ++i) {
-    h_A[i] = -77777777;
+#elif 0
+  for (const auto & l : list | boost::adaptors::indexed(0) ) {
+      auto i = l.index();
+      auto v = l.value();
+      auto start = local_length * i;
+      auto bytes = local_length * sizeof(double);
+      v.memcpy(d_A[i], &(h_A[start]), bytes);
+      v.memcpy(d_B[i], &(h_B[start]), bytes);
+      v.memcpy(d_C[i], &(h_C[start]), bytes);
+  }
+#else
+  for (const auto & l : list | boost::adaptors::indexed(0) ) {
+      auto i = l.index();
+      auto v = l.value();
+      auto bytes = local_length * sizeof(double);
+      auto start = local_length * i;
+      {
+          auto target = d_A[i];
+          auto source = &h_A[i * local_length];
+          v.memcpy(target, source, bytes);
+      }
+      {
+          auto target = d_B[i];
+          auto source = &h_B[i * local_length];
+          v.memcpy(target, source, bytes);
+      }
+      {
+          auto target = d_C[i];
+          auto source = &h_C[i * local_length];
+          v.memcpy(target, source, bytes);
+      }
+  }
+#endif
+  for (auto & i : list) {
+      i.wait();
   }
 
+  // overwrite host buffer with garbage to detect bugs
+  h_A.fill(-77777777);
+
   const double scalar(3);
   {
       for (int iter = 0; iter<=iterations; iter++) {
 
         if (iter==1) nstream_time = prk::wtime();
 
-        for (int g=0; g<ngpus; ++g) {
+        for (int g=0; g<np; ++g) {
             auto q = qs[g];
 
             auto p_A = d_A[g];
             auto p_B = d_B[g];
             auto p_C = d_C[g];
 
-            const size_t size  = ls[g];
+            const size_t size  = local_length;
 
             q.submit([&](sycl::handler& h) {
               h.parallel_for( sycl::range<1>{size}, [=] (sycl::id<1> i) {
@@ -217,19 +264,46 @@ int main(int argc, char * argv[])
       nstream_time = prk::wtime() - nstream_time;
   }
 
-  for (int g=0; g<ngpus; ++g) {
+#if 0
+  std::vector<size_t> ls(np,local_length);
+  for (int g=0; g<np; ++g) {
       auto q = qs[g];
       const size_t start = (g>0) ? ls[g-1] : 0;
       const size_t size  = ls[g] * sizeof(double);
       q.memcpy(&(h_A[start]), d_A[g], size);
+  }
+#else
+  for (const auto & l : list | boost::adaptors::indexed(0) ) {
+      auto i = l.index();
+      auto v = l.value();
+      auto bytes = local_length * sizeof(double);
+      auto start = local_length * i;
+      auto target = &h_A[i * local_length];
+      auto source = d_A[i];
+      v.memcpy(target, source, bytes);
+  }
+#endif
+  for (auto & q : qs) {
       q.wait();
   }
 
-  for (int g=0; g<ngpus; ++g) {
+#if 0
+  for (int g=0; g<np; ++g) {
       auto q = qs[g];
       syclx::free(d_C[g], q);
       syclx::free(d_B[g], q);
       syclx::free(d_A[g], q);
+  }
+#else
+  for (const auto & l : list | boost::adaptors::indexed(0) ) {
+      auto i = l.index();
+      auto v = l.value();
+      syclx::free(d_A[i], v);
+      syclx::free(d_B[i], v);
+      syclx::free(d_C[i], v);
+  }
+#endif
+  for (auto & q : qs) {
       q.wait();
   }
 

From 994f9ccadfab421189963bf31eca0b50f2807675 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 15:36:17 -0700
Subject: [PATCH 20/66] working with inlined methods

---
 Cxx11/nstream-multigpu-dpcpp.cc | 10 ----------
 1 file changed, 10 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 716615044..3f9bc9489 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -264,15 +264,6 @@ int main(int argc, char * argv[])
       nstream_time = prk::wtime() - nstream_time;
   }
 
-#if 0
-  std::vector<size_t> ls(np,local_length);
-  for (int g=0; g<np; ++g) {
-      auto q = qs[g];
-      const size_t start = (g>0) ? ls[g-1] : 0;
-      const size_t size  = ls[g] * sizeof(double);
-      q.memcpy(&(h_A[start]), d_A[g], size);
-  }
-#else
   for (const auto & l : list | boost::adaptors::indexed(0) ) {
       auto i = l.index();
       auto v = l.value();
@@ -282,7 +273,6 @@ int main(int argc, char * argv[])
       auto source = d_A[i];
       v.memcpy(target, source, bytes);
   }
-#endif
   for (auto & q : qs) {
       q.wait();
   }

From f2c874e54d89500ca728b96d4d259b1d458957bb Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 15:39:15 -0700
Subject: [PATCH 21/66] cleaned up

---
 Cxx11/nstream-multigpu-dpcpp.cc | 43 +--------------------------------
 1 file changed, 1 insertion(+), 42 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 3f9bc9489..876c07d6b 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -164,16 +164,6 @@ int main(int argc, char * argv[])
   auto d_B = std::vector<double*> (np, nullptr);
   auto d_C = std::vector<double*> (np, nullptr);
 
-#if 0
-  for (int g=0; g<np; ++g) {
-      auto q = qs[g];
-      const auto local_bytes = local_length * sizeof(double);
-      d_A[g] = syclx::malloc_device<double>(local_length, q);
-      d_B[g] = syclx::malloc_device<double>(local_length, q);
-      d_C[g] = syclx::malloc_device<double>(local_length, q);
-      q.wait();
-  }
-#else
   auto list(qs);
   for (const auto & l : list | boost::adaptors::indexed(0) ) {
       auto i = l.index();
@@ -185,28 +175,7 @@ int main(int argc, char * argv[])
   for (auto & i : list) {
       i.wait();
   }
-#endif
-
-#if 0
-  for (int g=0; g<np; ++g) {
-      auto q = qs[g];
-      const size_t start = local_length * g;
-      const size_t size  = local_length * sizeof(double);
-      q.memcpy(d_A[g], &(h_A[start]), size);
-      q.memcpy(d_B[g], &(h_B[start]), size);
-      q.memcpy(d_C[g], &(h_C[start]), size);
-  }
-#elif 0
-  for (const auto & l : list | boost::adaptors::indexed(0) ) {
-      auto i = l.index();
-      auto v = l.value();
-      auto start = local_length * i;
-      auto bytes = local_length * sizeof(double);
-      v.memcpy(d_A[i], &(h_A[start]), bytes);
-      v.memcpy(d_B[i], &(h_B[start]), bytes);
-      v.memcpy(d_C[i], &(h_C[start]), bytes);
-  }
-#else
+
   for (const auto & l : list | boost::adaptors::indexed(0) ) {
       auto i = l.index();
       auto v = l.value();
@@ -228,7 +197,6 @@ int main(int argc, char * argv[])
           v.memcpy(target, source, bytes);
       }
   }
-#endif
   for (auto & i : list) {
       i.wait();
   }
@@ -277,14 +245,6 @@ int main(int argc, char * argv[])
       q.wait();
   }
 
-#if 0
-  for (int g=0; g<np; ++g) {
-      auto q = qs[g];
-      syclx::free(d_C[g], q);
-      syclx::free(d_B[g], q);
-      syclx::free(d_A[g], q);
-  }
-#else
   for (const auto & l : list | boost::adaptors::indexed(0) ) {
       auto i = l.index();
       auto v = l.value();
@@ -292,7 +252,6 @@ int main(int argc, char * argv[])
       syclx::free(d_B[i], v);
       syclx::free(d_C[i], v);
   }
-#endif
   for (auto & q : qs) {
       q.wait();
   }

From 7fca06f362a3538a3d315db1207ffc44ba505820 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 15:39:18 -0700
Subject: [PATCH 22/66] cleaned up

---
 Cxx11/prk_sycl.h | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index 599d424c7..94f8de9d7 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -164,6 +164,7 @@ namespace prk {
                     }
                 }
 
+#if 0
                 template <typename T>
                 void gather(T * host_pointer,
                             const std::vector<T*> & device_pointers,
@@ -179,6 +180,7 @@ namespace prk {
                         v.memcpy(target, source, bytes);
                     }
                 }
+#endif
 
                 template <typename T>
                 void gather(prk::vector<T> & host_pointer,
@@ -196,6 +198,7 @@ namespace prk {
                     }
                 }
 
+#if 0
                 template <typename T>
                 void scatter(std::vector<T*> & device_pointers,
                              const T * host_pointer,
@@ -211,6 +214,7 @@ namespace prk {
                         v.memcpy(target, source, bytes);
                     }
                 }
+#endif
 
                 template <typename T>
                 void scatter(std::vector<T*> & device_pointers,

From a0ac723faafc19bfcb202fe955698ce050306457 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 16:49:49 -0700
Subject: [PATCH 23/66] fixed bugs

---
 Cxx11/prk_sycl.h | 50 ++++++------------------------------------------
 1 file changed, 6 insertions(+), 44 deletions(-)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index 94f8de9d7..ec61f0679 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -140,23 +140,24 @@ namespace prk {
                     }
                 }
 
+                sycl::queue queue(int i) {
+                    return this->list[i];
+                }
+
                 template <typename T>
                 void allocate(std::vector<T*> & device_pointers,
                               size_t num_elements)
                 {
-                    std::cout << "allocate" << std::endl;
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
                         device_pointers[i] = syclx::malloc_device<T>(num_elements, v);
-                        std::cout << i << ": " << device_pointers[i] << ", " << num_elements << std::endl;
                     }
                 }
 
                 template <typename T>
                 void free(std::vector<T*> & device_pointers)
                 {
-                    std::cout << "free" << std::endl;
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
@@ -164,71 +165,32 @@ namespace prk {
                     }
                 }
 
-#if 0
-                template <typename T>
-                void gather(T * host_pointer,
-                            const std::vector<T*> & device_pointers,
-                            size_t num_elements)
-                {
-                    std::cout << "gather" << std::endl;
-                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
-                        auto i = l.index();
-                        auto v = l.value();
-                        auto bytes = num_elements * sizeof(T);
-                        auto target = &host_pointer[i * bytes];
-                        auto source = device_pointers[i];
-                        v.memcpy(target, source, bytes);
-                    }
-                }
-#endif
-
                 template <typename T>
                 void gather(prk::vector<T> & host_pointer,
                             const std::vector<T*> & device_pointers,
                             size_t num_elements)
                 {
-                    std::cout << "gather" << std::endl;
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
                         auto bytes = num_elements * sizeof(T);
-                        auto target = &host_pointer[i * bytes];
+                        auto target = &host_pointer[i * num_elements];
                         auto source = device_pointers[i];
                         v.memcpy(target, source, bytes);
                     }
                 }
 
-#if 0
-                template <typename T>
-                void scatter(std::vector<T*> & device_pointers,
-                             const T * host_pointer,
-                             size_t num_elements)
-                {
-                    std::cout << "scatter" << std::endl;
-                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
-                        auto i = l.index();
-                        auto v = l.value();
-                        auto bytes = num_elements * sizeof(T);
-                        auto target = device_pointers[i];
-                        auto source = &host_pointer[i * bytes];
-                        v.memcpy(target, source, bytes);
-                    }
-                }
-#endif
-
                 template <typename T>
                 void scatter(std::vector<T*> & device_pointers,
                              prk::vector<T>  & host_pointer,
                              size_t num_elements)
                 {
-                    std::cout << "scatter" << std::endl;
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
                         auto bytes = num_elements * sizeof(T);
                         auto target = device_pointers[i];
-                        auto source = &host_pointer[i * bytes];
-                        std::cout << i << ": " << target << ", " << source << std::endl;
+                        auto source = &host_pointer[i * num_elements];
                         v.memcpy(target, source, bytes);
                     }
                 }

From fe2d82926601310458d18bc921377391f32eec0e Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 16:49:58 -0700
Subject: [PATCH 24/66] working but to be replaced

---
 Cxx11/nstream-multigpu-dpcpp.cc | 2 --
 1 file changed, 2 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 876c07d6b..2ab474853 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -180,7 +180,6 @@ int main(int argc, char * argv[])
       auto i = l.index();
       auto v = l.value();
       auto bytes = local_length * sizeof(double);
-      auto start = local_length * i;
       {
           auto target = d_A[i];
           auto source = &h_A[i * local_length];
@@ -236,7 +235,6 @@ int main(int argc, char * argv[])
       auto i = l.index();
       auto v = l.value();
       auto bytes = local_length * sizeof(double);
-      auto start = local_length * i;
       auto target = &h_A[i * local_length];
       auto source = d_A[i];
       v.memcpy(target, source, bytes);

From 6239694e60c1b369ba39f1bb6b3b5e5b9a26e433 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 16:50:50 -0700
Subject: [PATCH 25/66] working

---
 Cxx11/nstream-multigpu-dpcpp.cc | 104 ++++++--------------------------
 1 file changed, 19 insertions(+), 85 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 2ab474853..3de7a5d01 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -69,32 +69,7 @@ int main(int argc, char * argv[])
   std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
   std::cout << "C++11/DPC++ STREAM triad: A = B + scalar * C" << std::endl;
 
-  std::vector<sycl::queue> qs;
-
-  auto platforms = sycl::platform::get_platforms();
-  for (auto & p : platforms) {
-    auto pname = p.get_info<sycl::info::platform::name>();
-    std::cout << "*Platform: " << pname << std::endl;
-    if ( pname.find("Level-Zero") != std::string::npos) {
-        std::cout << "*Level Zero GPU skipped" << std::endl;
-        break;
-    }
-    if ( pname.find("Intel") == std::string::npos) {
-        std::cout << "*non-Intel skipped" << std::endl;
-        break;
-    }
-    auto devices = p.get_devices();
-    for (auto & d : devices ) {
-        std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
-        if ( d.is_gpu() || d.is_cpu() ) {
-            std::cout << "**Device is CPU or GPU - adding to vector of queues" << std::endl;
-            qs.push_back(sycl::queue(d));
-        }
-    }
-  }
-
-  int haz_ngpu = qs.size();
-  std::cout << "Number of CPUs and GPUs found  = " << haz_ngpu << std::endl;
+  auto qs = prk::SYCL::queues();
 
   //////////////////////////////////////////////////////////////////////
   /// Read and test input parameters
@@ -164,41 +139,15 @@ int main(int argc, char * argv[])
   auto d_B = std::vector<double*> (np, nullptr);
   auto d_C = std::vector<double*> (np, nullptr);
 
-  auto list(qs);
-  for (const auto & l : list | boost::adaptors::indexed(0) ) {
-      auto i = l.index();
-      auto v = l.value();
-      d_A[i] = syclx::malloc_device<double>(local_length, v);
-      d_B[i] = syclx::malloc_device<double>(local_length, v);
-      d_C[i] = syclx::malloc_device<double>(local_length, v);
-  }
-  for (auto & i : list) {
-      i.wait();
-  }
+  qs.allocate<double>(d_A, local_length);
+  qs.allocate<double>(d_B, local_length);
+  qs.allocate<double>(d_C, local_length);
+  qs.waitall();
 
-  for (const auto & l : list | boost::adaptors::indexed(0) ) {
-      auto i = l.index();
-      auto v = l.value();
-      auto bytes = local_length * sizeof(double);
-      {
-          auto target = d_A[i];
-          auto source = &h_A[i * local_length];
-          v.memcpy(target, source, bytes);
-      }
-      {
-          auto target = d_B[i];
-          auto source = &h_B[i * local_length];
-          v.memcpy(target, source, bytes);
-      }
-      {
-          auto target = d_C[i];
-          auto source = &h_C[i * local_length];
-          v.memcpy(target, source, bytes);
-      }
-  }
-  for (auto & i : list) {
-      i.wait();
-  }
+  qs.scatter<double>(d_A, h_A, local_length);
+  qs.scatter<double>(d_B, h_B, local_length);
+  qs.scatter<double>(d_C, h_C, local_length);
+  qs.waitall();
 
   // overwrite host buffer with garbage to detect bugs
   h_A.fill(-77777777);
@@ -209,8 +158,9 @@ int main(int argc, char * argv[])
 
         if (iter==1) nstream_time = prk::wtime();
 
+#if 1
         for (int g=0; g<np; ++g) {
-            auto q = qs[g];
+            auto q = qs.queue(g);
 
             auto p_A = d_A[g];
             auto p_B = d_B[g];
@@ -224,35 +174,19 @@ int main(int argc, char * argv[])
               });
             });
         }
-        for (auto & q : qs) {
-            q.wait();
-        }
+        qs.waitall();
+#endif
       }
       nstream_time = prk::wtime() - nstream_time;
   }
 
-  for (const auto & l : list | boost::adaptors::indexed(0) ) {
-      auto i = l.index();
-      auto v = l.value();
-      auto bytes = local_length * sizeof(double);
-      auto target = &h_A[i * local_length];
-      auto source = d_A[i];
-      v.memcpy(target, source, bytes);
-  }
-  for (auto & q : qs) {
-      q.wait();
-  }
+  qs.gather<double>(h_A, d_A, local_length);
+  qs.waitall();
 
-  for (const auto & l : list | boost::adaptors::indexed(0) ) {
-      auto i = l.index();
-      auto v = l.value();
-      syclx::free(d_A[i], v);
-      syclx::free(d_B[i], v);
-      syclx::free(d_C[i], v);
-  }
-  for (auto & q : qs) {
-      q.wait();
-  }
+  qs.free(d_A);
+  qs.free(d_B);
+  qs.free(d_C);
+  qs.waitall();
 
   //////////////////////////////////////////////////////////////////////
   /// Analyze and output results

From d299f957506126f9b49b894f55f1c6b6781b18fc Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Wed, 22 Jul 2020 08:46:23 -0700
Subject: [PATCH 26/66] fix input helper comment

---
 Cxx11/nstream-dpcpp.cc | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/Cxx11/nstream-dpcpp.cc b/Cxx11/nstream-dpcpp.cc
index e72a14cd5..268ab4b23 100644
--- a/Cxx11/nstream-dpcpp.cc
+++ b/Cxx11/nstream-dpcpp.cc
@@ -77,7 +77,7 @@ int main(int argc, char * argv[])
   size_t length;
   try {
       if (argc < 3) {
-        throw "Usage: <# iterations> <vector length> [<grid_stride>]";
+        throw "Usage: <# iterations> <vector length>";
       }
 
       iterations  = std::atoi(argv[1]);

From e7bb773aef4f5e72e3d29d9955a70bc31158599d Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Wed, 22 Jul 2020 09:02:37 -0700
Subject: [PATCH 27/66] add broadcast and reduce (unused and untested)

---
 Cxx11/prk_sycl.h | 45 ++++++++++++++++++++++++++++++++++++++++-----
 1 file changed, 40 insertions(+), 5 deletions(-)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index ec61f0679..6e4356ab6 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -165,8 +165,44 @@ namespace prk {
                     }
                 }
 
-                template <typename T>
-                void gather(prk::vector<T> & host_pointer,
+                // UNUSED and UNTESTED
+                template <typename T, typename B>
+                void broadcast(std::vector<T*> & device_pointers,
+                               const B & host_pointer,
+                               size_t num_elements)
+                {
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto bytes = num_elements * sizeof(T);
+                        auto target = device_pointers[i];
+                        auto source = &host_pointer[0];
+                        v.memcpy(target, source, bytes);
+                    }
+                }
+
+                // UNUSED and UNTESTED
+                template <typename T, typename B, typename Op>
+                void reduce(B & host_pointer,
+                            const std::vector<T*> & device_pointers,
+                            size_t num_elements)
+                {
+                    auto temp = std::vector<T>(num_elements, 0);
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto bytes = num_elements * sizeof(T);
+                        auto target = device_pointers[i];
+                        auto source = &host_pointer[0];
+                        v.memcpy(temp, source, bytes);
+                        for (size_t e=0; e<num_elements; ++e) {
+                            target[e] = Op{}( target[e], temp[e] );
+                        }
+                    }
+                }
+
+                template <typename T, typename B>
+                void gather(B & host_pointer,
                             const std::vector<T*> & device_pointers,
                             size_t num_elements)
                 {
@@ -180,9 +216,9 @@ namespace prk {
                     }
                 }
 
-                template <typename T>
+                template <typename T, typename B>
                 void scatter(std::vector<T*> & device_pointers,
-                             prk::vector<T>  & host_pointer,
+                             const B & host_pointer,
                              size_t num_elements)
                 {
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
@@ -196,7 +232,6 @@ namespace prk {
                 }
 
 
-
         };
 
     } // namespace SYCL

From bc0ce206ca26b0416693f1d714e934c43ba54f92 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 23 Jun 2020 09:29:01 -0700
Subject: [PATCH 28/66] add stencil DPC++ skeletons

---
 Cxx11/Makefile                  |   2 +-
 Cxx11/stencil-dpcpp.cc          | 229 ++++++++++++++++++++++++++++++++
 Cxx11/stencil-multigpu-dpcpp.cc | 229 ++++++++++++++++++++++++++++++++
 3 files changed, 459 insertions(+), 1 deletion(-)
 create mode 100644 Cxx11/stencil-dpcpp.cc
 create mode 100644 Cxx11/stencil-multigpu-dpcpp.cc

diff --git a/Cxx11/Makefile b/Cxx11/Makefile
index f0624da81..6c0e08e3e 100644
--- a/Cxx11/Makefile
+++ b/Cxx11/Makefile
@@ -97,7 +97,7 @@ sycl-usm: nstream-sycl-usm nstream-sycl-explicit-usm stencil-sycl-usm transpose-
 
 sycl-explicit: nstream-sycl-explicit transpose-sycl-explicit
 
-dpcpp: nstream-dpcpp nstream-multigpu-dpcpp transpose-dpcpp
+dpcpp: nstream-dpcpp nstream-multigpu-dpcpp stencil-dpcpp stencil-multigpu-dpcpp transpose-dpcpp
 
 tbb: p2p-innerloop-tbb p2p-tbb stencil-tbb transpose-tbb nstream-tbb \
      p2p-hyperplane-tbb p2p-tasks-tbb
diff --git a/Cxx11/stencil-dpcpp.cc b/Cxx11/stencil-dpcpp.cc
new file mode 100644
index 000000000..0dbb5764d
--- /dev/null
+++ b/Cxx11/stencil-dpcpp.cc
@@ -0,0 +1,229 @@
+
+///
+/// Copyright (c) 2013, Intel Corporation
+///
+/// Redistribution and use in source and binary forms, with or without
+/// modification, are permitted provided that the following conditions
+/// are met:
+///
+/// * Redistributions of source code must retain the above copyright
+///       notice, this list of conditions and the following disclaimer.
+/// * Redistributions in binary form must reproduce the above
+///       copyright notice, this list of conditions and the following
+///       disclaimer in the documentation and/or other materials provided
+///       with the distribution.
+/// * Neither the name of Intel Corporation nor the names of its
+///       contributors may be used to endorse or promote products
+///       derived from this software without specific prior written
+///       permission.
+///
+/// THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
+/// "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
+/// LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
+/// FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE
+/// COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
+/// INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+/// BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
+/// LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER
+/// CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
+/// LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN
+/// ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
+/// POSSIBILITY OF SUCH DAMAGE.
+
+//////////////////////////////////////////////////////////////////////
+///
+/// NAME:    Stencil
+///
+/// PURPOSE: This program tests the efficiency with which a space-invariant,
+///          linear, symmetric filter (stencil) can be applied to a square
+///          grid or image.
+///
+/// USAGE:   The program takes as input the linear
+///          dimension of the grid, and the number of iterations on the grid
+///
+///                <progname> <iterations> <grid size>
+///
+///          The output consists of diagnostics to make sure the
+///          algorithm worked, and of timing statistics.
+///
+/// FUNCTIONS CALLED:
+///
+///          Other than standard C functions, the following functions are used in
+///          this program:
+///          wtime()
+///
+/// HISTORY: - Written by Rob Van der Wijngaart, February 2009.
+///          - RvdW: Removed unrolling pragmas for clarity;
+///            added constant to array "in" at end of each iteration to force
+///            refreshing of neighbor data in parallel versions; August 2013
+///            C++11-ification by Jeff Hammond, May 2017.
+///
+//////////////////////////////////////////////////////////////////////
+
+#include "prk_util.h"
+#include "stencil_seq.hpp"
+
+void nothing(const int n, const int t, prk::vector<double> & in, prk::vector<double> & out)
+{
+    std::cout << "You are trying to use a stencil that does not exist.\n";
+    std::cout << "Please generate the new stencil using the code generator\n";
+    std::cout << "and add it to the case-switch in the driver." << std::endl;
+    // n will never be zero - this is to silence compiler warnings.
+    if (n==0 || t==0) std::cout << in.size() << out.size() << std::endl;
+    std::abort();
+}
+
+int main(int argc, char* argv[])
+{
+  std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
+  std::cout << "C++11 Stencil execution on 2D grid" << std::endl;
+
+  //////////////////////////////////////////////////////////////////////
+  // Process and test input parameters
+  //////////////////////////////////////////////////////////////////////
+
+  int iterations, n, radius, tile_size;
+  bool star = true;
+  try {
+      if (argc < 3) {
+        throw "Usage: <# iterations> <array dimension> [<tile_size> <star/grid> <radius>]";
+      }
+
+      // number of times to run the algorithm
+      iterations  = std::atoi(argv[1]);
+      if (iterations < 1) {
+        throw "ERROR: iterations must be >= 1";
+      }
+
+      // linear grid dimension
+      n  = std::atoi(argv[2]);
+      if (n < 1) {
+        throw "ERROR: grid dimension must be positive";
+      } else if (n > prk::get_max_matrix_size()) {
+        throw "ERROR: grid dimension too large - overflow risk";
+      }
+
+      // default tile size for tiling of local transpose
+      tile_size = 32;
+      if (argc > 3) {
+          tile_size = std::atoi(argv[3]);
+          if (tile_size <= 0) tile_size = n;
+          if (tile_size > n) tile_size = n;
+      }
+
+      // stencil pattern
+      if (argc > 4) {
+          auto stencil = std::string(argv[4]);
+          auto grid = std::string("grid");
+          star = (stencil == grid) ? false : true;
+      }
+
+      // stencil radius
+      radius = 2;
+      if (argc > 5) {
+          radius = std::atoi(argv[5]);
+      }
+
+      if ( (radius < 1) || (2*radius+1 > n) ) {
+        throw "ERROR: Stencil radius negative or too large";
+      }
+  }
+  catch (const char * e) {
+    std::cout << e << std::endl;
+    return 1;
+  }
+
+  std::cout << "Number of iterations = " << iterations << std::endl;
+  std::cout << "Grid size            = " << n << std::endl;
+  std::cout << "Tile size            = " << tile_size << std::endl;
+  std::cout << "Type of stencil      = " << (star ? "star" : "grid") << std::endl;
+  std::cout << "Radius of stencil    = " << radius << std::endl;
+
+  auto stencil = nothing;
+  if (star) {
+      switch (radius) {
+          case 1: stencil = star1; break;
+          case 2: stencil = star2; break;
+          case 3: stencil = star3; break;
+          case 4: stencil = star4; break;
+          case 5: stencil = star5; break;
+      }
+  } else {
+      switch (radius) {
+          case 1: stencil = grid1; break;
+          case 2: stencil = grid2; break;
+          case 3: stencil = grid3; break;
+          case 4: stencil = grid4; break;
+          case 5: stencil = grid5; break;
+      }
+  }
+
+  //////////////////////////////////////////////////////////////////////
+  // Allocate space and perform the computation
+  //////////////////////////////////////////////////////////////////////
+
+  auto stencil_time = 0.0;
+
+  prk::vector<double> in(n*n);
+  prk::vector<double> out(n*n);
+
+  {
+    for (int it=0; it<n; it+=tile_size) {
+      for (int jt=0; jt<n; jt+=tile_size) {
+        for (int i=it; i<std::min(n,it+tile_size); i++) {
+          PRAGMA_SIMD
+          for (int j=jt; j<std::min(n,jt+tile_size); j++) {
+            in[i*n+j] = static_cast<double>(i+j);
+            out[i*n+j] = 0.0;
+          }
+        }
+      }
+    }
+
+    for (int iter = 0; iter<=iterations; iter++) {
+
+      if (iter==1) stencil_time = prk::wtime();
+      // Apply the stencil operator
+      stencil(n, tile_size, in, out);
+      // Add constant to solution to force refresh of neighbor data, if any
+      std::transform(in.begin(), in.end(), in.begin(), [](double c) { return c+=1.0; });
+    }
+    stencil_time = prk::wtime() - stencil_time;
+  }
+
+  //////////////////////////////////////////////////////////////////////
+  // Analyze and output results.
+  //////////////////////////////////////////////////////////////////////
+
+  // interior of grid with respect to stencil
+  size_t active_points = static_cast<size_t>(n-2*radius)*static_cast<size_t>(n-2*radius);
+  double norm = 0.0;
+  for (int i=radius; i<n-radius; i++) {
+    for (int j=radius; j<n-radius; j++) {
+      norm += prk::abs(out[i*n+j]);
+    }
+  }
+  norm /= active_points;
+
+  // verify correctness
+  const double epsilon = 1.0e-8;
+  double reference_norm = 2.*(iterations+1.);
+  if (prk::abs(norm-reference_norm) > epsilon) {
+    std::cout << "ERROR: L1 norm = " << norm
+              << " Reference L1 norm = " << reference_norm << std::endl;
+    return 1;
+  } else {
+    std::cout << "Solution validates" << std::endl;
+#ifdef VERBOSE
+    std::cout << "L1 norm = " << norm
+              << " Reference L1 norm = " << reference_norm << std::endl;
+#endif
+    const int stencil_size = star ? 4*radius+1 : (2*radius+1)*(2*radius+1);
+    size_t flops = (2L*(size_t)stencil_size+1L) * active_points;
+    auto avgtime = stencil_time/iterations;
+    std::cout << "Rate (MFlops/s): " << 1.0e-6 * static_cast<double>(flops)/avgtime
+              << " Avg time (s): " << avgtime << std::endl;
+  }
+
+  return 0;
+}
diff --git a/Cxx11/stencil-multigpu-dpcpp.cc b/Cxx11/stencil-multigpu-dpcpp.cc
new file mode 100644
index 000000000..0dbb5764d
--- /dev/null
+++ b/Cxx11/stencil-multigpu-dpcpp.cc
@@ -0,0 +1,229 @@
+
+///
+/// Copyright (c) 2013, Intel Corporation
+///
+/// Redistribution and use in source and binary forms, with or without
+/// modification, are permitted provided that the following conditions
+/// are met:
+///
+/// * Redistributions of source code must retain the above copyright
+///       notice, this list of conditions and the following disclaimer.
+/// * Redistributions in binary form must reproduce the above
+///       copyright notice, this list of conditions and the following
+///       disclaimer in the documentation and/or other materials provided
+///       with the distribution.
+/// * Neither the name of Intel Corporation nor the names of its
+///       contributors may be used to endorse or promote products
+///       derived from this software without specific prior written
+///       permission.
+///
+/// THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
+/// "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
+/// LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
+/// FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE
+/// COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
+/// INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+/// BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
+/// LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER
+/// CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
+/// LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN
+/// ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
+/// POSSIBILITY OF SUCH DAMAGE.
+
+//////////////////////////////////////////////////////////////////////
+///
+/// NAME:    Stencil
+///
+/// PURPOSE: This program tests the efficiency with which a space-invariant,
+///          linear, symmetric filter (stencil) can be applied to a square
+///          grid or image.
+///
+/// USAGE:   The program takes as input the linear
+///          dimension of the grid, and the number of iterations on the grid
+///
+///                <progname> <iterations> <grid size>
+///
+///          The output consists of diagnostics to make sure the
+///          algorithm worked, and of timing statistics.
+///
+/// FUNCTIONS CALLED:
+///
+///          Other than standard C functions, the following functions are used in
+///          this program:
+///          wtime()
+///
+/// HISTORY: - Written by Rob Van der Wijngaart, February 2009.
+///          - RvdW: Removed unrolling pragmas for clarity;
+///            added constant to array "in" at end of each iteration to force
+///            refreshing of neighbor data in parallel versions; August 2013
+///            C++11-ification by Jeff Hammond, May 2017.
+///
+//////////////////////////////////////////////////////////////////////
+
+#include "prk_util.h"
+#include "stencil_seq.hpp"
+
+void nothing(const int n, const int t, prk::vector<double> & in, prk::vector<double> & out)
+{
+    std::cout << "You are trying to use a stencil that does not exist.\n";
+    std::cout << "Please generate the new stencil using the code generator\n";
+    std::cout << "and add it to the case-switch in the driver." << std::endl;
+    // n will never be zero - this is to silence compiler warnings.
+    if (n==0 || t==0) std::cout << in.size() << out.size() << std::endl;
+    std::abort();
+}
+
+int main(int argc, char* argv[])
+{
+  std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
+  std::cout << "C++11 Stencil execution on 2D grid" << std::endl;
+
+  //////////////////////////////////////////////////////////////////////
+  // Process and test input parameters
+  //////////////////////////////////////////////////////////////////////
+
+  int iterations, n, radius, tile_size;
+  bool star = true;
+  try {
+      if (argc < 3) {
+        throw "Usage: <# iterations> <array dimension> [<tile_size> <star/grid> <radius>]";
+      }
+
+      // number of times to run the algorithm
+      iterations  = std::atoi(argv[1]);
+      if (iterations < 1) {
+        throw "ERROR: iterations must be >= 1";
+      }
+
+      // linear grid dimension
+      n  = std::atoi(argv[2]);
+      if (n < 1) {
+        throw "ERROR: grid dimension must be positive";
+      } else if (n > prk::get_max_matrix_size()) {
+        throw "ERROR: grid dimension too large - overflow risk";
+      }
+
+      // default tile size for tiling of local transpose
+      tile_size = 32;
+      if (argc > 3) {
+          tile_size = std::atoi(argv[3]);
+          if (tile_size <= 0) tile_size = n;
+          if (tile_size > n) tile_size = n;
+      }
+
+      // stencil pattern
+      if (argc > 4) {
+          auto stencil = std::string(argv[4]);
+          auto grid = std::string("grid");
+          star = (stencil == grid) ? false : true;
+      }
+
+      // stencil radius
+      radius = 2;
+      if (argc > 5) {
+          radius = std::atoi(argv[5]);
+      }
+
+      if ( (radius < 1) || (2*radius+1 > n) ) {
+        throw "ERROR: Stencil radius negative or too large";
+      }
+  }
+  catch (const char * e) {
+    std::cout << e << std::endl;
+    return 1;
+  }
+
+  std::cout << "Number of iterations = " << iterations << std::endl;
+  std::cout << "Grid size            = " << n << std::endl;
+  std::cout << "Tile size            = " << tile_size << std::endl;
+  std::cout << "Type of stencil      = " << (star ? "star" : "grid") << std::endl;
+  std::cout << "Radius of stencil    = " << radius << std::endl;
+
+  auto stencil = nothing;
+  if (star) {
+      switch (radius) {
+          case 1: stencil = star1; break;
+          case 2: stencil = star2; break;
+          case 3: stencil = star3; break;
+          case 4: stencil = star4; break;
+          case 5: stencil = star5; break;
+      }
+  } else {
+      switch (radius) {
+          case 1: stencil = grid1; break;
+          case 2: stencil = grid2; break;
+          case 3: stencil = grid3; break;
+          case 4: stencil = grid4; break;
+          case 5: stencil = grid5; break;
+      }
+  }
+
+  //////////////////////////////////////////////////////////////////////
+  // Allocate space and perform the computation
+  //////////////////////////////////////////////////////////////////////
+
+  auto stencil_time = 0.0;
+
+  prk::vector<double> in(n*n);
+  prk::vector<double> out(n*n);
+
+  {
+    for (int it=0; it<n; it+=tile_size) {
+      for (int jt=0; jt<n; jt+=tile_size) {
+        for (int i=it; i<std::min(n,it+tile_size); i++) {
+          PRAGMA_SIMD
+          for (int j=jt; j<std::min(n,jt+tile_size); j++) {
+            in[i*n+j] = static_cast<double>(i+j);
+            out[i*n+j] = 0.0;
+          }
+        }
+      }
+    }
+
+    for (int iter = 0; iter<=iterations; iter++) {
+
+      if (iter==1) stencil_time = prk::wtime();
+      // Apply the stencil operator
+      stencil(n, tile_size, in, out);
+      // Add constant to solution to force refresh of neighbor data, if any
+      std::transform(in.begin(), in.end(), in.begin(), [](double c) { return c+=1.0; });
+    }
+    stencil_time = prk::wtime() - stencil_time;
+  }
+
+  //////////////////////////////////////////////////////////////////////
+  // Analyze and output results.
+  //////////////////////////////////////////////////////////////////////
+
+  // interior of grid with respect to stencil
+  size_t active_points = static_cast<size_t>(n-2*radius)*static_cast<size_t>(n-2*radius);
+  double norm = 0.0;
+  for (int i=radius; i<n-radius; i++) {
+    for (int j=radius; j<n-radius; j++) {
+      norm += prk::abs(out[i*n+j]);
+    }
+  }
+  norm /= active_points;
+
+  // verify correctness
+  const double epsilon = 1.0e-8;
+  double reference_norm = 2.*(iterations+1.);
+  if (prk::abs(norm-reference_norm) > epsilon) {
+    std::cout << "ERROR: L1 norm = " << norm
+              << " Reference L1 norm = " << reference_norm << std::endl;
+    return 1;
+  } else {
+    std::cout << "Solution validates" << std::endl;
+#ifdef VERBOSE
+    std::cout << "L1 norm = " << norm
+              << " Reference L1 norm = " << reference_norm << std::endl;
+#endif
+    const int stencil_size = star ? 4*radius+1 : (2*radius+1)*(2*radius+1);
+    size_t flops = (2L*(size_t)stencil_size+1L) * active_points;
+    auto avgtime = stencil_time/iterations;
+    std::cout << "Rate (MFlops/s): " << 1.0e-6 * static_cast<double>(flops)/avgtime
+              << " Avg time (s): " << avgtime << std::endl;
+  }
+
+  return 0;
+}

From 4de1f8323331913a5889a7639aa83379f3f8d7be Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 23 Jun 2020 11:52:12 -0700
Subject: [PATCH 29/66] cleanup comments

---
 Cxx11/stencil-sycl.cc | 7 +------
 1 file changed, 1 insertion(+), 6 deletions(-)

diff --git a/Cxx11/stencil-sycl.cc b/Cxx11/stencil-sycl.cc
index a375e1f05..9795cc638 100644
--- a/Cxx11/stencil-sycl.cc
+++ b/Cxx11/stencil-sycl.cc
@@ -46,12 +46,6 @@
 ///          The output consists of diagnostics to make sure the
 ///          algorithm worked, and of timing statistics.
 ///
-/// FUNCTIONS CALLED:
-///
-///          Other than standard C functions, the following functions are used in
-///          this program:
-///          wtime()
-///
 /// HISTORY: - Written by Rob Van der Wijngaart, February 2009.
 ///          - RvdW: Removed unrolling pragmas for clarity;
 ///            added constant to array "in" at end of each iteration to force
@@ -298,6 +292,7 @@ int main(int argc, char * argv[])
 
   std::cout << "Number of iterations = " << iterations << std::endl;
   std::cout << "Grid size            = " << n << std::endl;
+  std::cout << "Tile size            = " << tile_size << std::endl;
   std::cout << "Type of stencil      = " << (star ? "star" : "grid") << std::endl;
   std::cout << "Radius of stencil    = " << radius << std::endl;
 

From af3de74714fc0debb2167a5a6138401f2f695ee3 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 23 Jun 2020 11:53:56 -0700
Subject: [PATCH 30/66] some fixes - GPU broken

---
 Cxx11/stencil-sycl-usm.cc | 20 +++++++++-----------
 1 file changed, 9 insertions(+), 11 deletions(-)

diff --git a/Cxx11/stencil-sycl-usm.cc b/Cxx11/stencil-sycl-usm.cc
index 7224991f0..ba56f9ffe 100644
--- a/Cxx11/stencil-sycl-usm.cc
+++ b/Cxx11/stencil-sycl-usm.cc
@@ -105,25 +105,21 @@ void run(sycl::queue & q, int iterations, size_t n, size_t tile_size, bool star,
   // Allocate space and perform the computation
   //////////////////////////////////////////////////////////////////////
 
-  auto ctx = q.get_context();
-
   double stencil_time(0);
 
   T * out;
 
   try {
 
-    auto dev = q.get_device();
-
-    T * in  = static_cast<T*>(syclx::malloc_shared(n * n * sizeof(T), dev, ctx));
-    out = static_cast<T*>(syclx::malloc_shared(n * n * sizeof(T), dev, ctx));
+    T * in  = static_cast<T*>(syclx::malloc_shared(n * n * sizeof(T), q));
+    out = static_cast<T*>(syclx::malloc_shared(n * n * sizeof(T), q));
 
     q.submit([&](sycl::handler& h) {
-
       h.parallel_for<class init<T>>(sycl::range<2> {n, n}, [=] (sycl::id<2> it) {
           const auto i = it[0];
           const auto j = it[1];
-          in[i*n+j] = static_cast<T>(i+j);
+          in[i*n+j]  = static_cast<T>(i+j);
+          out[i*n+j] = static_cast<T>(0);
       });
     });
     q.wait();
@@ -133,9 +129,9 @@ void run(sycl::queue & q, int iterations, size_t n, size_t tile_size, bool star,
       if (iter==1) stencil_time = prk::wtime();
 
       stencil(q, n, in, out);
+      q.wait();
 
       q.submit([&](sycl::handler& h) {
-        // Add constant to solution to force refresh of neighbor data, if any
         h.parallel_for<class add<T>>(sycl::range<2> {n, n}, sycl::id<2> {0, 0}, [=] (sycl::id<2> it) {
             const auto i = it[0];
             const auto j = it[1];
@@ -146,7 +142,7 @@ void run(sycl::queue & q, int iterations, size_t n, size_t tile_size, bool star,
     }
     stencil_time = prk::wtime() - stencil_time;
 
-    syclx::free(in, ctx);
+    syclx::free(in, q);
   }
   catch (sycl::exception & e) {
     std::cout << e.what() << std::endl;
@@ -178,7 +174,7 @@ void run(sycl::queue & q, int iterations, size_t n, size_t tile_size, bool star,
   }
   norm /= active_points;
 
-  syclx::free(out, ctx);
+  syclx::free(out, q);
 
   // verify correctness
   const double epsilon = 1.0e-8;
@@ -186,6 +182,7 @@ void run(sycl::queue & q, int iterations, size_t n, size_t tile_size, bool star,
   if (prk::abs(norm-reference_norm) > epsilon) {
     std::cout << "ERROR: L1 norm = " << norm
               << " Reference L1 norm = " << reference_norm << std::endl;
+    std::cout << "===================================" << std::endl;
   } else {
     std::cout << "Solution validates" << std::endl;
 #ifdef VERBOSE
@@ -265,6 +262,7 @@ int main(int argc, char * argv[])
 
   std::cout << "Number of iterations = " << iterations << std::endl;
   std::cout << "Grid size            = " << n << std::endl;
+  std::cout << "Tile size            = " << tile_size << std::endl;
   std::cout << "Type of stencil      = " << (star ? "star" : "grid") << std::endl;
   std::cout << "Radius of stencil    = " << radius << std::endl;
 

From 12abe88e3d8f6b4076a9e53e0810e7bfb32b6e77 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 23 Jun 2020 11:54:22 -0700
Subject: [PATCH 31/66] cleanup

---
 Cxx11/nstream-dpcpp.cc | 11 +++++------
 1 file changed, 5 insertions(+), 6 deletions(-)

diff --git a/Cxx11/nstream-dpcpp.cc b/Cxx11/nstream-dpcpp.cc
index addcbf6f1..e72a14cd5 100644
--- a/Cxx11/nstream-dpcpp.cc
+++ b/Cxx11/nstream-dpcpp.cc
@@ -122,9 +122,10 @@ int main(int argc, char * argv[])
   double * d_A = syclx::malloc_device<double>(length, q);
   double * d_B = syclx::malloc_device<double>(length, q);
   double * d_C = syclx::malloc_device<double>(length, q);
-  q.memcpy(d_A, &(h_A[0]), bytes).wait();
-  q.memcpy(d_B, &(h_B[0]), bytes).wait();
-  q.memcpy(d_C, &(h_C[0]), bytes).wait();
+  q.memcpy(d_A, &(h_A[0]), bytes);
+  q.memcpy(d_B, &(h_B[0]), bytes);
+  q.memcpy(d_C, &(h_C[0]), bytes);
+  q.wait();
 
   double scalar(3);
   {
@@ -133,9 +134,7 @@ int main(int argc, char * argv[])
       if (iter==1) nstream_time = prk::wtime();
 
       q.submit([&](sycl::handler& h) {
-
-        h.parallel_for( sycl::range<1>{length}, [=] (sycl::id<1> it) {
-            const size_t i = it[0];
+        h.parallel_for( sycl::range<1>{length}, [=] (sycl::id<1> i) {
             d_A[i] += d_B[i] + scalar * d_C[i];
         });
       });

From ce6a713fe13ee890e37074f712f3d5179bc8a2f5 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 23 Jun 2020 11:54:44 -0700
Subject: [PATCH 32/66] workaround Level Zero SPIR detection

---
 Cxx11/prk_sycl.h | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index 6d2b417f8..2335c1c07 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -59,8 +59,8 @@ namespace prk {
 #if ! ( defined(TRISYCL) || defined(__HIPSYCL__) )
             auto device      = q.get_device();
             auto platform    = device.get_platform();
-            std::cout << "SYCL Device:   " << device.get_info<sycl::info::device::name>() << std::endl;
             std::cout << "SYCL Platform: " << platform.get_info<sycl::info::platform::name>() << std::endl;
+            std::cout << "SYCL Device:   " << device.get_info<sycl::info::device::name>() << std::endl;
 #endif
         }
 

From 546625177aad6a29fc351a192fdf46bf8576bdad Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 23 Jun 2020 11:55:03 -0700
Subject: [PATCH 33/66] some fixes - GPU broken

---
 Cxx11/stencil-dpcpp.cc | 121 +++++++++++++++++++++++++----------------
 1 file changed, 74 insertions(+), 47 deletions(-)

diff --git a/Cxx11/stencil-dpcpp.cc b/Cxx11/stencil-dpcpp.cc
index 0dbb5764d..421823e9e 100644
--- a/Cxx11/stencil-dpcpp.cc
+++ b/Cxx11/stencil-dpcpp.cc
@@ -1,6 +1,6 @@
 
 ///
-/// Copyright (c) 2013, Intel Corporation
+/// Copyright (c) 2020, Intel Corporation
 ///
 /// Redistribution and use in source and binary forms, with or without
 /// modification, are permitted provided that the following conditions
@@ -46,12 +46,6 @@
 ///          The output consists of diagnostics to make sure the
 ///          algorithm worked, and of timing statistics.
 ///
-/// FUNCTIONS CALLED:
-///
-///          Other than standard C functions, the following functions are used in
-///          this program:
-///          wtime()
-///
 /// HISTORY: - Written by Rob Van der Wijngaart, February 2009.
 ///          - RvdW: Removed unrolling pragmas for clarity;
 ///            added constant to array "in" at end of each iteration to force
@@ -60,30 +54,32 @@
 ///
 //////////////////////////////////////////////////////////////////////
 
+#include "prk_sycl.h"
 #include "prk_util.h"
-#include "stencil_seq.hpp"
+#include "stencil_sycl.hpp"
 
-void nothing(const int n, const int t, prk::vector<double> & in, prk::vector<double> & out)
+template <typename T>
+void nothing(sycl::queue & q, const size_t n, const T * in, T * out)
 {
     std::cout << "You are trying to use a stencil that does not exist.\n";
     std::cout << "Please generate the new stencil using the code generator\n";
     std::cout << "and add it to the case-switch in the driver." << std::endl;
-    // n will never be zero - this is to silence compiler warnings.
-    if (n==0 || t==0) std::cout << in.size() << out.size() << std::endl;
-    std::abort();
+    prk::Abort();
 }
 
 int main(int argc, char* argv[])
 {
   std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
-  std::cout << "C++11 Stencil execution on 2D grid" << std::endl;
+  std::cout << "C++11/DPC++ Stencil execution on 2D grid" << std::endl;
 
   //////////////////////////////////////////////////////////////////////
   // Process and test input parameters
   //////////////////////////////////////////////////////////////////////
 
-  int iterations, n, radius, tile_size;
+  int iterations;
+  size_t n, tile_size;
   bool star = true;
+  size_t radius = 2;
   try {
       if (argc < 3) {
         throw "Usage: <# iterations> <array dimension> [<tile_size> <star/grid> <radius>]";
@@ -139,16 +135,18 @@ int main(int argc, char* argv[])
   std::cout << "Type of stencil      = " << (star ? "star" : "grid") << std::endl;
   std::cout << "Radius of stencil    = " << radius << std::endl;
 
-  auto stencil = nothing;
+  auto stencil = nothing<double>;
   if (star) {
       switch (radius) {
-          case 1: stencil = star1; break;
-          case 2: stencil = star2; break;
-          case 3: stencil = star3; break;
-          case 4: stencil = star4; break;
-          case 5: stencil = star5; break;
+          case 1: stencil = star1<double>; break;
+          case 2: stencil = star2<double>; break;
+          case 3: stencil = star3<double>; break;
+          case 4: stencil = star4<double>; break;
+          case 5: stencil = star5<double>; break;
       }
-  } else {
+  }
+#if 0
+  else {
       switch (radius) {
           case 1: stencil = grid1; break;
           case 2: stencil = grid2; break;
@@ -157,39 +155,63 @@ int main(int argc, char* argv[])
           case 5: stencil = grid5; break;
       }
   }
+#endif
+
+  sycl::queue q(sycl::default_selector{});
+  prk::SYCL::print_device_platform(q);
 
   //////////////////////////////////////////////////////////////////////
   // Allocate space and perform the computation
   //////////////////////////////////////////////////////////////////////
 
-  auto stencil_time = 0.0;
-
-  prk::vector<double> in(n*n);
-  prk::vector<double> out(n*n);
-
-  {
-    for (int it=0; it<n; it+=tile_size) {
-      for (int jt=0; jt<n; jt+=tile_size) {
-        for (int i=it; i<std::min(n,it+tile_size); i++) {
-          PRAGMA_SIMD
-          for (int j=jt; j<std::min(n,jt+tile_size); j++) {
-            in[i*n+j] = static_cast<double>(i+j);
-            out[i*n+j] = 0.0;
-          }
-        }
-      }
-    }
+  double stencil_time(0);
 
-    for (int iter = 0; iter<=iterations; iter++) {
+  prk::vector<double> h_in(n*n, 0);
+  prk::vector<double> h_out(n*n, 0);
 
-      if (iter==1) stencil_time = prk::wtime();
-      // Apply the stencil operator
-      stencil(n, tile_size, in, out);
-      // Add constant to solution to force refresh of neighbor data, if any
-      std::transform(in.begin(), in.end(), in.begin(), [](double c) { return c+=1.0; });
-    }
-    stencil_time = prk::wtime() - stencil_time;
+  const size_t bytes = n * n * sizeof(double);
+
+  double * d_in  = syclx::malloc_device<double>(n*n, q);
+  double * d_out = syclx::malloc_device<double>(n*n, q);
+  q.wait();
+
+  q.submit([&](sycl::handler& h) {
+    h.parallel_for(sycl::range<2> {n,n}, [=] (sycl::item<2> it) {
+      const auto i = it[0];
+      const auto j = it[1];
+      d_in[i*n+j]  = static_cast<double>(i+j);
+      d_out[i*n+j] = static_cast<double>(0);
+    });
+  });
+  q.wait();
+
+  for (int iter = 0; iter<=iterations; iter++) {
+
+    if (iter==1) stencil_time = prk::wtime();
+
+    // Apply the stencil operator
+    stencil(q, n, d_in, d_out);
+    q.wait();
+
+    // Add constant to solution to force refresh of neighbor data, if any
+    q.submit([&](sycl::handler& h) {
+      h.parallel_for(sycl::range<2> {n,n}, [=] (sycl::item<2> it) {
+        const auto i = it[0];
+        const auto j = it[1];
+        d_in[i*n+j] += static_cast<double>(1);
+      });
+    });
+    q.wait();
   }
+  stencil_time = prk::wtime() - stencil_time;
+
+  q.memcpy(&(h_in[0]),  d_in,  bytes);
+  q.memcpy(&(h_out[0]), d_out, bytes);
+  q.wait();
+
+  syclx::free(d_in, q);
+  syclx::free(d_out,q);
+  q.wait();
 
   //////////////////////////////////////////////////////////////////////
   // Analyze and output results.
@@ -200,7 +222,7 @@ int main(int argc, char* argv[])
   double norm = 0.0;
   for (int i=radius; i<n-radius; i++) {
     for (int j=radius; j<n-radius; j++) {
-      norm += prk::abs(out[i*n+j]);
+      norm += prk::abs(h_out[i*n+j]);
     }
   }
   norm /= active_points;
@@ -211,6 +233,11 @@ int main(int argc, char* argv[])
   if (prk::abs(norm-reference_norm) > epsilon) {
     std::cout << "ERROR: L1 norm = " << norm
               << " Reference L1 norm = " << reference_norm << std::endl;
+    for (int i=0; i<n; i++) {
+      for (int j=0; j<n; j++) {
+          std::cerr << i << "," << j  << " = " << h_in[i*n+j] <<", " << h_out[i*n+j] << "\n";
+      }
+    }
     return 1;
   } else {
     std::cout << "Solution validates" << std::endl;

From 02d1f8d7a8f724cc5bd03e0849bb79dee4828784 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Wed, 24 Jun 2020 08:00:56 -0700
Subject: [PATCH 34/66] undo minor mistake

---
 Cxx11/Makefile | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/Cxx11/Makefile b/Cxx11/Makefile
index 6c0e08e3e..e24b39163 100644
--- a/Cxx11/Makefile
+++ b/Cxx11/Makefile
@@ -128,7 +128,7 @@ cblas: transpose-cblas dgemm-cblas
 
 onemkl: nstream-onemkl dgemm-onemkl dgemm-multigpu-onemkl
 
-oneapi: onemkl dpcpp sycl sycl-usm sycl-explicit sycl-explicit-usm
+oneapi: onemkl dpcpp sycl sycl-usm sycl-explicit
 
 occa: transpose-occa nstream-occa
 

From 0d358f980640161463fcf98e29cf2a97b51cf762 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Wed, 24 Jun 2020 08:04:59 -0700
Subject: [PATCH 35/66] add transpose multi-GPU DPC++ skeleton

---
 Cxx11/Makefile                    |   2 +-
 Cxx11/transpose-multigpu-dpcpp.cc | 181 ++++++++++++++++++++++++++++++
 2 files changed, 182 insertions(+), 1 deletion(-)
 create mode 100644 Cxx11/transpose-multigpu-dpcpp.cc

diff --git a/Cxx11/Makefile b/Cxx11/Makefile
index e24b39163..a20cdfbb4 100644
--- a/Cxx11/Makefile
+++ b/Cxx11/Makefile
@@ -97,7 +97,7 @@ sycl-usm: nstream-sycl-usm nstream-sycl-explicit-usm stencil-sycl-usm transpose-
 
 sycl-explicit: nstream-sycl-explicit transpose-sycl-explicit
 
-dpcpp: nstream-dpcpp nstream-multigpu-dpcpp stencil-dpcpp stencil-multigpu-dpcpp transpose-dpcpp
+dpcpp: nstream-dpcpp nstream-multigpu-dpcpp stencil-dpcpp stencil-multigpu-dpcpp transpose-dpcpp transpose-multigpu-dpcpp
 
 tbb: p2p-innerloop-tbb p2p-tbb stencil-tbb transpose-tbb nstream-tbb \
      p2p-hyperplane-tbb p2p-tasks-tbb
diff --git a/Cxx11/transpose-multigpu-dpcpp.cc b/Cxx11/transpose-multigpu-dpcpp.cc
new file mode 100644
index 000000000..2dec847f9
--- /dev/null
+++ b/Cxx11/transpose-multigpu-dpcpp.cc
@@ -0,0 +1,181 @@
+///
+/// Copyright (c) 2020, Intel Corporation
+///
+/// Redistribution and use in source and binary forms, with or without
+/// modification, are permitted provided that the following conditions
+/// are met:
+///
+/// * Redistributions of source code must retain the above copyright
+///       notice, this list of conditions and the following disclaimer.
+/// * Redistributions in binary form must reproduce the above
+///       copyright notice, this list of conditions and the following
+///       disclaimer in the documentation and/or other materials provided
+///       with the distribution.
+/// * Neither the name of Intel Corporation nor the names of its
+///       contributors may be used to endorse or promote products
+///       derived from this software without specific prior written
+///       permission.
+///
+/// THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
+/// "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
+/// LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
+/// FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE
+/// COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
+/// INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+/// BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
+/// LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER
+/// CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
+/// LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN
+/// ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
+/// POSSIBILITY OF SUCH DAMAGE.
+
+//////////////////////////////////////////////////////////////////////
+///
+/// NAME:    transpose
+///
+/// PURPOSE: This program measures the time for the transpose of a
+///          column-major stored matrix into a row-major stored matrix.
+///
+/// USAGE:   Program input is the matrix order and the number of times to
+///          repeat the operation:
+///
+///          transpose <matrix_size> <# iterations>
+///
+///          The output consists of diagnostics to make sure the
+///          transpose worked and timing statistics.
+///
+/// HISTORY: Written by  Rob Van der Wijngaart, February 2009.
+///          Converted to C++11 by Jeff Hammond, February 2016 and May 2017.
+///
+//////////////////////////////////////////////////////////////////////
+
+#include "prk_util.h"
+#include "prk_sycl.h"
+
+int main(int argc, char * argv[])
+{
+  std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
+  std::cout << "C++11/DPCT Matrix transpose: B = A^T" << std::endl;
+
+  //////////////////////////////////////////////////////////////////////
+  /// Read and test input parameters
+  //////////////////////////////////////////////////////////////////////
+
+  int iterations;
+  size_t order;
+  try {
+      if (argc < 3) {
+        throw "Usage: <# iterations> <matrix order>";
+      }
+
+      iterations  = std::atoi(argv[1]);
+      if (iterations < 1) {
+        throw "ERROR: iterations must be >= 1";
+      }
+
+      order = std::atoi(argv[2]);
+      if (order <= 0) {
+        throw "ERROR: Matrix Order must be greater than 0";
+      } else if (order > prk::get_max_matrix_size()) {
+        throw "ERROR: matrix dimension too large - overflow risk";
+      }
+  }
+  catch (const char * e) {
+    std::cout << e << std::endl;
+    return 1;
+  }
+
+  std::cout << "Number of iterations  = " << iterations << std::endl;
+  std::cout << "Matrix order          = " << order << std::endl;
+
+  sycl::queue q(sycl::default_selector{});
+  prk::SYCL::print_device_platform(q);
+
+  //////////////////////////////////////////////////////////////////////
+  // Allocate space for the input and transpose matrix
+  //////////////////////////////////////////////////////////////////////
+
+  const size_t nelems = (size_t)order * (size_t)order;
+  const size_t bytes = nelems * sizeof(double);
+  double * h_a = syclx::malloc_host<double>( nelems, q);
+  double * h_b = syclx::malloc_host<double>( nelems, q);
+
+  // fill A with the sequence 0 to order^2-1
+  for (int j=0; j<order; j++) {
+    for (int i=0; i<order; i++) {
+      h_a[j*order+i] = static_cast<double>(order*j+i);
+      h_b[j*order+i] = static_cast<double>(0);
+    }
+  }
+
+  // copy input from host to device
+  double * A = syclx::malloc_device<double>( nelems, q);
+  double * B = syclx::malloc_device<double>( nelems, q);
+  q.memcpy(A, &(h_a[0]), bytes).wait();
+  q.memcpy(B, &(h_b[0]), bytes).wait();
+
+  auto trans_time = 0.0;
+
+  for (int iter = 0; iter<=iterations; iter++) {
+
+      if (iter==1) trans_time = prk::wtime();
+
+      q.submit([&](sycl::handler& h) {
+
+        h.parallel_for( sycl::range<2>{order,order}, [=] (sycl::id<2> it) {
+#if USE_2D_INDEXING
+          sycl::id<2> ij{it[0],it[1]};
+          sycl::id<2> ji{it[1],it[0]};
+          B[ij] += A[ji];
+          A[ji] += (T)1;
+#else
+          B[it[0] * order + it[1]] += A[it[1] * order + it[0]];
+          A[it[1] * order + it[0]] += 1.0;
+#endif
+        });
+      });
+      q.wait();
+  }
+  trans_time = prk::wtime() - trans_time;
+
+  // copy output back to host
+  q.memcpy(&(h_b[0]), B, bytes).wait();
+
+  syclx::free(B, q);
+  syclx::free(A, q);
+
+  //////////////////////////////////////////////////////////////////////
+  /// Analyze and output results
+  //////////////////////////////////////////////////////////////////////
+
+  const double addit = (iterations+1.) * (iterations/2.);
+  double abserr(0);
+  for (int j=0; j<order; j++) {
+    for (int i=0; i<order; i++) {
+      const size_t ij = (size_t)i*(size_t)order+(size_t)j;
+      const size_t ji = (size_t)j*(size_t)order+(size_t)i;
+      const double reference = static_cast<double>(ij)*(1.+iterations)+addit;
+      abserr += prk::abs(h_b[ji] - reference);
+    }
+  }
+
+  syclx::free(h_b, q);
+  syclx::free(h_a, q);
+
+  const auto epsilon = 1.0e-8;
+  if (abserr < epsilon) {
+    std::cout << "Solution validates" << std::endl;
+    auto avgtime = trans_time/iterations;
+    auto bytes = (size_t)order * (size_t)order * sizeof(double);
+    std::cout << "Rate (MB/s): " << 1.0e-6 * (2L*bytes)/avgtime
+              << " Avg time (s): " << avgtime << std::endl;
+  } else {
+    std::cout << "ERROR: Aggregate squared error " << abserr
+              << " exceeds threshold " << epsilon << std::endl;
+    return 1;
+  }
+
+  return 0;
+}
+
+

From 83892be1d7d2bc761bdce0ed53c5e9d05d520afa Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Mon, 29 Jun 2020 15:43:12 -0700
Subject: [PATCH 36/66] WIP

---
 Cxx11/transpose-multigpu-dpcpp.cc | 72 ++++++++++++++++++++++++-------
 1 file changed, 57 insertions(+), 15 deletions(-)

diff --git a/Cxx11/transpose-multigpu-dpcpp.cc b/Cxx11/transpose-multigpu-dpcpp.cc
index 2dec847f9..a26244496 100644
--- a/Cxx11/transpose-multigpu-dpcpp.cc
+++ b/Cxx11/transpose-multigpu-dpcpp.cc
@@ -63,9 +63,10 @@ int main(int argc, char * argv[])
 
   int iterations;
   size_t order;
+  int use_ngpu = 1;
   try {
       if (argc < 3) {
-        throw "Usage: <# iterations> <matrix order>";
+        throw "Usage: <# iterations> <matrix order> [<use_ngpu>]";
       }
 
       iterations  = std::atoi(argv[1]);
@@ -79,6 +80,15 @@ int main(int argc, char * argv[])
       } else if (order > prk::get_max_matrix_size()) {
         throw "ERROR: matrix dimension too large - overflow risk";
       }
+
+      if (argc > 3) {
+        use_ngpu = std::atoi(argv[3]);
+      }
+
+      if (order % use_ngpu) {
+        std::cerr << "order = " << order << ", device count = " << use_ngpu << std::endl;
+        throw "ERROR: matrix order should be divisible by device count!";
+      }
   }
   catch (const char * e) {
     std::cout << e << std::endl;
@@ -87,34 +97,66 @@ int main(int argc, char * argv[])
 
   std::cout << "Number of iterations  = " << iterations << std::endl;
   std::cout << "Matrix order          = " << order << std::endl;
+  std::cout << "Number of GPUs to use = " << use_ngpu << std::endl;
+
+  std::vector<sycl::queue> qs;
+
+  auto platforms = sycl::platform::get_platforms();
+  for (auto & p : platforms) {
+    auto pname = p.get_info<sycl::info::platform::name>();
+    std::cout << "*Platform: " << pname << std::endl;
+    if ( pname.find("Level-Zero") != std::string::npos) {
+        std::cout << "*Level Zero GPU skipped" << std::endl;
+        break;
+    }
+    if ( pname.find("Intel") == std::string::npos) {
+        std::cout << "*non-Intel skipped" << std::endl;
+        break;
+    }
+    auto devices = p.get_devices();
+    for (auto & d : devices ) {
+        std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
+        if ( d.is_gpu() || d.is_cpu() ) {
+            std::cout << "**Device is CPU or GPU - adding to vector of queues" << std::endl;
+            qs.push_back(sycl::queue(d));
+        }
+    }
+  }
+
+  int haz_ngpu = qs.size();
+  std::cout << "Number of CPUs and GPUs found  = " << haz_ngpu << std::endl;
 
-  sycl::queue q(sycl::default_selector{});
-  prk::SYCL::print_device_platform(q);
+  if (use_ngpu > haz_ngpu) {
+      std::cout << "You cannot use more GPUs (" << use_ngpu << ") than you have (" << haz_ngpu << ")" << std::endl;
+  }
+
+  int ngpus = use_ngpu;
 
   //////////////////////////////////////////////////////////////////////
   // Allocate space for the input and transpose matrix
   //////////////////////////////////////////////////////////////////////
 
-  const size_t nelems = (size_t)order * (size_t)order;
-  const size_t bytes = nelems * sizeof(double);
-  double * h_a = syclx::malloc_host<double>( nelems, q);
-  double * h_b = syclx::malloc_host<double>( nelems, q);
+  double trans_time(0);
+
+  auto h_a = prk::vector<double>(order * order);
+  auto h_b = prk::vector<double>(order * order);
 
   // fill A with the sequence 0 to order^2-1
-  for (int j=0; j<order; j++) {
-    for (int i=0; i<order; i++) {
+  for (size_t j=0; j<order; j++) {
+    for (size_t i=0; i<order; i++) {
       h_a[j*order+i] = static_cast<double>(order*j+i);
       h_b[j*order+i] = static_cast<double>(0);
     }
   }
 
-  // copy input from host to device
-  double * A = syclx::malloc_device<double>( nelems, q);
-  double * B = syclx::malloc_device<double>( nelems, q);
-  q.memcpy(A, &(h_a[0]), bytes).wait();
-  q.memcpy(B, &(h_b[0]), bytes).wait();
+  const size_t bytes = order * order * sizeof(double);
 
-  auto trans_time = 0.0;
+  // copy input from host to device
+  double * A = syclx::malloc_device<double>(order * order, q);
+  double * B = syclx::malloc_device<double>(order * order, q);
+  q.memcpy(A, &(h_a[0]), bytes);
+  q.memcpy(B, &(h_b[0]), bytes);
+  q.wait();
 
   for (int iter = 0; iter<=iterations; iter++) {
 

From 9a8006a5fc0e7ebd3882b4dd461d333611f922e0 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Mon, 20 Jul 2020 14:31:26 -0700
Subject: [PATCH 37/66] add ignores

---
 .gitignore | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/.gitignore b/.gitignore
index d4e9d72bc..3c78c8721 100644
--- a/.gitignore
+++ b/.gitignore
@@ -166,6 +166,8 @@ Cxx11/dgemm-mpi
 Cxx11/dgemm-sycl
 Cxx11/dgemm-blas-sycl
 Cxx11/dgemm-mkl-sycl
+Cxx11/dgemm-multigpu-onemkl
+Cxx11/dgemm-onemkl
 Cxx11/dgemm-kokkos
 Cxx11/dgemm-kernels-kokkos
 Cxx11/dgemm-raja
@@ -217,6 +219,8 @@ Cxx11/nstream-sycl-usm
 Cxx11/nstream-sycl-explicit
 Cxx11/nstream-sycl-explicit-usm
 Cxx11/nstream-dpcpp
+Cxx11/nstream-multigpu-dpcpp
+Cxx11/nstream-onemkl
 Cxx11/nstream-celerity
 Cxx11/nstream-hpx
 Cxx11/nstream-upcxx

From 83faa815c528a5a23b3a3a7a3aaf7689d055b0eb Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Mon, 20 Jul 2020 14:54:59 -0700
Subject: [PATCH 38/66] fix message

---
 Cxx11/transpose-multigpu-dpcpp.cc | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/Cxx11/transpose-multigpu-dpcpp.cc b/Cxx11/transpose-multigpu-dpcpp.cc
index a26244496..215ae23d1 100644
--- a/Cxx11/transpose-multigpu-dpcpp.cc
+++ b/Cxx11/transpose-multigpu-dpcpp.cc
@@ -127,7 +127,7 @@ int main(int argc, char * argv[])
   std::cout << "Number of CPUs and GPUs found  = " << haz_ngpu << std::endl;
 
   if (use_ngpu > haz_ngpu) {
-      std::cout << "You cannot use more GPUs (" << use_ngpu << ") than you have (" << haz_ngpu << ")" << std::endl;
+      std::cout << "You cannot use more CPUs and GPUs (" << use_ngpu << ") than you have (" << haz_ngpu << ")" << std::endl;
   }
 
   int ngpus = use_ngpu;

From 4e818361b966a32117c7e49cc5e23363209ff6ce Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 12:43:44 -0700
Subject: [PATCH 39/66] add fill, cleanup dead code

---
 Cxx11/prk_util.h | 7 ++++---
 1 file changed, 4 insertions(+), 3 deletions(-)

diff --git a/Cxx11/prk_util.h b/Cxx11/prk_util.h
index 176c1186b..98ea627ef 100644
--- a/Cxx11/prk_util.h
+++ b/Cxx11/prk_util.h
@@ -203,20 +203,17 @@ namespace prk {
         public:
 
             vector(size_t n) {
-                //this->data_ = new T[n];
                 this->data_ = prk::malloc<T>(n);
                 this->size_ = n;
             }
 
             vector(size_t n, T v) {
-                //this->data_ = new T[n];
                 this->data_ = prk::malloc<T>(n);
                 for (size_t i=0; i<n; ++i) this->data_[i] = v;
                 this->size_ = n;
             }
 
             ~vector() {
-                //delete[] this->data_;
                 prk::free<T>(this->data_);
             }
 
@@ -258,6 +255,10 @@ namespace prk {
                 return &(this->data_[this->size_]);
             }
 
+            void fill(T v) {
+                for (size_t i=0; i<this->size_; ++i) this->data_[i] = v;
+            }
+
 #if 0
             T & begin() {
                 return this->data_[0];

From 767db07dde49e44b9212025d1b4397473564d3da Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 12:44:12 -0700
Subject: [PATCH 40/66] start decomposition

---
 Cxx11/transpose-multigpu-dpcpp.cc | 15 +++++++++++----
 1 file changed, 11 insertions(+), 4 deletions(-)

diff --git a/Cxx11/transpose-multigpu-dpcpp.cc b/Cxx11/transpose-multigpu-dpcpp.cc
index 215ae23d1..adf6c49b3 100644
--- a/Cxx11/transpose-multigpu-dpcpp.cc
+++ b/Cxx11/transpose-multigpu-dpcpp.cc
@@ -95,10 +95,6 @@ int main(int argc, char * argv[])
     return 1;
   }
 
-  std::cout << "Number of iterations  = " << iterations << std::endl;
-  std::cout << "Matrix order          = " << order << std::endl;
-  std::cout << "Number of GPUs to use = " << use_ngpu << std::endl;
-
   std::vector<sycl::queue> qs;
 
   auto platforms = sycl::platform::get_platforms();
@@ -132,6 +128,17 @@ int main(int argc, char * argv[])
 
   int ngpus = use_ngpu;
 
+  if (order % ngpus != 0) {
+      std::cout << "ERROR: matrix order " << order << " should be divisible by # procs" << ngpus << std::endl;
+      return 2;
+  }
+  size_t block_order = order / ngpus;
+
+  std::cout << "Number of GPUs to use = " << use_ngpu << std::endl;
+  std::cout << "Number of iterations  = " << iterations << std::endl;
+  std::cout << "Matrix order          = " << order << std::endl;
+  std::cout << "Block order           = " << block_order << std::endl;
+
   //////////////////////////////////////////////////////////////////////
   // Allocate space for the input and transpose matrix
   //////////////////////////////////////////////////////////////////////

From 68f1a94a686045775ca394e9d4d9438fc91dc1ee Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 12:44:52 -0700
Subject: [PATCH 41/66] device queues class and related methods

---
 Cxx11/prk_sycl.h | 150 +++++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 150 insertions(+)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index 2335c1c07..599d424c7 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -4,12 +4,17 @@
 #include <cstdlib>
 #include <iostream>
 
+//#include <iterator> // std::distance
+#include <boost/range/adaptor/indexed.hpp>
+
 #include "CL/sycl.hpp"
 
 #ifdef __COMPUTECPP__
 #include "SYCL/experimental/usm.h"
 #endif
 
+#include "prk_util.h" // prk::vector
+
 namespace sycl = cl::sycl;
 
 #ifdef __COMPUTECPP__
@@ -83,6 +88,151 @@ namespace prk {
 #endif
         }
 
+        class queues {
+
+            private:
+                std::vector<sycl::queue> list;
+
+            public:
+                queues(bool use_cpu = true, bool use_gpu = true)
+                {
+                    auto platforms = sycl::platform::get_platforms();
+                    for (auto & p : platforms) {
+                        auto pname = p.get_info<sycl::info::platform::name>();
+                        std::cout << "*Platform: " << pname << std::endl;
+                        if ( pname.find("Level-Zero") != std::string::npos) {
+                            std::cout << "*Level Zero GPU skipped" << std::endl;
+                            break;
+                        }
+                        if ( pname.find("Intel") == std::string::npos) {
+                            std::cout << "*non-Intel skipped" << std::endl;
+                            break;
+                        }
+                        auto devices = p.get_devices();
+                        for (auto & d : devices ) {
+                            std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
+                            if ( d.is_cpu() && use_cpu ) {
+                                std::cout << "**Device is CPU - adding to vector of queues" << std::endl;
+                                list.push_back(sycl::queue(d));
+                            }
+                            if ( d.is_gpu() && use_gpu ) {
+                                std::cout << "**Device is GPU - adding to vector of queues" << std::endl;
+                                list.push_back(sycl::queue(d));
+                            }
+                        }
+                    }
+                }
+
+                int size(void)
+                {
+                    return list.size();
+                }
+
+                void wait(int i)
+                {
+                    list[i].wait();
+                }
+
+                void waitall(void)
+                {
+                    for (auto & i : list) {
+                        i.wait();
+                    }
+                }
+
+                template <typename T>
+                void allocate(std::vector<T*> & device_pointers,
+                              size_t num_elements)
+                {
+                    std::cout << "allocate" << std::endl;
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        device_pointers[i] = syclx::malloc_device<T>(num_elements, v);
+                        std::cout << i << ": " << device_pointers[i] << ", " << num_elements << std::endl;
+                    }
+                }
+
+                template <typename T>
+                void free(std::vector<T*> & device_pointers)
+                {
+                    std::cout << "free" << std::endl;
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        syclx::free(device_pointers[i], v);
+                    }
+                }
+
+                template <typename T>
+                void gather(T * host_pointer,
+                            const std::vector<T*> & device_pointers,
+                            size_t num_elements)
+                {
+                    std::cout << "gather" << std::endl;
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto bytes = num_elements * sizeof(T);
+                        auto target = &host_pointer[i * bytes];
+                        auto source = device_pointers[i];
+                        v.memcpy(target, source, bytes);
+                    }
+                }
+
+                template <typename T>
+                void gather(prk::vector<T> & host_pointer,
+                            const std::vector<T*> & device_pointers,
+                            size_t num_elements)
+                {
+                    std::cout << "gather" << std::endl;
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto bytes = num_elements * sizeof(T);
+                        auto target = &host_pointer[i * bytes];
+                        auto source = device_pointers[i];
+                        v.memcpy(target, source, bytes);
+                    }
+                }
+
+                template <typename T>
+                void scatter(std::vector<T*> & device_pointers,
+                             const T * host_pointer,
+                             size_t num_elements)
+                {
+                    std::cout << "scatter" << std::endl;
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto bytes = num_elements * sizeof(T);
+                        auto target = device_pointers[i];
+                        auto source = &host_pointer[i * bytes];
+                        v.memcpy(target, source, bytes);
+                    }
+                }
+
+                template <typename T>
+                void scatter(std::vector<T*> & device_pointers,
+                             prk::vector<T>  & host_pointer,
+                             size_t num_elements)
+                {
+                    std::cout << "scatter" << std::endl;
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto bytes = num_elements * sizeof(T);
+                        auto target = device_pointers[i];
+                        auto source = &host_pointer[i * bytes];
+                        std::cout << i << ": " << target << ", " << source << std::endl;
+                        v.memcpy(target, source, bytes);
+                    }
+                }
+
+
+
+        };
+
     } // namespace SYCL
 
 } // namespace prk

From 452c0a30c8db5b17be06cee3d5a02301c64b24d1 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 12:45:07 -0700
Subject: [PATCH 42/66] use device queues stuff - currently broken

---
 Cxx11/nstream-multigpu-dpcpp.cc | 148 +++++++++++---------------------
 1 file changed, 50 insertions(+), 98 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 5a717683e..99f5d68a3 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -69,12 +69,14 @@ int main(int argc, char * argv[])
   std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
   std::cout << "C++11/DPC++ STREAM triad: A = B + scalar * C" << std::endl;
 
+  auto qs = prk::SYCL::queues();
+
   //////////////////////////////////////////////////////////////////////
   /// Read and test input parameters
   //////////////////////////////////////////////////////////////////////
 
   int iterations;
-  size_t length;
+  size_t length, local_length;
   int use_ngpu = 1;
   try {
       if (argc < 3) {
@@ -94,48 +96,34 @@ int main(int argc, char * argv[])
       if (argc > 3) {
         use_ngpu = std::atoi(argv[3]);
       }
+      if ( use_ngpu > qs.size() ) {
+          std::string error = "You cannot use more devices ("
+                            + std::to_string(use_ngpu)
+                            + ") than you have ("
+                            + std::to_string(qs.size()) + ")";
+          throw error;
+      }
+
+      if (length % use_ngpu != 0) {
+          std::string error = "ERROR: vector length ("
+                            + std::to_string(length)
+                            + ") should be divisible by # procs ("
+                            + std::to_string(use_ngpu) + ")";
+          throw error;
+      }
+      local_length = length / use_ngpu;
   }
   catch (const char * e) {
     std::cout << e << std::endl;
     return 1;
   }
 
+  std::cout << "Number of devices     = " << use_ngpu << std::endl;
   std::cout << "Number of iterations  = " << iterations << std::endl;
   std::cout << "Vector length         = " << length << std::endl;
-  std::cout << "Number of GPUs to use = " << use_ngpu << std::endl;
-
-  std::vector<sycl::queue> qs;
-
-  auto platforms = sycl::platform::get_platforms();
-  for (auto & p : platforms) {
-    auto pname = p.get_info<sycl::info::platform::name>();
-    std::cout << "*Platform: " << pname << std::endl;
-    if ( pname.find("Level-Zero") != std::string::npos) {
-        std::cout << "*Level Zero GPU skipped" << std::endl;
-        break;
-    }
-    if ( pname.find("Intel") == std::string::npos) {
-        std::cout << "*non-Intel skipped" << std::endl;
-        break;
-    }
-    auto devices = p.get_devices();
-    for (auto & d : devices ) {
-        std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
-        if ( d.is_gpu() || d.is_cpu() ) {
-            std::cout << "**Device is CPU or GPU - adding to vector of queues" << std::endl;
-            qs.push_back(sycl::queue(d));
-        }
-    }
-  }
+  std::cout << "Vector length (local) = " << local_length << std::endl;
 
-  int haz_ngpu = qs.size();
-  std::cout << "Number of CPUs and GPUs found  = " << haz_ngpu << std::endl;
-
-  if (use_ngpu > haz_ngpu) {
-      std::cout << "You cannot use more GPUs (" << use_ngpu << ") than you have (" << haz_ngpu << ")" << std::endl;
-  }
-
-  int ngpus = use_ngpu;
+  int np = use_ngpu;
 
   //////////////////////////////////////////////////////////////////////
   // Allocate space and perform the computation
@@ -143,55 +131,26 @@ int main(int argc, char * argv[])
 
   double nstream_time(0);
 
-  const size_t bytes = length * sizeof(double);
+  auto h_A = prk::vector<double>(length, 0);
+  auto h_B = prk::vector<double>(length, 2);
+  auto h_C = prk::vector<double>(length, 2);
 
-  auto h_A = prk::vector<double>(length);
-  auto h_B = prk::vector<double>(length);
-  auto h_C = prk::vector<double>(length);
+  auto d_A = std::vector<double*> (np, nullptr);
+  auto d_B = std::vector<double*> (np, nullptr);
+  auto d_C = std::vector<double*> (np, nullptr);
 
-  for (size_t i=0; i<length; ++i) {
-    h_A[i] = 0;
-    h_B[i] = 2;
-    h_C[i] = 2;
-  }
+  qs.allocate<double>(d_A, local_length);
+  qs.allocate<double>(d_B, local_length);
+  qs.allocate<double>(d_C, local_length);
+  qs.waitall();
 
-  std::vector<size_t> ls(ngpus,0);
-  {
-      const size_t elements_per_gpu = prk::divceil(length, ngpus);
-      for (int g=0; g<ngpus; ++g) {
-          ls[g] = elements_per_gpu;
-      }
-      if (elements_per_gpu * ngpus > length) {
-          ls[ngpus-1] = length - (ngpus-1) * elements_per_gpu;
-      }
-  }
-
-  auto d_A = std::vector<double*> (ngpus, nullptr);
-  auto d_B = std::vector<double*> (ngpus, nullptr);
-  auto d_C = std::vector<double*> (ngpus, nullptr);
-
-  for (int g=0; g<ngpus; ++g) {
-      auto q = qs[g];
-
-      const auto local_length = ls[g];
-      const auto local_bytes = local_length * sizeof(double);
-
-      d_A[g] = syclx::malloc_device<double>(local_length, q);
-      d_B[g] = syclx::malloc_device<double>(local_length, q);
-      d_C[g] = syclx::malloc_device<double>(local_length, q);
-      q.wait();
-
-      const size_t start = (g>0) ? ls[g-1] : 0;
-      const size_t size  = ls[g] * sizeof(double);
-      q.memcpy(d_A[g], &(h_A[start]), size);
-      q.memcpy(d_B[g], &(h_B[start]), size);
-      q.memcpy(d_C[g], &(h_C[start]), size);
-      q.wait();
-  }
+  qs.scatter<double>(d_A, h_A, local_length);
+  qs.scatter<double>(d_B, h_B, local_length);
+  qs.scatter<double>(d_C, h_C, local_length);
+  qs.waitall();
 
-  for (size_t i=0; i<length; ++i) {
-    h_A[i] = -77777777;
-  }
+  // overwrite host buffer with garbage to detect bugs
+  h_A.fill(-77777777);
 
   const double scalar(3);
   {
@@ -199,14 +158,15 @@ int main(int argc, char * argv[])
 
         if (iter==1) nstream_time = prk::wtime();
 
-        for (int g=0; g<ngpus; ++g) {
-            auto q = qs[g];
+#if 0
+        for (int g=0; g<np; ++g) {
+            auto q = qs.list[g];
 
             auto p_A = d_A[g];
             auto p_B = d_B[g];
             auto p_C = d_C[g];
 
-            const size_t size  = ls[g];
+            const size_t size  = local_length;
 
             q.submit([&](sycl::handler& h) {
               h.parallel_for( sycl::range<1>{size}, [=] (sycl::id<1> i) {
@@ -214,27 +174,19 @@ int main(int argc, char * argv[])
               });
             });
         }
-        for (auto & q : qs) {
-            q.wait();
-        }
+        qs.waitall();
+#endif
       }
       nstream_time = prk::wtime() - nstream_time;
   }
 
-  for (int g=0; g<ngpus; ++g) {
-      auto q = qs[g];
+  qs.gather<double>(h_A, d_A, local_length);
+  qs.waitall();
 
-      const size_t start = (g>0) ? ls[g-1] : 0;
-      const size_t size  = ls[g] * sizeof(double);
-
-      q.memcpy(&(h_A[start]), d_A[g], size);
-      q.wait();
-
-      syclx::free(d_C[g], q);
-      syclx::free(d_B[g], q);
-      syclx::free(d_A[g], q);
-      q.wait();
-  }
+  qs.free(d_A);
+  qs.free(d_B);
+  qs.free(d_C);
+  qs.waitall();
 
   //////////////////////////////////////////////////////////////////////
   /// Analyze and output results

From e068ccfabc0d9be85cfa9a43c88c18f6a637dfdf Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 14:13:26 -0700
Subject: [PATCH 43/66] trying to fix

---
 Cxx11/nstream-multigpu-dpcpp.cc | 119 ++++++++++++++++++++++++--------
 1 file changed, 89 insertions(+), 30 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 99f5d68a3..d06cee517 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -69,7 +69,32 @@ int main(int argc, char * argv[])
   std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
   std::cout << "C++11/DPC++ STREAM triad: A = B + scalar * C" << std::endl;
 
-  auto qs = prk::SYCL::queues();
+  std::vector<sycl::queue> qs;
+
+  auto platforms = sycl::platform::get_platforms();
+  for (auto & p : platforms) {
+    auto pname = p.get_info<sycl::info::platform::name>();
+    std::cout << "*Platform: " << pname << std::endl;
+    if ( pname.find("Level-Zero") != std::string::npos) {
+        std::cout << "*Level Zero GPU skipped" << std::endl;
+        break;
+    }
+    if ( pname.find("Intel") == std::string::npos) {
+        std::cout << "*non-Intel skipped" << std::endl;
+        break;
+    }
+    auto devices = p.get_devices();
+    for (auto & d : devices ) {
+        std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
+        if ( d.is_gpu() || d.is_cpu() ) {
+            std::cout << "**Device is CPU or GPU - adding to vector of queues" << std::endl;
+            qs.push_back(sycl::queue(d));
+        }
+    }
+  }
+
+  int haz_ngpu = qs.size();
+  std::cout << "Number of CPUs and GPUs found  = " << haz_ngpu << std::endl;
 
   //////////////////////////////////////////////////////////////////////
   /// Read and test input parameters
@@ -123,7 +148,7 @@ int main(int argc, char * argv[])
   std::cout << "Vector length         = " << length << std::endl;
   std::cout << "Vector length (local) = " << local_length << std::endl;
 
-  int np = use_ngpu;
+  int ngpus = use_ngpu;
 
   //////////////////////////////////////////////////////////////////////
   // Allocate space and perform the computation
@@ -131,26 +156,53 @@ int main(int argc, char * argv[])
 
   double nstream_time(0);
 
-  auto h_A = prk::vector<double>(length, 0);
-  auto h_B = prk::vector<double>(length, 2);
-  auto h_C = prk::vector<double>(length, 2);
+  auto h_A = prk::vector<double>(length);
+  auto h_B = prk::vector<double>(length);
+  auto h_C = prk::vector<double>(length);
+
+  for (size_t i=0; i<length; ++i) {
+    h_A[i] = 0;
+    h_B[i] = 2;
+    h_C[i] = 2;
+  }
+
+  std::vector<size_t> ls(ngpus,0);
+  {
+      const size_t elements_per_gpu = prk::divceil(length, ngpus);
+      for (int g=0; g<ngpus; ++g) {
+          ls[g] = elements_per_gpu;
+      }
+      if (elements_per_gpu * ngpus > length) {
+          ls[ngpus-1] = length - (ngpus-1) * elements_per_gpu;
+      }
+  }
+
+  auto d_A = std::vector<double*> (ngpus, nullptr);
+  auto d_B = std::vector<double*> (ngpus, nullptr);
+  auto d_C = std::vector<double*> (ngpus, nullptr);
 
-  auto d_A = std::vector<double*> (np, nullptr);
-  auto d_B = std::vector<double*> (np, nullptr);
-  auto d_C = std::vector<double*> (np, nullptr);
+  for (int g=0; g<ngpus; ++g) {
+      auto q = qs[g];
 
-  qs.allocate<double>(d_A, local_length);
-  qs.allocate<double>(d_B, local_length);
-  qs.allocate<double>(d_C, local_length);
-  qs.waitall();
+      const auto local_length = ls[g];
+      const auto local_bytes = local_length * sizeof(double);
 
-  qs.scatter<double>(d_A, h_A, local_length);
-  qs.scatter<double>(d_B, h_B, local_length);
-  qs.scatter<double>(d_C, h_C, local_length);
-  qs.waitall();
+      d_A[g] = syclx::malloc_device<double>(local_length, q);
+      d_B[g] = syclx::malloc_device<double>(local_length, q);
+      d_C[g] = syclx::malloc_device<double>(local_length, q);
+      q.wait();
 
-  // overwrite host buffer with garbage to detect bugs
-  h_A.fill(-77777777);
+      const size_t start = (g>0) ? ls[g-1] : 0;
+      const size_t size  = ls[g] * sizeof(double);
+      q.memcpy(d_A[g], &(h_A[start]), size);
+      q.memcpy(d_B[g], &(h_B[start]), size);
+      q.memcpy(d_C[g], &(h_C[start]), size);
+      q.wait();
+  }
+
+  for (size_t i=0; i<length; ++i) {
+    h_A[i] = -77777777;
+  }
 
   const double scalar(3);
   {
@@ -158,15 +210,14 @@ int main(int argc, char * argv[])
 
         if (iter==1) nstream_time = prk::wtime();
 
-#if 0
-        for (int g=0; g<np; ++g) {
-            auto q = qs.list[g];
+        for (int g=0; g<ngpus; ++g) {
+            auto q = qs[g];
 
             auto p_A = d_A[g];
             auto p_B = d_B[g];
             auto p_C = d_C[g];
 
-            const size_t size  = local_length;
+            const size_t size  = ls[g];
 
             q.submit([&](sycl::handler& h) {
               h.parallel_for( sycl::range<1>{size}, [=] (sycl::id<1> i) {
@@ -174,19 +225,27 @@ int main(int argc, char * argv[])
               });
             });
         }
-        qs.waitall();
-#endif
+        for (auto & q : qs) {
+            q.wait();
+        }
       }
       nstream_time = prk::wtime() - nstream_time;
   }
 
-  qs.gather<double>(h_A, d_A, local_length);
-  qs.waitall();
+  for (int g=0; g<ngpus; ++g) {
+      auto q = qs[g];
+
+      const size_t start = (g>0) ? ls[g-1] : 0;
+      const size_t size  = ls[g] * sizeof(double);
 
-  qs.free(d_A);
-  qs.free(d_B);
-  qs.free(d_C);
-  qs.waitall();
+      q.memcpy(&(h_A[start]), d_A[g], size);
+      q.wait();
+
+      syclx::free(d_C[g], q);
+      syclx::free(d_B[g], q);
+      syclx::free(d_A[g], q);
+      q.wait();
+  }
 
   //////////////////////////////////////////////////////////////////////
   /// Analyze and output results

From fc1a39dfcca5467669fda8bac7803b4bcd02dc09 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 14:13:48 -0700
Subject: [PATCH 44/66] trying to fix

---
 Cxx11/nstream-multigpu-dpcpp.cc | 11 +----------
 1 file changed, 1 insertion(+), 10 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index d06cee517..391b417f5 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -166,16 +166,7 @@ int main(int argc, char * argv[])
     h_C[i] = 2;
   }
 
-  std::vector<size_t> ls(ngpus,0);
-  {
-      const size_t elements_per_gpu = prk::divceil(length, ngpus);
-      for (int g=0; g<ngpus; ++g) {
-          ls[g] = elements_per_gpu;
-      }
-      if (elements_per_gpu * ngpus > length) {
-          ls[ngpus-1] = length - (ngpus-1) * elements_per_gpu;
-      }
-  }
+  std::vector<size_t> ls(ngpus,local_length);
 
   auto d_A = std::vector<double*> (ngpus, nullptr);
   auto d_B = std::vector<double*> (ngpus, nullptr);

From a99fee73722e896f24b0ca53a5809303e8ca7dd6 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 14:15:44 -0700
Subject: [PATCH 45/66] trying to fix

---
 Cxx11/nstream-multigpu-dpcpp.cc | 17 ++++++-----------
 1 file changed, 6 insertions(+), 11 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 391b417f5..b2a981b30 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -156,15 +156,9 @@ int main(int argc, char * argv[])
 
   double nstream_time(0);
 
-  auto h_A = prk::vector<double>(length);
-  auto h_B = prk::vector<double>(length);
-  auto h_C = prk::vector<double>(length);
-
-  for (size_t i=0; i<length; ++i) {
-    h_A[i] = 0;
-    h_B[i] = 2;
-    h_C[i] = 2;
-  }
+  auto h_A = prk::vector<double>(length, 0);
+  auto h_B = prk::vector<double>(length, 2);
+  auto h_C = prk::vector<double>(length, 2);
 
   std::vector<size_t> ls(ngpus,local_length);
 
@@ -225,13 +219,14 @@ int main(int argc, char * argv[])
 
   for (int g=0; g<ngpus; ++g) {
       auto q = qs[g];
-
       const size_t start = (g>0) ? ls[g-1] : 0;
       const size_t size  = ls[g] * sizeof(double);
-
       q.memcpy(&(h_A[start]), d_A[g], size);
       q.wait();
+  }
 
+  for (int g=0; g<ngpus; ++g) {
+      auto q = qs[g];
       syclx::free(d_C[g], q);
       syclx::free(d_B[g], q);
       syclx::free(d_A[g], q);

From ee31d7612a1653d495be101f1f3dd1c0128a3296 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 15:36:08 -0700
Subject: [PATCH 46/66] working with inlined methods

---
 Cxx11/nstream-multigpu-dpcpp.cc | 114 ++++++++++++++++++++++++++------
 1 file changed, 94 insertions(+), 20 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index b2a981b30..716615044 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -148,7 +148,7 @@ int main(int argc, char * argv[])
   std::cout << "Vector length         = " << length << std::endl;
   std::cout << "Vector length (local) = " << local_length << std::endl;
 
-  int ngpus = use_ngpu;
+  int np = use_ngpu;
 
   //////////////////////////////////////////////////////////////////////
   // Allocate space and perform the computation
@@ -160,49 +160,96 @@ int main(int argc, char * argv[])
   auto h_B = prk::vector<double>(length, 2);
   auto h_C = prk::vector<double>(length, 2);
 
-  std::vector<size_t> ls(ngpus,local_length);
+  auto d_A = std::vector<double*> (np, nullptr);
+  auto d_B = std::vector<double*> (np, nullptr);
+  auto d_C = std::vector<double*> (np, nullptr);
 
-  auto d_A = std::vector<double*> (ngpus, nullptr);
-  auto d_B = std::vector<double*> (ngpus, nullptr);
-  auto d_C = std::vector<double*> (ngpus, nullptr);
-
-  for (int g=0; g<ngpus; ++g) {
+#if 0
+  for (int g=0; g<np; ++g) {
       auto q = qs[g];
-
-      const auto local_length = ls[g];
       const auto local_bytes = local_length * sizeof(double);
-
       d_A[g] = syclx::malloc_device<double>(local_length, q);
       d_B[g] = syclx::malloc_device<double>(local_length, q);
       d_C[g] = syclx::malloc_device<double>(local_length, q);
       q.wait();
+  }
+#else
+  auto list(qs);
+  for (const auto & l : list | boost::adaptors::indexed(0) ) {
+      auto i = l.index();
+      auto v = l.value();
+      d_A[i] = syclx::malloc_device<double>(local_length, v);
+      d_B[i] = syclx::malloc_device<double>(local_length, v);
+      d_C[i] = syclx::malloc_device<double>(local_length, v);
+  }
+  for (auto & i : list) {
+      i.wait();
+  }
+#endif
 
-      const size_t start = (g>0) ? ls[g-1] : 0;
-      const size_t size  = ls[g] * sizeof(double);
+#if 0
+  for (int g=0; g<np; ++g) {
+      auto q = qs[g];
+      const size_t start = local_length * g;
+      const size_t size  = local_length * sizeof(double);
       q.memcpy(d_A[g], &(h_A[start]), size);
       q.memcpy(d_B[g], &(h_B[start]), size);
       q.memcpy(d_C[g], &(h_C[start]), size);
-      q.wait();
   }
-
-  for (size_t i=0; i<length; ++i) {
-    h_A[i] = -77777777;
+#elif 0
+  for (const auto & l : list | boost::adaptors::indexed(0) ) {
+      auto i = l.index();
+      auto v = l.value();
+      auto start = local_length * i;
+      auto bytes = local_length * sizeof(double);
+      v.memcpy(d_A[i], &(h_A[start]), bytes);
+      v.memcpy(d_B[i], &(h_B[start]), bytes);
+      v.memcpy(d_C[i], &(h_C[start]), bytes);
+  }
+#else
+  for (const auto & l : list | boost::adaptors::indexed(0) ) {
+      auto i = l.index();
+      auto v = l.value();
+      auto bytes = local_length * sizeof(double);
+      auto start = local_length * i;
+      {
+          auto target = d_A[i];
+          auto source = &h_A[i * local_length];
+          v.memcpy(target, source, bytes);
+      }
+      {
+          auto target = d_B[i];
+          auto source = &h_B[i * local_length];
+          v.memcpy(target, source, bytes);
+      }
+      {
+          auto target = d_C[i];
+          auto source = &h_C[i * local_length];
+          v.memcpy(target, source, bytes);
+      }
+  }
+#endif
+  for (auto & i : list) {
+      i.wait();
   }
 
+  // overwrite host buffer with garbage to detect bugs
+  h_A.fill(-77777777);
+
   const double scalar(3);
   {
       for (int iter = 0; iter<=iterations; iter++) {
 
         if (iter==1) nstream_time = prk::wtime();
 
-        for (int g=0; g<ngpus; ++g) {
+        for (int g=0; g<np; ++g) {
             auto q = qs[g];
 
             auto p_A = d_A[g];
             auto p_B = d_B[g];
             auto p_C = d_C[g];
 
-            const size_t size  = ls[g];
+            const size_t size  = local_length;
 
             q.submit([&](sycl::handler& h) {
               h.parallel_for( sycl::range<1>{size}, [=] (sycl::id<1> i) {
@@ -217,19 +264,46 @@ int main(int argc, char * argv[])
       nstream_time = prk::wtime() - nstream_time;
   }
 
-  for (int g=0; g<ngpus; ++g) {
+#if 0
+  std::vector<size_t> ls(np,local_length);
+  for (int g=0; g<np; ++g) {
       auto q = qs[g];
       const size_t start = (g>0) ? ls[g-1] : 0;
       const size_t size  = ls[g] * sizeof(double);
       q.memcpy(&(h_A[start]), d_A[g], size);
+  }
+#else
+  for (const auto & l : list | boost::adaptors::indexed(0) ) {
+      auto i = l.index();
+      auto v = l.value();
+      auto bytes = local_length * sizeof(double);
+      auto start = local_length * i;
+      auto target = &h_A[i * local_length];
+      auto source = d_A[i];
+      v.memcpy(target, source, bytes);
+  }
+#endif
+  for (auto & q : qs) {
       q.wait();
   }
 
-  for (int g=0; g<ngpus; ++g) {
+#if 0
+  for (int g=0; g<np; ++g) {
       auto q = qs[g];
       syclx::free(d_C[g], q);
       syclx::free(d_B[g], q);
       syclx::free(d_A[g], q);
+  }
+#else
+  for (const auto & l : list | boost::adaptors::indexed(0) ) {
+      auto i = l.index();
+      auto v = l.value();
+      syclx::free(d_A[i], v);
+      syclx::free(d_B[i], v);
+      syclx::free(d_C[i], v);
+  }
+#endif
+  for (auto & q : qs) {
       q.wait();
   }
 

From 4fe3b65a331910debef6b29426e56555b7e23935 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 15:36:17 -0700
Subject: [PATCH 47/66] working with inlined methods

---
 Cxx11/nstream-multigpu-dpcpp.cc | 10 ----------
 1 file changed, 10 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 716615044..3f9bc9489 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -264,15 +264,6 @@ int main(int argc, char * argv[])
       nstream_time = prk::wtime() - nstream_time;
   }
 
-#if 0
-  std::vector<size_t> ls(np,local_length);
-  for (int g=0; g<np; ++g) {
-      auto q = qs[g];
-      const size_t start = (g>0) ? ls[g-1] : 0;
-      const size_t size  = ls[g] * sizeof(double);
-      q.memcpy(&(h_A[start]), d_A[g], size);
-  }
-#else
   for (const auto & l : list | boost::adaptors::indexed(0) ) {
       auto i = l.index();
       auto v = l.value();
@@ -282,7 +273,6 @@ int main(int argc, char * argv[])
       auto source = d_A[i];
       v.memcpy(target, source, bytes);
   }
-#endif
   for (auto & q : qs) {
       q.wait();
   }

From 63b2d557398e31fe68a5d03aa0d97aab1868977c Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 15:39:15 -0700
Subject: [PATCH 48/66] cleaned up

---
 Cxx11/nstream-multigpu-dpcpp.cc | 43 +--------------------------------
 1 file changed, 1 insertion(+), 42 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 3f9bc9489..876c07d6b 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -164,16 +164,6 @@ int main(int argc, char * argv[])
   auto d_B = std::vector<double*> (np, nullptr);
   auto d_C = std::vector<double*> (np, nullptr);
 
-#if 0
-  for (int g=0; g<np; ++g) {
-      auto q = qs[g];
-      const auto local_bytes = local_length * sizeof(double);
-      d_A[g] = syclx::malloc_device<double>(local_length, q);
-      d_B[g] = syclx::malloc_device<double>(local_length, q);
-      d_C[g] = syclx::malloc_device<double>(local_length, q);
-      q.wait();
-  }
-#else
   auto list(qs);
   for (const auto & l : list | boost::adaptors::indexed(0) ) {
       auto i = l.index();
@@ -185,28 +175,7 @@ int main(int argc, char * argv[])
   for (auto & i : list) {
       i.wait();
   }
-#endif
-
-#if 0
-  for (int g=0; g<np; ++g) {
-      auto q = qs[g];
-      const size_t start = local_length * g;
-      const size_t size  = local_length * sizeof(double);
-      q.memcpy(d_A[g], &(h_A[start]), size);
-      q.memcpy(d_B[g], &(h_B[start]), size);
-      q.memcpy(d_C[g], &(h_C[start]), size);
-  }
-#elif 0
-  for (const auto & l : list | boost::adaptors::indexed(0) ) {
-      auto i = l.index();
-      auto v = l.value();
-      auto start = local_length * i;
-      auto bytes = local_length * sizeof(double);
-      v.memcpy(d_A[i], &(h_A[start]), bytes);
-      v.memcpy(d_B[i], &(h_B[start]), bytes);
-      v.memcpy(d_C[i], &(h_C[start]), bytes);
-  }
-#else
+
   for (const auto & l : list | boost::adaptors::indexed(0) ) {
       auto i = l.index();
       auto v = l.value();
@@ -228,7 +197,6 @@ int main(int argc, char * argv[])
           v.memcpy(target, source, bytes);
       }
   }
-#endif
   for (auto & i : list) {
       i.wait();
   }
@@ -277,14 +245,6 @@ int main(int argc, char * argv[])
       q.wait();
   }
 
-#if 0
-  for (int g=0; g<np; ++g) {
-      auto q = qs[g];
-      syclx::free(d_C[g], q);
-      syclx::free(d_B[g], q);
-      syclx::free(d_A[g], q);
-  }
-#else
   for (const auto & l : list | boost::adaptors::indexed(0) ) {
       auto i = l.index();
       auto v = l.value();
@@ -292,7 +252,6 @@ int main(int argc, char * argv[])
       syclx::free(d_B[i], v);
       syclx::free(d_C[i], v);
   }
-#endif
   for (auto & q : qs) {
       q.wait();
   }

From 069ceaeda959f51532971890fe104cb3a8ceaa27 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 15:39:18 -0700
Subject: [PATCH 49/66] cleaned up

---
 Cxx11/prk_sycl.h | 4 ++++
 1 file changed, 4 insertions(+)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index 599d424c7..94f8de9d7 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -164,6 +164,7 @@ namespace prk {
                     }
                 }
 
+#if 0
                 template <typename T>
                 void gather(T * host_pointer,
                             const std::vector<T*> & device_pointers,
@@ -179,6 +180,7 @@ namespace prk {
                         v.memcpy(target, source, bytes);
                     }
                 }
+#endif
 
                 template <typename T>
                 void gather(prk::vector<T> & host_pointer,
@@ -196,6 +198,7 @@ namespace prk {
                     }
                 }
 
+#if 0
                 template <typename T>
                 void scatter(std::vector<T*> & device_pointers,
                              const T * host_pointer,
@@ -211,6 +214,7 @@ namespace prk {
                         v.memcpy(target, source, bytes);
                     }
                 }
+#endif
 
                 template <typename T>
                 void scatter(std::vector<T*> & device_pointers,

From af851be66c170b0a52142db48580ca5e401e2e6a Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 16:49:49 -0700
Subject: [PATCH 50/66] fixed bugs

---
 Cxx11/prk_sycl.h | 50 ++++++------------------------------------------
 1 file changed, 6 insertions(+), 44 deletions(-)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index 94f8de9d7..ec61f0679 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -140,23 +140,24 @@ namespace prk {
                     }
                 }
 
+                sycl::queue queue(int i) {
+                    return this->list[i];
+                }
+
                 template <typename T>
                 void allocate(std::vector<T*> & device_pointers,
                               size_t num_elements)
                 {
-                    std::cout << "allocate" << std::endl;
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
                         device_pointers[i] = syclx::malloc_device<T>(num_elements, v);
-                        std::cout << i << ": " << device_pointers[i] << ", " << num_elements << std::endl;
                     }
                 }
 
                 template <typename T>
                 void free(std::vector<T*> & device_pointers)
                 {
-                    std::cout << "free" << std::endl;
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
@@ -164,71 +165,32 @@ namespace prk {
                     }
                 }
 
-#if 0
-                template <typename T>
-                void gather(T * host_pointer,
-                            const std::vector<T*> & device_pointers,
-                            size_t num_elements)
-                {
-                    std::cout << "gather" << std::endl;
-                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
-                        auto i = l.index();
-                        auto v = l.value();
-                        auto bytes = num_elements * sizeof(T);
-                        auto target = &host_pointer[i * bytes];
-                        auto source = device_pointers[i];
-                        v.memcpy(target, source, bytes);
-                    }
-                }
-#endif
-
                 template <typename T>
                 void gather(prk::vector<T> & host_pointer,
                             const std::vector<T*> & device_pointers,
                             size_t num_elements)
                 {
-                    std::cout << "gather" << std::endl;
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
                         auto bytes = num_elements * sizeof(T);
-                        auto target = &host_pointer[i * bytes];
+                        auto target = &host_pointer[i * num_elements];
                         auto source = device_pointers[i];
                         v.memcpy(target, source, bytes);
                     }
                 }
 
-#if 0
-                template <typename T>
-                void scatter(std::vector<T*> & device_pointers,
-                             const T * host_pointer,
-                             size_t num_elements)
-                {
-                    std::cout << "scatter" << std::endl;
-                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
-                        auto i = l.index();
-                        auto v = l.value();
-                        auto bytes = num_elements * sizeof(T);
-                        auto target = device_pointers[i];
-                        auto source = &host_pointer[i * bytes];
-                        v.memcpy(target, source, bytes);
-                    }
-                }
-#endif
-
                 template <typename T>
                 void scatter(std::vector<T*> & device_pointers,
                              prk::vector<T>  & host_pointer,
                              size_t num_elements)
                 {
-                    std::cout << "scatter" << std::endl;
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
                         auto bytes = num_elements * sizeof(T);
                         auto target = device_pointers[i];
-                        auto source = &host_pointer[i * bytes];
-                        std::cout << i << ": " << target << ", " << source << std::endl;
+                        auto source = &host_pointer[i * num_elements];
                         v.memcpy(target, source, bytes);
                     }
                 }

From 45c3a0bba43ff2a979e97cd8a4471ffaa4e34140 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 16:49:58 -0700
Subject: [PATCH 51/66] working but to be replaced

---
 Cxx11/nstream-multigpu-dpcpp.cc | 2 --
 1 file changed, 2 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 876c07d6b..2ab474853 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -180,7 +180,6 @@ int main(int argc, char * argv[])
       auto i = l.index();
       auto v = l.value();
       auto bytes = local_length * sizeof(double);
-      auto start = local_length * i;
       {
           auto target = d_A[i];
           auto source = &h_A[i * local_length];
@@ -236,7 +235,6 @@ int main(int argc, char * argv[])
       auto i = l.index();
       auto v = l.value();
       auto bytes = local_length * sizeof(double);
-      auto start = local_length * i;
       auto target = &h_A[i * local_length];
       auto source = d_A[i];
       v.memcpy(target, source, bytes);

From aac97680b2d67f10169f0364136f3b3a5284fb99 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Tue, 21 Jul 2020 16:50:50 -0700
Subject: [PATCH 52/66] working

---
 Cxx11/nstream-multigpu-dpcpp.cc | 104 ++++++--------------------------
 1 file changed, 19 insertions(+), 85 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 2ab474853..3de7a5d01 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -69,32 +69,7 @@ int main(int argc, char * argv[])
   std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
   std::cout << "C++11/DPC++ STREAM triad: A = B + scalar * C" << std::endl;
 
-  std::vector<sycl::queue> qs;
-
-  auto platforms = sycl::platform::get_platforms();
-  for (auto & p : platforms) {
-    auto pname = p.get_info<sycl::info::platform::name>();
-    std::cout << "*Platform: " << pname << std::endl;
-    if ( pname.find("Level-Zero") != std::string::npos) {
-        std::cout << "*Level Zero GPU skipped" << std::endl;
-        break;
-    }
-    if ( pname.find("Intel") == std::string::npos) {
-        std::cout << "*non-Intel skipped" << std::endl;
-        break;
-    }
-    auto devices = p.get_devices();
-    for (auto & d : devices ) {
-        std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
-        if ( d.is_gpu() || d.is_cpu() ) {
-            std::cout << "**Device is CPU or GPU - adding to vector of queues" << std::endl;
-            qs.push_back(sycl::queue(d));
-        }
-    }
-  }
-
-  int haz_ngpu = qs.size();
-  std::cout << "Number of CPUs and GPUs found  = " << haz_ngpu << std::endl;
+  auto qs = prk::SYCL::queues();
 
   //////////////////////////////////////////////////////////////////////
   /// Read and test input parameters
@@ -164,41 +139,15 @@ int main(int argc, char * argv[])
   auto d_B = std::vector<double*> (np, nullptr);
   auto d_C = std::vector<double*> (np, nullptr);
 
-  auto list(qs);
-  for (const auto & l : list | boost::adaptors::indexed(0) ) {
-      auto i = l.index();
-      auto v = l.value();
-      d_A[i] = syclx::malloc_device<double>(local_length, v);
-      d_B[i] = syclx::malloc_device<double>(local_length, v);
-      d_C[i] = syclx::malloc_device<double>(local_length, v);
-  }
-  for (auto & i : list) {
-      i.wait();
-  }
+  qs.allocate<double>(d_A, local_length);
+  qs.allocate<double>(d_B, local_length);
+  qs.allocate<double>(d_C, local_length);
+  qs.waitall();
 
-  for (const auto & l : list | boost::adaptors::indexed(0) ) {
-      auto i = l.index();
-      auto v = l.value();
-      auto bytes = local_length * sizeof(double);
-      {
-          auto target = d_A[i];
-          auto source = &h_A[i * local_length];
-          v.memcpy(target, source, bytes);
-      }
-      {
-          auto target = d_B[i];
-          auto source = &h_B[i * local_length];
-          v.memcpy(target, source, bytes);
-      }
-      {
-          auto target = d_C[i];
-          auto source = &h_C[i * local_length];
-          v.memcpy(target, source, bytes);
-      }
-  }
-  for (auto & i : list) {
-      i.wait();
-  }
+  qs.scatter<double>(d_A, h_A, local_length);
+  qs.scatter<double>(d_B, h_B, local_length);
+  qs.scatter<double>(d_C, h_C, local_length);
+  qs.waitall();
 
   // overwrite host buffer with garbage to detect bugs
   h_A.fill(-77777777);
@@ -209,8 +158,9 @@ int main(int argc, char * argv[])
 
         if (iter==1) nstream_time = prk::wtime();
 
+#if 1
         for (int g=0; g<np; ++g) {
-            auto q = qs[g];
+            auto q = qs.queue(g);
 
             auto p_A = d_A[g];
             auto p_B = d_B[g];
@@ -224,35 +174,19 @@ int main(int argc, char * argv[])
               });
             });
         }
-        for (auto & q : qs) {
-            q.wait();
-        }
+        qs.waitall();
+#endif
       }
       nstream_time = prk::wtime() - nstream_time;
   }
 
-  for (const auto & l : list | boost::adaptors::indexed(0) ) {
-      auto i = l.index();
-      auto v = l.value();
-      auto bytes = local_length * sizeof(double);
-      auto target = &h_A[i * local_length];
-      auto source = d_A[i];
-      v.memcpy(target, source, bytes);
-  }
-  for (auto & q : qs) {
-      q.wait();
-  }
+  qs.gather<double>(h_A, d_A, local_length);
+  qs.waitall();
 
-  for (const auto & l : list | boost::adaptors::indexed(0) ) {
-      auto i = l.index();
-      auto v = l.value();
-      syclx::free(d_A[i], v);
-      syclx::free(d_B[i], v);
-      syclx::free(d_C[i], v);
-  }
-  for (auto & q : qs) {
-      q.wait();
-  }
+  qs.free(d_A);
+  qs.free(d_B);
+  qs.free(d_C);
+  qs.waitall();
 
   //////////////////////////////////////////////////////////////////////
   /// Analyze and output results

From 02591d6bbdbbf5df7d5bdf46474fb056a9ef6c5f Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Wed, 22 Jul 2020 08:46:23 -0700
Subject: [PATCH 53/66] fix input helper comment

---
 Cxx11/nstream-dpcpp.cc | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/Cxx11/nstream-dpcpp.cc b/Cxx11/nstream-dpcpp.cc
index e72a14cd5..268ab4b23 100644
--- a/Cxx11/nstream-dpcpp.cc
+++ b/Cxx11/nstream-dpcpp.cc
@@ -77,7 +77,7 @@ int main(int argc, char * argv[])
   size_t length;
   try {
       if (argc < 3) {
-        throw "Usage: <# iterations> <vector length> [<grid_stride>]";
+        throw "Usage: <# iterations> <vector length>";
       }
 
       iterations  = std::atoi(argv[1]);

From f01342163b6da74bace01c58596e8fd990865737 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Wed, 22 Jul 2020 09:02:37 -0700
Subject: [PATCH 54/66] add broadcast and reduce (unused and untested)

---
 Cxx11/prk_sycl.h | 45 ++++++++++++++++++++++++++++++++++++++++-----
 1 file changed, 40 insertions(+), 5 deletions(-)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index ec61f0679..6e4356ab6 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -165,8 +165,44 @@ namespace prk {
                     }
                 }
 
-                template <typename T>
-                void gather(prk::vector<T> & host_pointer,
+                // UNUSED and UNTESTED
+                template <typename T, typename B>
+                void broadcast(std::vector<T*> & device_pointers,
+                               const B & host_pointer,
+                               size_t num_elements)
+                {
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto bytes = num_elements * sizeof(T);
+                        auto target = device_pointers[i];
+                        auto source = &host_pointer[0];
+                        v.memcpy(target, source, bytes);
+                    }
+                }
+
+                // UNUSED and UNTESTED
+                template <typename T, typename B, typename Op>
+                void reduce(B & host_pointer,
+                            const std::vector<T*> & device_pointers,
+                            size_t num_elements)
+                {
+                    auto temp = std::vector<T>(num_elements, 0);
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto bytes = num_elements * sizeof(T);
+                        auto target = device_pointers[i];
+                        auto source = &host_pointer[0];
+                        v.memcpy(temp, source, bytes);
+                        for (size_t e=0; e<num_elements; ++e) {
+                            target[e] = Op{}( target[e], temp[e] );
+                        }
+                    }
+                }
+
+                template <typename T, typename B>
+                void gather(B & host_pointer,
                             const std::vector<T*> & device_pointers,
                             size_t num_elements)
                 {
@@ -180,9 +216,9 @@ namespace prk {
                     }
                 }
 
-                template <typename T>
+                template <typename T, typename B>
                 void scatter(std::vector<T*> & device_pointers,
-                             prk::vector<T>  & host_pointer,
+                             const B & host_pointer,
                              size_t num_elements)
                 {
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
@@ -196,7 +232,6 @@ namespace prk {
                 }
 
 
-
         };
 
     } // namespace SYCL

From e0fe457d61db6d8fe18c31775bfb5cbe69604aa6 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Fri, 24 Jul 2020 11:17:16 -0700
Subject: [PATCH 55/66] remove unnecessary preprocessor

---
 Cxx11/nstream-multigpu-dpcpp.cc | 2 --
 1 file changed, 2 deletions(-)

diff --git a/Cxx11/nstream-multigpu-dpcpp.cc b/Cxx11/nstream-multigpu-dpcpp.cc
index 3de7a5d01..315fca060 100644
--- a/Cxx11/nstream-multigpu-dpcpp.cc
+++ b/Cxx11/nstream-multigpu-dpcpp.cc
@@ -158,7 +158,6 @@ int main(int argc, char * argv[])
 
         if (iter==1) nstream_time = prk::wtime();
 
-#if 1
         for (int g=0; g<np; ++g) {
             auto q = qs.queue(g);
 
@@ -175,7 +174,6 @@ int main(int argc, char * argv[])
             });
         }
         qs.waitall();
-#endif
       }
       nstream_time = prk::wtime() - nstream_time;
   }

From f5c510de7275f694a9173d080018c7301f976d19 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Fri, 24 Jul 2020 12:30:26 -0700
Subject: [PATCH 56/66] remove 2D indexing code that won't work with USM

---
 Cxx11/transpose-dpcpp.cc | 7 -------
 1 file changed, 7 deletions(-)

diff --git a/Cxx11/transpose-dpcpp.cc b/Cxx11/transpose-dpcpp.cc
index 2dec847f9..6d742f1bf 100644
--- a/Cxx11/transpose-dpcpp.cc
+++ b/Cxx11/transpose-dpcpp.cc
@@ -123,15 +123,8 @@ int main(int argc, char * argv[])
       q.submit([&](sycl::handler& h) {
 
         h.parallel_for( sycl::range<2>{order,order}, [=] (sycl::id<2> it) {
-#if USE_2D_INDEXING
-          sycl::id<2> ij{it[0],it[1]};
-          sycl::id<2> ji{it[1],it[0]};
-          B[ij] += A[ji];
-          A[ji] += (T)1;
-#else
           B[it[0] * order + it[1]] += A[it[1] * order + it[0]];
           A[it[1] * order + it[0]] += 1.0;
-#endif
         });
       });
       q.wait();

From 76a8bd5484a5a870e096fffcd8b669d84836ab74 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Fri, 24 Jul 2020 12:30:34 -0700
Subject: [PATCH 57/66] fix a bunch of problems

---
 Cxx11/transpose-multigpu-dpcpp.cc | 123 +++++++++++++-----------------
 1 file changed, 51 insertions(+), 72 deletions(-)

diff --git a/Cxx11/transpose-multigpu-dpcpp.cc b/Cxx11/transpose-multigpu-dpcpp.cc
index adf6c49b3..ef055bece 100644
--- a/Cxx11/transpose-multigpu-dpcpp.cc
+++ b/Cxx11/transpose-multigpu-dpcpp.cc
@@ -57,12 +57,14 @@ int main(int argc, char * argv[])
   std::cout << "Parallel Research Kernels version " << PRKVERSION << std::endl;
   std::cout << "C++11/DPCT Matrix transpose: B = A^T" << std::endl;
 
+  auto qs = prk::SYCL::queues();
+
   //////////////////////////////////////////////////////////////////////
   /// Read and test input parameters
   //////////////////////////////////////////////////////////////////////
 
   int iterations;
-  size_t order;
+  size_t order, block_order;
   int use_ngpu = 1;
   try {
       if (argc < 3) {
@@ -84,61 +86,35 @@ int main(int argc, char * argv[])
       if (argc > 3) {
         use_ngpu = std::atoi(argv[3]);
       }
+      if ( use_ngpu > qs.size() ) {
+          std::string error = "You cannot use more devices ("
+                            + std::to_string(use_ngpu)
+                            + ") than you have ("
+                            + std::to_string(qs.size()) + ")";
+          throw error;
+      }
 
-      if (order % use_ngpu) {
-        std::cerr << "order = " << order << ", device count = " << use_ngpu << std::endl;
-        throw "ERROR: matrix order should be divisible by device count!";
+      if (order % use_ngpu != 0) {
+          std::string error = "ERROR: matrix order ("
+                            + std::to_string(order)
+                            + ") should be divisible by # procs ("
+                            + std::to_string(use_ngpu) + ")";
+          throw error;
       }
+      block_order = order / use_ngpu;
   }
   catch (const char * e) {
     std::cout << e << std::endl;
     return 1;
   }
 
-  std::vector<sycl::queue> qs;
-
-  auto platforms = sycl::platform::get_platforms();
-  for (auto & p : platforms) {
-    auto pname = p.get_info<sycl::info::platform::name>();
-    std::cout << "*Platform: " << pname << std::endl;
-    if ( pname.find("Level-Zero") != std::string::npos) {
-        std::cout << "*Level Zero GPU skipped" << std::endl;
-        break;
-    }
-    if ( pname.find("Intel") == std::string::npos) {
-        std::cout << "*non-Intel skipped" << std::endl;
-        break;
-    }
-    auto devices = p.get_devices();
-    for (auto & d : devices ) {
-        std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
-        if ( d.is_gpu() || d.is_cpu() ) {
-            std::cout << "**Device is CPU or GPU - adding to vector of queues" << std::endl;
-            qs.push_back(sycl::queue(d));
-        }
-    }
-  }
-
-  int haz_ngpu = qs.size();
-  std::cout << "Number of CPUs and GPUs found  = " << haz_ngpu << std::endl;
-
-  if (use_ngpu > haz_ngpu) {
-      std::cout << "You cannot use more CPUs and GPUs (" << use_ngpu << ") than you have (" << haz_ngpu << ")" << std::endl;
-  }
-
-  int ngpus = use_ngpu;
-
-  if (order % ngpus != 0) {
-      std::cout << "ERROR: matrix order " << order << " should be divisible by # procs" << ngpus << std::endl;
-      return 2;
-  }
-  size_t block_order = order / ngpus;
-
-  std::cout << "Number of GPUs to use = " << use_ngpu << std::endl;
+  std::cout << "Number of devices     = " << use_ngpu << std::endl;
   std::cout << "Number of iterations  = " << iterations << std::endl;
   std::cout << "Matrix order          = " << order << std::endl;
   std::cout << "Block order           = " << block_order << std::endl;
 
+  int np = use_ngpu;
+
   //////////////////////////////////////////////////////////////////////
   // Allocate space for the input and transpose matrix
   //////////////////////////////////////////////////////////////////////
@@ -156,42 +132,48 @@ int main(int argc, char * argv[])
     }
   }
 
-  const size_t bytes = order * order * sizeof(double);
+  auto d_a = std::vector<double*> (np, nullptr);
+  auto d_b = std::vector<double*> (np, nullptr);
+
+  qs.allocate<double>(d_a, order * block_order);
+  qs.allocate<double>(d_b, order * block_order);
+  qs.waitall();
 
-  // copy input from host to device
-  double * A = syclx::malloc_device<double>(order * order, q);
-  double * B = syclx::malloc_device<double>(order * order, q);
-  q.memcpy(A, &(h_a[0]), bytes);
-  q.memcpy(B, &(h_b[0]), bytes);
-  q.wait();
+  qs.scatter<double>(d_a, h_a, order * block_order);
+  qs.scatter<double>(d_b, h_b, order * block_order);
+  qs.waitall();
+
+  // overwrite host buffer with garbage to detect bugs
+  h_a.fill(-77777777);
 
   for (int iter = 0; iter<=iterations; iter++) {
 
       if (iter==1) trans_time = prk::wtime();
 
-      q.submit([&](sycl::handler& h) {
-
-        h.parallel_for( sycl::range<2>{order,order}, [=] (sycl::id<2> it) {
-#if USE_2D_INDEXING
-          sycl::id<2> ij{it[0],it[1]};
-          sycl::id<2> ji{it[1],it[0]};
-          B[ij] += A[ji];
-          A[ji] += (T)1;
-#else
-          B[it[0] * order + it[1]] += A[it[1] * order + it[0]];
-          A[it[1] * order + it[0]] += 1.0;
-#endif
-        });
-      });
-      q.wait();
+      for (int g=0; g<np; ++g) {
+          auto q = qs.queue(g);
+
+          auto A = d_a[g];
+          auto B = d_b[g];
+
+          q.submit([&](sycl::handler& h) {
+            h.parallel_for( sycl::range<2>{order,order}, [=] (sycl::id<2> it) {
+              B[it[0] * order + it[1]] += A[it[1] * order + it[0]];
+              A[it[1] * order + it[0]] += 1.0;
+            });
+          });
+      }
+      qs.waitall();
   }
   trans_time = prk::wtime() - trans_time;
 
   // copy output back to host
-  q.memcpy(&(h_b[0]), B, bytes).wait();
+  qs.gather<double>(h_a, d_a, order * block_order);
+  qs.waitall();
 
-  syclx::free(B, q);
-  syclx::free(A, q);
+  qs.free(d_a);
+  qs.free(d_b);
+  qs.waitall();
 
   //////////////////////////////////////////////////////////////////////
   /// Analyze and output results
@@ -208,9 +190,6 @@ int main(int argc, char * argv[])
     }
   }
 
-  syclx::free(h_b, q);
-  syclx::free(h_a, q);
-
   const auto epsilon = 1.0e-8;
   if (abserr < epsilon) {
     std::cout << "Solution validates" << std::endl;

From b5666fde38b1e4fca2b57523e99fed339793316e Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Sun, 26 Jul 2020 08:46:16 -0700
Subject: [PATCH 58/66] need a unit test for the collectives...

---
 Cxx11/test_dpcpp_collectives.cc | 135 ++++++++++++++++++++++++++++++++
 1 file changed, 135 insertions(+)
 create mode 100644 Cxx11/test_dpcpp_collectives.cc

diff --git a/Cxx11/test_dpcpp_collectives.cc b/Cxx11/test_dpcpp_collectives.cc
new file mode 100644
index 000000000..4a1472a44
--- /dev/null
+++ b/Cxx11/test_dpcpp_collectives.cc
@@ -0,0 +1,135 @@
+///
+/// Copyright (c) 2020, Intel Corporation
+///
+/// Redistribution and use in source and binary forms, with or without
+/// modification, are permitted provided that the following conditions
+/// are met:
+///
+/// * Redistributions of source code must retain the above copyright
+///       notice, this list of conditions and the following disclaimer.
+/// * Redistributions in binary form must reproduce the above
+///       copyright notice, this list of conditions and the following
+///       disclaimer in the documentation and/or other materials provided
+///       with the distribution.
+/// * Neither the name of Intel Corporation nor the names of its
+///       contributors may be used to endorse or promote products
+///       derived from this software without specific prior written
+///       permission.
+///
+/// THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
+/// "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
+/// LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
+/// FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE
+/// COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
+/// INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+/// BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
+/// LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER
+/// CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
+/// LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN
+/// ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
+/// POSSIBILITY OF SUCH DAMAGE.
+
+#include "prk_sycl.h"
+#include "prk_util.h"
+
+int main(int argc, char * argv[])
+{
+  auto qs = prk::SYCL::queues();
+
+  size_t length, local_length;
+  int use_ngpu = 1;
+  try {
+      if (argc < 2) {
+        throw "Usage: <vector length> [<use_ngpu>]";
+      }
+
+      length = std::atoi(argv[2]);
+      if (length <= 0) {
+        throw "ERROR: vector length must be positive";
+      }
+
+      if (argc > 3) {
+        use_ngpu = std::atoi(argv[3]);
+      }
+      if ( use_ngpu > qs.size() ) {
+          std::string error = "You cannot use more devices ("
+                            + std::to_string(use_ngpu)
+                            + ") than you have ("
+                            + std::to_string(qs.size()) + ")";
+          throw error;
+      }
+
+      if (length % use_ngpu != 0) {
+          std::string error = "ERROR: vector length ("
+                            + std::to_string(length)
+                            + ") should be divisible by # procs ("
+                            + std::to_string(use_ngpu) + ")";
+          throw error;
+      }
+      local_length = length / use_ngpu;
+  }
+  catch (const char * e) {
+    std::cout << e << std::endl;
+    return 1;
+  }
+
+  std::cout << "Number of devices     = " << use_ngpu << std::endl;
+  std::cout << "Vector length         = " << length << std::endl;
+  std::cout << "Vector length (local) = " << local_length << std::endl;
+
+  int np = use_ngpu;
+
+  auto h_A = prk::vector<double>(length, 0);
+  auto h_B = prk::vector<double>(length, 2);
+
+  auto d_A = std::vector<double*> (np, nullptr);
+  auto d_B = std::vector<double*> (np, nullptr);
+
+  qs.allocate<double>(d_A, local_length);
+  qs.allocate<double>(d_B, local_length);
+  qs.waitall();
+
+  qs.scatter<double>(d_A, h_A, local_length);
+  qs.scatter<double>(d_B, h_B, local_length);
+  qs.waitall();
+
+  // overwrite host buffer with garbage to detect bugs
+  h_A.fill(-77777777);
+
+  const double scalar(3);
+  {
+      for (int iter = 0; iter<=iterations; iter++) {
+
+        if (iter==1) nstream_time = prk::wtime();
+
+        for (int g=0; g<np; ++g) {
+            auto q = qs.queue(g);
+
+            auto p_A = d_A[g];
+            auto p_B = d_B[g];
+
+            const size_t size  = local_length;
+
+            q.submit([&](sycl::handler& h) {
+              h.parallel_for( sycl::range<1>{size}, [=] (sycl::id<1> i) {
+                  p_A[i] += p_B[i] + scalar * p_C[i];
+              });
+            });
+        }
+        qs.waitall();
+      }
+      nstream_time = prk::wtime() - nstream_time;
+  }
+
+  qs.gather<double>(h_A, d_A, local_length);
+  qs.gather<double>(h_B, d_B, local_length);
+  qs.waitall();
+
+  qs.free(d_A);
+  qs.free(d_B);
+  qs.waitall();
+
+  return 0;
+}
+
+

From ee43a2d71f7641462e7838e422441fe490dbdaeb Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Sun, 26 Jul 2020 08:46:39 -0700
Subject: [PATCH 59/66] whitespace

---
 Cxx11/transpose-dpcpp.cc | 1 -
 1 file changed, 1 deletion(-)

diff --git a/Cxx11/transpose-dpcpp.cc b/Cxx11/transpose-dpcpp.cc
index 6d742f1bf..7fe69d290 100644
--- a/Cxx11/transpose-dpcpp.cc
+++ b/Cxx11/transpose-dpcpp.cc
@@ -121,7 +121,6 @@ int main(int argc, char * argv[])
       if (iter==1) trans_time = prk::wtime();
 
       q.submit([&](sycl::handler& h) {
-
         h.parallel_for( sycl::range<2>{order,order}, [=] (sycl::id<2> it) {
           B[it[0] * order + it[1]] += A[it[1] * order + it[0]];
           A[it[1] * order + it[0]] += 1.0;

From b94896d9ad896f00239aea9ceeffa556dac76aaf Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Sun, 26 Jul 2020 08:46:56 -0700
Subject: [PATCH 60/66] hoist invariant; start alltoall

---
 Cxx11/prk_sycl.h | 42 ++++++++++++++++++++++++++++++++++++++----
 1 file changed, 38 insertions(+), 4 deletions(-)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index 6e4356ab6..0c667deda 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -171,10 +171,10 @@ namespace prk {
                                const B & host_pointer,
                                size_t num_elements)
                 {
+                    auto bytes = num_elements * sizeof(T);
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
-                        auto bytes = num_elements * sizeof(T);
                         auto target = device_pointers[i];
                         auto source = &host_pointer[0];
                         v.memcpy(target, source, bytes);
@@ -187,11 +187,11 @@ namespace prk {
                             const std::vector<T*> & device_pointers,
                             size_t num_elements)
                 {
+                    auto bytes = num_elements * sizeof(T);
                     auto temp = std::vector<T>(num_elements, 0);
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
-                        auto bytes = num_elements * sizeof(T);
                         auto target = device_pointers[i];
                         auto source = &host_pointer[0];
                         v.memcpy(temp, source, bytes);
@@ -206,10 +206,10 @@ namespace prk {
                             const std::vector<T*> & device_pointers,
                             size_t num_elements)
                 {
+                    auto bytes = num_elements * sizeof(T);
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
-                        auto bytes = num_elements * sizeof(T);
                         auto target = &host_pointer[i * num_elements];
                         auto source = device_pointers[i];
                         v.memcpy(target, source, bytes);
@@ -221,17 +221,51 @@ namespace prk {
                              const B & host_pointer,
                              size_t num_elements)
                 {
+                    auto bytes = num_elements * sizeof(T);
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
-                        auto bytes = num_elements * sizeof(T);
                         auto target = device_pointers[i];
                         auto source = &host_pointer[i * num_elements];
                         v.memcpy(target, source, bytes);
                     }
                 }
 
+                // num_elements is defined the same as MPI
+                // each device contributes np * num_elements
+                // each device receives np * num_elements
+                template <typename T, typename B>
+                void alltoall(std::vector<T*> & device_pointers_out,
+                              std::vector<T*> & device_pointers_in,
+                              size_t num_elements)
+                {
+                    auto bytes = num_elements * sizeof(T);
+                    // allocate np*np temp space on the host, because
+                    // we cannot copy device-to-device if they are in
+                    // different contexts.
+                    // we can specialize for single-context later...
+                    int np = this->list.size();
+                    prk::vector<double> temp(num_elements * np * np);
+
+                    // gather phase - contiguous
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto target = &temp[i * np * num_elements];
+                        auto source = device_pointers_in[i];
+                        v.memcpy(target, source, np * bytes);
+                    }
 
+                    // scatter phase - noncontiguous
+                    for (const auto & l : list | boost::adaptors::indexed(0) ) {
+                        auto i = l.index();
+                        auto v = l.value();
+                        auto target = device_pointers_out[i];
+                        auto source = &temp[i * num_elements];
+                        v.memcpy(target, source, bytes);
+                    }
+
+                }
         };
 
     } // namespace SYCL

From da594fbd588a1ceae6e8b22ce32ed1a73fc53907 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Sun, 26 Jul 2020 09:00:51 -0700
Subject: [PATCH 61/66] progress on unit test

---
 Cxx11/Makefile                  |  4 ++
 Cxx11/test_dpcpp_collectives.cc | 76 ++++++++++++++++++---------------
 2 files changed, 45 insertions(+), 35 deletions(-)

diff --git a/Cxx11/Makefile b/Cxx11/Makefile
index a20cdfbb4..e97e44d86 100644
--- a/Cxx11/Makefile
+++ b/Cxx11/Makefile
@@ -99,6 +99,9 @@ sycl-explicit: nstream-sycl-explicit transpose-sycl-explicit
 
 dpcpp: nstream-dpcpp nstream-multigpu-dpcpp stencil-dpcpp stencil-multigpu-dpcpp transpose-dpcpp transpose-multigpu-dpcpp
 
+test_dpcpp_collectives: test_dpcpp_collectives.cc prk_util.h prk_sycl.h
+	$(SYCLCXX) $(SYCLFLAGS) -g $< -o $@
+
 tbb: p2p-innerloop-tbb p2p-tbb stencil-tbb transpose-tbb nstream-tbb \
      p2p-hyperplane-tbb p2p-tasks-tbb
 
@@ -278,6 +281,7 @@ clean:
 	-rm -f *-sycl-explicit-usm
 	-rm -f *-dpct
 	-rm -f *-dpcpp
+	-rm -f test_dpcpp_collectives
 	-rm -f *-celerity
 	-rm -f *-tbb
 	-rm -f *-stl
diff --git a/Cxx11/test_dpcpp_collectives.cc b/Cxx11/test_dpcpp_collectives.cc
index 4a1472a44..4168f4426 100644
--- a/Cxx11/test_dpcpp_collectives.cc
+++ b/Cxx11/test_dpcpp_collectives.cc
@@ -43,13 +43,13 @@ int main(int argc, char * argv[])
         throw "Usage: <vector length> [<use_ngpu>]";
       }
 
-      length = std::atoi(argv[2]);
+      length = std::atoi(argv[1]);
       if (length <= 0) {
         throw "ERROR: vector length must be positive";
       }
 
       if (argc > 3) {
-        use_ngpu = std::atoi(argv[3]);
+        use_ngpu = std::atoi(argv[2]);
       }
       if ( use_ngpu > qs.size() ) {
           std::string error = "You cannot use more devices ("
@@ -79,54 +79,60 @@ int main(int argc, char * argv[])
 
   int np = use_ngpu;
 
-  auto h_A = prk::vector<double>(length, 0);
-  auto h_B = prk::vector<double>(length, 2);
+  auto host = prk::vector<double>(length, 37);
 
-  auto d_A = std::vector<double*> (np, nullptr);
-  auto d_B = std::vector<double*> (np, nullptr);
+  auto device = std::vector<double*> (np, nullptr);
 
-  qs.allocate<double>(d_A, local_length);
-  qs.allocate<double>(d_B, local_length);
+  qs.allocate<double>(device, local_length);
   qs.waitall();
 
-  qs.scatter<double>(d_A, h_A, local_length);
-  qs.scatter<double>(d_B, h_B, local_length);
+  qs.scatter<double>(device, host, local_length);
   qs.waitall();
 
-  // overwrite host buffer with garbage to detect bugs
-  h_A.fill(-77777777);
+  host.fill(-77777777);
 
-  const double scalar(3);
-  {
-      for (int iter = 0; iter<=iterations; iter++) {
+  qs.gather<double>(host, device, local_length);
+  qs.waitall();
 
-        if (iter==1) nstream_time = prk::wtime();
+  {
+    size_t errors(0);
+    for (size_t i=0; i<length; ++i) {
+        if (host[i] != 37) {
+            std::cerr << "ERROR at location " << i << " : " << host[i] << "\n";
+        }
+    }
+    std::cout << "there were " << errors << " errors" << std::endl;
+    if (errors != 0) std::abort();
+  }
 
-        for (int g=0; g<np; ++g) {
-            auto q = qs.queue(g);
+  host.fill(0);
 
-            auto p_A = d_A[g];
-            auto p_B = d_B[g];
+  for (int g=0; g<np; ++g) {
+      auto q = qs.queue(g);
+      auto p = device[g];
+      q.submit([&](sycl::handler& h) {
+        h.parallel_for( sycl::range<1>{local_length}, [=] (sycl::id<1> i) {
+            p[i] = i;
+        });
+      });
+  }
+  qs.waitall();
 
-            const size_t size  = local_length;
+  qs.gather<double>(host, device, local_length);
+  qs.waitall();
 
-            q.submit([&](sycl::handler& h) {
-              h.parallel_for( sycl::range<1>{size}, [=] (sycl::id<1> i) {
-                  p_A[i] += p_B[i] + scalar * p_C[i];
-              });
-            });
+  {
+    size_t errors(0);
+    for (size_t i=0; i<length; ++i) {
+        if (host[i] != i) {
+            std::cerr << "ERROR at location " << i << " : " << host[i] << "\n";
         }
-        qs.waitall();
-      }
-      nstream_time = prk::wtime() - nstream_time;
+    }
+    std::cout << "there were " << errors << " errors" << std::endl;
+    if (errors != 0) std::abort();
   }
 
-  qs.gather<double>(h_A, d_A, local_length);
-  qs.gather<double>(h_B, d_B, local_length);
-  qs.waitall();
-
-  qs.free(d_A);
-  qs.free(d_B);
+  qs.free(device);
   qs.waitall();
 
   return 0;

From 0a74fa00b311ab326024f84285f7cc72b9b44710 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Sun, 26 Jul 2020 11:15:45 -0700
Subject: [PATCH 62/66] work around issue with CPU-only in "multigpu" tester

when i use 2 devices with CPU+GPU, it's fine.
when i use 1 device with GPU, it's fine.
when i use 1 device with CPU, scatter crashes in memcpy.

i have no idea what is wrong here...

Signed-off-by: Jeff Hammond <jeff.r.hammond@intel.com>
---
 Cxx11/prk_sycl.h                | 36 ++++++++++++------
 Cxx11/test_dpcpp_collectives.cc | 65 +++++++++++++++++++++++++++------
 2 files changed, 78 insertions(+), 23 deletions(-)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index 0c667deda..38daa35f5 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -100,10 +100,12 @@ namespace prk {
                     for (auto & p : platforms) {
                         auto pname = p.get_info<sycl::info::platform::name>();
                         std::cout << "*Platform: " << pname << std::endl;
+#if 0
                         if ( pname.find("Level-Zero") != std::string::npos) {
                             std::cout << "*Level Zero GPU skipped" << std::endl;
                             break;
                         }
+#endif
                         if ( pname.find("Intel") == std::string::npos) {
                             std::cout << "*non-Intel skipped" << std::endl;
                             break;
@@ -111,15 +113,20 @@ namespace prk {
                         auto devices = p.get_devices();
                         for (auto & d : devices ) {
                             std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
-                            if ( d.is_cpu() && use_cpu ) {
-                                std::cout << "**Device is CPU - adding to vector of queues" << std::endl;
-                                list.push_back(sycl::queue(d));
-                            }
                             if ( d.is_gpu() && use_gpu ) {
                                 std::cout << "**Device is GPU - adding to vector of queues" << std::endl;
                                 list.push_back(sycl::queue(d));
                             }
                         }
+#if 1
+                        for (auto & d : devices ) {
+                            std::cout << "**Device: " << d.get_info<sycl::info::device::name>() << std::endl;
+                            if ( d.is_cpu() && use_cpu ) {
+                                std::cout << "**Device is CPU - adding to vector of queues" << std::endl;
+                                list.push_back(sycl::queue(d));
+                            }
+                        }
+#endif
                     }
                 }
 
@@ -130,7 +137,10 @@ namespace prk {
 
                 void wait(int i)
                 {
-                    list[i].wait();
+                    if ( i > this->size() ) {
+                        std::cerr << "ERROR: invalid device id: " << i << std::endl;
+                    }
+                    list.at(i).wait();
                 }
 
                 void waitall(void)
@@ -141,7 +151,10 @@ namespace prk {
                 }
 
                 sycl::queue queue(int i) {
-                    return this->list[i];
+                    if ( i > this->size() ) {
+                        std::cerr << "ERROR: invalid device id: " << i << std::endl;
+                    }
+                    return this->list.at(i);
                 }
 
                 template <typename T>
@@ -182,21 +195,22 @@ namespace prk {
                 }
 
                 // UNUSED and UNTESTED
-                template <typename T, typename B, typename Op>
+                template <typename T, typename B>
                 void reduce(B & host_pointer,
                             const std::vector<T*> & device_pointers,
                             size_t num_elements)
                 {
                     auto bytes = num_elements * sizeof(T);
-                    auto temp = std::vector<T>(num_elements, 0);
+                    auto temp = prk::vector<T>(num_elements, 0);
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
-                        auto target = device_pointers[i];
+                        auto target = &temp[0];
                         auto source = &host_pointer[0];
-                        v.memcpy(temp, source, bytes);
+                        v.memcpy(target, source, bytes);
+                        target = device_pointers[i];
                         for (size_t e=0; e<num_elements; ++e) {
-                            target[e] = Op{}( target[e], temp[e] );
+                            target[e] += temp[e];
                         }
                     }
                 }
diff --git a/Cxx11/test_dpcpp_collectives.cc b/Cxx11/test_dpcpp_collectives.cc
index 4168f4426..d3105b5e6 100644
--- a/Cxx11/test_dpcpp_collectives.cc
+++ b/Cxx11/test_dpcpp_collectives.cc
@@ -34,23 +34,35 @@
 
 int main(int argc, char * argv[])
 {
-  auto qs = prk::SYCL::queues();
-
-  size_t length, local_length;
+  size_t length = 10000, local_length;
   int use_ngpu = 1;
   try {
-      if (argc < 2) {
-        throw "Usage: <vector length> [<use_ngpu>]";
+      if (argc == 2) {
+          std::string a(argv[1]);
+          if ( a.find("h") != std::string::npos) {
+            throw "HELP: <program> [<vector length> <use_ngpu>]";
+          }
       }
 
-      length = std::atoi(argv[1]);
-      if (length <= 0) {
-        throw "ERROR: vector length must be positive";
+      if (argc > 1) {
+          length = std::atoi(argv[1]);
+          if (length <= 0) {
+            throw "ERROR: vector length must be positive";
+          }
       }
 
-      if (argc > 3) {
+      if (argc > 2) {
         use_ngpu = std::atoi(argv[2]);
       }
+  }
+  catch (const char * e) {
+    std::cout << e << std::endl;
+    return 1;
+  }
+
+  auto qs = prk::SYCL::queues(use_ngpu>1,true);
+
+  try {
       if ( use_ngpu > qs.size() ) {
           std::string error = "You cannot use more devices ("
                             + std::to_string(use_ngpu)
@@ -68,7 +80,7 @@ int main(int argc, char * argv[])
       }
       local_length = length / use_ngpu;
   }
-  catch (const char * e) {
+  catch (std::string & e) {
     std::cout << e << std::endl;
     return 1;
   }
@@ -81,11 +93,13 @@ int main(int argc, char * argv[])
 
   auto host = prk::vector<double>(length, 37);
 
-  auto device = std::vector<double*> (np, nullptr);
+  auto device = std::vector<double*>(np, nullptr);
 
   qs.allocate<double>(device, local_length);
   qs.waitall();
 
+  std::cout << "Testing scatter-gather" << std::endl;
+
   qs.scatter<double>(device, host, local_length);
   qs.waitall();
 
@@ -122,15 +136,42 @@ int main(int argc, char * argv[])
   qs.waitall();
 
   {
+    size_t errors(0);
+    for (int d=0; d<np; ++d) {
+        for (size_t i=0; i<local_length; ++i) {
+            size_t offset = d * local_length + i;
+            if (host[i] != i) {
+                std::cerr << "ERROR for device " << d << " at location " << i << " : " << host[i] << "\n";
+            }
+        }
+    }
+    std::cout << "there were " << errors << " errors" << std::endl;
+    if (errors != 0) std::abort();
+  }
+
+#if 0
+  std::cout << "Testing broadcast-reduce" << std::endl;
+
+  auto host2 = prk::vector<double>(local_length, -10);
+
+  qs.broadcast<double>(device, host2, local_length);
+  qs.waitall();
+
+  qs.reduce<double>(host2, device, local_length);
+  qs.waitall();
+
+  {
+    double correct = -10 * np;
     size_t errors(0);
     for (size_t i=0; i<length; ++i) {
-        if (host[i] != i) {
+        if (host[i] != correct) {
             std::cerr << "ERROR at location " << i << " : " << host[i] << "\n";
         }
     }
     std::cout << "there were " << errors << " errors" << std::endl;
     if (errors != 0) std::abort();
   }
+#endif
 
   qs.free(device);
   qs.waitall();

From edb86875bdac36fbaa25109dc827cb883966e3e8 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Sun, 26 Jul 2020 11:23:04 -0700
Subject: [PATCH 63/66] broadcast and reduce tested

---
 Cxx11/prk_sycl.h                |  6 ++----
 Cxx11/test_dpcpp_collectives.cc | 10 +++++-----
 2 files changed, 7 insertions(+), 9 deletions(-)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index 38daa35f5..a5d1d52c9 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -178,7 +178,6 @@ namespace prk {
                     }
                 }
 
-                // UNUSED and UNTESTED
                 template <typename T, typename B>
                 void broadcast(std::vector<T*> & device_pointers,
                                const B & host_pointer,
@@ -194,7 +193,6 @@ namespace prk {
                     }
                 }
 
-                // UNUSED and UNTESTED
                 template <typename T, typename B>
                 void reduce(B & host_pointer,
                             const std::vector<T*> & device_pointers,
@@ -206,9 +204,9 @@ namespace prk {
                         auto i = l.index();
                         auto v = l.value();
                         auto target = &temp[0];
-                        auto source = &host_pointer[0];
+                        auto source = device_pointers[i];
                         v.memcpy(target, source, bytes);
-                        target = device_pointers[i];
+                        target = &host_pointer[0];
                         for (size_t e=0; e<num_elements; ++e) {
                             target[e] += temp[e];
                         }
diff --git a/Cxx11/test_dpcpp_collectives.cc b/Cxx11/test_dpcpp_collectives.cc
index d3105b5e6..9f1c7b12d 100644
--- a/Cxx11/test_dpcpp_collectives.cc
+++ b/Cxx11/test_dpcpp_collectives.cc
@@ -142,6 +142,7 @@ int main(int argc, char * argv[])
             size_t offset = d * local_length + i;
             if (host[i] != i) {
                 std::cerr << "ERROR for device " << d << " at location " << i << " : " << host[i] << "\n";
+                errors++;
             }
         }
     }
@@ -149,7 +150,6 @@ int main(int argc, char * argv[])
     if (errors != 0) std::abort();
   }
 
-#if 0
   std::cout << "Testing broadcast-reduce" << std::endl;
 
   auto host2 = prk::vector<double>(local_length, -10);
@@ -163,15 +163,15 @@ int main(int argc, char * argv[])
   {
     double correct = -10 * np;
     size_t errors(0);
-    for (size_t i=0; i<length; ++i) {
-        if (host[i] != correct) {
-            std::cerr << "ERROR at location " << i << " : " << host[i] << "\n";
+    for (size_t i=0; i<local_length; ++i) {
+        if (host2[i] != correct) {
+            std::cerr << "ERROR at location " << i << " : " << host2[i] << "\n";
+            errors++;
         }
     }
     std::cout << "there were " << errors << " errors" << std::endl;
     if (errors != 0) std::abort();
   }
-#endif
 
   qs.free(device);
   qs.waitall();

From dfacd83694967748987207acd063b6400a73b888 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Sun, 26 Jul 2020 12:13:43 -0700
Subject: [PATCH 64/66] there are bugs somewhere

Signed-off-by: Jeff Hammond <jeff.r.hammond@intel.com>
---
 Cxx11/prk_sycl.h                |  9 ++++--
 Cxx11/test_dpcpp_collectives.cc | 53 ++++++++++++++++++++++++++++++---
 2 files changed, 55 insertions(+), 7 deletions(-)

diff --git a/Cxx11/prk_sycl.h b/Cxx11/prk_sycl.h
index a5d1d52c9..01bd531e0 100644
--- a/Cxx11/prk_sycl.h
+++ b/Cxx11/prk_sycl.h
@@ -189,6 +189,7 @@ namespace prk {
                         auto v = l.value();
                         auto target = device_pointers[i];
                         auto source = &host_pointer[0];
+                        std::cout << "BCAST: device " << i << std::endl;
                         v.memcpy(target, source, bytes);
                     }
                 }
@@ -198,17 +199,19 @@ namespace prk {
                             const std::vector<T*> & device_pointers,
                             size_t num_elements)
                 {
+                    std::cout << "REDUCE: num_elements " << num_elements << std::endl;
                     auto bytes = num_elements * sizeof(T);
+                    std::cout << "REDUCE: bytes " << bytes << std::endl;
                     auto temp = prk::vector<T>(num_elements, 0);
                     for (const auto & l : list | boost::adaptors::indexed(0) ) {
                         auto i = l.index();
                         auto v = l.value();
+                        std::cout << "REDUCE: device " << i << std::endl;
                         auto target = &temp[0];
                         auto source = device_pointers[i];
                         v.memcpy(target, source, bytes);
-                        target = &host_pointer[0];
                         for (size_t e=0; e<num_elements; ++e) {
-                            target[e] += temp[e];
+                            host_pointer[e] += temp[e];
                         }
                     }
                 }
@@ -246,7 +249,7 @@ namespace prk {
                 // num_elements is defined the same as MPI
                 // each device contributes np * num_elements
                 // each device receives np * num_elements
-                template <typename T, typename B>
+                template <typename T>
                 void alltoall(std::vector<T*> & device_pointers_out,
                               std::vector<T*> & device_pointers_in,
                               size_t num_elements)
diff --git a/Cxx11/test_dpcpp_collectives.cc b/Cxx11/test_dpcpp_collectives.cc
index 9f1c7b12d..001920d36 100644
--- a/Cxx11/test_dpcpp_collectives.cc
+++ b/Cxx11/test_dpcpp_collectives.cc
@@ -93,11 +93,21 @@ int main(int argc, char * argv[])
 
   auto host = prk::vector<double>(length, 37);
 
-  auto device = std::vector<double*>(np, nullptr);
+  auto host2 = prk::vector<double>(local_length, -10);
 
+  auto device = std::vector<double*>(np, nullptr);
   qs.allocate<double>(device, local_length);
   qs.waitall();
 
+  // device out vector
+  auto device2 = std::vector<double*>(np, nullptr);
+  qs.allocate<double>(device2, local_length);
+  qs.waitall();
+
+  ////////////////////////////////////////////////////////////////////////////
+  // scatter and gather
+  ////////////////////////////////////////////////////////////////////////////
+
   std::cout << "Testing scatter-gather" << std::endl;
 
   qs.scatter<double>(device, host, local_length);
@@ -150,9 +160,11 @@ int main(int argc, char * argv[])
     if (errors != 0) std::abort();
   }
 
-  std::cout << "Testing broadcast-reduce" << std::endl;
+  ////////////////////////////////////////////////////////////////////////////
+  // broadcast and reduce
+  ////////////////////////////////////////////////////////////////////////////
 
-  auto host2 = prk::vector<double>(local_length, -10);
+  std::cout << "Testing broadcast-reduce" << std::endl;
 
   qs.broadcast<double>(device, host2, local_length);
   qs.waitall();
@@ -165,7 +177,7 @@ int main(int argc, char * argv[])
     size_t errors(0);
     for (size_t i=0; i<local_length; ++i) {
         if (host2[i] != correct) {
-            std::cerr << "ERROR at location " << i << " : " << host2[i] << "\n";
+            std::cerr << "ERROR at location " << i << " : " << host2[i] << " (" << correct << ")" << "\n";
             errors++;
         }
     }
@@ -173,6 +185,39 @@ int main(int argc, char * argv[])
     if (errors != 0) std::abort();
   }
 
+  ////////////////////////////////////////////////////////////////////////////
+  // alltoall
+  ////////////////////////////////////////////////////////////////////////////
+
+#if 0
+  std::cout << "Testing alltoall" << std::endl;
+
+  // fill out vector with junk
+  host.fill(-73);
+  qs.scatter<double>(device2, host, local_length);
+  qs.waitall();
+
+  // reset host and fill with input
+  host.fill(0);
+  for (int d=0; d<np; ++d) {
+      for (size_t i=0; i<local_length; ++i) {
+          size_t offset = d * local_length + i;
+          host[offset] = d+1;
+      }
+  }
+
+  // scatter input
+  qs.scatter<double>(device, host, local_length);
+  qs.waitall();
+
+  qs.alltoall<double>(device2, device, local_length);
+  qs.waitall();
+#endif
+
+  ////////////////////////////////////////////////////////////////////////////
+  // THE END
+  ////////////////////////////////////////////////////////////////////////////
+
   qs.free(device);
   qs.waitall();
 

From 0193c93bbac5645f434414050fc258f7684fb76b Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Wed, 28 Oct 2020 07:22:17 -0700
Subject: [PATCH 65/66] never commit binaries

---
 Cxx11/stencil-2d-sycl   | Bin 218944 -> 0 bytes
 Cxx11/transpose-2d-sycl | Bin 90472 -> 0 bytes
 2 files changed, 0 insertions(+), 0 deletions(-)
 delete mode 100755 Cxx11/stencil-2d-sycl
 delete mode 100755 Cxx11/transpose-2d-sycl

diff --git a/Cxx11/stencil-2d-sycl b/Cxx11/stencil-2d-sycl
deleted file mode 100755
index 1ede69183b5049779fe0bb80e8a6c17a40a983a5..0000000000000000000000000000000000000000
GIT binary patch
literal 0
HcmV?d00001

literal 218944
zcmeEP3tUuH{+|(0GHsx=sBEK}3d#)BOnMFqdM5{^w4$=W5W_+x9MoRB7*JlvY3aFc
z+qUd(+gks2qwR&33cj$HVNZKXnRUl8L*0Cq{J-CG?wz?a%&4_1>INU3dw;)s-sgAD
z`Tf4<^_y(hur5}s#rW%Dxx_-MWuQZ_<gdlz7!@OE{x~dyEl1)v*>bX_E9h9k;}?E&
zgglG82-0Fa<0WZfX!JKv|30sa0~BcoAC^AiH~2JC$S3^;{~Y?OeCC}hN#kirkTm_p
z@ik4-mNbWa(Vu@)WDLgB>`%m3p{JlCQ~J}NJN%L~o@Re6o1{Br29rEPghS)0bkl<|
z3PevQUDMy1yQIH0Ug^(xCP=o$cpBcBM*d%>e_z(c0gAMP4@<K64L<3Xf4S@3<N3ZL
zLwekiA>%WiC8E$Q7UOC7yBz+Q&i(z<vuC+Nk1txeXnF+3Q!jPPxg`^C95nFUlJV!1
zOq^Uk<D40T2c0u$V85wT`t=w2X83eFeB_lPNt7?WC<L8|-z=TSqOXp<e7vLQ5k1a2
zy@xs?ElvnGzYoKI1^-9je-8eS!v9?SzXJb9<3In#;Qv+le>DmH?^--36xBOVEYDrA
zu_meOnF|}g+H$uqf6c9VeXPZCPcB&Zz@10VtjS+Fv->+atqa!N=Dg*lA=&S5OwE4Z
zbz6^(JsT%BU%v4lJBQ@wUFtb*)O&aKn%iUOV}%QsKVN=xmz`hyt;C2Y{5cmXKRTQV
z+H*u?{-r3SNbX;V;{IM#awPYcb&t&d5^+azKQIdak5Tw{qw*q!vnC3^>d46MCr8O|
zpD5+_n<(j-8zubdQTTaL%I&Er>G>c^dOkn{k5mpXqn$+JpNRGviSLNQ-xwwQtx??n
zDN25iiNg0p;XfTkel|p@->;&SPoF5|a8;Ci`J&Xz%~9N67A4*%qVV5~lAdRyl;@LC
z%IELsq$1U0Y?OFcM{(a8rCt9jO8NgIN_zT7DWAKdxW6$<yuXf8KA%TP&#6(|Z;jH9
zmPFzIJxVxRqO|wiC~`PHO8D7P>em&eUapSf{(>m!yda8uj`xw|<b^2p!f`Sg|HJ=I
z2IExxZyDeS`IL=%Otc(pnWgI?Df-trNarcw*UlLtI7vExD$+^!4Z3@S{|8-u>e3v#
zOZj*U=}fSkXeoF=hGTr(tmmsj*Fz2dN4opD4~Dw$hk9Xp>hyRGePb-bA-_h~zw-2e
z=Aj>8It%pl8~Hj<Z(q$}<*-7;dqTT(exl1mO;|dYBOJ!7>G2xjuh8R7(9=oXf`1q3
z`7KCy2-^6WqnBrbo=(I4e3U2C?+6S3kEoYKlxKxro(V`F|NfwtL%kl3Q4SyL;TMF}
z?{xTK`b+ijlNkvApodL$k1ss?Z0cTvEcy92O`0+}f2w<2nL9rpWU0HjtZ3Z${9B4{
z%P+*6yU3D%?Z^?M-RI}$7tWZGo}S+S#&J_87Q#!}#K|`~3rD-t(+i8omF2t3#!Ylj
zbrxoi9*3Xo^9!d;Djio=l$|@G5J8M_%I9cz|FrykL^5T1eo4{fo7~0uMP+4E%H-FP
zKRup|{G9x8rKLra$1|o$h-$Pu!(CK1Y2sugei~B`hD`IsDM(-Y1ZSUDSW+~uEE`|?
z=R2oN<$t%#`4}fW7tJUvDs@ksGFb*Ts1T{2JY_)sRsGZZPrYrbyJ%8=Vab%jTLw&?
zGCf<yIHhE2_C%4Efk;_N#8|IDd;?^{5Fg5Vl5<S{n6&)t(SuMENcI%wZQ|sqMP+X1
zr0nb~Mo$^j{=<0l2lrrPF&|+T4RlVP=*~*llk<~nFFg%Wmlc(kj4Le4o-|1>Sy__f
z^T(ASyE1SH#W-1=Nb;DgM#3ZIWZaDtr=_P;W=h6Qotp2yt+WU^nJ^_=lnFmb5x5be
zCPHJeg?Xo-Or01h1g0ZUDOvrQNs*2li*A}YIlpk6yRaC+jW5YHK9rW173EKxSmrJt
zS0Ym|$ee=0aZ}xfQ;`}}etsYVHj)`L@=J@#rcRkWu4JP7w)|;nfl&0SGwLalc<rsC
zb4QFGkk2%sx(Ae&yR+F?*xt@7WTBxYr4K+=OrJQuXfooM=oU3P<|-l6df7?e=S?Un
zpIR(Fk9L<#h2VxaOh`~Wi7Olfc{?v(HowW!*?v&Ep<*=jXNwU9SoR{>S4=|KqL#{v
zMBO7M(YgX60LEzdz``lzZrveTPM|W8@(iQON~YX|4(LDYHqg?Mv?-I(@X8C_*^^N0
zB5@PSip*7y?sAgsDW~3A=AK~TucdU#boQe+6`~j9$8<~nm6NAWL~5@nnp!@oNOZEd
z6_)VZ0Flj+{R>M5P6aC{wrmLyc;myM@kQ=&6HC(5M_)74l~Xin)QvZfp_6b2gGP<M
z(hYb0A&56kE*hW7rid0A8d_*HBS#pq3`T=?Pnc3RY4A-&ZqXo}u92hD@&~eQ20mu@
zACNXEJ3D(ML^HiVI`MInjNX0p!2CQ&Om=!YYO%a*vS`_|lL<tUe%|<^X%h>J@~0M+
z6cxIsl%)@lZ~2lR=KQ={%Ztj3($knClLJ%Pqz@=YD+>e{t>kVjpD>}QEPvvp(vnCe
z*FOzC(Uii8Xxmp$bQde*&@UI2WnaPkpI@v~xg$rX=cf<KEG#U7<FX;>NfpG6qDadh
zG)`~_VXQ=2L!!|0kUq8i#z_-VuuKA4(S-8Jg&a4W!={BsgFbtN2vV>00fke>7v-ZS
z$I*F6(7Iq4^`5TR`!L99Hv2bp7DnyDDa$=l-RhsR2c{3m`1v)fhmzi(b!CVWt23Xn
zjq&29i5Lyb^3gc<BD&|p_o&f1Q^uE<6v<k^$Q_!Kp!^P;UOdj|^8#%ly?<e8xmg}$
z{N<CQrNF4){)3BVKu;-jXO`VGHFNU#D~fKNI;?EUB-gk}H;x~dom+^J&Rj1Uw-l94
zE-J~FZD4%S)WUpG@n+%de^Y2$+BMnq!BSV6IN`Qzsyaha*Frf6<VUaLpxikjK$JUU
z05@vbXe-m9YUP)fO__1qPZp%~^BHh%*^~(r0ma?qM8iK%sDH9q8ZjA3YVUdgRV`6n
zhFh7cq5Xqtp%{V+Z2~OV^nrn46;gtRWweC!0mu%9SPZU$A3=UX`o{D@<)!1%l$jZH
zms84a3r&-eesg~s!B6BCgbruiR44%MqRCU)9@$ubvI>>WVW3bB9^-DDf^h?4;GR;#
z2Q*)Oyg?RbOmtf&6-}C2Bp!vOw^`6YiY8B^!@^0WaL9mk9evWciSSy4tdGNo8=+f?
z$^&cic+2piL-PmpOS24jIfo3*@87R~M)0-Yd4c!zf$}vk53UFHOHU6WGb}^%@-l}w
z^V2bSiI8-6{X^ZQ>w(L!FfCxBh<O2;8C`(t#^N^)XgGhn;0e>o(hYC?8fSq4gg=<4
zg5L!^e&Js?OLu_@)4jptJO9Jn0WTJA7$*P2u(R|4Cm!!~!9VHCitkq8ivIW}<CZQM
z61i536R(C{oqNV@2(X9ca|Vk)`byKkr-4@Qe*}>nY57{%lNL+)2@{cpc*|y!`$_sY
zx_?NxKf>~3i2JT4_gxW(j2{onxE;SkBD-7Sdq|%8n^e%<EXV2eyU*T&)Wlg%*Xdh@
z`&dhwPEQncjO9|DcBejog6?7&37UV}Z-<B{OG>^8($Z?;50xzOYuKkOEn?=zpJ7*$
zPwd?IGwgKoiN70vh8<1*6$TSe!!9OYBLDKEVb_yCQnJLafme_}%)~eBV)6~!n4b+h
zoqPlTC*QD_$-jmS{m;Nj$j>&IcpA6_`7RURz)8p-ZsHsEJNf2$hNK!<>VTC*y&GPV
zO?*^%;4j6*2P6^rOEd8S83g_YoA`{|_;Z-}Ml0br#l&ZtjK5qHU$#{FCC|iH499pD
znD}hd#$U0C4~Q`ES8C$xO-Fp2VdCo|EBF;Ae$PNC7RxLX|0ol`#>BUo_;XEswt3^P
z*2L#rlkqpt#5dz~btXRNlZ?N56aN^4iD!d}-^;{bY2x=b@taNjV@>=uCjN0Iev653
zV0QehnfS+>+_#$eCz$v<O#Bl~e9Qeoxi#i?`8nRiKgr}i!NmWSiJxTR6SFk_l1=<%
zgNbK~iGPZTpJw8pYT^$z@lP}H9VWir#8*uG(@p$b6aNeoKhMNJ)5I?@@l#CvViP~r
z#4k1R&oc36nD}R#_!TC8UlV_piGPlXUt{9;Gx6t|_~)AVwI)8tE#q&ViJxvT@vJlP
z`<wXnCjI~uzrn=kT%z%}(!@W{VB*<q;tw+M*O>U{oA@mz{$LYdGx0eWZ2YyF_*n)M
z&mAUyhKX;{@mThe7nu0*CjNyceu9aAk%^yV;$LjyC!6?}nD{9s{-q{<nu+f)@dumu
znI^u&#J|kMS4{lNP5jQ+&JyS>fzA@>EP>7v=q!QG66h>}&JyS>fzA@>EP+F-1h(3K
zwM(ho7_WHZzR2%lQK}o<UD}$J%4P9OMMB%o`x5N7)4#&6?PLeuNEh>)ucZxtr+-YE
z5VWsZ(C?5Y1nFxK^y{PvJ^Jbdy@WI&M_;X=7my~@=&KR*zep2e^i>G@Y0@;CeWil_
z3u!`%z5+o%N}7<NFIUhHkS0{<a|n7iX+ng)G(q1@n$VyxS<ttWCM4)f5Of)7LV-Su
zpl>Ek2+-HM2aMBiBu(hg*COa^NfYw(H4FL*(uDea4T8RmG@(3SouG%1CWPm!74!w9
z3ElZ>1l^xBAv<4%pwA*rsLod^=u=4(qVp99`UKL1=6tz=KAJQkIiEw&-ANOQ^Q8&8
z3u!`dzGOk~x&btyH(!FFw~!{}=CcTT18G8SzSbX^|1U`=lWr08$D|3Z`I-g&4rxMa
zz6L?RPMT1fuTIcQNE1Ty)e3q6X+med8bSYyG$Auzg`l4%O{mOQD(JtECPd~d5cH#@
z361%31^obNLSjCLpl6dN6y{44^xdQhf%%dJeLHDFU%muEmyssq<+BL-X3~VZe62r-
z`X^0@%hw|4Ye^H@@-++k3etqMd<}xWj5MJvU!9<bkS2uXs}=MGqzPU5Y6RV%G$AWr
zg`m$OO{mIOD(F*56Qc4J2>JxlgqnQ0f<BrwAts+g(A`NBTJog{x(jJSO1@-4@46l|
zp(I~|ptq1FgygdbdIM=fN50nGqW(!cNVf?3W733*e9eM>hcv-nUxT1uCq0yOouHSH
zCS>NT74!nq*`#X({V&qPNLPT)U3@=QdTQ$-ii^3%auLY|c|e`=M1AKjF8F7rMSB=k
zmABM(vPGv~MA8M#{w@7mr@HzEMg3B#{Hir~jI*hsW=5t(X=+RskEVu;(69CW_}VU(
zf7j6c(h2=+Cs!c_7E4Wi0isea=CAvhda~F>9<i8=ww4JsOD6;!vwvJ9+|S%39%`%7
zxam@*aYu||U7@Vr<4z2O&`l2^+&|;5xcGaNfu;PID;0IUb~_4vMcg`Ytk*AX7a!gG
zX9v@etKE!J3(}caXI?cL9lS$P_bA@6_B2IZt4-h4)~0yxv?nX-=h_7*y2Ta9&Z6eZ
zOv?iHblNl&pQ3)Fc-{6i?IRMNfp*0+#vU(RYFB~fR97e-i{f!;PS0aqTSduyVyjw&
zp`hZ9!4`Mi?4d*b$1=LXB7hjYE@HpjmYZf<)ap{VYtQavG)>xerpI%U-GwwIxH8(@
zaoR)3g-lgTAXSt%JyprtX(U2ZMR|*os&m?>>MtUI2&p<=Pt`ahRU$z#!ueQxic<ZF
zdwf0DNmCLM>rp*zt+vLY@s&HQ?gYQnGc?|-w5cOVmtUxO7(-ibLIfW@q>tk~Lwg7x
zq|1*md?YEJvG&0o7hB~r$90)EWacl`)*$2ByZAw2`jh!{B7bh@Pa=LqRf$5`#G*nn
zMWI|9$YPIRq4<voDUU%$?t<kJbliiE_g)kSFb)c2KSP2pvMb&!dxDbDWUD?F73|{=
z+xL~SIiVSe=7bisR!iBAQt+0*x!TvR)MFvjEyZQ|6BHF8G-cV3n@~Dvpn{ipY9TAK
z>?c|j^=o?k&5pLVOj({v#&?kV$H54cXNL$`7W$~lWofAS>z69(QdX@@$}u7-C9K+S
z-DBHVZFW3rD_e+qju7?1iYFTx`_3%ufx69R-DZor%@JbWJ>WWtCGjEz$#ybEh0)px
z+fW8*Stl_$=o~HsEqVfUR*Jer`xvF|PlmqQcs2A@bU%u>p52$Ht`@(QtE^g*kjl6}
z8{a*1OEGA$C7mDEGd<3l6D`!#Gs!OQnD6mPZMx2PE#lXf!=Xsu7F$AGbC%VDv8DpG
zX&Jrv2lP)`H3LGTPlT8BZ421VX`8`&g^FtBjw9~s=I>VTz`MHCJG8BOsqLYL>Q8JB
zH&!*eW7Rd+EtOqe_bLSSH1n@Ep=T~d6)duY$6|O;vb7ONmv#?+Cdl$q)ZL4Q(BC`%
zZfipdhA)a2KGtfDk}+semd>b?jMEnl(;0t~j9!aks~O2!?LNUk;;vg-XT6T&X?^UA
z7K>>>w2g_ID6=mI$aeJAui5%Fmc?zgUEZ+Nw+BTK9E;d~CfKfiZGv#IMYy<#ISCB6
z6Kb~D&U)K-uPE&b6qhA;tL@qbGPN==w}8kqrDj6Sl^ozQugo07L2iaq{XSFG#|;IU
zTtGckn};}L0e=NMLOUJ-De7{4@KQXF#RUd0D=IEbMDBp+b|L~X*S2gC^`u>ZGLxa-
z!WgNkYJ-HQxRbBcB{U#`wyMWrs)R+66e$WRg<d_9_qU>_sBG(EyKff!J3V*B8&c+>
zXZAGJ4YvEd@?(PWaWX!FU-diiFOEY^+A9BvS65+6ofUq1)YFckZ>1gzhj>duG_kfh
zS75+IG)YECc1APTmC>T8jZWL}H>(?*wyZZ5)n!+NhpJQHA;(jmtScE~?a4XS+iX?i
z8J)VGo$E~G#i=f1bh(PU###A8LK&P>4S}AKoBocrSkDVuw~KCE_OzVpuiPiXskOXY
z=Io<p#ruy!V{ob4T<Vuv8VW`6h|sdoPr*;}idd_KJ$HeK1$}P8O=T0uv-8c1MF!FN
zj<+b4ciK~8%YQ|$$sWsva0H2GaVQ=pCSz@RFaL4yBG!)>JoL^M#0Nh;28yynw&R@Y
z#$TU}VoEWJ=|?6>ZB!b+NOpNJBG{^)hsY^&nVckloZvCuB*ogGR5n;qptgH!;6zH0
zigvhwwx0HH6qev+shhN$AY!6(mi?XQnHVXt-`c81!EeP~Lfy(9>OYQx`5I+L_Qj@N
zjm`VgR)*80-MiTk**^y&tTZBYsb6bX!9kP=KZj`^7GYl02v>b4BRn<`;ru{^M;j3;
z9=Bc5)`_%X0BWDdTiQpto(YVY$LsVc|BCQrp{@=@`6u|Q_kmn=ADU{#ov2~Omfb3x
zEueg8cZqQ0CS2aW;jRZp5!P_?h3haCQiP_xw@K!_Paqka0?9~%H{psoPttrM#SwFU
zE8`5UT|dhyV$R3uQ9i}+Aikxg*z0Axy1|y3Wl!UeXl%J`Y^92Kj6GRfi{>xX4HpuU
z=E~S=t9k&Xkhz%Jt^cIp5FPBHmCB_F&Wz8o{M~a)JXM2DIn{0M<Lh-TIGd_~t@;D1
zOtd6wLR5q$fe;huE1)}P3zgsr|9v4U!b8405KKTFil+qM#k`@*$kk3mOS8Q+7LAr9
zS_ygtb^%JJy2gcPk~R*YOw^BK>@w?l9j9QkN^-HCZm(71LaBvS$!~*Iazda0lXU&#
zfY!(TVfFFrcJ=Y?w?=(D2%+A4eXM5IqE*&1jMU6`2iM13Y<t{meY^@}@Gz>6>o*$p
z5yO5$v=k>=in@I7b#op7Pe;|a?vtZd&}pYwEdC<dqjtRq!xSMsEr;=W;s&|e_m@TO
zP407r>xlj36Fvllp=sj=2H25ukdA?P*^KKl$7Wtn^Y?n#zkc-3RNS>qOjVQRdJY*}
zv5XW#O<9R-`0l}X>F71-=s^rACP#mTBma2m;_uSMH=!<O(!~(zqFTD>8X8ePT_j5v
zh0?`2p)M|l3oV7|JqvZBt%4&zQW<Nn+=Xs<6VzE+blNrz`7qg3q~!=CZK``v>cXa)
zbeUd};WpJW#DR*=F}?>hT6cEXpm>?6!HAW-_!|U*O74baYC{lWJ!Hh<yA$A^RtRst
z<B(wA6sR;#^#kTYZ+UleaN6yjn)#|2n2wO0-dgwdra|Z{chJ}jH%;FTbekA=%nrk?
z(kBBBll+g0$T2+Fs(4rrN1rwnoA1Kt$y*pbdEf4D^2`qRGkM3M6q&pNCa*h)D5ZCh
zl9!3eA11F6weK4U!jwGG-5)?uC$n--O!>v44QyFY;S-R;%Y3C>^hbyvO+m=yI`H%+
zv57FlRHl~S5kwc_cxXn?(w_&4NK@P82_k?`L;xbtzXSsiI7NR3!0!kEZSh9R5Cgf{
zh<ts}?}RYF+rEZh@!b>m@vtaOGM$au6Su(l?wKcH4p;>P*!PC&jn5-UUAj$Hfyl9T
z=2!TJGMK`op{Axolk~MPd7ilIjNrq2gnzLyd*UuMz6W{)Th)Ac6}`f6V!(ND)!T3t
z9!iM}<@@aL0mOZ$2%$ei7|KM6`iqR!+_X-n|5@b2e>NR2XHFtJzCd?;HympVQ7XbH
z^L-0cK>Hltw2%1n9)5hYpnkI((jH-b)Ed+*QV)PSID(uiG9YAb)0fC*m>{2k&t^e>
z8u<(t<ge*3njn9KkLJN)A_E8t^6z0N2|@m|5xEdl*|Po^=Jy=>72iE^iCIwuxmZ+I
z+~%Q%4D3~qH!%C{3?M1UH++F_5acJBG>E}JF~%5z{D2XBxCr`?Mu=#c@qMp?>@r-1
zhw@h$N?+r9Ae453Eb1?^Y(Cy1)BiQ{AqDvd<|MM?TXo0t;aK}ON<|9tLs0j$-XOIE
z{v3%P-(sLULXh7g^`Sv6CiNPqgCocVA_GE@Pv>ixAYTriS&+X#KEnn1B>Iac$O*v!
zM2}p{0D^+t%wdx~@|v}J<R(FW4?J@t7*D^tAS;<s1o=;*vf@&V@1`D^=hKAs$fqF4
zXoCFk=lBLe{)|b3Ag|}puJ_2VIif_LETezQ_#O~JTh$BgdgMyORk$F3ERq#hXnYTZ
z;+`JXBa8ZrESv9tCewcs(k}&hfT*b$WTxHlGf#KiicD)~v!IIscxkME&BdSL^vizu
zD3LZ)Sv6nC`2nB&M~K(WbjA8C79X3miZe0z>hqszLd17-hB4WtwrOKnz_7>(fTC%9
ziFCQtJuY>#b~97s;p7h#=AN8yRQD`^)?&f37-OodL#Af*c^S;eQ4*d%gUu9kZ+lPK
z0o0|4;r0|Y(WIS@)QI^96aGGPV+w>ko9dL?KG><Eg2vd>>Pv5Tpnw4}XT!cc&gso;
zQ!01FPVae{C-$wm4|CoD-xT#-#rEvSfQ6Mt?P6Osx4XK4{|f!EP-$G(g{|OEs2U*1
z&P8qV?_?BA`Zh)VSS$LJm4@i_fQV(?y99v{-Z{hYpDzTB>Yns<uHnlcm!1Aq`nQT&
zVt2UI@%9u<Q#4GlrB>N1Q1N&HbR)=Skc#?{y+wa&d^T0tiO2G9MU{OApUBKRO5>ME
z^+Wbr(r~j9PlAk#lklUx%eb2?bN`r$@KfRjo^8c5(E;UB0NR*)e?j{6J|ui9UYEVp
z1!y~0Q|@P)Qey3LG9|SK?4-x+YY=KMjU72j4IHq;ro@5uDS!^UDxPkbXk>$&;qts-
zuR!L5_@y)x_Zz?b>Sy7XU+q7BIU@^#Rl-sdAZGo?6jrRo(4`D58WqRtq?{@0V<J0z
z&O){*IyHFm58^eKPboq*2*-)$7L=k*Xn{hC7E{=?DZ;@r2;(QB2?%o=Z4?~|W}}@=
zv3AE}nVg<cDwij?)MtdiIn@@IcaC_SPjSVR0&!{wo7q1f0quEJ3Z|(VkiAl3$TQe@
zW?<sSeRE*O_-Kg@XWANv5gc|O?H`%x8ODj@Om(D~Iljc{>59(9JaKIDBvwfr?LQu#
zIDZUJa-D?XNvxBIXY5!y0tB07r2_>g2F-b6K~E&S^uJdBK)X#-+z<KgLN~>V77avH
z{lYbD^;Mz(#{jY6`#dE0CcLv7xcE#_fmQZ8FkR>Zn)y_*_y#Q>og1o+qgGPxW(WL2
za1yrR#rvu~$;z7gQqgM;W0`ij5VI)5#bfql`slER3t5x-MGlP27Mvk6%M_|#b5MT!
z{kAqt&JDKMW<874v3YE<C1QRqb0Ir?r}~xReN2=cCcmptG8k^Ezb!vey9XZWSh1Z2
zA2-AeI^AlKJ}J6s2-~G@5j|+z7z{R%60;6o&~%U(;reTB2*TW3RV|So^r~uKMYTWZ
zRa9U_J)?@^ktLyHK-u_6d!CXI7|dPjH<)(|s2R`Ld2S!4SEdBoQSXpB7I!b-<;Z^M
z{K}Akya$)pgif+xfznAKLTU?m!Hhx{;*3-_-`K;-=8X3^9lhL|l~H0JY^$EW2TEA?
zV0CHR-eqk;SwZ&<8KYr>`PmYCUPrB*lEY!gi8m?|8s>LS>vxLkgNl-q`a_QG*{_sB
zAFw1P^>viZJ4(g|+dW07G{vh}l|na^8{4y+IcMciynUWi8e6*18M}e5r(qgf{SNCd
z#G)5paQ<zpE#asMwlOQQEaJ5-w!GC!WusN8ToJ2eygq%MQrToxtV@-QUDKN;IBk=c
zO|ab<cLBnhU>h4ZL_AYgPO$Y}37;z|e1pANmM&Obu?CSYLBnYjjYh%mWA+B5bc=25
zQp6T_TfU)<N2<)1cP*hPzOL6@}vQ*0JZfiwsn7RNxB)AHDI)TN8=qKn?lF!a~c
z;0QV#oK%URwf@poqzT_+V3N{UvQ^!RW-vQ@sILM~8SR4%l*_BN)eth+?F$ANuz|76
z$5!<roQJ{E&kNTP?T?hzOj?sx`VIrcQUS#qTa6Gb&dRr~sKz$T6qi_Bw(K1;3CWCo
z039QfPcl77ugK&jh-A@IM!`^J?F-Hpr|ql{P`bVUggzHVI>ufw!W(-j=l?|ycNQwb
zWqY=TRrV&TtmnNbX1H%gwe|Gi9ktVlYD4Yh;r}&pH;Hf($JhtM)e=Utp1DJ6USZsv
zcx8U-L=su#h(KE+okS|{f53w<PSa7=MBBd8szh02Bb@I{_8Ozw^|manAt*KfS#+Bh
z)$J<X?XfIjEUs`+cZ<_r2APA-E#3v+PxIT%WwaeklQ4^an1%U_UpGUt#G4y$+NFp{
zyMRCE;YTRy=w*EGq4=5K8mxlnvluz`eFmme{m^7G*{a?a4owD~Z=vq>N_aI~w^MJ>
zIcu@ZZIX221p0)OLtpWCH9X0V&V2yQFQG`dJmab6tixPL2%7(C$Xtkd4q>lzA!djB
zoNS;LW2^cO^+Yk)imLT}3Bo9WFwGpwNiM_+>Z0t6{qfRa`X}s_4{$lbCV0YLf!GgH
zQE||-Rl%eaMYVDjit1M&{3xsyTz=%RlqZN~NI3tAX7x*uZqYup$KY0eaeqxtiZ&Y@
zx_N+ZAl*-6Z-~DOgObAC5t0`iP7h$kVL??)`9;j?@Hd%N0eke|D}lj3P?qFW&0z3E
zPpqh7s%GU|C|`a@2wloAU<h&a7J>_YCH#vpcf1ksFL1$G^w00`kC~e5pv^FhMmQ5u
ze;4$+FwAQXy^8Oixb$<P;BvEAr@+6B?<QDqB%~q?7VM57qrrl|ejVQ+11p#`G{RLF
zRE2V-{hJB-{VoyFyuMKq(k6nAn`L|tKzp{T*O5mtVvgX1%UC4$M#EJ&KsaB9GQ{|9
z3Pm+Sxs;*gGKm+8nus{=*1aZkvje%3x#-7Syvyag@M(?ibDHjR5qxSp;ZAt>{T@EG
z6F_Rc`ICSj-|QdoQ;i=qJ#7^^cj!bTiOD+g0*P@TSiHlrUCU@*(tfg4Jt)4J$Bvo0
z>*L`%V2|t@53B2{V_p&Pu!e|u*hRMLo#A*G3sn0pvTw%2Y)HIBwytCWh2vq1On8{^
zKT3#G5Dz=q@O7Z@FvJ>)hs8r+B$%<3aR-qM8npY1hYkL9Cmwb<<6-lfD6IcE9#(;H
zLh-QAd+Smp@vwa1z`(;|l%I@;QCy+%2Jo=QE2-eLQy7UOcj94B`1g&6{bM;>eU-fy
z1se$uJExbZz<uIj$%Vwy&{wzIB*B&lcvz+oGufZFo7g!N@UYxtL}r;niH9v-@-y+U
zY4B*q!_GMRC*xu7!b=Dq)*oT+t*ZVdJw(OB5+>_a)LbU3C=?I-D<$DD!NWdG3@e*s
z8~2WfecjNBhegK2#<53@gokYg9u^b8!vKe(-;IEW0o)LHm<bDuCl>aN2@888fQ9u#
zIK;vRiRaJ5!fv-QjDB$+9~B7;y9knC#==}|HQ`v;ac~6vEr^AkAzeknX7&#YTMhw(
z&i>Ej{ldcjE?h^{$@^e#l`8P~#SC!YSeOI#r=3a1;aFIIL=uXHC4&>d!XE6oe^}TZ
zC}sl-`wia1v9RkzIA$#DBjzp~3wuH&(ZIr9l1?I(cLXeKhA4|jSlFglWoZpUsYxu%
z71iw$-EDW4a1aaoKac?|>~VgJf`ye~4rH;w!iw>x4M0R%KmMfRryUkn)s>n`lQtGP
z{fStZ6J8DLr=4m;ENlnj@5I7PSlBnH+D<G?ZtQ(BIHBYhOQ=J!uvcF}QSB8Adm7Ru
zv9KDr4aLHK4Gy81d*}wz{W#X;{EuT{7tUu^mom2&zJ_68eZezhVXrPg`G#U)J27z>
z6${&lkGg+>h22U2?Xj>I83v;^VPVgOdCjC(9Sb}CgeVZyovc$&T%7TJ?^xI#<~Yh)
z&$5^C4W+VxNdp+N1cRzXku)Ym$HE>vK1xEi!Vwa3r}5o{VztM@t}<MOV`2Z0p$sy<
zn?i|zg`F$16LH*q;w71zjmVYE#i`7NfrWj~Oh#U6ceC#EU+}4Yix^B;*ij(0Blr`G
zpHM7p2{{H9_96)b3!6v6z``!X0B?*2`^LhsTgnogtc1RntKE+DX{X~y%rEB(VO#VD
z=Bcy>q*#*HdqF-IATK2O7m%#qYlVM^jqq=*=PPiktFYEftTJ=UMG<Mm@J1tW@Ev%;
zENVeltA#WA4v8?069Fc<)Y5n^1;Ba?1%?*$1V1T`nGWGOIakFCH%@VnWCC4c{lFeA
z28BX}C>hPbZKDHtHZKemOVv7RVPJtgs)Ob8=pL36wvR?j8`{QIqK!0Zli}7}J&wTo
z$i0?lE#~4-p2=|`<(Vi1FIsulJ)xIp^D`04^Lf@r)HDMPI#}g-*^m1!&#t;`{t9k?
zMtQz0%d;gWq&yp6V8qeNv*mfcJd<CISe}KfjYF|KckSMHdA{@_-85;d;Pz*f=PFsA
zwOvBW^VaA0R-Ua(_40JQ8L>Q%VUiBT@_c&NzRPoh5Tz#V*KqqY%5%Le&jM>md7kpG
zy_ILe`+9kneipGjm$Ehv#qzv%=f2DHSRqPHT0giAEzgkoo>`d9Q`GMj&&i5sfPy7o
zxq`7l8wTK5@l3_IW31HMpnZwGj*4d}*05SQTTQ@{D_OZLj|(V|o6pUJO7&~*_}0wI
zVewXfoOmdnId(+^iz70)n1%}{YzcGhgZWIwVj`|0O>=pk5wW{~PUndr+rokzE`!8_
zL2`i&58Oy*kOg{>rFxJFT%B6Euo$GpR(*OLoK`mMQPgU#PQ-&tk1;+t+VDuMw$N8f
z+z?5%@EZ;xNUUz<TVge!7e1IzrKvg%53IpJNr+|75<Rq~AP2S-kr%lVl}oW}=pU<|
z`2i{7u^q^6sT3+zF4bPl<+0lIXK7RKy$tIZsX9k2w6mocp&PNyv5Q<FR;HSV6@=DD
zSmEhmwcyFL7chyXw$wRd`6koeKo?Dxm0m8lEx@{$QtU+CdjeTbP*DamaiZu_^h6~p
zDOf0uaiZAaQfDapN*oh~a7q~tlVL+R&3q;*1qdfsX>!a!RI-vPD)6Q>Rn*`?rs7#x
zE7DOd9)TslNsKkp8sFi;HNL~;8sAaI8sBbMSQ&YZ@9^Ln-{EqN?<ix9uk?iII(SKO
z^(^K-qnZWb?gkm>i%}X}dmg_4Fo|V;%YD!}F(ZV@<(bc*Bk?X|J5)RmJMftQTXdwE
z;*g#6ZCd(2q3)8Sb^8aqoa#C_`QI+brfT*X_=ghd=ouD7$d0e$)_~4jHVg5Y*RVN|
zaqa1+#Q3tP2WlQV&H~JHv}xaC&A_74*;uSs`iKMUwc1ojkH5D#A8D<2?9(8Q1mPQq
zAi16t&8;A?6u2kUc^o>3CH2GO{YPecLRwme(-Yp(OzwLK_t6_!q)3K|NJ5tEBa-kX
z`@u+tiAbWZ)(;B80bEQ(c{8g207gSNbSEk+u>J$b1LjulikY6{RIxE>x7yrhU!Hq6
z?b4WnM=~w`^H6Y#8sk4l+N5vI!^Dv1C|iQnmWVdugiT4KG{)ak@mweuOU{N9aYjWv
zY`&%9xHBAfHgh9KIvD1Py49)f;RuUirUE?9(Xq4QpW+z?{bD4J*vqmPb9gVMtt+~F
zeV-AxSb<d_+vu?_&xCj$k#KxK){cPofi?S9e^>d;@{CBfy);xDw^hI(9b8_TOFKJ_
zYnf+|mqK1KdDxvXM<j>r1dc%!NS7@!){Z18!15MZV$o4j1<0(&n?<`Fzf3||APL6=
z#2pFY7Ls26D>I=l$ngc1Jb2|pot{`bs>3|Om_3RirkB4DJxcL+*~K8!J>U^(9h!tS
z+0e;g<DV+_0c>0FIX3QV*?%YS*a~c(#m+X)lQI`OnBdp`CL8!ugdfnrzhnb{4~K^>
z%EfRWXy6a9s?{d8_4A)Z^Ns=G^xPm<RlbFQ0{IObWHFSBH%-Th+N%EscM=CO=QHSm
zi#W|kXwHz1{gV(G3$-{9$x-G)_4jO7p4gPrt~||tdPqOfiV}sVwV=@c_vE!pn7qD@
zrgO;2>%&h(m)GO}8bMy|utq}V^-GAgF0c2($1gx$(~#q!J%=;JT=v*(by=qRmZH9&
zscr+<C@h(7i!0df6J<H-mdj9dZh#tXi81W^@@$FdO3>Ay*JWR+cg^Zh2VIroYg(2%
zRZ-Mi5X~)lS!&@}IF40^7R;^^yZ&Yk9WUY<T0Eg?=nP|#+~a>i)y-#LE&6L!!EP{1
zvxogoUV>9S*{KeXS1OlbqzIg5L|A2eEo*$OHcEe<k6^SiB%f;{7x3xH7kktW=t#L;
zds~!PllF~|Xf6xUG8%)V_6<$prkFbDL)V#3_vCq@98cjyY3f#rqq<z4>4Q7m6u1Ls
zJ1R4y2|E{l)JyO@k(0HutZ(pr4YoXwH7GwAqURxlv@vV(%;a+IAB=q93_k2L<C)t1
z6pjJvSOCkFyKU3##sSwjXR401t;WI;>~b-FLYXb^?mvwq5f;&(2p>2Xb9RnJKNnN1
zhyGYgLTa3tArpU>>h>{)OU2W}&I2-C*tHdJt9lWWXNYal=am?xC{Nn6kGHjDsk^s-
zl4*0TT}W2t?(SvT3pp;=Uvu2ctJRMxcNR|TJ9FnZ@H;Ja=FS9cu`jc$uVd6~RvI^)
zQ@K2L=FUIeW3{NOr@vRZ{6~L$<?=oLn9AjC+3KFm#!V+@dI$F7UdB@D9|eTb3l^Ni
zxKBf(v(;8t4A_;s$CnksBjyjhS6bDNl!>pMT<yPHY4n|b%jWUw+SKi~m#Qw^3~|Yv
z6`R2KR=lelNWt68-8LjkePjBP%AMWIPE%JZ-X509*Q~QuI?J4;SZB|%@YUa)8R|au
zvx>&F%vmTOw%5v*Jx*^<o0758R`nS45|PG5r&OVksHJGL|A<=gKBFr&&)6%#R6J1H
z8nG7(Cq}>S#-ZmA>1=FK#yiz9e>Yn~7h57$5qNS@-w(;Xy(${8gR2THD;x=yEDV}&
z{E3w==KFFHlS}m}XU~z2Ga7Ao_Yx_3RR%8)@7nnooI#*4P2q-|gd_#g<Df@GDPGb<
zA~J1>*gnlfjKQwF&=gQKQfyWAsC(u+dC}RbAsi1N8pS)7=dzB)MxOT3fG4BL^>-C{
zjWJ?T!eZg{Zn7(5I~vq8EKOik6(|B6JS~pV2K!;bhHyw(5p8d#;PtS(P)(>SZb`-p
zXXP?)Y?sA0;oawsW6-FC9n*U0yw4>sm%Q!}ckT5*U@$w1xpSm%Lo0g}Lhr;>4>tGU
ze0#-{7O2TpZuF^~TtdG1F^T!=YD?_Ge35}d4XHmy?ocw;A_MQSv~U=OJWP89sB9Ix
zIj9ZSGOZpf_h3U~&O}I<vZBV>I{^80YprxZ<&NbqbWZjorY?Q)L(nv}8<7wBmKS&%
z8F<UW8%A&cbPnNqvdXXUU#XL#^iS3LAzeJ&y~&><KHv!cjP2!@_%q2$6|6wjAX9A!
zl!2LR#V>fl^U~pL4Oldc5>T?#1J|J9jQzTYSbu&FQ?Ca4@f(oRP<;0gOYdEeiu7tP
zQoMrco&dHSe?o@OES#n{f}a8hY}brdJozwhK5-{fA-H6&2<AH9>2M{^`xZ8*?^uvH
z{Tu$%8$v?F`S(0;Tb#C?=JJl`VJhR%4tUhF9i2ud&+YqO%*t-pYDDPh%4kTmV6aLk
zJBjTM&E{(~yw#%YIsb}riNhPFR-+GULw}E?dN3HGwLr6iG0CA!*u7wKJXO>$AZ=Od
z7H#?ty2T*J9n=#7CQooHw6G!*{3Ak6r^PXG=$%6kun&3>_G5xSDP;Gw=@ffsQ@2`}
zd!qkwWqgBXuo~G1cLuqYJYruMjn^-gM>U=%3a3eX1w}2UZ}sFJ*rWE@JId4z5b<Mw
zPN;kwV)E|&oe)rMIcq;C@6*7R@_vY=_p?W2dV7bacLmsH{V-zt=_A^Y4(KRY<&^s{
z1H<+lz5V<c+J5dAH5l4{zIC6VRQ_l!?>hU)fKG^YJsY%GCT!o$XM2{qOB?(>-F9^I
z>AD6QnW_0az}&ZQH~xoMC{0?WkPIw)=-_s<Tg1Osi$VO*Pa%I$^y8^7aW%>wAZ`T;
zCZp;wWZM#k<r0<SfRA@f%<0oiP$CjWCfE|L!fe|OX|~kI>=ks9I);-*F3xLlGOY3v
zOt$?6AAsN~m<Y60Jq!ZjGhCV#4fK>)C5{Kegj?e}Nv@$6fPfmFNSB=0k#k673m%<7
z72!L3UWc(OpA(7A^phaZII<-?CMTZ~u|3CzRkq2tMB;eB@7R;)!hYOEjTC!Yi!JVS
zbl|qCS_Y26<vErVI_6xi*jol0g3M>goVknzMmSTcd{q>c#l4I$WHHlg@T}A7$SXDT
zV#*#PPa>GQ-`KKQiyiQ%IUb;BEL}9y48;9mGnOIGf@lSRxFaZ7M!NbkUBUEle=bt_
z2ts12e+8$(!ISo=;vF7u8WC&Q|FGJdx^Zp~gDYyPgAPLicqm5l5$y*!<1(T&GkREl
zYJ24HxOy6iyuL_`Z^!Be?a~ksaf9@ye`_m93Kq$skpB)@a|LP8^Y7bPBRcach#V9i
zal2L$^q>2%DFosHrQVi+woJ2~P(E6V)NgFI1V@t2huIb2k4nM^bOOSI!~7vlX&SCD
z5*{F1^$)x#-rOYYmI%g>hZx2(1|Bk`=Eu|S5+Pk1`T-q{Rerc8^uu7pkt^fq;?4=A
z+z40AM>nMhc?En5o9Al4`+8`cuwYKqQ4R!@Cj*MHReMFMyZlB`TX6#Ke4qsu+wfKB
zFO`f&_YfR1)5KPt{*F@ln<R_vVVq$xrYQ+6yD5!9@I_>tM`S3KJ7UULDurm6!wXOc
zN$fXdgCBKYga-fgx8V&w>3%pfDnrkr4B)6p0Zc>y{)KX{KKg>$aKpafXoO<EZ^q?0
zDu<o&mB@(;7*38jDH;T{UreK51;*sTisx!rk0=`y(hip=6AY}jxGmo4`Ry#^)9HD(
z1`n6#3VgUW-evVGp8hWD*G}8BTNLZ(O5@jEl$f$&1(sv$NbkUNo!&mNIED-7$-qUk
z%eqBL-Jn>1bXmW3S-()MxR~YHm5SBp^h}wdr20Xvaap%IJp!&&Qg<sc2*+jp&ShP%
zSeN6o2G0aNkhIcbCyuLgdM|opBo04eB{;pk?sIx$A9s3t{4@O%oI4Ze_#9RCZLsmP
zKLo$WQ(JA<;6R#$Ui0wMywx`LbrMfYB5yUFJS&}y1(Db5pIdE-z5a<a$E?l_fB8Zj
z$z^p}KX6%_T-GHnYlF+$=*oDb{9%*D8;mmqUz^1i7iqoC2jVc+(DgQD-%tt;!}T^7
z#37fJ4L`J7Z)5qC1HQ4|=ABOj)q<)M$Z^N4x2Z>TTDLie=z5z9Ot~KV>uqc)J+nV%
z<;`MmU`wp1#RH3Q>hOSa1+AiU5l*y4IG8!G%uo3(R4=&*=Z9HT?m`yfJZWBp^UQ3Z
zX5?shV>MFeA{@Yu0gS`Y8l53p<9~LAWpEWnhp1^#<vA#rh7LK<pMDQ3duiw*oYGck
z3Z-V#U=yS#un6aV_~~4PBNkWu>}xxN)qg;z7QfNl_tG4f^M&E-Z|d$w_s|s6{JZw+
zZ?LXvU+ZtW!-;AA&7ouOuYQ+<MU^=Cw*&3{?px86BH8<mRqT3odtaW(wpM$U%%FX3
z*!KSwdq4MX*{DP8{r~$ST>U>D6&Og@MMNut>Cx@|ClL~L{C;p6)HU~R?^Cz<CENQ4
zE&m-dkeKZKBW9ZHeUtrxg?!u*>4ikOJXgW~d&gE)0m7;7P&~he{ddD)rw1!EFk!L7
z>2bga%!2vlQ3ks_$u3WEe2%AXF0_{%PyIYRoF1X?DV}Qv)1=oF&*d-(KUO^HiggdB
z*S9Lx52QhOYq3k+;8IKM4I{jL&UUIlx-ju!#mQ7Zx>A3HRp(QzpE=b}8A`K~x?His
zQe2Y*vrqNY*Gi}LZAE<@$1&`5TCp5$rz>?ce7yz}5^1PKQk2w2o-+tTtc5<+&s+#<
zjnn$M)B1r^eHT7AJFP1?+uQ;lG-MTZmy)^!p{(XP%(P6Mp1D+JmDG=2)^#v!xhZj_
z%c>zjIBQf8uBTvzEA<;tJ6+c8a9<(ZuT^5k+8g+TG;hqYev0V6a9Tel#DUVgrI;~j
zPMF3nZy#bJmK>`eHY*Va%P6mFp(V$Arxz{Lh17Y+dSS=99>z~eHGb|~Xu)*x-{=%+
z$x**&K6hlNZ-b2*SM;`p=4{V#cmk}K_)hveq5T0ZTU-)PGdH2n@9?q)_U^kN#y$+s
zr1CzdoBO4kv4VII1TEipw`S_TJ`%o2(IF`K0@X`*NpE?59)X?Q=MklH3GC!|%B!7~
zD_|#Y%CRoZu{P$=T3$+1*}7a<&J8&kU)!p4faaN$A2VJ7m^!Mx{N(%SBE$Bl3|T|o
zVQ4RplJ@ehcJ^}Xn;b9=d-*StYJn_tpuJ3RUi<LQL)2bwg^F}o*vq}&U{#v!Wf;-P
zl1Z}}Msx!nFru6BApF>AM57R*>|{9#pXS#Fjp&zeqsA0sL@zWO(Kp=zBbprT;@jb}
zb0^C$!-#H~#>x&eqIq9Ws1f}Xq$glRyQX&<(dvl9#E3q3MyUCdCFZx<?PqD0_O#>o
z?d|Cw%lBzdFMyLn(w?5VjN?X!+tUlyp;bk)r*B0;1?*PCo-QFXXutkf?P<$Y*}g;U
z>FaRPdg%Q5Yvy!Cwx_Q`NVKOvhtp8~Ir{uLb&p@NJ$=yf-_iE;{97a2)0pLKR=7JZ
z%f3cf)|WtUb9ts=26b2(xpVOX<2cLSklp|rEAG`sX|UDHXYUvAq*c1omkfnQuD24?
zn{pZ%0a%p_5xA}DE22OMXa_eFz_c6#o7FP}5nbkRc@m`!j!hpfd#mEPn?^bv*W<lb
ze}{R#fL1$LR5$s#*5#Sa*)W%9L4$Zay%G<B0Kj5xP^_DCJjqPXT&HyzjM{?1PV1Y_
z#;>~M#1s@Op4n7XU09Ilw6<b5vD4ePi&ORIr226)#3!)%oT+cX+RL%N?^2tc*6+df
zJFRay)eSkRuY-6u$GRjZbr;M+r?rt6upySs;J=Y$-N}p8T6jB2Y8yDa;fB_6tuys)
zgs8v=mabd317p~&5E{7CUMn^dl-TRI9IIYQ{Sn{%Ff^HZ4UhsRX|YI}!OnBR2lIqr
zOaY*%W=mXPyOR1gKfp#+JpZae9+lMXE}#e2*EnH~n2|=5jp8Yr!GP+N)K;)y*)}Mi
z2P%a7W)^Rq(+cUxvd>ejn8RLaxWSisWCI!~EgpsG>QUal{~YD*^$3|QIo>|^jPhQz
zh(v9Ux5qtB@4$bOsK-<~h+c~@!+jr1qYhKw;$<F6{yt(1E7M=YdIehcUfr@!u>Tgu
zdJ9bVPr<g&l0@D*5PfEYAQT`7k8aZoXZL~lLimA!Z&xJ+Pc;4+9-#n9(Hjl_Px;Nx
z5Wh71jTdPEse5GHa4J0J+2_DRqJ0kUf^lZ7vQ-ZU3gGMVV+a(W@3%4GS9`$&9$Ai&
zAPf)azmmMe5DyqH@qiue@Bqs~4)_Kh@W88rYJtdgARe#-(P>R3hbSIU02S}Bzyso5
zVdaJ40SS`H4qC?p01})ine1)BY{3H{K`S1yeC?cRj|vj-&ZYTE4U{xF)BeCj^ar6J
z!Fy(qV8|^13CPisZl+$@dECV>Vy69-39Rfekf7`8aFC!1(h~p)&b+A;Bsgq9g6_p;
zn~v+B!{^&uB|cF1XnTC%v!Z?C1CPSVA&C!+!zJ1W0UvnuT{Ngj_`u~TsCM{(i_8Or
z547AUn|263aN&}0eBdc_x+3EPg9;@+un11~7ayQ5@=L}C4qE;@8Xx%mxTyHR8XX^K
z5%|CmsBC})#0>jN10<+0K!Roo5<K{v1PT5ipS^!4pC^&;Ke0yGjs`wZA@G3~Ta^an
zfktO58{SHbt?GSPR5TNjfLr6SX%{fTV8xS%Th3t#1CUTWGimz^902bP`n!gAq5$O2
zb9q#1oi5Lx*NDgcE#mQ<hKJ&LiaIFP4aB=J(Ty4OwTkChCayxUE`hOo)nLWCOWY_P
za}^eZj{$Vyam43X*8nSUSz+5Oai!w=+h^a!8fvZzhl_ex>^aswPU|*U{ac;ZO~gj(
za6wK^>UwbeIryCVK5+x<4^Hd9!CIGNeUJM&XE{}@$X~+f=Q&fC;ERM8UdO~UBO^lb
zy|lnrimWL-hv)<1D78xJ2l%oTCO*9bEkN?Hl3<r&-2gm;DP)F_yjqmUJmy*5<x1rN
z0wU?2r|QT{-N1QmbqCOk9P39p>Ze?SP=SQJ;k5c(p6BKYk3SNunCnVqT8K}$Jo9Vu
z0m~o+4zj|@ee_xOnjGub@VXU+0T;w2a1ujK>JKu<%TPx(<fSe{N^`7hSpgM%0=D1^
z3D0c;nV74j?m#>enNTa>LrE362hsxRLo|wY2bMP&ZWuAykPW4nFZH-qbSBdS4uKAx
zs>h0ir^p7{l4YOe0vnwB$(cpYJeRlcOssWyjzlePik+!=d)*Hws^abY)JSiS=SF&a
z{duJKqWMH?=DNK0`7ZAHcH3(Z7JRwwv#`QJxBs^e1+-8H^q_@reP6(v1{`6%pk9_#
z-bUf-U&57btfZa;1sEf5{njD2gpwBtiTH#^kbM~-D0l>Ar$-_ll6oE#feRT0sSQSi
zG8mA$$Csp2-6K;2I3;hrz-Jh8Unas&-(=OBS$P}DY7p_$6+Dg=tQ}zG!Q&8HV&CV)
z5{e99JGSbrI11UfXLlGzqVI3Mk~^IDf{#plf!#sq{(_@lChsuBM{bk&2#zZYJI~Yd
z3>6*&A1V7kLA5~eI}jg9!fIaa@7Eoo_((HU+`|GNS^pF(FAN`Pl}vWHL40JlWHw8t
zsO^-VU7r@-TP0KM8f~iJ0i_Tf3|gJr6QZrGz+J7D`N{VOK$Gk9&`E@XCVn$$((_t?
zCgf=A=&}<u`DLuExaUe%b{J@~dT}^tG72&g08O^QPv`c8!(?T}`&V&$LX`Cs2{?cY
z`xBBMYmb-wW6VDBlAGb=ki<*U|H?t5!`D;X3_v0xUUCWwsvTa^hs*<nm(*P@TXhIt
za^!R2c*$+%bVbHXx?UmilKbFvfAJFPCck97<e=rhqw$i7xsmab%8g01k6U!iL=%|F
z4<^h6^XYP7MTLQxtdW?>9kmiOnJ%Bbr^@F^Q{?mXTk!Ptv0#mbuyAqYB)91Us}T5!
zW~+LHvA}@E7cA<~@e>yeG;A2S6&oKi9XXyPC-4&&9IedpJV!*t>6zJr2mRILc;*up
z$?@DzoioSt=N))BJx@{f%<()Gj|Z_53CVB?!d|hG1gB>{wN)oiy|ccqVC{kgPEt3)
zS{FMjQgNMuSf%k{4t7sivG`*Z?0+n=!0w6?nC|eB`UM<gt-@+0)yK6Vb&3_}$)`GW
z;<RogbTUu4+^M^CrLLySTBr3L018g)c47)S)(>4O4oqW^Vyy#qXwY=8A;5sl17ATR
zu-QV#ZT1kisX^vfiqcu>#DRvX8es-_bV^W3hay^$I+yh`#VQaH1?xjR^XplF>Jn$_
zE=2w=QUWgxEKPtebiFpX_5&qLL?#F4jRRFeQfB3(ZiKIOPV0N{MMJ@v`X+p#j9luP
z;4+jP&rBjRIqKG&)TQw7iPQQnJk$ygEHbCHL2R`Wt6y53I7|b1BA&Ap;0at3lo3dU
zlDbN-5{N?$xv49}4wlU>t6r*&IY4B%LIbJWgCGEHeE`Q5A~HA@xYb<ZR5(krLN6y4
z>|7!!fNJst9Mb>*rjl%dvJjjR6uwJvMo<j`fib?->ky1|3A~1<;7DQ~KkYE6T2eK@
zX)5{BD%jq>{|B(<LB)H~D*$Z%I?`(g-RBS3x>5;*=Xsa+A`i}Zc%C9X7Y9~)2-!He
z{zRZ28rOsjBtX&%WMh+{2#|ov`<|4<Qi$aUG62a)r-WTL2Rst>0VO^5C0s)&=X=J*
zFbT*=Z$whI2yeCox4?Wr!J7{G5Xcb(g8(j*w~4!SYVmm>Biu@#<jga1@^C%MSRzmf
zed&g1j^NZAoQ*~}4Ti6O8{w=pab!5NOul3|3GmL?6H%1dFrxtNX|`3rNVF#xXpcNV
zByc)zO>jL-ZjQR#slG{MQ=B&oak9v3!&62;3B$oa_2@#_0RcW77Vm88>VU$Qqi%Or
zHYF&Ya`Z0Q7H3m7{h<?sXo&OZT<VwF??iWnCLg#zBLPRC*y#`l#3kck+stjTc5C_Z
zE_G_WOTAE0*T}<W0_j}rfLkr!$%HIhbPf*X#2HxfDuJ8ppil%(8t1u-DK4RR_>Y81
zL3$;;@f^lxta|gG0H)%Jm=><s>~k6YuGQ=!j3%uQo<WUcLXGL{Bcadw{0KbgK%568
z%5QiA^M$iL5*XZzaD}IFgw8Or{;o;8LBT=987N-=m-<f3zWBm)EW2Os=auIX-UILQ
zJVKrqTtDNF$bZHP_qiMc>I($b<UXb1(zD9DrGJ9byKd<sa<!4j4R*L2Oqm*d4JKGW
z&Jbrf;dox0@ce_ows49v>SYenkMmm8;W(Lw)efo)sAR=+dxCQI?eWZK<L+3jy~6!*
zP8>@$SU5r@_hJn;Y8Tq7+52kWAe;U!>F5IK5I<>3<GNS{i~4|SW0T-090+qYPAy$+
ztGWp87xCsFA8v@i_*#jZW-z=a$g^cvyH8d;8H$RzhuaYS3><LS=Eh{mHus0Ebm@Oj
zgpNFjL^;H7uK2w+b48Z@W@`@m-BKrx0b_s7KYXmRv)31{W*BnE<L$L)hY7)VVsJ__
z$u6^+M88f5aVr{u6D?XCMRh<od2iQ#8zO7cp5k$oglpv?T(Zvo#F454&*8d<g$eb_
zo#^x~5<^+wW<VU$)o~ZuA+ioVek>)&gL95D*4e5aLIGqh49acbz)?0iXU3=QGMDEL
zY>{nqZ{lUg$Jb*%O~1edmp9m|IltyhU?8EFnKT40GoiPmgWkl|4S(?`z`gl06R1i0
zjY0lultv1L01aiWmX%FI`q!aiJWQA3u2P8q^W)U?d>O~7;ixLT2M;|^O_K+z1-{})
zH6Cf$Jg2Q~G&&xp2A11@e7IZiU=MkC>2;y0Xw_2@a-f^-$Y9?XY5%*a>(u-Ip&|W$
zE>8SXydyCa@*5nRKD|vjVwD_*SCsY8MrC0XKr`ub&C<p3sBG=NAz(CFc6f$Z7S*D=
zT~Ltj;K-&Gp}Iu)?AuU*+kFGzcPZ_S;R&WR)F_pE9Q6)_rPzk^gfR2reBwNaz;U&T
zOGSVCw(RAd?AKwRIQ5R*>*D!oAGp*d+J>D-6M8(+x8k5|-1UUf8g3DZ=<ztNZHq~^
zRcB&Q$gH^2KGEVn14pvEj@W@dKUp>g(CP0uw{KUlD_q<i<$Dm`vE1BN^$uRdskzka
zlXxFMg1E8`N}N3Cn`b~Kh<=%U36#4jvb#3A?c~i4tZx4e?)xOC7H$&AQEb0%5H?;Z
z8k2s`u5m%BZ!CCOOjD*vlRG|h8~n$(yKz96!E0&Q$FuS5Y0FJ>di1+LlASoqvH~%1
zT$$m-1aB#-$E9x5p3g)imCF<gF$W8$M<!CFU=!3Wr}tI;jB_IqPOo$_!S)?=yWd!R
zO>ibPn`#F_0{~iL)@*A2Zq{tribq1&bVXq+eE5%{to&Z3-zM#TJn@kl&)29!Y7sZ+
z?xR&F-CPhNz$gO6Gaa(f<QoU!tf}19#eGcWF01>v>UYW^2i>&CGkGYoI0(EOUKI6w
zo{?<q7pFeKslx_QW-xPhE1vTey(nBbT-DF>esRE#xO@IFQ9``-kERYcBZOWv7kceq
zJ>2lz&k8(wU?)c%%FH}IAu~8U6o=<$RxU24wqmP39;+Cf>b=b%@K{5hPz>(X@Cy05
zm&z=koMdx0-P-~-ed2Wo9{j^A4QKx0gi#w(N%tvW1@E+g9GNe@gY5F8L0PZgUMgqq
zjt(4cet~|Q;rTRll4%|1nlAM-t}jHV5dSACxp_Qbodbi#ujuz5?w>bau@{Im{0c=x
zDzDb#X^kn2RKHXYhvn6>Fw}eb2<ki?eF2@*b1&PzGvi(ghPxXQ#1}nzqEm_&cQ(vV
zd4N-pXaFlT%Oz}eiw83Up5Hm}m_HBgDYL!@yryr{>QEVr$<gkiOZDD5IO*W)G%}m+
zrF7ySB<L|A_8q3E0q1Q%yz=T~DW5$rlKoD|<!pIRhEKeFfb#P9<azk$gl>Z$aT^Yc
zu0!riW7V^i4ybzFrlld5?fSb`G{e30cR~9Zou23y)b~ZFH>^Ox(9w*P8^<8C?2TiP
z>%@DzV~}gfPL&sC@cPUOLG!kdeIAC~LZ>ig*tempdSSLC*^%*Zq<CHEgn3sbZv7-X
znSw|sI1HKZ?2jDmTU)?n-`Xmk56SC5aTqdtLtEs-kW0}7zkLewgma16cmaF9#~`b}
zwN;H325$+j7g4{{=3a==3HVj1PzN5O8w^l0(A(ImaCHh+h&^Gig@4}RIuB1dT$C2`
z&JCO!qj(&HacqlH`2{e`5*)8={g&&g@?6$00d_TGp%uZk0<09m*&$1DU}zRDTJ!d)
zMo2gyrB~k(-q^lGY}3E>pId|S*y^;Mg^gu9xO}UC>ttf@=GmMs>nC*O#PK7pjPGq#
z8{s`W9l2|RzE1GhcOQP}U$LFFLil?HP)HY7#!mNi7j!A>o*Ac@KWDvyBP_8RY>!P{
z0d2&W0`E17x<y&Nq4I01a>NG#$F@8!<Vg&8xb63Qa~5kvTdq2`HQ}UOh;bV>d-Y|8
z@^ZYfi2w;%27m)|aSjgFl-bl+xN+g$n$;UJE5EQhk63LK1mL3vAN3d3NwM}r2Hs{a
zqhtrv_3Op4)f8=1@kw+FNn(w|kvP4YpRBffy6B&3!al{=?*0awv*?RMxY<{%?d~`6
zNp?=9=fe?{qLBHcH*k=9=ziRc3(Vp)iW!4FK0};G3ndNItGYNn(O#SYA$W=b!+#{j
z2}gQkN8ClaJne!!y)TyQg~(G0<*DyKkaWt^nIpV?&!oVlH<;u}?A9~MQv>A5FOGZ_
z^3-apdJ?4r6}fV^Ax>U|C*)Dc6U6XA9DUOTsEB(S#0keA%{VnEA&FTJLYg*#Yg4f?
zt<9GT-#lL!(DLf<ggo(5L@Aq;Cy0~b<F-fl;wlhp`RvSXOCe3rGur^%0&;N+X-YRq
z6PldUy4t38WihL(l+~N0G;I!%rdH%s*IF+gM2Fk8<%13TChR<M+J8dxIY{<j@H}&K
zDmr>f>yh)slosd9_oYw&;kRfchp9fjxaz0s(|;WJv-RnO+MlIQ8{U2?`t-n{K3&(p
zoj(1d(5H_?Uju!*0F|+r9Bt5mPJP;eLeUnc$ssF5pN{`SxITRk$}6Bxr>6gp>eDTd
zpLY864m88P=+nmaO7cz-F)MK}?-ZHz8;q(QzlP_@$00^y&y%g{V(3Qzj%`)1;)T;#
z*FeU&mLOLgzuyg9q3985tJ(=6bYe@0%i}0^VSRz(DUDZRUeIBdWS94fHg$F77colZ
zmp`~-p0HQIJ<ejl1oyw87S}@I?SV<yKZ1(}j=9CSDinb41d#grd4icPYb)mcUD#<~
zrPARiPV9iQ-L2rg27X*~F=3g9xynTG26{(;#vAA#0yN$ddd$_y9&?4hp7C+{d~w}N
z4YdmEIviCnHyvnb1;V$`{VRt1SCq;o%y8~3_xZ*P4WvzTor{t))-y?DE^tPSt?C7#
zk%r&1V!P)tonMN=6dG(Dp2$*_&YxlCLq{zEU+SoD_LU7jL`OXnKz68(`Y@6etTQa<
z#+VJ|T+|uQER0@fgTw0VReJ@}hC0LEjP0ni`u26!d>87BD{rX}8uhhS)YlhC_yMl3
z-TPf%x=xsiBBW0ETtDEAN(6mS48aFoA2g?;qxHdi&NlSH+{G0SV6xzidob!&fGbJs
zy&!K5kQb7?5hP*Z6VAdM^LmtRV7_p)Qn|6f33Z(}Ho*<Acm%+oRt#@^8GHv`fFUH`
z&dv{)`pUc7PZ0qoK@q~thL|tl{Vu$J3w}~6dP>j9HNEk|yO9(xZ%ctoT+F#gTgrxl
z#URO?0I`L^^IQ_qanpo=?F%Fb#`3wgOtj$WX#?bStZ3y;T0giAogb3=`98|C77N-@
zo-H#%%5!xpBaT*{&B=Oswx&cZ&#A19L$N%&-@5PeTmhM6*?*3ynx9dgFU#_*ogPx2
zGgJ0fo|ZJdJRO50mgi|q(xF(M3#RP5Jf{g!YSQk5+n-UMt7Lf=ObaQ`^fUKXo(T@U
zJPVYF<@qja<4`Qmn<wwPJkJoK)TCVkw?Csi*UR!uE)OZsFHYZEd8S>imuJm25zDiZ
zwQ(qx=LwVcU7jDDK{rj>rjqdT48hN5QJ0N$pV6>*D!HNi4ZrM8-eI`k@boz9m<<50
z!}l9brMy%V5XETGMN%!)<F0N1zm;!^)e?cP7HEA_bs8K4TSrOo%0$dKP;=#Uq&}~Q
zNrYN*Qme#VlWD3EQ>9|kR0<V*R>0k20<zlqryZjE4U_(SIP5pXfl2|$yK`?~)B}~e
zLe%Cv05|CeDrF|4lL*}#*eKwp1ULlTwD}aMyX0t1blJH#@RzYS@aB`m_!4?`(Tn$n
zLuvyc6M?;fAHYxN-oV3TZ{Yl2K`98VABu3EQkvW!Sp1jv`vbjwh@Bk8`#2LZ2J$*i
z8l^G*o{Hx}E?<e$E`t-({y=>_+{}#}>3}aP>Q*eB<p_%*vI0C#OS1dsANB=d%6TMK
zCjv9#+;}N%U5N&Pg#p(EyA`Yg48w4JEH1vpD$lR5z>{l1Y3d$<^*&fUXZ3fL&n(Y~
zWZO$aQ@H%6K%Z_$NVK!l$eTePE*M3G<Y7(P9Jxva>;zkiOd}=-?P6M6-M)wi_sypY
zkXa8c$)a5_gM;^1?y^7<jtMLqMMALL)ZNQ}WhV56c(2lyiC~4C3=OP#ONi)EETQb>
z??aDr#i`3K7NK?zctl!<CSl4HIvFy4DzHi{lw0t5HzX?VL}EOxK;~HN#+o?^p{d8q
z2L2S`2dwJ<5_p*QPz4%zU{ybtom|1HmMc)U!-rUbf+en4rieS2-$JN?WcQHy#VXWz
z{}GrPLpJ5<Vz%nP!Cm`XfP)@-&;zrlju4rfAszcCA!Zh8aUhbT%!TUj*{(b<2^34P
zJk5T3NI%hvl0a`Q3N46-|F6hvmoRyqU4974>y=5-<@KXuBgpGlcZJLAUm&EqybeF^
z7a^~$C^WhHldFvm`hD=v713Vm@cq{tsvsVb&a3+~<tF@oxW~ve<}3co_ra(2l7bpC
zH{qEYJ~y$`oUX|GukS%fgy@fgAcx{1N*G=rTt7iu?U%g&`k>{%qbDbPN1ODwAfD49
z_k+iD=>6a^I3)dpk>1$l&?0b~TCY`DEA~0=2j7(b$rj9&uE~d;8g@T8_&t1Ea6dR+
zdTDrR-h%tVNo<fr-fBAePC6M2BCpq`Ew~?i(}BDneA~a#Glb!34{RszFvQcM-Vfe_
z`Uv7_|B_S-s;&d^w0cCRePcUB@w8bmsSb<tyH3A>RcSuItMh(v#Z%2iw@QZCUlrwQ
zGl1ll`Llu`+owIy%0of6cg!H$oTC7;k)z$%liEY)spY?jQ_JJJv$Deu;L3G}gKVoH
zJpqvIR`}@z*$xwsZOoDKJOS$G;pdg-N_=h2U)$qr=Nz$5d~HK~2)=gc+z<ZT)d$D^
zn}((o(f&h0wYUGsJW%!@mgTqGKjFcV<DqNQcAC=_#r{J`!v2Fe?63Vt-Qt&Q{~fga
zcewqBy+i^0K4|~(*sYGg9~=f@=l$T~e()IVdHWXHpMF0$5pv!S{v+=Pe+w;B-Vgp3
z?+1UM_k%Cz{op_He(?2l8hSrCY}7dG<rWK`J^2jOcliC_v}|GG(#%ch^C4c=z}|fq
z#Mt-YnN;4#bOS?In8Jd<_iJeRzPkly00>_n316h>5EOiY>ZQ9J3vYRSK7gIv=Yx*8
zAAH4n^rT_-@{JmKhoQY3^?vZ?T(iA=x1?Gi3ms@LuR(O$%a%jbUfux}>9DYuzaJTH
zFXQSj%P7IDV~uv+4-S2%Ef-Uk`(Z?j`@t;_23D&4?#DghM)W$f5k0(ZPupU0w3GJ0
zWv3DS%UG$>u#1%)W<(!JeY<pare#6tBUllDiEI_p6ELFt?gnur4z=?Q#GDzPJR>U7
zp$fy}{YQo!4wYdX_7t39?irYs9^ON^Hy;jlgyCMC<`F59VIq=Ya$&$oVcH^+uA-?#
zie#9GWSER(q?j>BB+@;a)?@NafdhMT1Ea~~eB*(QhR5pIe%KRY{&0V81bezv+SAJ4
z+S}8g?cB4k^(v3TiD|vcp<_>v!v?Q|FrWJ9P0+I<+0&P!pxW8fE;0|0J>9ZRw(pSn
z)C;c)x2K;nrz^5OJ!tzLVNWlD)BUxlseAmA?dgM-|Bkk&fB!v%!dMSyvZryDb@P7T
z4-OkEu3)G%*z{*_J`cb9!DDh_I`0SnuiX#+IqnDFgi}j!S(&^ad<E_Y#}4Z(aX&b&
zT_1=Oi{<^`AbRb=4EHKx1-u_zyzqYTRl)ngY1zM}TlNX|w_&Wez;yo<Y&)jBN#v~q
z(FarB0tyhs8@f#|oUH=!h42Fd-~O7U;EBdR!y^<RDSD&f|0%!O8RD0QzwsgsAa#$7
z8%~ACJo}sQkZ6DNzjr_QOE|AH91pl+&0&fMM7<xp#lZpJ*pE^ssTNv~9k(B42cpyd
zjuT||bvPicS{@E4w#Q(ZYz@<yV(fmIBM-2`65m$vsbhy8G|01q<1#CG*f7@HR=^Fz
zYQfWdwBH<go)<!Cpo=C;F;u+60uNY!39HgPe-1pLRWey}ru(lXvsp4*L_Rz32j35n
zK->>LF9;HpeM|LpAx|SzJP$kYnE!7xNO0<R013#^cF<)fNbt)53I4D_8WABU#C$y_
z93&VInFxRc-Ta*(!C`Yh_y$x~(58!o57bC}p#I7B_`pKnKJkIu;pC9S2Qmk99O>}&
z*0*0B1s_O9LAApN`jUBo@PUS}Wz!D92TmLojt{8jbVbGoj{QdB1CPULP?jQ{M;=^n
zO<m-dj1L^N{C6}yaNGK*_`sT<c0V{lf&l|0NH9V^d+X1W_&f~n2gm$>=l$S^@BQG7
z+-ccB1fmX?MhS}dgX6w2)BWI$;NV^{)BWI$SnB|Y1Rw@Z{cXg(Q>)?RHQW#G!^x$a
zaoyAxxF38cPqgLz;5$wCgTq(I{oq@8KX@z9gBHH^{WspQYJco{L2Z{*-bUeSi*SW&
zwgt5r6kv?J^;>v9`1gcFu<jood2crZ1O<=0ADkYEct~n1C;}HU3R2h^AS0B)fYd#1
zlTLMyOby@^{eEx}4-?_1Z$dWpW|n?GxQL&w;8DLH9IU*)oAI02ck_Sie(*<@wZ}*L
zHyx(<NYwkmTh67zW8foKNQxG72jU}1uq(BD*B+wy$Qr1)hXp>e{2W$g7(UW0nW6Z|
zCz5HxM}VY!Et##X`@{+hP5#dN!S`ong}5KQ;-SFGii<y`&K?4q#9{6{vpxYui!(sJ
z{S2T9IoeXX>;z4I8KB98kECT40-8LBi)%txR-6l&2!JN<z)$DOio;}k!iyj8iGDwL
zoy1F0=C#L5yleJ}ms|!Xha_H-cqT`S4#!I_10WG`J%tqo)ebND;X^PF5MEOAzHHSY
zc!_^tI9_s%IbD(QlCKdG_a{t-)BVLusGIzf@sfj<|Bl8>obN@(OMc${;KWSMKUHET
z`m?wGJV}3^&gWrpKX?EuN$9*Eyz_qWtO)mm<90vO{osOHX@E0=5>U-NKsAD@*C7~5
z)hQla0<C|V$4|T;TsW*Hg|ohU;VR}Vd#hl3`}zUayo>w6cLT6lhx@@n_xS|JEiA=t
zJ6mx-_!~Hyek+j;-VgqUydNCR5#R+u8mtK!NPq-b%h*kVB0vHv?|V`bOCgpc$N(fG
zof39IFuF&gKA@z>zJzNC<$TY$7$yN3>5VbtGrZw`aDn-Nf;S!VA&?^o1_4|~zaJc*
z2QotZ*Y5{6arFDa83f%B&5`$m8=Q?sI1Pp`Bv*!mRWCARaP<4ZO}_N|!SRW)C!#3#
z<9_gc-am8QivrfcHA)yw53~CmFa6a|y?^GURT63W8TUCVP+xz>eU65=U&{S6vmPd7
z1k-+nmi8u;`_TIwj}>5mexGB@TL1&d(O#m<&ifoK+QqL&FqCIer4HGG&=n;YxPRs;
z`1zl_&#?ef(eD14w5RrZ|BPw9?N7bWajR`g*9o?SkqP*@Dj7dFq)o7;K4z~4bcGjr
zt0P|K*ee7F7Z~gJIz9~=$4uhx^4Dxte+1zfR=`^$18dM=C2C;fROnBWq|wNAaXhIq
z9#|v(NyvF0_c|hh@?uA%P2TK?7kRZKUgX`56U60?_#I<M77}shByK9^Fn*_<_dE6+
zOye<dzvKTA>E!*61G?Y^mobX_9qV6%H5Rzv@fNso;j$B4$cGDRt{2o3_FAMl;{A>@
zaCc1}F63JsxR4K1Ip-P|JUVU9zH7RW51T)i#zSlP453*@cn6y9cAQ|F5_jowEcuk4
z!{xI#X&-cROVCD?H$A?=n;ykgDZJ@%K3w3YN8D<I>+h}$ab5#;<dO+a+vGJ9Y&YWn
z*pCtZx(T-4oQPS+NtE%scU<P}H5j*1PsX>%ZtT1Diz3VGGPf;3BsekvJzX!{*mx(-
z6SaPbZ0=TKaEAu2Yjjz6nFIUC9HG;SWvIAikP+K=`Ebb$XkOcxy;7L%DJbp8*ES9l
zH`_$Kw()HJQw?$s|KdIz!rizJCqe%-H|!Ix#Q8pOZR7mq5zP8tIQ%~J*nzu|#GsUn
zLehCb4x|KaU_Y*Hlv46qKuWMsIdE-bWGU%uNJ-$v#%%0fhL|MvmSU1DpS?-@PDB=Q
ze~!5RQ{LQ2`N+xGVypTqN`W^w?zFl`xxBH*MwbVO!@E#=@9fRn$tSOkC=aN)clC=N
z%b&~K)@XHmMtCo}fQm6hVF&WERN>8?yx!FMp*froQDCcpmjY;Z_GVu;1xm$*@N2c#
zmq~2o3fwl1`{TpT>*IZkLd7`f_v@Hb(a{jW87L!cx!``TeciWs%hQLizB}repQ`Vk
zv-D@{ySW%>e}=wmc>AU3yAK8RT}NX(efKn>@9Ot0wl0CbOOCdJE<5#Ii<YxEg1$Q!
zx8a29yT_vB0{ZTJ`1zmIcS|7^?eyKjPw!RV4W2I@kFkFL?^}ezD3x96x>R+k=~i&e
zOdVq{g_euc&GE}K(#6%~PvTQR#r-`9lZx9wZ%}bp@|hC1v!^82fTW5`&6j$JSXCi6
zaF8u{bb<{Vd>3b_BUy5D243{t8qjcC=o<>IoSz?yyHSGbEtFiT-sVER?RO5<TPRSt
z*!nz#Dehf-0WUm``-??XSd4oY+eFmH9e$fZMZd#uU-vGyK>bVtxFr;nbbwe1aX+BV
z`+H-&Htz3>a^E7{y4C>I$^-V3DBeI5^pZ5*K<^09cuVNPLs<B^$C_yOEv^aNw@CN9
z4fng--?#YbLZN6<c#KosP4_LnD)hzn_boo5^Go4P=$CbPLcg4&^W_QqurtVqa_I(t
zu><eg*jFMbmoJ|Xu3VlTQdj@Y`xbY!ud7@fvbewZE&liGi}x+=Uw!Ec;rs<sA<RV8
zMbrny5PZ<}L31iPS|2<XMKqy?>#euiezhy}YM1w7|It=#_IIiuWM1i1zt0?#ss3=K
z;yq_0*rQ#kKjKQoc<tGjA)Jjr#<)*T|3ts9)TM55shhIYZ!+6@twnRgb)}z`Z@>+N
z@z-7d|Lna9U>4Qc_CML!gb)xhxZnc<q97(AK){87AfTubP;m``1c(L_lYoF5DpgcO
z+z|J;<BnD>F4eSdv~@wHO08C0YSCK7rAn*j`Twq&bH|e*3iR#UuiyV;$l<=ub>HXA
zHTRr3vt*tp!;T+z!mtyE6+b=ohx<{j?`a0Qtol@>>f4rW8Q7MAZ5h~>fo&PsmVtj?
z22#Smo)`q#dykm#ZMW8i>bdO27l#d5l=I%=xg!s__-_x_ee>K3J`}BG-O$LccD8=#
z&;>`bJUjHuLu4Nw+I`(AyF7o&J<h*kXqV~YZ*%p!q1Rlk<xywv9C~O&R)-E9ZgTaj
zho08yzESVayTZk97|L_Jvtos6$c1)(B*<=tg40~x%=reKT^y?~iPf)-)q^1CK+4Fb
zv^Xs}BlVcnUyk)F;5%aVR9*3Vi+(%cFIJ6PKgP%W-XUDfT05(!IltLB&mSWS7qb>;
z^$h1X8|R(djiMl!enDYKo#O0VXRme^C;N83#?t|J-?bOzuKfoup0YpO{?xI-{x81p
z0%h#}7c6WgykDC)ZrKliI40KLQ%Fb<eD3T&ob7UN#1}jf*<sF(akkvqi7!O{5@*Yu
zy};RpZ%6)1oxR%GN1a{HU-#DXfU}P}`v+%R?HTzyINQb9!Ol+PuP<vUakkvq3!I(9
zUlZ1HwzC&Fd#AI@`Rlk^9&q+iXaC^r_+t(nn;20xyL?L7kVGO8g!Q6|lG>@2)iZ`9
zf+-cnCr_^~o?109KPVb^Nb#_-V@4fz=*Yt+1jkg)N>rDfGOMhnwyZQ!Qc*r_=8UqL
zwTa%ro{8G&CAEq2n#9b?+C)jBs`Avb>O|$#MD3}S-GbU+Zg5OcR8n11QBhWr7*|$P
zR#H7>dg73>>X~H~HHq0})ivdnGZVpqefs3)?h^_cUt2bFN_j=1Y);vfS+(-=lQ$wU
zt-8E4II^Z>8shicJyBj;R$U@@%>jx1N~)_%<|azZ5vBePNF2A{<ci8ECnsvk=au2F
zsV%AAM;(MX>c6_Aw0u_00Vf0_$BjFD+z_wB#Ee-rwTa1Pi39de<eFQpe^^6fNL6J`
zd2RXZvL6Ynt*lH`lvGbEOYEJfWNW8ZRGylsF0VP+;%#dqHHn#J)7YrlWr@n_L}T0F
zuvs%EM_K)0s}uVtf>F|>O=NF2F7U$}x4n@~D1O4+DtexpU@wL#4!!V7PcSabN6d{g
z+$p1qj!cw>BZtkIa&k@LprV2KiJDneRh8AX{esCQHRV%^Yig^@XHFY3r1;R{DeRZp
z>RD526EkO3RD@$=Hp8ZrRfVhGJFj%_nz>Ud`c0V<RL`1e*%+HkX!Q(fWw1;wt0uTC
z;j!Z@E21$G_Eu6`Ruc?QAicIM(fiPYDk`gL_Nm#Ep_~{tds?EF@sQ{p)-`}js>>3!
z)pL<ZY7?_+${4PeiEt2?R+dG>xNJ^&O>Mt6K~Y6n31QR9W@@a_dU_dq=+wqmvueW5
zV5d};HpW#}w+TvSa+s8sGN`mJwVOgud)J&=Ud!+=pBYl6)$Hl&enG!|oQ&cyCDW^_
z!ab53jG0+lHYZUzt5$oZx@6|GvRI}|s;bInmPWg1@~o*OEE*0Rj`PZ@EBhrTR3@fW
zmq~kx?Z1*KQ_5;;Dy#b@!aeIZvvEHyY{CefUNST4C>T~-TQ;LA+?txQT84i`ZFyA%
z-A)OQ!30xCw3(GNW@zK5Raefc>X$gsuSN%rh6d@?CXs&<NG~Uc^MM9^*_^71@+qWk
zM%j$Y>bZ%^DtDOo3yP1OFup)THMcmgbj;L|VUqHGpz}Ps{||J3kIw&r&iCj6KhOgl
zJ*8x(CN!74n%dGKLuQvvsYPLUIJ?};D4A2N<FEIg!36d(W2$(1Wle2yRc&>ms#@A>
z=Y|t!c{M{zE+)wGnM_?87R)dN%`Pu3D{X9ERX%fOS!vXZOM#O@H2s$*7(&yVbQOxv
zFP~XntE4DP{TX_Of5=#A<P3>0S3VJD$tS}6_(Yf)M?`CLm2hp~!}6w7<ZA@y^)H_p
z9-qZk%=|OT*xcf>>gvjBFDAD?hrJF^^Kjl;wP<*F{u<A(akSK59Mz5A$MJey$6pp2
z&zFd5saq1+6*-X=r^VXo%SN>%u8OS1<>ch#=H%t{&&kgjkTWo6P)<S4;M|<t+}ym}
z{<-<N19AuE4$3Xa9h{ewmz$TD*FP^mZ$RF_yg_*dd4v1s^v~^|*S~-N{Qd*_59~jv
ze?kAj`8oNy`FZ*M^Yilu<PXdrlwXiPctFm8+yQw5`VYt-FkryI0fPn<3>Z8xXJGEY
zyn+1(<_{b&aNxi}0}BQY9+WdEcTnD-{)6%d4Hz_V(4avDg9aDm6yz4<74$F2FBniT
zuwYO@LBZg`NF2=S2h;Unnhk~uH_rQS-J&R8tKIglb9RHXS<9k4B%B>zn>(O*d=-;8
zyNJQaXdYA4xOWGZmerP&SL6;H<|dLcGpZ^^GqgvJJ#27s@wAz<il@w(lbcsOmJ@Js
zRV9b>+>v=BM+S5|(C?O$M%kFnx5+I&bXINIoZ>ABk2bpQqG;Tl>$cm*&*84VGRAMb
zD9X<&$2V?jUXBgq%E>2j^xIf%49LxkPKxG;)^F?Ua&hzHc%xfSf%Dt0(w}tIV&gOG
zn!>Pd<1?)ApS82N`X7l~wK(dp@cO8qoEsxsXtpk@H*SvY+8pi9=o)RzvBwSw=UnEK
z+2alypHn=5%fMM>BWHw_fzjz>%!J~x<#{6y8=qU8J1D$7WY}=cS2?AGDRaz}kt1i1
z965e?@yNptIkF;bIEYhAX+>G}$dScUDn^bUQ9Sa<3iY1P70!$?>TK-f+>tEB<41*k
zGk`YHng4^%;S46b5wrcj#BIOrkM%CUD;-ZNgFo@wlP$spR8lCdC{-Sw<Kg)pUI^Cm
z@94+YtNTvF%RF4?;pJd0|0mXK+Vl%3!z(>p@8MNoE&n&@v~5|9Uc+lWyw1bx!CL<R
zxLvmG8`wU>8$B%2_*Mce@jOKArhEYoYg^^vIUb(x;cdrPG#9P(a#HW%ZO2!XpPw2(
zHr|$ad0Xb;Iu9@R@CpzARQ|31)n5Es53lpE<_(MA;NguP-qPc1#k@jVv7BBQnxZoz
zTX$w;H=N~ci(#R^uvKK2w2th$Hj&L~8`&mjdb^nSPWQRRo1X6NlHteC`onZ;=bWEg
z?49#NJ$9bnaAmaqkmSG7S2<noxn1J^!qAmtc12X*<a(f)>z2I#g6kH${-|3TZI@kt
zMEQ0K|AYCS<nkLPmH$>Qi*(I*&q1r6jPg6*>{DBw@BaTq`Ob3N)imEu;eRmStDO$Z
zckgSWeAl_>%1d5~@>^&2<t@*5{(n)v=U?62_;w2agZVCW`L%p6yEf9b+C8VQe<#ZC
zYP0LMJl_NUi}Jm}ZD-T*?G*k8^S#35*YdsUx+vc{>!Z9DI$PvyowF;P9bcQ*-+wT`
z^M>N`nN>V!E*rDS9G@HAaTb^J)M4cKk}>1^7jN#tgU!Fwoi4l2H@!vIM|zk1Ez+Cy
zX=LZ;Z=Ky#tDdkPS~lbG$tR8B=G4x2Ic|MC5E-oPo>6jgS#iyDo==w+*Op8(S)162
zH$*xUPG63*h0Yc^Tj%TwXX~Af>&qMPgT7&Qvp%}AqO`1f%un3PH+LsKxS5{pcD!-B
zcXIk|f2?+S8149D;{tPYf9Q5XZaxp5i>H>)EU73iEvYRTQ^aG1!^YPRE}L00xuUGN
zeCn8qHP!ujRGXVqUc-Z@@Hs0_CPt1Nz|%+`S<D`pU(0VmMvfn-OOn|mi(Q6ozf?IL
zmiW3GqkI>BT^LgHzm4n?XS2SG>YK=JdL5!Co$*<te8!B)Gk)}G$e^Ei8ZykDhWzln
zw71jQI1l`=#@H+nt@cMQ#~Sz3O4nbw(fqf(&K(~q&Spfm&e?>!zWjIQAt!t+v}K8~
z@s#6q{>ypDiAIEthkDna<zd}T(RLT@9NEHMUEOTgsJ@vzxaVo5|Hq%FS>6iVb~WbB
zR~Q>XdhGYVbsw<N>9Bkk-Qx1=em`E=$JNdD-ST|rjrs4%_wt(~-A(iD6#fVEJ>BKk
z@?C#xq^r)oZ?I&DtDD_-%k$m;zbN0?Zo8W1+bR4H=6kKvVfoJCTb8ucyZ1L%9PH|5
z583j3=l>Vwdm-Ppt)*$cox=ZMzDK+KhGO`y?v6;;2KPS9y5n5k?D1Qk?*acs`QGTZ
zvuVDa!vA2tSGxRKzSk{}@|iW=<+&oV!HmexcXl)9%kXL@HhceDub-wnosIeXVU4lu
zZQ1qHM%SO^Vf~$MyK9_1HL_XGE^+qXnTLPn`l-t4{Fn0(yM7Aping<+s=S(4%7PK$
z3q)hfCyy&T<<Jt|fr>4<*xx7mg=$6lWW6_$nBj+o{+g<?Ddqf%abEcH7cbuMqEX4r
z+8X-W<OPvf|BZfoQ{>0|_R7eQ`R(12AM@KwBtPa4Utr;liP+Lq-%t4MWsM(eZ|`pW
znBQLIi1~}${xUkn0kc)kzu|5-e(#Cwl2|)yZ+69I{Hr(P->?~fmeXVFi`$&d_?KT0
zZAZMF)gRuBzi2c4S8c|>WHbI1oAIySj9*^^^izvIHr?Ek8bojOj<)=t@8ZnH8ZEgm
z@^2g*y?;^Y#z)}zELS%^CHzeYoj8B2yI}f7O_{XR-COFnCz(Nu;DHvAuLExvOQmdv
zvvR54#@X$h?d5EO-}7%rbPDyud4cZ0vHf^z5YTU0_^xs)e0$yiP(SS{jmM?Ec;@-1
z_<nC*vG#xP{ocG{{yB(f?BAPL%s&({jec)lX&<x<_2r~R{>JyeLTxQV-)QHv*TJmM
zQpY!WHO$+l2YtW2Ddzcmlki4O-dtq;Kkxg!xybyB*-?${y}8J?=`0d2f8$$b-Zow3
zeD=~=7W+*5Xg7-R6b~!+#w*W;l~cpYkzwV<uySBn+iO_cW?0){Sh|GM_(w=kcU}r3
zOrwl#Db^WqcJc68<rTGKW{#?;oLo{dX69_Y9mCtoV@iq1U@KZ<r&N^G)b!KVH(m`4
z2;ck+--#JHvfq@7Aw%?%-H;*C3!!1#j^S8urmg$++<@=}=}o(cUga7xBy<O(P`-lg
z=tZA82FCEe>f*H>I*xXsjA9#A*B6wJ3fhHuPw<v(r;a)6uP-=3IhcQ1PY1C6QXJpJ
z5$r%w|9U;Aj53v?C!^(*lPJ1)_#@>l%G;E8DC;QiQs%Le(<rA?&ZL}0nNJzUMh&MN
zNEt~vh%$<j$G+}Q$)_AlIfOEnGL<roGM#b~<zz|)<sr($lt(BlDUVVfqwK|w??dTJ
z=||azl0*3o<+qgIQC_6HM0uIAgd|={xr}lJ<x0v@%Gu=N9Ll+rt0~t|uBGh2en4(e
zNYSEtS8PHRmOktW`L&;9wHUW+RCQd`PUBUJ#U#L_DO`4>Z#F6HM>atn$>F|MeS17e
zVjrb36Ga*n)5^t&+l6{ttZC{>tmb5K!W!?Ys~z8K5cVUk8^=N>R{g6#`K-k2>f0~s
zs~eowFJAS2Shch57~<-R>Bg2!#{Mho^4BZejnS&#`~N%o+O+STgHu!fclzFRUAqMb
zK>lxRM|@rJdN=mmKJ2LG)~&Htg0GMqYrjqgbGU?@#>^DgPP~m5*?2v^PW5#GZ8S#I
zzsAG^|6*V9zBMNH;K0%L#C62$@wS_*cMEn7p8H?wJHGC2oZT)a+5a2c5norlt}$^Y
zD{gMx`?BwBUeZ|TLrur^{uGv>R$m-e=O1A82g7>MSZ~F#rO%w1zi(K-Yk#XBL0z9k
zv-(Ta13s5#^)I9LjrDA81TxG&o4P)`X7y{r`q;+$Q`GgDHuHZF#qVeJ){IAe*3Ih0
z)LB2<ml2NHMPXgsx<>BpMs9T@m!f2aOMN4EG@N}_)A~CN&OWzkTpgT!hSRuRmGp2~
z(b(T`IQwj;#Z7CBt80vV7S2BNX>lJla(6byWwPV#v!E8&A1-Qpbz|H_IQxvK#oebt
z6D}Ku4kTBq>UvR&&M||SQ*_*CIjs3Y*CFDCbv<HO*CiI;$>VjcVlldAF|2DBVRmJZ
z?cpvS-pRxIyy!-vb&Yips=8sjQ=~!XZ=J7I5|sVf67{<~MKQwK4r|u~EWLg^VQbeD
zteAMaUU2bt2{>!F2Us!jcD>=W?f&`_)UBPa4;2${w-=o9<hS#6_Q9u^cspG?#@i*}
zY<+u!6=Ut@GB4;lU>}NxqT+OT<Ty@o3Ca<8g>xzLaacEUd5*&b^IcqjuwtdtI39Hc
z;<e8gxVQme@ydh64Fs!CX*F&TSiHuFaRp%U>f<2#(|#UI(HN9Z+oo%peJSF#ZJGo3
zbDXv(o$@o<ia&rN-~N<yoW7ypxaLAQ@zQK@!@zNU!{NjiQcT~0VCj?3^o;<EH+>_)
z;^O)af|F1B&UKncfu&nM%gbo6H0v0$JdXj3_w#%(b!pb|Wo-`ui&wm99t)Oc`AqYn
zVDYB;FtE6|=ELFSljgIX<|43k%V+sJ0vy*o4o<wE=ke6znkT@CSG;LH5-iQ~ndYOw
z;!X3>U~zHH6XE3Z^Lz|->6XuObu3t8Tyuuy`8cq6%|8}*JXqs-505(mEMD=Z`9yFQ
zMLyG93>I&iCxOM8X3J>_oP5%G0C`r7IE(w9BesBIbNv*2S|(F$?k;t>9k$HFQ$0M*
zVI6DJJ-*z-Cwcf}hoz&!!!tZQ)5Db>uJZ6H9<KIq4Or)fTCC0Sv%u24D`huV5?JL>
zI%ZQ8BdqPPcBg{1eSSM(Yc~h1n0ULnaPf8tIBPc#teAMa)8LdVe|-t+*6wt$V&d)2
zfKy)mcD~Lt@hK+W?yP3oCE#p*^TCR-b{c~^H=Iq$peQa4dyeB2m!R0W;asqMDIT}L
zahS&A;b&mQN~awo=Yhp*jM%YsK3Kf+U~vmWzv@457l6fUOj+E8VDak1j<1Wr8ng1*
z@wEsnUfb3Zdoe|vwk@4v=Y~tb@-3#=oV6tMH`RP8oOo%rxXZwCeV4<DSG?)F0xW&<
znZ7H*;!WRDu(-IstKj65K07xo153AjmY1u+%Cn9+%kwp0@qV7Kr7q1n9<A+lVDXAK
z&DVpaSw7Qz16aIiz7Z@guDK3QK54dj>?W{u*HJ8gH-qDvZ-Eo<=lNFZam}~EiC4U7
zz8x&h@|os4z~W8wa<I6#<~!l!^YeTcb?KJRa&<RYnl*=6p6>yR_w#%&b!pc8W^L~S
zi&wm9z8@^j@|orpVDYB;0kF8Z=AXmK_aMdc{18~W<+D6L432Al1Wvr4=U-5dYhDQ_
zUh$^+QLr@2XPO@ai#N@WgT=))KLID7G~0OoC0M%Uvs^t1mgZ`T<@qVFct6ke)TOzG
zVr_o~uBRy8H2)eb&GMP%r@`V)^D|&^am~-d$>-<!IqK3apXK>^a9r~$IPrd-e?vX4
z`L}T56>pk<2bN~}O!Et1@uvAju(-J9m*C{{^ZYV(>6XuOwHkabWe&yi{0dn7Y>LIb
z8v1$G>~XJw#Vg)4uK|}*<TK5`2a7k&uY<*zW*fV2z{w|_y4F#QIE#y4>-+(qmbDbS
z)_K$6cGy39_$?2=?QkpXpFI8@53lp^yADgodmet@!ykC~&mR8J!+-JcdJli(;g3E1
zR}X*U;lF`(ZS*PDu5msCYa4f^?B+@WtDH;s28v>YwcXb4bFlK^w-dH@Uw{=8Z}%l!
zyj=p$+I<C9OuXIS;nq?7^(ClVyRX5DiMRU(PW!=c=j+^vPciX!|7fON0?yX=Pq1RF
zoyKfG>fcf_D2hwNe&;yFB`9`n^gUR<6pw3g9H#O3NrDwCopwyAk@)v0cI>67BZ~51
zajDeRr?eWE1}9!)(71H!;?;*8j~QT%arx|cYylRpZEK0IC0LxcEuCW5My=uG)3ZXG
z<Jy4Znzw@!FU=O$mU>)YJ2>%*H+`94>66d&wFiqgeOX{}aeW=&<dZ%-m+%#=fpp7f
zdD$K;%^y%K&z<1J`+44hx-{$fwYHt9i&wm9-VrR#@|osruz1tl1uQPEc_%peq}k@Z
zox##ApXF~Ca9s1QaN_+uccmWJyc?W&#hc~?SeoTC&E3G_O>=j!xVYxs;pFr4+=IGw
z%V)Xj36^Hfd6ws1aN_+u??GLfH6L2r-qgh_-ZbwCmS*`(^Il-_rnwJTTwL?saPsN7
zw&l4WSi0r2JnsXJYtDfa@8>y}dR%iJoOs2X=Kf%5md`ZjgT<TX0bp@)%>&`&lV%&w
zgTT@)pXI6mEX_KHSe^&NiTCq7gt|2A{9<kQr7m9arg=ZGG|Ok2_XmqN%?Aim;+luT
z$>-;}kh*lsXL%k5j%ywcC*IHVfz;!gN5F|!ylEZ@mS*`(^Fd(org;=tTwL>LIQjfM
zkD)Hz@>#A921~Qf$(H9s;KciR9!p)Cb-uQ?hf)`>c+-3sSeoTC&4+`<o8}_0xVYwV
zaPl2NvGF_}EZy>1o+p6gnvaAN@8|g_>T%6S!--eCX`Tp{X8BC>F<|kg`B<>HxaQ;F
z<dbF_&&PwMTRzLx31Df~HIC)^L^$z&o{OnVv#x)v?Ih~r6>pkLz|t(AX`T!gZ<?oo
z#l<z3!pZ07xs1AW%V&9>3XW@@1}EOn^K|NQ&E;_76>pkP0!y=eruk&Bc+*?~78ln%
z15Q3a&oik@w|thXO0cd$bWLY@u7VS<>qCn>g?a;ZUBeky4JTglrnv^J>uvc=b1hiB
zX`TfZXPRy7&W4juI(4nD7;zRCzt*3FPs^!TyVjrUu&(vzdH6IBpYFw<;qhmB_$&|4
zcUU^k_V76#KG(wwJp3~cpXcH8J-pDv7kKzW4`1ZrMIOG`!;3w9iHDbfb#HJf)~@j{
z11l%GUf#`>1XlY<+j%)Y#R&WN23No-e||e*Yj-6+#l+h!ZKhqqYj+iX#l+h!gVVn7
z*XOsp8lPg~?XH2-e)HS;I<Lj2n0UMEnrY{+?|S@-v345cx;MB1&c8Rfk-9j=slDAB
z)WONePa}7e<DeRkt()N#E1h<{-2xV`F=)r?tzhxWgT>tjR-e*p-0fiT8nedT0T!=5
z?D$;{)-fTU9lv*i#oO_F7g(IOEuCWb26w~B_aL0jiT6;CYrYpwyfj<fec-sh`{BeZ
z-t?^iOP_qE?*XuQ)At})TwLGJ;pCG(JNG<9UApD7ygUq+W*yU(=SRTe{XGAIx-{!}
zx3(+6;uUY29|cRZe5Uy^uz1t_I9Oa<^Am9LNwdw9zoahR@>%|#1jjW$1t;Fmb3OIA
z=3l{ySG;NdHCUSEGtEzf#hd15z~bVXpM{gp&+~KCrCUDB)$?F!{u#ycyb3Jd&+~7n
zOS9%rYx`TUc*UFM-+`rBKGXaHSiEU|5iBmQ`DHlyUZPl@SA(TnKFjkf;JD^j;l%rS
zevNuu^BOquiZ{)_2TQYjrulWSc+>m_SX^B5S~&Tn*~ar9z|t+B<?2naG@nngJpU0a
z-p}(})TMbL#oE3N7O!~I{3oz9%V(P30gE@y>%ijTn%{+!&(HIF)TLWK%k%r-xaJSw
z#QS;vGxfOU58=cs-ZcLOEY0$n=JjClruieVxVYwz;pFr4{8#GIEuZD;6R<R2K(Rdk
z4J_Wz^QY9M`9g}d{R}K#@uqnLSeoTC&7XtCo8~XT;^LaWf|Kt{ijC*LgQZ(O%k$UZ
zxaM!*#QS;PNIkCkA8_IoZ<_xJmS*`(^S5B}rujRtxVYx;;pCHM8_x}3>6XuOl>|%k
zMHI`kIuq~bIR#Fd7g4NjDx7%5o8~mIG|Ok2)4}3Ra|T!(KS4Uh&Uq~$<n!~~lDc%u
zXL)V~j%#iWC*IF<8|rb*+rf!fylHL=mS*`(b33qj)0_zw$4?W@?IGmz^PELpy5+N6
zbpT8A#T3hPM>z3*p0}qi&5J44wiBFq#hd0Gz|t(AY3>XbZ<==mi{qz><}MKO>77Cw
z&pUyoTRzM4&fvJ_UEsv~dES+JTys}A@rpOiyMd)yKGU24i#N^Pz~cC6qPaVSe9~;=
zd3UgM%V)Xj0hZ=VD3<4*aN_+u_o6P%ODNWM4><9PH_g4l(k!28-V-d|H17o#$4?W@
zeIVrX^W2xZbjxRX-Wwd(+z(E?pXYt3$2I4`iC4U7&IL=ee5N@MEZ#Khk4TH-r-|l#
z2>JXx51=mH@>#A1g6mkvl@!bKAUN@t!&zJb^_!?)<#B`I#4Fx34*}05Mn2QLFIc>3
z-VZE}pHQ=n-TfitlTO|1Dn=YXVO;!PSD)9>qIc5mUboO;-RlnX@Nf?w=*5rl_>mqy
z$it%?#ss51JjTNZd-xC!kM;1O9zM*&hkLll!$){{oQKDIc!GzI^zcz0KH9?*J$#IZ
zkM;0zVBH%ZkF|T_6Tr%$fA5$eAKItT!HN8*7-9e3xEMnD_S^aQoRjb=hMy+wN+9Cx
z62#d0CgWF3yxkNC?K^*ce!Eh9is7fp`pO`*pZ#{e&Z+nm!%vfT(;(vQ{Pj)8uNZ5m
zV?y`F<q-b8@k!LhDNgO}-uPq)`8cE+xeCWYH6EWc;1nyJcFfKMi`SU7W4jV8UU{&%
zDzN&LR^v_qi`N)8t{N;}ec16{1J*GlpB?YDVDWam&jO3%CrGE*b;79-^3A5$96ARa
z*E|<ayfj<fJaAm!X>j5dZ~9ILOP_qE?+mbb(|0CV96wF;odqGE^x3&;K3KZtv%H)Q
zmS)WXmgjT8;-%T*&IL=e<_F^zfW<4`H2(}N&GMP%^T6Uw^Z8(L{4~+L5JEm_wt4je
zuyo63`MVGt*L)G2_);%!5jd{-VmR@NH_eN|(k!28z631ZG%o>*<EM${OCjX*^L!a~
z>6XuObvam?$5JfMSAfM!v&CHrmgYk}ZYfy2;!X2aU}=`mG%o{-H_car#qrZb^R*E2
zT|==vUk8?M`7F=ZgX5ZSfD<px7Iz~!uDK3Qyy8vsO<-x3&oti*7H^tw0gL0OiRN1&
z<dbF_&$of4TRzL*?O<s>jAD7d11!FjVsXpC(tNnb-3b=2c+-3rSeoTC&3A*vo927K
z;`nKz`CbV5{5;=BUApD7{M`?ZYhD2-UYafL0dQRNgK**%Z<>D&mS*`(^Fv_qrukv8
zIDVRFegr~3KhM9QF5U83{#JsexrkzUeiSTTnl0`zurwdxagT$=E8a9e0hVU@O!F_n
z;!X3DU~&93(OeH9-%}JD&%Xjow|thrUxVYCpN11J%@+3zIIj6wIPr=%&Ch{HP~<bs
z&x6IA=2c*E{4~-08wmNN*~as4!O|_C<?nZ3X&y(hJih=IUrMpK7s1jz-s4^Zi&wm9
zei<yy@|ot<VDYB;6|gvdnrMC%LOwswuTht7`7D2Hz;VsLhZ8T&7WX<huK5i(@rpOi
zYr)bipK1OBSiEU|6D*FOCYt{UA)lY;x2Q|Ee3rkr!O}c|VtM`(SiCe_+&f@tKGNgX
zfyFD{G`|a$X8BC>dtmXV`F*fBewt|hGlYB}P;5MZ2$pX7EPsCi$2G5q6EDpc_YpX*
z`C~ZoiZ{)F1&^S}XPQ3&i#N@G1B>IQiRMos<okeP<M}hNbjxS?+W?m4qbQc=&%xrQ
z+2XzcOY_kl_a#`o;!X2cU}=`mH2)ne-ZXy=7ROH$&EG)CC(V}UjbQ1P&+_*Va9s00
z;lxX`#eEBoYyJ*Syy8vs_uvr}`Al;ISiEUYg2nOEM6+I0lkWqH<v9gTy5+O{rGlk-
zBE|BY1}9#cEiRq9G#}$}8F1niZ<<?xrCC1H+!8F_G`9kaBdm$$HgNLk^PZOH?ZDD4
zpXIMDIIg)JoOo%rxJ>GC&F$gDE8a9`fu&hK)7$|p-ZXavi;HXC9!@@Kwmf$NOSgQM
zza7BRd@RNC+!;>1G+W$`)TQ}2kIRM=uXxkk1uV_-ndY6q;!X3;U~z;s$@4C7^7(n*
zmAZ7xXZh<2j%(fxPP{Z*T!MOBb2m8giZ{*O!O|?BY2F<y-Zb|Bi;HXS2`8VQ=U&vM
zTRzL*9^jK{Jc(j??hPmYL^zAvlX?a9$sV^CoOs2X=04y;V&pT;eZk^Q^WI=_goSyw
zvD*($KIzo69>s{WxcIXkeV>gMeFuO&>&bOk&wBJ-9pZ)cogIet-5q+CF#v1NG6sSb
z<KOEiXeZ5D{~&yd5%!;D6u_xJzn%Y#U@$(##M=#Nrk%gOeeo;C+9{WMMz9~8|BPUN
z>f#iq_V$e6066*lX9PnXM_A*2Erb)V_$t<+cUp&m#oN9g?)=&o8zTpT#VaosHv+7_
zq}{lYVDXB#F>(-C`$;|<BctS}Xuk_fgSIK165sEm@oDk*`xrRezXyBx5D$+9Yrh|g
zwf%k=STX+oOVGFN_rvii#`c4?D}qyhemj4^AAwIX@pj{yY3HwRJbuMkJKOIQ;Qal5
zBz19$Q+wO*N5RSG@Asn}M_A*2nFyy?>9l=%3|PFj+4kSDV6~Sn<BkK1SG?`h<H6bo
z^4UH;0W98*`xC+9q*?pbj{8Y)@)c9G{}m(7;^O<i6rYwUSnc!4*fNK8tWWjuG!IXA
zSn=f^f0Bn!_Hc#6(lNusGd*1C;VQ7k*C|*VC)HqS@W)Al{%m~J;8Tp&;m<3zaMJ6y
z^T*dLe2R&;o83%1e|@LoS4_O!95`*ezdpa+Tzra&x0?s2Jo)W>ou}bbOuXIc&9w8^
zcLsjNSUWoo&V=)igR`iMQ=Hn{aWEfFKL0p4+i`?7j^%UU6f2!JzRv}V*FLvnV*yya
z@?dd41FKJIHSRpHc#RR`&IgNEA39z%{uWX+2IbSXU4XriB3@&o1bdO=EC+f<D*j^U
zTZFZ1ip9bdU-Ko@#Y?lrEdj^%T?!{&@uu%Gu=L4i`Ys2HH+@%t#l`hq2`8WQ=^9U(
zmr|r#KFiBhU}@GdWO-f&7VqczYU<Lg<ICD!0~W7%(|j#hn&mUi*MY^G=Ig=Y;+k)O
zlTVs8FG=%_6zP`F@>eHJ@ipH>UA&*?o2kb&-vTFI@uvA!ur$kOnr{P(H_f+$#l<z>
z0VkiI=jGI;TRzLxox&8&8J6d}z~VLkSlr#<vniS*jJpRcUh$^+UT_&jKGS?3SiEVz
zA1ux^TTWNN$tRtf>lGu;;^K4tgZQ*OfVH{)=MHPGf5^iRd-xGA{uds<(!-B>_%Vm2
z<8co^;o)C;_(=~x<>7h{|H{L^2J77LG}g`y&w!=bpF0z*UpbVHXYnb<a%1hDgVXl;
z?fg0Sd3=hAw_DXrJAZw@!LOKjyWheoSN{6^cE7`?n0UJv;FMRtov-sne2R&;d#Rar
z{`y|VuNZ5mF{o?f)o}i~;T7uQ6sPufZg>?=KL6bCn&Sv-9Q$kF6f2!}Jp3LkUSq_L
zrPsmYl?RJ^1FSx!)ws1_@fuUc{Q)dqec18!CRk%uK0Cht2o`V0*IQt5mIFIC{0UCJ
zw<$Jfy#tPGUI!;$nl0{Ka9rPeaN-qj`rZdipM0k81F(40_h+!UxV{hJ<dZ%-H~a-G
z-SSyp)`O*4$DHN)Bd~Zs&mU8lW*v{#_OD>^iZ{)lfTdYJ)BHEEc+>nTSX^B5XK?aK
zv&~~0z|t+B<?nNFT=N%j;{7~-Nj<LlD>(6rH_d+sOS62Y`D?Iv)BFusTwL=;IQjfM
z|AV@8%V)XzCs>*_hgqJ#1&jCd{2g^^*8FB|zXyv~ylHL#OS62YISCeTnuBznwNa02
zPKB3G-#cb`P6JD~e3s{Qa9nc+oOnOaEvUyew}ca~c+=bpEY0$n=GI{GrnwDRTwL>Z
zaPmpBjpw#t>6XuO)ebDpIwx43GvUPhd2UZ#nsvUgwpnoE6>pk5fTdYJ)7%j(-ZXCy
z78lpt2~Ivg&pS|;Zuu<FoxyR<JHm<g^PEjRuDJ`Gc*UFMoxsv8pK0D1EZ#Kl0u~q7
zyepi1exAEhmu~qiSG$2VXX_kjc}~EI*ZI`qx>48staF}m-QmP5-ZbwH{y8!7ndTl~
z@us;aSe$9LvD*tyKIzo8j$*`FT>M%`-yN()-vMdYI(s^-YaM-OtUcq<cgGsmcgR}&
z-X5>-m9-dszpP<>&#bU?<a#*I!~H#+@8JO+9_Zmg9xm|kU=I)R@V*}253FmW{jqk9
za{yS|=wCY|(5swF_fUL_v0PfaLOA8aZ|7fg48y0Gc)Q`vwDZ?@Ab!Qf+l_!zZvFN7
z?MC8LOuXGeaM}-kJ74E0e2R&;8{JGhe|=-{E5_Ps%<9_cU^xHU=n(4S6sPufZ8R26
zKL6V2P{$D#*s*dLoMNTZxWmEXHKy#?D*}sG9xUz%u=<o%<Hmu-YYZAU9xPsc*zq_4
ztT8U19gjzX#oO_C6j+?)z^;uZ!pW!au(Ubu7;s$kv2fz0+2W1^$Mqc#CtmTU?*y>)
z$!Gdb1dBI)#b9x9eUsqilRi6_lz^pMKFiBwur%u!wLDJ&i}&+fN?n?D{94;Guz1Cr
z=BZ$5md`X#1B*A!)4}56n#<wjlV+RuP6A7}e3rkH!EwzMaN_+u&!8UHJQGg5;!SfU
zSeoTC%~fFWruh`GxVYwOIQjfM*HD*k`7BqpU}@HzXL+6l7VqbIHg##%d}wV?1&dd_
zX`Ta?X8BC>T(Ef4JWoDKT=VI0@|{MpJf8uUZuu<FXM*FJ&w>;0=XpN$xaPCr#4Fx3
zp97X=`AqY<VDYAT0a#pI^UvVqlV%&w=YgeLKFihlU}+viu{<vXi}&+<0d;9Epjg`r
z!QvHfnlA!NvwWs`5m>xwz8EYnu6Z$>e14uUp)TF>S)P}G<C-sp6YuBwGU{>7m&1uy
zylK7yEY0$n<}1PCP4iN)xVYx4;N<i3yo|bZ%V)W|8Z6C&DVFDJz~cQpUrSw@hfu8T
zbzt#|H_g|BrCC1Hd;?g#X}%FGF0T0|IQi-*HlA+=OSgQM=Uc#W&9}md_w#%k^|<ES
z;lwN6G~WT1X8BC>a<F*Qd?#33T=QLU@=3Fe=exnuEuZD;9<Vg;OR+rP3l{I^`9A8>
zydTBd-VYY9c+<QBEY0$n<_EyyP4k0badFK*hm+6G^F!37TRzM4!{E5)N8rT!dHx0U
zxaO5`;uUY29|cRZe5Uy^uz1t_I9Oa<^Am9L`FZ{&b?KJRa`hy5EM*wQ^86H7{7{O;
z)q@YE9O!Ys0*hC?Y5p~MPl|k|`Dw6t)BFrroN2bP`z)M%(y42G#fY=G__hA?__RES
zwQKiP4(nR~Hy-}2hkxhAzu@sNdiW&|zwEGdtoHCL9)8usuX%Wlhkx(k*FF4(hu3=e
z4<3Hg!+-SfTONMf!+-MdJ7C=#ti#$h{<~o1#J_e<uzlJ`+RpdzDaLYd?cRq|{`_|S
zHTMVj6ccav=VsdZ>-!MDV&d)o0;hf9ug`C{9-m_3?LLCje)HS;IzPszn0ULtHq*{u
z-zWGLW9>A?b#L%DIRD<@Q|jUrr}lPl@EM$Z{=LBl#}O9T@%A~KVx`l#FTmn82JKk=
z5-eVMu(+?l>Qh>c`#V^?#;kE)gT<>4JAS_b>zI(wj^B-7@pk<F11!#RVD|?9gp)6Y
zVsqlR;JD`R;KWO_#eENs>uZ1$uXxj!1WTWMrca3%Z~9WSBPelwsc`a1pPhTss7tqe
zmX~y}H0zkQJZHd(_w(F>x-{!}x3(?e#4Fx3w*pJEe5ScISiEU&0~Qz8yd9i;(roi&
zTk6s+pXIL|IIcMpPQ0Jz_SEB=v*5%l-ZXarOS62Yxg%J-Y2F?zF0Q!~oP2(scc3oa
z@>#ArgQa;5#qzu(oOnOa+0><3^QX1#0w-Sarg<l@G|Ok2cLs|$&AWib#Wi<@lTUwN
z!ScKtSi0r2JSV_$&E4R{`+4q8J+66oIPr=%%{{=<ET3ua2^Mdfdx6EpHSYl@pETQe
z?hTf1`7Bp^f~8sK9Lw`waN_+u_n|J$Iv-ivzHs6dZ<_Z8OS62YxgS`(Y2F7cF0MHT
zPCh@+xzwdwKFf0+IIg)roOnOa`PAc@2f&F}ylEZ?mS*`(^B}Nz(_8=+7uP%(PCh@+
zL#Ru)e3q+y!P2aAxaE02IPrd-_opt+I=@@n1K`9f-ZT#dOS62YxezSgG!Fxdi)%g*
zPQKw38_y%a(k-9mc_cWl`5-v)ex65Bk82(cCtmTUc??*Z<ulC(gT<TXL%`zVn#aP)
zC(SmV4+TrNe3q-jz|yR1BFppPaN_+u7g3jHT`yVNBjCg<-ZYN`OS62Yc|2IWX`TQU
z7uS3woP2(skD@N!@>!mb2FEo|gcI-Q`55YP&BwxtSG;LH4lK>`ndalc;!X1jU~zHH
zC&J0+=ed}=bjxSCngo_+U1M6FOW?%&d7eyNnsxnYZKuGASG;L11xvGhrnw9(-ZW1I
zi;HWX4kzC<ijC)Tuyo63c|Hjo*L*UZct6h-)Z?0Gz=>D9X`Ts|X8BBWC0M*^t^$jT
zYd!@|K54e`Tn(0P`7Bp8U}@GhyXCnSPQ0JzS=6Oj*YnnPHk^3Ho90u&(k!28o&y$d
zn&*PW#Wl}^lh4odY1E}#KFjmz;JD^9;KciRK9hP}^I34>6>pm7gQZzM(|k5qylFlM
zEH1A3TsZmsJTIUw-SSzkeg@Vx^#>Ho^LcRMb-!bA=Tq19v+hZZTL>p!@uv9#@G4^D
zGtC!*#hd1fz~W4^jon3X@=2%ebrmDd;^OzZi}7i>7;E>smpH6@-6bBr)Wer~@t1r2
z6&}9Q!%H2Oj;lPp%)?iE_!<vi>*4D>e7%Qn@bHZuuJiCs9=_Sbw|Mwg58vkD+dX`T
zhnIW!P7mJ&*1hrFSi8r)2do_W_l^njp?#{n+>1{!wy&(+eQ?UR-_F11ydR%p;_X&6
z)6QSt1NapaZ}%Xa_MN{zzunLADJI_TAvo=4zn!o1VSI{-w|k_ScK-T)fnPD!PRE4q
zjaS0)6XuU!0|$>%5vRBW#qNzCgOks{H-6l4gf$+EPrxZwI_>!UC0M-1tR34=g2gKj
z7WWibeM+lw^<eQD<Hr38EM9%s@&0SDjv@K%cz+r!-j4TYz~U?ic5nO~oP5txYz}=M
z9M`-GPP{Z*+;6~feZPehuXxk<JFxW0XZl_Mi#L5Qg2l!4y#yzp^x3)UWw3P1XL(r-
zmS)WXmgiT%;{80oN?n>YKUmw>z~U8en%97(Sw7SJd$4%Z{5n`%T=N@n@=3GJt82m1
zEuZD@58$}wH{rxfv&H=p9M}97oOs2X=C{GpET3uq6Ii@yeg`Zru6Z4te14war7qp_
zS+3p#OY^l9%k%qS@zQK@AAqI#I*<D^SiIs*^M_z*md`Z*1uWh)uLp~ZYyKEczK<xD
z=f8rbTRzL*C*Zi|zrl(3^ZY6GxaQB`#4Fx3ZvacPe5Uzxuz1t_1z22M^Otb)NwbaT
zufWnRpXKlGU}?UdVtM`=EMA%|?i;W)-{5f@!QvHfn*RZoX8BC>Kf&Tn^S5Aean0Ys
z$>-<!d+O3HpXIp$9M_zL6EDpc$LVSl%_(r=6>pkTsY|nbra28P-ZZC!LyqS9jD^i>
z8SwJ?d2T^ny5+O{wFFD^jTFmsD>(6fo?BB_p6e*qwhf$k#hd2sz|t(AX>JP^Z<^bI
z#l`d79!@^}ol6_fSzzgw&+^v+9M{|tPQ0Jz?WxB#cY+hIc+<QCSeoTC&7HyGP4kXm
zadFMraPmpBjpr_4>6XuOwG&vHZ=zV9cZL)1=Xn?E(tI<;+U^P`Uh$^6D_EN4GtIk!
z#hc~?SX^9lH#qtHJa?xq-SSzUcL&Ec_ka`c=eZ~KxaMAP;uUY2_W(<?e5ScKSiEW8
z6D%&Sc`rEm{5<!eF5U83uKI$d`4)=hd2cxJexCbLm*!h3)^;B_@rpOiIbdm)&ot+P
z#hd0lu(-J9d^q{^H(G5x4**NIe3s{d;JD^NaN_+u7f_FD9t<a5@uqnQSeoTC&HIAI
zo96w%;^Lb3hm%j5Z9E?UmTvhhS3|+ld>h5`TnH!L&+{<q(tJC`+75>kuXxjZAXu8^
zGtDEw;!X2Nu(-J9gW%-z^E`^WbjxRX9u1Cb9s?)d&-205<C+hF6R&vFJQgg?@|osC
z!QxHxVPJ7_&4<Iu=jXYIx^&BDxjF(Y&38~N&*R|4`*|KuU7D9utnCCi@rpOiM}nnU
zKGS>@SiEUI8Z0iZ`4~9)CQ@uX9}AXl`7F=Jf#aHwhZFDT`2^~5%_qW%SG;L121~Pi
zrg;)rylE~0i;HWX3@4v7+jyP=mTvhhSEXQSzLR2kE`t;A=Xol1X}*hMZKuJBSG;MS
z4wh#5OmjI{ylFlOEH1A3WH|Z!JXcVcZuu<FGr)1pGvUPhd9I`$*IWfBUh$^+6tFbQ
zXPT?Q;!Sf6SX^9lEu4IQo@Y^)Zuu-%v%!zCj{7N==TqUt-wS7PbErQ~{Q-}g3nyOj
zrg<Lt5@O^t&8LCIo95HO;!LxR-810ilTJPBQH(f?i$Ci*3!j!VvG%NIzQcOfbGC=i
z@$k7|J<C{twPzAP11rYA*H6%gG;96m;Zuxhv3BRfsXxD+|BPTEKE=e_UC>NBe|;C?
zSB$k&F7=GyA~@0;>e4fUMbyP9E<v$p1Q)}}=RYG@>^Q<2_v<Ba;uWvY<d@Lt60msN
z_m?`qw#CNCWnl5ji^W|IR$tO?+!bK)inlRxrTi56Y>X@gi`RY^mImAQ_<p|%pB8_=
zFN4z<(0;$#!`FEDTCn!}by(Yf*Mk+~@4p0n*nYnOpJGglwYw2c{rT<u{a%MpG4Xac
zHPg;t-_7_HW9@9e-va0F_gkrpQ=Hn{e!mS)K7YU8?l{64_sbn{ij_{=r^~_OwavEw
z?gXp7bQyOSSiItGpWY4DK9JA$={;cacHG|!7H8XL$Nl|q^4&+#{#T4Ri?jWovUA$L
z6(r#vwxjpg-zQgqm;dwoWbaNq-@#_};Q4^+*!9?j__M$LK6xE>EmqGC)?+6TUy%Gh
zxeU83Xh`b5yC9_@*_L&V#wM_<u!Y#(sSU|V*aEEP&CysL2NSUxM{}?%u*<N|V3%Xp
zVpm~T)BpPHhGdT&Xtz^C@_6jTy@|)pDQrk?AZ{f#y)*Z0!&x78;(-mx)3M7(G$dDI
zH;!ybeuW)9sv()PBmTpQ=ZiB|Vi!=KKCU6T3Y&c-`m=e)epExUFaG7&(b$PcvtIZ)
z$2TOasP{ghA-N2@7F&;9k6nY^h+U7(KCvO$iW}G7*j=y%*cG(Tp2Yg8ufk5m&M9d~
zZiF8_1>IeUD{Dy3haZi-LUt;;WT(N)U(WVYUwIP!QD0l#kj!rlU&Hq7#QJ8TQ*~^W
z?Cgf*t+J;!BwxU;pWBcep}2Dzl38uoPV6%3a~3ot3slFBmHip(lRd8?xg5Lk0`>=S
zqc3AWQ(unlyEFUiiiTvT?WkjW%U;R)WtWmyZ1%Mc$qM4;+`@KHUyH4$zUnr%Lv?I=
zTkP$uU-k~h3AWX}4ar~^bl=yIyodT|Y&~`&wg`SXb`ABF*!7CPAHDFaRuG3>_H(w6
zNi6#z@{R3{9f2*tPQ;GJR$wP$=VO;+ufwjyuE4IsK7(D4?ZkwX{R_6AdT;C}*ooK)
z;-5fgCjDWTP+#~f;;Apg_Qq!an(>2Oj{N}t^yk?x@?#TSvA-iv@?)1_d%wVV#jeDz
z!*0Zu5;yv#hGd=MUv5agg<Ze8A(_n|w<&lP9oU7hv3~5bKQhkM4*LQ1<$pp)0=@6D
zz1Y$3GalPh$L7d>K>xCTZb&Y|uKkdF6SwhGjyv(6v3=cW_c`NKb!^)#>=%qz*)JQC
z)3L3-rmnaK+EZVSy@L9(AemgFI(EHmN;0`i2W)CGIRcyA0zYxnGn2`M)K_79cW3*v
zlF1dSW1o@jkW6lr?U+m^I<nn6CX>^NTee#=SxS8)_6h3iyCsv0RL9oIcBg;Y-IK}h
zu)X)hDsJy&a`g7Bzh5$0usi;|Wb%0Gt@<aERoI2tCGzLfAO5uk$>d7;2Pc!OsJGfb
znS4Qh>^kf+Y`{F#`+#J!ka=?%b|F>^bhxC<8yBR^$x7L|ZOc~ro^#TnAs$Tp`}fIx
z6fvS@mbe^BEgaKnxTu>El&THiC+DXFGP4fK%s#mNcBi(Q9}L}T-@W?xV2h&uDzF=A
z%aq8?Xl9oBpHI1!dHh<exN}oemt?jYnW=TD)KPjcpEEs#i`qOyNx;n$6SWzc*$O~a
z{xy{O_)ow(|IwlUz|2;P`HE7HKhyyh*NSa^0*>h`T*AKKR>rs-xQF1_U5#-g;MAYx
zQf()~y#Qyr<*R^OWpT(Im)R;@_X7C&gBz0jsz-R`bQ#>((abmEhG%9C%gi2@nK(CX
zacb&B!K~q#t(cm_zaKM!^F*iz`rOnadL?HR{rwP~OYQ>4`nbXRP+WQ{|8Z`)dDFP1
zeq3MT783VU{b}3v-HchBn^=9gh?@@A7S6_v_S5Nbt>Bn?+<rPT-1Wm;UaoU~rs8l>
zKP%wUX~QLKxJdsqaO;l#X<drb_aRQ7_|tJ(M<+U8!MW75=D_uay9Z8x4>y*}mn}!^
zpvHZp^&L-}Ih=F#w{T-^{%UOsaV;ROkaO;AB`n;v*~2pv!!vsi&&(N?S#WO4MJ+DQ
zSe$-I+IgvIlT$KtLJxkT7#FR=eXZ|VxQ_GhB)W*Lt5K7-O`q3(=H#Z^mY&Wyg4>#H
zE1=Dyip_7^B;rbEG$ijM_nX_cYf_uvwp-~VYtH7kP47$;%xk)B>)`U?wr1NpX~&<o
z`EA>exV6NUlhe&@+mUI_Z`*wOm~j5)w@uHOPUkvD(zIwy>N&(5xUJbX{k~|#g`3~D
zY$nHDE^0{5Ab*?Nwqw$p-?roFWBFB^-!|Q&ufDqJw&_0O1-Px*wijr#?3$n6w$W_P
zSHx9a+mPHx$=vjK8<APm<dEx}ky$Wo(=Ck78--j?FSx1cTsHx3KAi0<9e2~=UVyW?
ztOwlbaI4@B0!zoasZ+z#)P(T=(cwI<dGc2E$2I8e#<<ku!w{xR_5BR~b@+9NX%V*;
z?kzZ9!zXaMmi6al{Q_%^7pHSdC%Dychp01jMXI8Hb$^h~bugE4;i7eofD7RKb?N@$
zJNod?lNE3UcQz!sR0|ii)%`?1+#VjMdy6ctoqcXOTm{$7whrax3ApKS&E-Y;eGC68
z{1>Y4rsvQzZT^*pbWYM6RyJK<HeB0ZHeFv|xK?mKw!X3Wr{mw;`f7<=O`LzeUkG;{
z*VB_W)!JnKUO`-sH9zReA^sV-1l-mfD;sI^32ioaZc4PF|KI=5&P}ECk$7kG+qQ_f
z(eF0hwmP^Ga9gu&YiN`8-sZRMJL1+8_dhu|6>>md@wd%y+jQcd;C{u%ulC#Na4X@q
zX4_WKX2FKdZ`)epj^}>pe{ycxg?rbv-)(-|Mi3Vyn{L}gxbL{n+L~=!M4MIgv$-+(
z5OH<fv;9xbO&jT>Z@c7XkGBN((-Yb!o9wrIxFWc%*|zDl*@gSXpW3$3q;UyxUlI53
zI5)jTU(0q%Hkn5^z+J)psEtF-qv=fMOW=NNUh9E>1O5w%{i%6$EOFUAo33vXTt4@;
z{`zX+a^QY!eOKULg8!%1r~9cVh@11__sN8Gah^JsGp4pjOUk^WvEdzU%e2+~3xhPf
zug%A&bHn_<e4iZ4bzAzf6NhV?xSHnjeMIJ@bJG{6U6PvCBQ-O@Jy+=A)^d{C9Zy;I
z@%PE&IDw|Gqg{0E5Vk8)yYo_0U$$mkm=DV=3W{iR1!cqE(Ak-GUp2P#uklA@u1INe
z(J`b=a~B=M2qT~Lx1RDuT0^AelSxgsA=Gk7YU(4Vg?mNQlA!$u=?%%2JQqmMF0pO!
zwT#MKm)b<jer=oAvW^Q5ZC@>Y*6qkWnfk1lyhVK${6wDx^tp;Y@7b#%IUJi_Kc&g`
z%}<GTQfjiv2F@omP+Q&4*7tF3KiRsrg|uDM*R{<q-KzDTPTTc7`wcaZ*t)hWY5QG2
z*S2cQ+baM14*jeg_9@pp>DSRV8kbG?X?<FgeHyfAexKHJOcc`RXl&mCo;T8W`kF>P
z^f@fE_o&SJlyfr{MMui1DVe=F1ftu~aHQ3<Bh<$t`dBu^^^sm?x!mGD#?ptrZ!dj+
z&SM$}`Sh{rwhhZH^fxW_@#eRzFdVB1?q|L_fajA;Na>TB?T_)_^jI97-h7Yi&@=*#
zwe&fEWJB`z(zqhlCwC5-Raz{vJNSOw!IQ&q@3=d7<`?zz1pUn6nUDS+Zu;8I_0y}_
ze)glEbWOGgHzeOvKf%;6@62VRGV4<H04Xgu#jbvbL8UJ8Ykg@tg7)=?HYD|TQPVp$
zwjYt16E?5#n&*Vazt(p|^t*)geBw9VM~s-J<8Ozb7=PM^RrJ~S7`F`-jT*LS8>Fcf
z_juP8Hzad)Ow8XhO?z!dlkR8NPji}9ZoMY`E-AZ``#ouTVaqfP-HayveyR3Urzw5f
zR_$x$DTjN)ThHP=B2C$}--3NNVKbT*&}Y^{r>SV`H0hYv{cLb4zf;rrD{WR&{FuMA
z`6IM2(0JDUY{2h?)OY&AMm<bg8qX)%@E@6(;5{s2bU!<v_y@H9x+p%J-Zb}dJU32#
zZ8w?v!sB6q)^`QJqtM*B!f(%$JGEyrxHy_Tm!^6%K{$El9NCmPFf&J**3#z-JWJ`N
zK40+rMAL}OszyymZKA14=S1Dle#i5adghq)tm!rvlY?-&i_~0|*5rh$`AuVF0&Q2^
z!2K%6Wcmo&HaA9M*9>o_Hor&Kp<jBI)8`YnIz7j4xt>DWen8tQo*C#NaQc$Qwsu}w
zk=mGy{Yh`rbCb?zT7Pfu{TA_zAv{+vZ|sBM5t*C2zR>+_-TkiZnyqWA``L&1Jz%)r
zpxoOJn_ur+v|aUpYuk70+GcY<_|}82?Zho_8}5JFZs0jeczv;ew$1JT*!;e^>x<>|
z*_Pi+hSwKQH0rT^xJB0&pU}sgCtV+(Y<(X(u5#Kkp6cCPwaZCcJ%3iwzQ=R!+?PZ9
zEy&I0&VA3&XVFVe)AX&^l+Ha~J<oQ+bKmJ(rfGBMKK)+0?b}Y%LtC$D8SVGu_qpM@
zZ`GD*+T6KMzw2K1iPIFEyw&@zFZYkDzH;ZjPPE^GeYd%D-+cPa|K4dDyLFm0FV)k&
z2fud?=jlmN`{>?u^Yip~v|ZaKnbc=z)35lE?TO9PzuL?^UBtuM1w4-k_1v@NdUQRj
z-`N-Jkc{T(b&YN97~kwXO&8(sr*Gw*f)%fSpJaE3_xXo#pWg}i1pM+Cul25hU)Lp>
zEK~eJnOT>lj>*hkoW}Y6;`EW3y%%M0C3{|r(fZBWsLaBd;fac~XyX+*=i%@f`Yybq
z(2D0Ly1ca|nM@fT@NP?&c6{SfuTK2RX-K<Yrw2vHJlG<5B1QGpDeZol9(<T`%q!{q
zHM_4khyFZ01MkZ8447Z0U&0xP$7RWsOkS)C4%&|2(jIYP#HD?emckc*>mIB=t-}?a
z(_Tq?i|f04+jP2er<T8J^B{eFx!suW6D^-;tKS*dx9jwEcFQ&G?gyXSe#}EVw|t?!
z_|;jR-q^9_2U+4T@7U(m9a~=C@fRu2^=i3hd;JOSk2<x#taIANPCSiRyo2ENJ8<K^
zB7{!~z8b=J1-}a6xt%j;y|8l|Bwg0IH*b@6KI_FDgGYB{2d~;O1Nh>O`bE}@yJUTq
z2;SZ$m!5acdN&c=uxnpFg12kdTZ!PGyB6d7N7oGKr*_ML`Ea*B;L8(zz)vRV>cvC`
zA+IJB@<u`-e@<+_tZ(a$i5rl;w0qXdUcv3%>HLlES$Fjc{?eV!FW)`uwqC*0yBFj8
zb&m|_g*`K1?(f+L{8rCC;PZRY`O;n)gk0N8A$7eJa$hfX{;OW<{GC0r&g&a|wg;Wp
z_0IaXPq3mloxjyP>!UuwqCJc8U9?vQ^ecO1z--*B5BRn|eZZ^xa8`b^PX;0H^ijwM
zeH8LhAJUublf@b?>DwV-NjW3+jI=X2G{dF-;^DyxO4UWf`R?jHQ@RE{`S3;uZv6_|
zJ)4qp=*5V7Go{^YsVRR+sf}Ls3)>~rR;Q*sm|EUyNtfUhCX72%T78=xJdkn@@jp*(
zbN4PSUr+6R&MqxCrs^BAzi!cH{!T5gYT4$~E-hbenfP6omS42I41U3OJ73?W<(=EL
zTiB)bBireHkLTKMx2#Lc+uF6?*tO+r?Y8@8*Oqr=cK$=pmd|Il`?PE8HJR5E^I7}t
zzV6!cpY8Qs-d}D1R?7WdgHLy;Pr0{iux7`-sLapa3%oYF4cgwzZiB8*vfIFaot**y
zZT3K3E$-6p=`O9G?D80w_!|>h&-4rycFW-@c(<%y^bA&Y>%#!=mUUOp;Fj*i_|DnA
z&22q{dv?#j`Ni%T@Yna~qre_*>Usum^ymX~PEU63r9CqUU)ocF*Y;FkT~A&Jd#q>2
zS9-SoThDgMo?J3E*#S-S?{d1RF{j^nIlUvyX~WJx<n+5P%IU{pPM`O3dUcr71zt|C
z2y^;Xm{W2`PJbWf^kXllUnr;g&h-uC^zN>~$K>?RuEFXZ_oDLMj(dUEWVb=vpR(Ja
zYkhVb_%E_E;J;B$@9om=sV=P_3v>EaBCEb<us}I|s9V<0dj`)ar=NApy1i#`WA|cw
z4c*(^)H7JVdj`%=ch7*ox<?-c_Goim&)~HleP9}TkkgBMW)OZ^PX%7pQ-Rkhr;qgP
z_+ro2AN6ea?PhYiXG$WN%1in?E=>*2Pien6HDzgvM)fVJ?H|(+&T1Uh8vp-S#U@kw
z>qYH;S#P!FkKDBRpe=toMkn2GS`G(4+Db23+}XC{%WZ?l+je}hZSZ2-$6z$)?|DJW
z2`hDW_!*h_Yibr>d;V=Ir<rTgI`S6>?n&zi@nqT;IRBM+^4KkWb7)ygn^#g&ZcZ7+
zY@d?BbDYmpGTu#1`8uV>l8%-`hP7YRIw&gUMckB*kGAGd2e*H|HD7k#>7mw~riSoF
z=5I4P)wK?8XqkO!>)?Y{ZHW1_RU5n;TeZP^PU|*!7qwm_we;7mu>Fgv!QrfPY0CEe
zUD!KQuEFzkY8%)WQx`UF6LHTH$I0)?l<n~?Pq`f5<Ed?6pY`Ih!aoLdd0I#Q=EZGk
z`-kh;Ieb}WL0U)tR>jh^efaEfT1Wn@#T#imMjG6H`8?b&|ImKX7rHHKH5~j>xL=-Z
z+mU^=x^2hz+6M16?w97)<@!3Wo%ZqKcJ!r}jc;l-9Q=OR*K2J%((j+!cKoJo@XeO=
zb#2(!E$T}jvVEl0aPY>kuk~#^((gapc3jjhSk%tO%TMUyO;B{LR9_F$*Y8>l2VdM;
zWAFR69qIRyb{%hO7u@udeeKq@&2_24ahZ&`@<W(2QaZk!5<HjEacxSlHf5}Gnzlnq
z+wEKJm9jG#&dV5_675Fq@3y7COt~qQzY4DNM>4HTN(Xklc7B^x87XxsD@c44oJ<>*
zGN@P9IqAW`U&CxnY5$kBlohF2{H=@n)Zu(4BdyIlX(@}+y6aE;bmZIi>(e^odo^u>
z^$_m+eZoK1enD!Rk6QBQ*co7axyo?xT^WnOkF@OgR?A>j%Z_ih4Bl+{q1KGX4#E3e
zK)v6hBku|Sy@mdWO~n6eef@$w|01I!?@|0F;}O=WzW#5UyS7H}f9pJ#O!<l9V%xF5
zg~$HCb`1QM<LS38I{vP8@K%d+{{6>Ocu;NoZ(9boWnfzdwq;;j2DW8jTL!jeU|R;Z
zWnfzdwq;;j2L2z<Kz)8;n1T8Mk*#y})y^(){Qu)=+P3-sr5T8x2><Y0*XlVuTGe9p
zF|qp8SbYZX{%C0%8D8Wm3{m)w0BG5qVPTzL)rU(qzh~9L*E@tuwzK?3D_nA%e-~Hh
zw^QNr_l9Jp!1~lenZU{5y`iYi)39(^o)*>lWpKD0>x4O(fvs-`=Qk5QL8G=L(ic5d
z=Dh~jvEFmgqE{ld==U62R_t6DTH|weit2jxP|JLmNPh1bF1CK&nhUq5uuEac^L9p9
zx8F-|aP<qbBYzn5f8f8h{BFFtWuV*72RVC`vs0a&?d*BZE_L>HXCHC)IcHyY_CsgC
zcD6-sVYvFv&h~P4ptA=#dz7<Not^FMdCo3%_I76<arQZ9Uw8IHXTNr~MV?!~v%Q=h
z=<Gqx9_8#*XJ<Qmp0i7xz1`VIoPEyO*PZ>)*{_{#(ci7#*<Q{LboL-;k8*aZv$LH&
z&)KEU-tO!p&OYbt>&|}Y?AOk=aObnm&h~P4ptA=#dz7<Not^FMdCo3%Hr$!sf1?gO
za7d!}k&|c5teus}&FPodFK6!ov%+fbnRz+=a`N|dbTDRSZCOR{aeF2zXO;~s8j~1N
zbYP!8i32NVRFzkhRVRw7D-(G+dAa>^6TPuH{R;ZgydZDTp5E%3g=x%o%To(C@#!xq
zKhrFq);JIOjnabjz~-N(d`9Cu)s$}$G<STbG0WJz&@{ePVDn2;zIEd~)RboybjMLs
ze!C#iEZ;V;>zJnT?HcFtrhFz7Tr|Ho<=Y4I?`w|F3YIj>cL+8P-gKTx3pxhVhc?G=
zAL!#^@g<G7(d_)<`_h6P0z0oX<vRz3?tIgf-!W)z-b>@`vHp_g*2~$=oj02Hvr|xX
zS#$9_^Im&%yq)!a=tZZG^x*U44@`uj^U<bx=oPxR5A=GtzYKA_Uh(#q!yK>IxBX?Z
z<Mm3mzsz>LUbps_3mvalsr}^!$Llp|e|gaHdIj2Fo^!ljZ}yir9j{lE{pC}~>$PKl
zNe$1t+Xs4;*k3w3UatuI%U+JxYrg(+faCT0uD^_Pyk5cem#L1|tF`_z&++=$p}*)&
z9KMyAFSl&U-{g3`4(l%uJ6^A}`pa(|ua6-5i@tkC{p%H0f7#%8y`JhX>8Yx1ALtcR
zf5~>dKC0+1eH^dXO8sT1<MlB_e;H@-u{@MIULP^^ms1_Dj}Q9Gg^t%p1O4TC$LnK%
z{-XEWwO#s1pT9iqczs;YUtV{-K62+TA30thqw|;V9IubY`Ahro!jk;Q`0kF^$JG2~
zfaCSCGk?+N0K;*@$Cdo$ILGVbVg54H@%k8;zntxOeU!^zu5i3QqUA4lI9?yK@|W<%
z81ku)Px;G>E?ysj@|Sgv*GHTD<x9uw<4OL~BD@gZKG4UG{H2TI_3<Hp>FaoXOvqn`
zI$j_D@t1Lq*GG8#rOfgAXpX<kfluWw$Ig!l=e!0!CCCicEglv!_3nOwcah<D4lcbs
z>L)zhh~U-ZX6JMLeWDcJcDD25^o!gIxY0=oemI}neZ{UJpBYSY=hK7>AME(R@sk`s
z(fIQtou+5bkMLJIe)L^YyxrgEyKA+*RgSm&nR>@BaXhbnhs$e@FT5w}r{1kte^){M
ztZ?xiT)aLn81{d66mNV_$1jQT!yUgO#uqz&b&NmV@trS>`nUU3eUGWuySwA<e)bXT
zC#LgN$8U)7pE^D(w%#@*Q2pn`_+E}*enC?`!yW&y<4w<rjxUP!GtcoG9G`Icyvp%e
zF8?`>f5iHU>3<wv<J_KaS$<x2yglDC{?G8uU7u`l@rl@TurC~66yq}(*jjJ=x!KO}
zI*yjaj-x$7eutpoqNc~`VXhy0F6TBkI5v#$6eMEtKc;_f7~e6tB6glqf6Z<0`NZ>A
z7&f_%y(a8u)9cAw!uU>`T$euN`1p0~^I<=mUT3}y-<`b8uP>B<ApD*Y>>qjHAbwIx
zG_Ljty?h54w*=iZ4zG*&0>`g{SA6})g(0&#HFD^CJUhA=-(>JWr8&MIy!tP?IO^Z#
zhw<>C&Tk9DZaDnI<uw<dwJeHX?)bA9@QP0?D-4<NGy&50g*3O`y%~^-FMJ`2pA@#@
z@3+89PyMY;^<2ZPi{i6pMtnW<ua-9LBfe^0VOS5p8wfPj@vE<j_>|DgYp9N|D~S4e
z&pGC1MeE(i%_lu9-til6kK%264`rg0&Lu8yy<PlC@X}eeG+OV?j$h#7H{2NYL$~4b
zxQh>FM0|9;&filYY3gVGQ-xvNH&J--K74ce+>J|8#V=_c^)oyrYA_c*+`m^xyv-*)
zxgqJO`2C{(?RnR}@akv9tr4&9xz+MMe23tN`!CyGZq=ggy|yrn<AWIC(%tciDbadu
ze_d+4+b?%T;e3oH>Zk70!jNHihs$=IBb`-FCo;mN8@zND^@;lbyW?Mi*Y+;EHsWnO
z&*K4Lb9uWKUi}1rDGYniXQ#DHp<!0AQ!puZ-**yxx75sF{S8t7wjbBQtDpMO5pUya
zB~yU(taQhV=_%c*c|Fg-hk8yg40YIk?8*b!=JfCTBm81`t#|z`ksjOcL%3yCKPz&g
z{==2<-$eK@pJzn8t@l9}Z*gW@?i$6fbNkWehcbArx6U0$Hcl>f{G_WQJr%B_!+DCD
zAkXpp?(bdy^Pi0L*#5nX3zhDv%mbfCJco0*jOW7u9ayhD-*D4IFd1HY7Ty-Ece#tt
zOhkM^Y~Jew-&~%LaPbpeKbFt$9bbP<(>&kVEy~X%Hy$Ph(Q;DvXuXFoisJJfe>1%D
zUwC$5$h36F-NCy@eElI&yv+mOz&EFJ2PQ7{Q<o9N+kA4V<CnY?^>6#@z@F$~JXg8#
zT<!Ec3Lp04;w}GEdo{n_dGLx~{Z7=s#qYt1O!;5s&R;hEFLM0!<xO>FFklqF+Km%C
zzGgW-sEgt){~H{?(2Y0iKbxnB(vx$4Q$5c*e*Th(w;Z<ED_ZY#r*l#eEhjmC&dp8N
z+qqBFf6>knZ^!$m#=G%p^WF)4l{e-GH;?H%jkHV-`3U>}-}NK>%dVfoeG9|zd9KlV
z_;7!%j`;99zVLmxx8v7GJg4t)Il7<Y&y09G-XDOsoVd`?yyfDvzKh~7bk3vqiSo9=
z<^MO1zr^wDTt15&{~&yG{Xh33{2$=8U4=JB>$P!p9s{65>Q2GL*!+Asd^ir@jpD=a
z17qEn=1OPh@N<KblF)xFx50<~yX%2TA<OkcUh_JygxC07?#7{wx2*mVzseog#*c<q
z|2Yp7hCPShnFl(E17G}x<D&6n+w~>9`tRcAB~BmVk~JV2KRJU7!@9mpOUqz*^^<53
z^<(?xVaFHk8SyqgFCG~6Q}4#l2~jt}A45I}Cgm17CNkf_tN-~=M7;I0W>CZzwu<_<
z@zbxs@ov1?JaZ*{bNl_5Kf<pKdA7?PFWjbu%Qvq7x*^eeEpN9DZodD=;HAHCLZrXt
z_EA57gx7dj;_fddMs(0_NR<EH?mBI@<IjgzKTF*8xqXpxzkQou??iaTPg)eMH+r7M
z*L?5SeEfrp;Zrw#Zod!l8V^O+N86j_^o&zKIu8zr`nNov6!y<}bNkn>>&}Lko}yiw
z=B?lUQU7b*^>&5p{|3izbms*Qt8mFaAnIp+yQm*KPu0Uq=V*7GZ2ja6)%Lax);XQ}
z?l>*eLO#O&|8swYe-&Q+=iJ#e53LI$e!QE1xO@tiJ>Z)gZ`vK|XM;OmFOR|l9sc3|
zb>~gX=cA6#Sw=&a-=~Bo_!_>s{#y@^wztrY+g4F{&=p?&7hYc&GIkt&4KF=~?)u#J
z@6-cbyt}?NJ=r6gUvD*hsQ(y*u}lj8=Wlk6Y(D-_c&)c?X%ugH_y@fDS^ail*n{bO
z<sij(4%WNlh0|`hd=~QL^UA0n+waArqCC{OJlJ*nEO_<5u1yqg^Tx~Y(zD8q9~*C{
zjgI1joG4!3&7o!YG0kt+(eUcOsB08&*GuUKHy@u3ulTy`DBh0Km*Aym<sA`k+jYPp
z5kK9{&z6TN@akvDsZsoek<8#7$FG=I7&5lKgU3ekRZm8|?ccvTzV3yHxBNeSXtdsS
z?s_RZ?2W&fRvG1aU49hL=`vjQKg{K!Z__+{3?FWn%d?HQV-JtwH(V9<v#aap*YM4a
z^Oi-;^E<&S5A~l${aD-ouexWAaqO(_W@#WmXcuT`2&mb<P!NsrwLLEa#j`tivu0;!
zhxP1c**w1W*mq`}^(*%E>`W+SOCNa=vINpDP}Gh1(Io=9qE(to1w|^QX@9h-s!EZn
zh;1rWsVdS1Q54Zqdd_#wxxT*lv&Z(1_f9R%*gpQA=R4ndedjy3-J|?NTz+wt%404>
zd_4tl9OtDcY5X$ZV;|;uJ(ShuPU`;<-*JS>-@^FW&F}{p{_G>v&NRbc0yx^UyFUpV
z5MI!oeqEcV_RoGdtG^5Xe>cE!JTH8S+L87@$8hT@f{Q-?58TdW-jA}5UtXeiPBK52
zdHof@5pP+>o6y709wqqmO==(1X8rmi!_QO+F7$TeF`Cy&o|n+)B*3x#-9OCg`qIuf
z0gm%p<ax<>?!AM@!}3DL^UmW0fA&MvugKrOVR)9?$DCLAs(*yaU*dVaYZt-43vi(g
zg3$lP6IA~4UDUqp-(UF{l;8D+$ocq>x%}?OvburtHPlZ1PILR`0gifO*slLdkMgg-
z%iPZU0FHROh2@Cg?cW%FfbB$~lVf*N`7D>O&@ioUGkg#0$x?pu9&^8s0vy-z^4)|V
z(QhA7ye{7%Jji-|;3V}s&HEzB{r(xlpJzG*cBfz07O4E$Pf`27$nf_79Q(a=B&#8J
zUPC|BxcoD$_saO66gamd@V^GQY2Cli<&!*~o4MZ`md)kg-2<KnIIhca)>~v<o@DsT
ztUn0+okg10;;pl~N72u3DiM4))9o%E&#y6j58IW3=gR;$&Fco2+rOFG*Uzeew%)oz
z@Z`m;ZdvI3S%BmCPqJJVyd_t0Uw7gVc3(pSx*g!SE@y9`_D>Snx^4~Id7E{f`GCy#
zT>v+Y^8tWkJIN1IJDArHU+*nbJI`=C#|dne0IvIGJzVhcwtESF=})q{q{!=U0vzY{
zTTCY+r@qJVGpzqy;P$_GirTq+OZU9)fsKRxKK~VJ|0I{cxr*}w_yoaU%kcLC9Q(b*
z{)8mM{~6%e&gBZVFXO+nX2#D$0LSv@|DM{H^_r{$9Q5#$_Y?e$-2NeeqyI4M*E)ga
zah#XB+j(8X-0vU5I_!pZKgZ`O+`N^B@;I*x?3WO{eTU&UG5rglf5UxL{u$O=1P@OG
z+(Zw5+XMbe5BRPowf`LNccHhh0bJwxFKND*#|&S`TIPN~4sea<+h|<`&%f$1{C~2#
zzW7!C0N{v+8`*vlJRE3K`Q2G+NBX@CaMOI>0D>OdIly!x<9{09IG){W)DEUA!Pi}<
zsr<9&37#Ra^;v*p`NfyB8ZyuDYd2^e!*b`%0LOlltdB{*-vGF2oZr`QX#f4xzLdFc
z(_H>mfMfe>U!rk}-1#EIFS4Ip;BUI$+|CNXabC~PQ#;~cDt(m4&v=08>(_Sxj^+3K
z1&#A0fvxkuPVlq;O>jW3e!T<bJC@&|_JM8c*Lwht?Ob9%iR{xC0gm%J&vv@t?T+7|
z^2sk{b$#KtM?cQ`9>>QnQuEdZ!1a2)LghhS*RQ{0c#`4QF#JahzqCr@l>POIGt`dt
z?^#_EbD-ku$7cwhJ)gy|meBK4ze(e7JWTD#_@4tfj%W8dDlhyb`3dv790#~A|4&q2
z_%=L1nCA6qf@9uhd{r6#{2uC8&UbG3ZElC{7g?821040_lZ>}ps2S@iE`R=PRzsd*
z_&)+%Xp%wt?LV<R@X0;j%j)lfw?F+I>Noj^1ef()`CY=#2I~X6buIAY0UX=M<n+PU
z*8#5a@OgsEcwS)mWtNX(-+k%<ED!naLhW4CaFBz%f3M+Ae(pgU&jIGEGM>E*e}?HW
z&E+>4-e7%0_Qekv{v5CSEnNOB57GE9vR*BC_!hvC&R=G}eSyn29;Wh*7qc32lHv9v
zX8hmZ1O9jq_?H2W_}s(vFXOrHlQf=J*)FSazZ(EIt^0#L;Qz|)oM-!5=>M@t&F%aV
zz;Qg;C$qZ8S9oDw1US;?gCY9-QIB>OK1J;$uP6H7%k5kMIP#yf%ztFQ&j1|p|0>&$
zckq1Q`WUtIY>3`$fMfaV7(XIsU*z%^AENOK9e(C4m4A@w`~bKAF90{;^9KM&Je+?&
zjbGvizW-@z=h7z$F8Dn3IKkIgPuR`ve}mz#a`|6i_)7rC_Ah^&#wqxD|7XnOxm&{l
zZ||e>U*L8=2XJi1Vtyj{yy>$9zxWE37x+5BP4j(1!(l(Nyt|Iue+uBJ-(oI6e963?
z({MP?V*NSE<-I4U-{e=b8uAja`~2^9&H}ioe!COkdfnM>l70O+z;Rv|UrTttjVrwZ
za2)@cOqL<^_NL#bcBYvgWdHs-z;!#!XZCZg+s;w>Eb|Q+|I+~1_-s+X;(xyTb3D%T
z1Q$F!!SIW0Zwma{&+~Ym>Ms8QhChFf;1wRvR{@Uu3-kWrOX%v`0LS^B4bAsI0FL9l
z%=i)dv09#6E0!y_rb@TAHj9-+v1q|v0_AQL-G-;U!g9s6qmX3M0LvI)lTny$XwOa=
z%B2l3Lm&2pp`5ATX+yc0C@f`|TguQ!YARYcZJ0;eFy^$OUqi8s0aY2p)G~&t8Ad!|
z!03djoMCi^UMCHsi{d1T5d(r#(WX*{iqY|>qF6Jmm0_t;QIw^k(>APUCQ2Te=(sY`
zaTykABHGqOblMY9q)tSKIvMS8GP-C}QAAHgM?V!s&UCcmbhO9mC^f-JXqchQOk3*q
z`NMl>=ap);msL(N7gDK`5-y}pEToE+41S#~xn7}MnYX7-xy_neQLXZ7t>CqrZp*RM
ziM%&ItyH;Qu9ZEjzOquO7fOlK%|fH$HWT&bd)=aEC9oaEKbC8&aHpwM@Cv=)iB|c3
zH~M4AZ55m4hF5Qzep@dWT~)3YR^3+g=X%3yC5m*(Dv|8*d!<}EW%|)8G*?{@e#w7i
z-@JkwT8+HxEflJ51dy;Tz-eHv%B^|LvfEOHX4CZ3rmA5(hD!8H!cO-4(b%2TO!cdo
z?)PJ+-;Wc0e(cw3zefADIoYSbsXo5}l}DF?aWfPCtpSUwTCQhYsIDIqDGR?_dZTnG
zQZ?Px2&`R0XtC+Fy!OgUqG**|0F+_7HI-LY#R}X3Y{5`Ub+uZlFBdAR1jG$vXm40Z
ztQFUDOF(zV5^4o@9MV-`Q&ZWdwbBGyQl)max(QVR-xTi6uA)lqKQepBQO?4gQc(Ez
zg`>(jz`z4@M=Uk>k%ieqxqa|kSLISSpapxw^V!Ma{rmIIl3JSGJMTcN5f)-657b-U
zLCr;SCr(UY?R0L%SwFInPpXOg+HTu*s`|_1GGNSY=9biaIpr+mZDmgtD!_Q$k}6ax
z^<n`ql`A^Vy5r>c!aNQht>}tVYlT_~Zc;i9;Md8|Dd%VfThEj|x0=Jo=9g^;UMhdP
zZrhn@wrhuLII<jo9O%rOacii0sq#whc&nLid8MgxOSJ&Kx%?DXbexIxLIp;<?qs~p
zhU*+Th+~{ym^(5DTxtm!BeY{rsr~I*(JR+$ipQ1P53?24+8OMLG>n2#VGAnC)#`E;
z#-C3sC#f7esSc@Xp$06j=^TMks@dA6LPmPzV18CXchl++{jBQ1eGAwx3}oq8-b<xb
zzM+bBxS<LdY<Nvr)<&gJbaVb-n9tibp&oc?0}xoqVej(`GfJ)2+N!v*VW-r5y?9DB
z>XmYF(@8mcvN9#V6=ar&-0I=wdza=?&bmfOJ>6(~PBELkeLlB$-|^!rodC8FrIX3o
zV$p52V1;1}xH5CLZegi2+ElV!gC!`J6v-InHk<XPaVXtX7eKU6bA;$#G&I$RhGvO|
zCP6?fdQBQ+K7!Kj5$q7U7aE-iQATbtGXBVVY(Wrq1}GI!qDn6EFre0hK(4q^fb3T4
zv^ge=Yt4GCo>s?FcB-`rTv4;c;;D44e%e{@B9ep+EPKcurO})T?<r(2wu-VBq1)bE
z2Dl|{#VvN?fj&F2L%-6Wku*v%vqT|{A=wuVyBGVK0h)k4TR(-|GRVDv!NB59)#~0F
z=!Udl!cGE0VYF47)q)6k<7AM`mkTX7*Pp2g(~^<w=mpCZK`2Iq&?3oAWT2q6u9QK+
zUCqJ%!{uG-aH&*USZSkxDg>%0J~s`N>w|%b+)g0brDHzlvQs5jTLk_@{GVpXy8^P2
zmv|``kiN3qOn4%KHP`5f>jAVIEoVYlxnemp6j8>lSj{C#?02KoPM$7+HVR7g#-^s&
zq!PkP7waWgY2^-92dR`rrAA|SGg?o)0+tY<73to<ibZ_*n!;7rPBkk|H=3u?jrwWW
zWuRY!{3?$o4O3&0hFdW90H*C!vC#%Qs{&4ekg{gue(}m+z~~*jFXb#AEDk@-z^*gO
zA?0i_TAxjX1{5Y{CYsblN6(!VyW~K<0+wE`kJSRYe92`y#&s6gtGJ%H%9+-EP0wFu
zgbLaBq0&_B+}G!%gA8|qsW9eEbx<%%tlmzN!irKu^DWRB>}uhZt6FP?rdx`tZe51b
zhpJVw0c}`Dw7$GeRRL4qfo78JS{aO6G`oN(QmQ}Eq<WdUVCi~xrsS>^+7(f)b7=g+
z3wxn)>Ry(VGuJr0lmt2DYEK&o{9Kfl><;lR*%|PEpi=?e5MWd07QwnU+QN1cjNt}2
z{6J9v13h93=O<B9ULV*6kcpjqM^K-l<X{jV@jExP_~<5dV68~0TI_0KM{Rt1h5Z!Z
zpTOVjjISjT89Q7lOx_}-S+sO_b)`ZYjYhXw1)B8SZi5gxBMf^=X^(_$r$D1G7r~R=
zL>;$?d$$PNR(VZOHd^2)0!IeW^Ax((U^k<1={7Lo3<NzTgYd6(?DVQv)#qOwg*J0~
zt>9_q74$J|@0tKh7#8a&a`8N%Rzkd24Ty(E?J@WvSZD{9bqiaE6wd9ZW#EUyTM)rD
zjL|<THU}(`(I2qxTs6Tm&4Q)35@)I0Vc-I#a!s{cE_kbhhHf7fDt;M+dph9Xj2f^S
z|H=cW*=e<0U^jS#D+XwN=TCPacDqB=#a`rZ^yahgG2{@7*Y}u*84T+LLoqx2#O*lD
z%t0h~{JWea5-2SNwG2mrH3bJ*#kFh}4nt=5=9Ha)Bh)B6?N%*^I>AWlW3T~^FoeyE
zw$PV*#O+$@K5vO4Y^NADapOrZDk#Mjx5iqRN<ns7IB$>QteeO*2aBKe`i_P1A7O6k
z=??goeAmSldvr<cUtPU(OC4c6944gU^i{<N;pXDa^cUl*J7>c@v*(od<x<+JM#OfU
zoR0W7mq0d;`-FbWMb|q%epjNlZ3hrScI;O8@Lr?gbg95D9L1MiEtE0(BkyIv@UEDA
zA{azsr^$0t2Pxqes^HH9ub~4jye=ypqJB_i5sx(oD8nI5SaU%iww*>#s*cvFLi}6z
zA<&LiE5;ZKG}i5{BZD9q&1=>-JMJGoypp}NJxA%lsFI4UP|zw?y)`<p2|Lub)-VF(
z?Q`%e7N_j-L8}F#QYms3!lIN{SLhFHDL@qlHs$Vx(6Pnhz2Lsaa^+R<62g!TOfsNK
z<{Yc)R>4i)txFY_>&*~oF!f68B!Bub2{2V^)j2+G>t)*^is87n>QYWqa<@G;ya_Bm
zVxMuxYWpwvzG8cV<09k`)=twW*em|YSHKNrX4gY)-GMDo(ho=UQV5qb514hExXrO~
z5$zz_a{M7WV#{?RkD^XaIt0gK$?3I1ORY2}GkEYMtIINMYc4e&3hfaDV2W#wUy&X`
zJtgf84#--rTCUeCZlR`+{f0jA(Mmj=-uZrN4B!oElmmGn;y*zh9*sdmDnz)WO96>v
z9IGBF^qsF$luQf47;;rO`pwsux($K^#pBi|Rx0h*nqh4<Db1iEP%Ui09~{hXz|Eoi
zDYnAj(0$moh|t)zBYmMq-{qjI8<p}hFrW^H39Yf#VM&(+WfRY*3(Mto8xGIF6<cVv
zlphD}gsi8*JWwGacEu|500wtwuAOtpp8XCi?}y)6pc}wF1Udq%)K}raUk8izwLSPE
z$qL;g=>!}03iPHppn|@D03pH{CqZ8_RftZ6z^&9IM8Cr|kV(21=A@E#1|o2<<TRCp
zdkea|<6vDJM{`=2w{3mlVoe8!IZ3DjN5V<v2bHpoz0!0c22Ni9j@s7-&8*u#QKbr8
zMbaUZ5V+*Q6_BE8lwA~<xFctZ^%_8HUMtlo4{Vsn?`rW?hjB%Onh)p==3uv%e5j2v
z=t&F<PxEPe@8d>UrR_C2wg{J8%F~MQ$y$gNUWvFfuSiEfOxX>H^}#qe9p?>u%Uh{8
zt0rv`V=B8%_JDmZ`!6-^Za}n9(VK0qwq|RkBkp~z{mpuHzEE8*6`aLlby1?G@H(tL
z!?$5|%sh;uRa73XoJ5nGVwQ<#8e>5Mygw9qs>#7O;HG7w(<oc<HVrYU41V-~bW-W$
zq-IKKWv6I}914}sDCA3yZ8u%G#9PziNV9^#5c-Ja_|JqiLWI)HBOPjA4lJ;Or;fe`
zW4?$c4*%|J2;}bvA5yWg*&#?<-+@E+oGvW4z^zR&-pI52&r&Oz@jH=*m*cQU^w?Ru
zmsxIuhq4FPkRHs`5>(hb3eHt`#&waGzu{rX$l&ZW+QY!2+*%7SM_>r&sAk!)l0{qx
z+bdbL)4JDn*4~%s=pe##H_8#7J{SXw|JZN<2Bt|eepWle)`rW*9kV}d@{78_OiQ-q
z_%^=gs(5o|C2(^_BX|2X7P9$dPJLL7?5FrFTTOvG#jCxAiWw1t0gGqJo@_VZwt|ay
z9O1Tky-DX^kviRKyCwk9m*ZOncDIx&i+y}!Y`>PSuKlXJ8`ge>SX+|oOyIH=#<sl!
z_L*4?8-UYlRdLXJnggqfytGVc+GVqi*cebXjNf_MrP2rj`f$eh?^})_@wU1OG!%sm
z<s=vYqw$|Z@Kz9=fBWTb51k*x+Ze8tP^d+@)u^|~m7Vu0tsL|fx^HBPtto=tou5z!
zcV+E#_pKPi2Je4quxEZ82Xbq;-Yllh(ZM)y)0EO8`I(3U?(CjE3sh~kBJ&+0R7X^8
z#Ejk%HV!(GG&--IARW(cF{{Ku1<oj;0|j#8`elqTKNHS3KGh;mCp<m3M3n2`ZQFrd
zHu3BKBS<;CJ~D$jR04ORAw%h^Va}tnD*yPg$4xV%?>it}{k<!G)+<b$wS^TC=-Ia+
zdY+06D%V9?cCJQ&=Ld|N?yL#07RI}Hy)i_mhDHo+k<X}KX0d@}Li{R-k;&{xlW=&2
zIb^zAb+2VO2HvdQ>%FqwC)dMsvB-`N=5WBABkPpL0WQFU=csQQ2hg}?I_VSq+#kjq
z4RCMOM1rX#gag!zW$<6zQTEmjaOT49V_{0-<Y!>p3z@6X*`d#y`D9v7q7AIr6q*#j
z_z^}gQe0>zGD}zzJR?t)OOU!T&8O@W%|dMz(syY9M5;&5=m}*(CBi9}b<jq5{U;CS
zk9u&JHwA}jhx3Q(rFO-oWq_j^$XTeC4(*d9nGi`2_a_zL9s}j!=uJn*7*Y+GRDVCL
ze(@j(rAn7ylwxTho54g8Lqi}>ft`jM^QX%tw+7vmA%ecUJml~mR3DGuphm(Mb(TYV
zWZB25ylM4$`y=3^S|2KXGCy|Mk9~d%!yo-X*3Lta{}ZA=n(d<JR88qG!n<Q<GLLwJ
zXhSmWs*Bs8f)H?j3J2|0YR00W>J8nA;pLu3)%ne>*%_2^lqnb`UYGPFwgIAn(%3{o
z+65kx;Ci0|54Y8!HXI*94uvgqK$_WXzp*hkM6RUtEhx97)dQ!BX}%1HlwFd_0#W4F
zgyZ+Tt}8v*+{1nd8w2&lIN~c>o2^v*p=fMi|9RJfn~7U<`1oy$tHzFkRMJa<>fZj0
zp`FCCNQdeqF)0>Wp3r*le9(qz#eaHt)fV0``}kuR#81I)xvO=c54Tw%iMd36bSP#h
zhlt)6LO{MtWb|OgZOIJXFKnW7e+yV4Mgy6G|M({-W2a|^4gCX!atMc##-CV`+l#*~
zVgW$o3C7gpRn%5_tFZb()Y|wj8w3@*5tc*Fdav$spi_8AeJY|knyieSVYZI245E*0
z?=p-SDmO~*CXp;VWC9q!H8G19tSLmf;}-9u6v|%kz4BMxN*h3Z9ZGK=^z@*MiHI9Q
zFg1lXRaYW-&B*^hC1@b60~vm86;fwaD$36f3eGxATZ@-o@R2kF9>m418~0M=qidDM
z^qJbe8;FAnBZ_wq7>r$`(;Us#fws0B)5ke2aG@2ejZXYN=hKQrY^U&shFsTxrGt82
zU0lDuVLxbGMckCCS=#VwqDb=Xl_y)Mi4l!&8gLJZfy*nK4n8JmAKv8C$>qa5(qL=F
zuNn%I7z+D=6E`3Cp>y#quxQx4I}$x3Qzjjq`q<eP1F%0%_2mV)cZEq@!<T=za<uIb
zZ%$mQ&G3i45RKf~1hUcj%t>}aC@V9C@QgVbTR4PJEyJa7QCkKR2k|E|HIhNVMQMu6
z*Y0V$!Koi}A$KxRTZ4Q}<$6my<uf@r^W0}h7$M>1tlNZ^boA{zi)p1pl%S9G{BU+H
ze8=7&AYs_l>YA3CuD)3g=L-;8+8s!m(0T16^3cG?<0q+cIaIflV;wHhx&7BOkZZUj
zjG;uf=I~;?Zm(Dx*@GZNFGgfH<qU<nL5*07D1ygMEEiR=)z%>p0~>U4heHJ|@GW`y
zSkPzW%-zeT2`zq8YHS-mYDxy<yi5oh^@wy@Qery#5l-RVVls9mU~VYZpeZG!uZj+X
zQLdxMa7JW9P>91JyMC<EHpjz3I&#w@m^{JpQ>lN_<zvc}paE8MY`0AUi9Hv(QZqrS
zfS#$DMmW$R7sK`np8obw$4l3Fhz$pJ46O<|WmtpYL$Gvq9SC`XU=NSzZKy5B_Eu=q
zjjm+|P6-D^N*|#cl5<zCuE;%$4)5$NN!MoWndDlWvydnle3j-W8}wR%I36O?S0|e5
z{S;rH515x{hX~i8BBBq1OqVx+WhoC5K{*qURtxWPsMU=P1y8SQ)!{jCWq5|&dNSmv
z@MmwnaVx$mUlMNr{pHL6`L{;8zYLGgTZ7o%k~-yXsv>;y+=!QV%)SBHg;8gaNtM8T
zIf9piY+HXJ&14+VIDBXOm2(+A;tq>3Nm8G3ID4}}b&cOv4eqWj?aLj)5i}R?#ej`B
zhxEWD3(5BC1$~)s@9Zzg$soN5KI;$MMaHD|6Gg~d+QfSpDU}1468u3PJlV+-GNe7R
zCO<4_Se2Gj?uxiKSf8UB3^r1Ze_JF6smS?Ik1l+2RFdq0F-6EjLX-ew)2TeWd$jFV
zd$|gaX~taXfXd+GA-k`q$a5iuiA0~_yrmV)R2I@`;yANET030^&E<&OYFCk9_U%*Y
zMAESO(+hJ)<{;(U5@gTzoHA;f(@-&ZF$Gz3fYGH^!%sdQ-r0w0BZ(#FNY&)$3u3Z+
zL9g&hoE>KjJRlYi&hUvP<1l!FxbDslEoN8;r$TZD0U^PCzT}F7nmWeK<n|{a9YhHl
zDG6ziY8k_$@;b*tH~&h2)eQXPsrV0F$L5^EWD#R<72u}ygK;%4-9`@3>wLu5A<f1B
zY8*iwVjD+<i~>{vKT$3!&Jmf7(PJ6Bq?v+Gm@L#U&W{FZK@MISRHrSiC<)liWyYf&
z2erzsm|x5|I_fU8F%IQeq0)BqoPL|Qxju1(+x+F|qu~&5Iu~W&gl-Awwu7QDssp0V
zj4(|G5?r`b*m7?RBmR*Necr8BtMwY4BP%|=>`<vtbN}OStTt7vdu#X*?d|3v;9S6G
zNHy9`SFM+uUb_IXP+iYi8Pt&40h%H*pRuOmw=<yZVE|dlt-yt_CR}QR{pY8SM{d8B
zCe&H|Z9mo&ax(Ar@pL@&hCq3!hhjRtm&23LvA+%g5jlDluMc-nCaCSdQ)!$WpTI}P
zp_-$6s(Z#mbi7g>Nx)u(?&uBE<36+m*na!gvJ$P$s#jQscL=c5?`!f2WWL*MSP9^1
zZUP>#dn-CQ6RWj$0<!6@S&7nS4Jy;S*Q8(8!TSjrcDueP_zlwP7q9|<YE(Qcfw%Lm
z1RgM032hlAnstmq241&ses<w@b$I{&`NOkwYVXm7xp_zBb0-|izjbS?QEpB`=4W$3
zouf<2B-}N%(kxV6wN`?G$Tt{a5uSjc9~A)J+vSQ&15$-%v#?16lFv9OoB@na&$du4
z7omO~#tr`xdNO+82?$2A62*EIvxQmP^m+%ha}E6M;`T1=%IZ%S81PPp%Nv#rzJ3Y5
zybk`P{<n5z;hSZBivfG|x6Z$x>U`9nZ214fpZugQ^<UnV)$o@Y@T~r3SyJyh{w{B~
z!G|}(pVYtbnymim!fW)K^&nTc7QW)xrT&fdv$YT2v8dEfUZ2&!B(K+R)(L*6Z`6i-
z#`lBp_mjZ*AHFe*VC!M-;A#D>Gk)nu-jBoY{~M^EeS22d$iAH_UZyt-$B#IW@iW+3
zWw^ALyeX@HO5Q{z&hUbT@h9`YkL&NH;?~7?Wc8<uNEq<C@LGDu`Zy%%U+RApVAus0
zv#ewmzQHR=Z`=%hf&VfN0j$G^VEsK@e-GC`6RNPAE6V$ChU%ZsWOa%287lZ+`xpWA
z)slMr)p`Iv1p7a?F{^(%w?XyZBnA0BG#u+ut}pnv&QN`e5q~Dp-9WhiC%FDwxY(Jm
zQT;Ptqy7co(h5O4>+nskFa4k8`e(WR+9Ohv-oyRB6srH~3{k?XGt^=Q2`}&p&;K&~
zhGUZc*FH$~*FH#)<jsM~@G(4}ABF0lyNBwZyNBwZ3@t#o|LdXipN2MgyIVItLiKO_
zDAgA_l~G9l@_r-K|CvDjB-c-J{V=|yp1l7u)W`Wt|5>h|<@)Dn7}CA9$NxkhY^aQT
zN9w=uD2@Mxk5R?lTwj(!`jv6LFVz3bk5T=XKhE_-{Yia!|6r)Tb(ZQ|XQ=)nz4@(3
zJ$XM6s=xR+)nEJsRg`f`15!`EFF<{S$^6f7{gYfD*C+VO2EV}PJoldr!KJ<%f=hG3
z_s|q|jpw-k=if^W{5-rp1b;Gqp{v&eOvX+n>HoQ}Q>)Gwf>5HBAmq*P#Z>>rLj=7`
L2FjH}U#<TG!}$as

diff --git a/Cxx11/transpose-2d-sycl b/Cxx11/transpose-2d-sycl
deleted file mode 100755
index 9651bae29f4e76ea0cbd2b78f064c8b785659faa..0000000000000000000000000000000000000000
GIT binary patch
literal 0
HcmV?d00001

literal 90472
zcmeEv31C#!)&H9;Bp_raED{BD&`5(Q%w!|MZ9)=wBLj{siii#&nUH8UlL?D;2`2b4
z4rpxE(rT63)}o*Nq^(-C3PF~jbpf}csNg<hTo5ausPq5*?z?aDW|*<I-zW9^e>`||
z-#Pc(bI(2Z+~wSR-^;b-u1QHIlcHZq%GnB`z4;D-(tZ`C=AvF2hf<^*qc{|+a-z})
zR4KT1I){AH!<r;S;?l!(4OEg5GTj;(zb456h_Hi!GF<%jhI;M{nXdP8$VV+)b&>|^
zp<>Zsrc33cO@kGiLwk^6d7B36p)sAvuS<(px*Xbr4EN+~pdK32Q8!tKwD_!JO2mU6
zy3;g#o30QkC)L4pJHOWAcMj0f>7j)Lxb#p@P8oS`mhqdD9DoQr7${cp+Z&RWm-}5`
z6`!}gE<l71@t}t*BtJdW)18lWl=Hh@vUtjLnO`Ek1Z4(#Xp$L>tE-(~m_M$r>h!wW
zhStTWFD@!Py)b`lOXJvFQEu`l?c`~*L<-uM6kWiX_$`+>s(x9@`Bjbqefyt!N`L<p
zTPn##{A7eq+%DYHaJzAzk9!90nYei|hYNAfCLphi5mtNGIfu2nAN{a1tIv-f-}uhH
z>q4HLSIi!6s!6@)(YJqc)iFyuJ=>P{dw%NPM|Uo9UjFdJ@|QjwUH+15N&gQAY^>dW
z{)fN+VxnjEIf0?)y?E8&RsBovsC<0OpIR?V`r^&s*6I1ghN~d?z*r>UK;QWIbD*Sn
z^baPW{|{7hJo<C{#mB#eyyMZcnZ(2YG6DWNR9-y#oeA(iIVL`RLxS=SPoTGJ6UcK<
z0{)8<;Abb$+tmr^?@b`*%L(Ls84W+4e*TR16AwQOonJh>BLV)y1pGfsK>zy$<r<U#
z|MLX+`x4mI2MOx^odo(Bo<I*5Bq&!XL4948fd1SB`TiyW{>23HJdi-24<^vh@6dV0
ztH+cC`R+(Szc)d9KOuqs|B^tS+ywdwB%q(4Am3{e=;w_D@|=`_{<8$_=!pdQ-zDI)
zFF`-xPGE;s3HX;Ms9#rtdbuzG{e%Q^PDnt{c|bfnc_Kl*aQw95j=fF<;w0RA^Bhr8
z<*3I@<yd98oS)>#*cFg-B=D>Imk3Oj#J50B(sxOE9e=yDpS3oJq|}04kkg_JQ)&ik
zeDugqWw|=#{8Y!kFX>keil!fH(&Sky^VR1ebHRslcFK8~K9;XRKR`L>N%{4170C9r
zCq@r1ihPehOwL`%m-=5FBj*<IVZK3`ug-s~%-162<h+B|nX<g|><$6zKP#j@EmBUM
z{t@Vt@;hSq{}T0*34OLneOe$NuiK>_)=56P9$uCF=f%|TBBY`GO_INrOn6~_*5a$G
z95aS<vO>k<Sy12D;A!zyH2XXrfK9%dW^YB6=W_27PbHpwUd1zK+LRf-@g7g*;>C8m
zJ$HUZOKl~RG}ksPa8}On+3l4z70n)Bb49JM#aUTCqXIwW<0~8Mn<|>U<?bn!U@_CF
zg)@A)Hjf9HG%oVgc^ek^YCPWN=Ei0%cG^FmPqAmJr=qFJ+fc=v>XFq9U$M{ITwmJ&
z;TKYRAT*h48zJA}0+$z5)_E(M%Mp|7aW=N__Gu-b=|p1h;!1CmuePy4V^&xR=^GmJ
zJQw8Jb6b|Q_`LO=%DTqN%kvr<7nN%{HrBP2*9uwkAz5AAT&E+yJWVj<2VK`YXL@GZ
zJmoVAQ4<imk!7oGXz@1tob~19(`Pi!JUpVx7~v~I5k27P&387``pWE5oPWCZ>^5ZG
z>}{&6sPvZC*GtW6nym6v)S<W<a~MU1R-F)e<^|J`kakirzjmSBPMfK#Xle2ImNa=$
zlIq5Cp%X@ECNLkSCb&^;G0ABtEw%ADP>x8Yl;yIJLXP>~1+@*H$_ig)4cJxHx%G&q
z)@H9~VQsUowW3awpwK8mWkrimCl%75@;#9Z*hm&H_B45$TN)cG>S}#UJPU0RF0$(M
zdWvUW-&WD?DKqjslnK?H*VO7OXJcV|E2yN>(30$VsES3kRo({VQR@>mI`aZy(^7X@
z>VoRJ)|MI(J;PVm0>h1Mn6RM3EUt1U?5)6~HNS>MY(LO$v>BED%VtCa)_Rfh>Gj|(
zYN^>P>K-|X))g@UAZGaTD;ryVk`OH?QkjsvSg*3W#s%nr{(Id9S~^5)Y(T?nt@M@G
zL+wJi>SnL8>d{@+YdvMl70teCg}+Ku<0AH>3o6kIGSaSiW;HCTg|ySXEv@xl(aA2U
ztYciBDCV@>%DVg(pnA=gEdd6vM-*0heHFEJcKeKrN?lXE_2<pMY$i!!2@21fG0O+K
zTo~el25(gfn<83hG`Hw%rcKdvDMEwxRW~-*7cKDmM1yp?rp>T<^4T^ck>$C0w!-rA
z@@X(ldoDWhih8|wpONpG4T~wa+fj?H%?+YuYn@Ca6MI3GcVTU%*VE#y^H%yAo9%hp
zlSjkHkQZFh>TUJfZIsABV9<>{uLi9w!Y+~K=C@W?dz(GA^-Xp0G?!~bPt;ghi?)4X
zt*=I{K)>v5E}zcwkFSxCd)f@U$6i=cS?L9F^F;KdD)NRZY@Wgjfi1*X30b4EkY%v9
zw9c=ug<>fJT2XatLnX%z=cI+v*`Uv!B3Q~=&#P>#@_JB{6(o;hEe%7jce||jNwCv$
z_HXDc^x6d}^&YQoWmI{-J+Js*uUW~(p3Az@O^Ma%p>1QlSWt`6u-Svg@hzr19;wfp
zF}1O(wa%;60!HrWlJwed{-T-+z0ZrZ1$%B~Q>)P)wESBe5=o%fZ*GxyG3F_izLMqz
zEhP<A)4f-;OloedcU9ESuc|0_S7M|y)=Tl_-sT2xokwc}Ro<3LkEnQ~apo?FmgTS}
zYcJB~O10HX$~o03MO}-@L8Lsgj(hFS2?L_t=>xc4!+Kj;gsGONskw3Sl7HHe?BmJU
z-P~ARizT`RPBi=iG5yn;rJj>6(&5y3oN9^c(rGoRN^^T<p&0^-ZUR)SJwGz6!b;Gv
z^p;@HLvb*~VsI7sIQA3OH`)tZo2t;1Sr~Mejm=A<Wzyw0_NQ^u#BV|9a4K3b0q}Vn
zTG$@hSpVrMR5^!%N^S6{nBRzT!{b2@gd%#X(bFq13SXlLFb|fa4+^xn)~D2a>s!1c
zsBBuIpt*P(7LvZQz6pe6D`)KW6}3p}g(4~tF&{H6QI$Y7R4J27OFemGZOUYqb7H9{
zcWiEP@8j5l$g@3Pdz?KR)cIrW_9(DeDV;sLWTMk!$519XNxIx<I=f`9#lq2m!y<MM
z=yW7u?KcI#saP}TZxTW{Qn=Ib%=lCV4iPT6t0E=|IL7cwQ~HUuW2Vq?T54^tfZWpr
zS8|4<r}PIV9nYlVrKK`~#)N0MO!7&~TcgmiCdG+I-OqN9S^|dsl@G}l7t`BhybZAb
z=G&0TG0NYCf2k;~$Je3==}Oo@UoYcGe~X~+s~po`%R{5@W1#ON*2kGYuZn{|gOL4{
zV<o-++R=d1lv5=9!ULB>np7oE!dD3T6y<CQ*9tgUnJQu5=$}B*Ny=Qnyn<%U52vO|
z1xEYXYrvNo@VdWBZE<Z~zjQy7c&@SQm+rR{&vknJ(*0`Uxn{3lx}Qw^1v(O;?&lMK
zo&m3~Ul7kd0sYebWa2N<kqC9aop^npfYG}DO#B=o<fX5h5I;#rBGlI@h@Wb}>+2@O
zs|LL8&l9iv?u^c|X!^%8lc;y%cv%g2&3ZL_jscG)ipXU%;IV`dxrz*U=B-~2172?>
zj8hGG%A{Xz172&XTFh(%-l-EKoM*tZP3u>U0gola$kk-P%cdjZ78~%=WCgy>fFBUy
zqA1G^_zVNS(||V{@T&}Xz0EOtwE@pPDg9bwz#G@?)*A5I&X$&9odG{cXM(WHfFEqY
zZ!_SB81UN-_+t(Dod*0+1AdPIudm@TI%vQjXQ1C}z#nhGA2i^H8SqMGuiff<z>H2e
z;71tfEe8Av27HzQ&oxZ_vKsJK9f>f<fFEhV+YI=V4EQ1g{$vB*VZdh_@TviSiUIF7
z;71wovkmwk8SwKA_#6Yi#(*Dfz&9E2ryB5!4frtze47D(ngPGufIr=U?=;}Y8t|(O
z_;CjOY6G6*mVT`<;O#mR;aUSe*MMJVz~>q8T?Rb&9QA9P0biga5pFl&3k~?42K;yf
zevbiPWWWav_+kTouL18i;13$`<p#VW*Js&BPB7rp4frz*c#8plrU9R2z@KHnTMhWL
z4fq@b{u~3|X23fP_#y*dYq46S!+@V?pjQp}DF(dTfS+!_AALNkfukBYs)3^#II4l8
z8aS$fqZ&A>fukBYs)3^#_@C9lXXX>WRNFsHR|BbU?#43RvMygzc)QxZIenAJC|vLs
z(BV_w!LRv52c8JmFfOzwjO&zF37ZIS7x43hxwIJS67W-mxuh6cE8r&xb15;jTELGI
z<`QD4Q^0>D%%#Inn}F{lOm{fcB;dOVbEz;iPr$z*%%#APTfjdd%q75(L%=r>=F(rt
zCgAG`bIC7c74VgWxzrc32)LOrm-s@8fG;D=rM=MJZ-6*uK4C8Dh4u(|4q-0kg|-WL
zI$<v1g}MZME@3Xwh1LpqB4IAgg;ooA0%0!6g*pYCOPEV>p*8`ZN|;M<p(X*JM3_r&
zp?Ly6o-mi(LT&*MB+R9@kVC-z2y=-oWD{@_VJ@wOtOEY>4ZvJd3t0rbk1&_gLW+Pt
zAbcX>y<fBZZxOZ<-Xq{w33JITv|Yf@6XsG`s7t_45#|zEXsv*sAk3w)&}socN|;Mx
zp-ut+kuaCSLTv)Rk1&_OLQMj`n=qHYLh}Ut3&LFT3b_UR6T)2T3ONLP17R+4g=_-8
zjxd+DLRJA^NtjDoA&Y>U33DkcqzL#j!d$`%?fpvBKVdFih4u(|4q+}?g|-WLI$<tV
zg}MZME@3WFh1LpqB4I8~g;ooA0%0ymg*pYCOPEVhp*8`ZN|;Mfp(X*JM3_rYp?Ly6
zo-mi3LT&*MB+R9wkVC-z2y@9OWD{@_VJ;PgtOEY>b--LA3RwiakMP-q6#;)h_#DD}
z4~hCG>>#{Hz^@YK5>RNnfS)JKrJqojfS)2<N_ee+pCDXDc(s5ZCCnwTP^W<ZNO%(A
zHUZy9crxK8!0rt<<Ai7MU6|$uo~>L@@X>i#MVc+@-@Rep4u=xF6;(HTlleqN!VjS+
z0%m__|H$dzajEKmOKpE=uY0DmyUVuLp{U&(yB=WBz5Pt|b3>kbRZ;%lN%~FIW6dXa
zKmtYST*m{c>RJ5t4O&MOyUe~DhzReg?%Y(}OU(Xqy`W$Eu?YNo)r}vYqi#HyteUo}
zJHGK{MmVHN4zcN(f7@B_LI+CgpjoQ_-Qbm|gsrJB0Aspj(_#6MzUPKs8Qj4+&{{8C
za$(5@Gtl8XRR1^X%DLG#)xSHq;LC7WU3pcuRrS9SoB-8rXhU(<XKi#SkFw_rE`<72
z|NH7nU$!my3V}d=wi=k3oh~SY7Xan-Z&d?|8gK-ifjj!_6`I*)?pTkZq3y>-iZAts
z($bz|nO%`!kc`Lm?5D$Sn|b|Sm;XTUt}mEPcklq^37nbjf=m`yaoCp{yalDuq{@j%
zMf;OdS%W7Nh?a`>mq4o150~n0!61%QeWg?tx>Q1-WI;YRJ4ao%%U89I=c8!}nd?wJ
z;l1XKrRnVlO+HJHGf<koQVsj35N<s~4KRnW+Y%>5e=Wt(Kxu!Gf^chJJw=upn44X6
z<Z^4@?6|n((h|?6;7$}g_yT^Q%pNO$hVkc0{$%1uRFzQ5$5a)>6iS&BDPsR#rS$ZT
z(nq0Qx?X+s689(Zx2xiN%!39wR=1!tv(=Sl*%r09+q~>pRB(ttY~QoA=7eS>niE>k
z?qJpdXkld?$o;2ftLt!p>GGOpPqpd?hwifMq18==`6?dLIV;&(mOV^S{qHg1wFkrD
z5>20K@h7nQJAsJk^N1K(8TzR9%{J8hC7V?LCRVK`${-<19jo>u-`vBiwmcoRRW3|@
zsxb8;HBgR%ePXorNZppRZp%g8P8DX}FG8I~O*{lcGM|W1Vn(pve&_%#YXrqX=P&`V
z=n2qSss1N|uR_~BR?J`j@HceE=zi3d>)3q-)~?2H`?IECmaxjyoAvm>swNB?Y)Ru|
zdZs&BbE1VBdM2%lOa2^D{_cxIbC7><3kZdL`^=WqE{qKrYuZqo%8U(V=%0ei$Ou9Y
zLlXP`N7>B<KLzeDoVd0h?0a=uPue;Mp8cCvmWG#YGT+j*Y?t}gjU5|(DgK=oZ_>KD
z>11^u%kS?-&)kG6SYHPm)$mgd9Xtba1sCF{TGN;6KeYY^rhDS=;V>kayxuKR><<1x
zLlmxGArY%J#3}1<l!%)&#NhR#pI|1tgVzWIgu8gtTGPcGPuHb9gu?cYC+3-{U$l$j
zYXjtA@P$vB$8Ky+{mguR*QU@nP=O&W+E2Cl!Y8W*#XdoCCQA|-ZmT=@nNNK#^dCao
zZBUou{>(h5i^yOzkoy44Hb_(5Ig0~a$*hu@9OPy@{rgM&a@^=dAs^+uG`I$NXbOG@
zens#&FjD<n<lv<S?nsRcUM+}^F_9l5@nI$cGY`JCPt;Rz0(7Qv{}Xe}W{!m-QL6bR
zX`vAdG<R4I&mt>c7Mc}aEi-xPGxQYg;Ux2oFTquE2Chlhtt^1VPXFfeW$&18+@-}?
z^teV5x21g9N9K+<5m&PG>r_;yxqUx?b@XXO9|guKR}BTzEIpx+f0c;Tinja-6pc<u
z@M68VW&Zbq&r)*s8d^gP+@Gwe68YsIi>Z}gw_Po!0_CMWL#edWky^HVy~Vi#=s7VV
zp#9zWsixESP;4#ZUqv#03n~yem;amKLqaccGv*t1F}eO3Nn>)A8IF({wnj31G?L*J
zy%~NSEK8i>*@tI1DPe~9@6}3}LVg$%+)a29$9!Rzd30H}gFiNHVuqQQTU|L5)35tb
zPhu+I3iz@euHw(k9Y04!lswKUNN5NijqOKm-(+zXzu{|C1DB_>>;8BuevVrwXDQ|E
zs?Ez@=8(pjUT0Jn{zRlxwlGy>Zc{G0?BDccM0Me}M5wcRmP-ja2%?`&XJzi7ZaK>g
zE~1(62{z;Mf9djvg8A^EV^HT?wSpeO85S$RjW?UVwE{*%Q85*;s<#5@+4ojJ=MPB#
z=hM`L{twU`qxJtF3l)vpal*ev|EuuE*|+NdUM$x9Z`A*ek9GYoVq+II@i<xn`pam=
z=V0}zW0!A847y~5qV#yRZt#UC(EpwcQw#1Q*Ffrn&r&Iv{1}E7$Kg)S<AOTI$q_7r
zCw&M;m{?r-5g8sy$Hv};Dd+5qOXikbLWkp$O~Go2xq(xqU>&9ER(4`2UC*<ioKHO;
zyx<ee`KmOEb2W<o(1?K|pA-`{iX4q%Of<znQdl*LJ{rXZ(G+_jMQ|6@fth=H`<Lh_
z2V=^v2Cm9Z5B|Cbc*C@muu!C&mX;!&n3f*@jI5d1Y3Wj}=DvJ7w&r~0F>{VIQ6+I}
zt?mPg*B#u9?1N#@twW_Nq5s7CNYDx}RD`)_=mtzOoc@<ZIaG|VMJ|*9W5?IND@q>Y
zxY5&BZQp`{;uGJ+YTyzK6uUT3yyJ^Z*h@LRH+r(qMLf4?x>%>}cRF2G&mAIb3_|9P
z1rUhi|KkulG)Dk4voZ6Bo}-$!uSFZzD4#ZvT@p2rMdUlo{eXPB`@ylRmoV1zxF<rG
z)$<FHIZAKt7y&(U)EY(!Eduy~NqAneCgBp8Kxm=>j1r1r^LzA<+po&bN^U({YYn#s
zX@<f-o5ROtUFMEo!4NsGhIL*KoNOE)(`Oq+kr_`WNv&sUOx#Qvz+9m_d_JZPV1Y$0
zun=rZdszs#@9hv+FrF;XGOwf&iI&+{7vSCA)TuG4f6LS&K9IWPNv4eBH|}BE3Z!17
z#|PGEek1HR4+ar4shkg%(v<Y6EGCs&-@5fZ#6b@yP&63TC`^SydnjHY^~-Guvaisx
ze^rk+^z4ryspumnb5U(J`+uD(wwD>Eak)j0k8tr_B{<}gLn(#&6@`oM{PvOZU-~{e
zwJ{|2B_@95U9GTo5C`j^6)~d^oe1wWxDv^N%lXrepU~}?DvL%REMtW{903am{!W1Z
zHk;lk${~#JdOpV3^dEsU+Vpf3_i&rOiYXJ>bYm|IVbf-^Fxd1xDKrg^HU+u>!e+G=
zVUJ0@1C^xP^l!H&FslBd-cpz8@!xLKH?rQfe)KS#-uJdv&F4}ySj2P;XSz*~(%Hva
z<4Tke*4jspk65F*<8Yhavn4?xCTm=}^!Nyu!)*E)3K!p|bEW(@yrbLn>cqsUlK2u3
z2UkHWnoa)|6Y1b1NEUpMKM&w1)Q!DQ&8C}JA#X*%3W6^HG>*jRrN8Ipw37C3BHi@I
zZ?Ud~N&ktDH0irUFDbg|-M|@5`dXAW#CY(C^wRe+VU$I`CO8PLzwG58Ecz^RU_3aW
zlYWWgs4(a%J$r*e&x=W{FtLaaq`tT*fi0XNDlPRvJ>Fo@V-N47A7?!#FzAtQQaRnh
zB@_(?y_6&W9+oYTI!k9CYtWBDM#LBB@exxrcRYxs(Veter;6pWP~-B+6S9yIF1|%E
zo%B}}F1|rm?9t?Z1m(~=>E{v?=S$)hAP#mzE1`v0iV1#%6u}^W-ey|P$Ab3?ov{}>
zkzxwmt-$s4)1Lj2_%NTK!9QcWSgwca`%N}s^oO{kV|Dq%!55i7+-)popv>5c^Y6ww
zj?4dP@Pplm32?C;v+Due-|>I*Xfmj9Ea8Z{C2}1cJ0L96+wg|PUdOjf_B~FxxFNyz
zMQLV18nNDMSnpi=VHOM?diMLWEl&T}&JA4T!F8hQpNVyQ|8}+SHg#jr>g(t7@3lX#
z9{98;4eR~(=MQ|U!n;x1cZOB-0~=L;M>b{)sFjZF?IK)}&3#JMzaqN};Z*Yj`==Iv
zWBw0MUjWPYn>zx)p1bliEG3falVF-Ku9R#@YTvK=KL~DpgLO)u()_?KSMee9e~d?3
zdKs6h8{bZ1YkOfgOUC)Xmgv>s%_33%>~mM9{6Q_==9`RF0ejbHX3Kz~4M>c=KCDN7
zX3k9M^O<?}Mzy^wMJ?Xa`f<<6@F&U0zP~3+KB|ETo7P9PUBWVIgv)FADU$0AO<ZuB
zr>=Y~JIIo7xlLW^0>+=89o#pZnbu|3aNVuRRs6ZR;}%erY!LpFHR9&<F8*+TNOP+`
z_AM~DRpH+CH?d0?wf<)Gv9SJ@4BcP{W$LnU@A6xzSbqC$&x)wsv0Fn+P}f32jw#UN
zC&5dF3Pn*nvbjjbI$e$Mumu*B`WB4>1-7XuVtSAt;gsH@SZPFwf6`mx6LjISdP`i5
z^)9-R-%ojOj4AJrWqGkFD$CpOdN>S!z@nI!-;TC`QtmTnVomRHP=;MAAI#nf`Pm2A
zTq}Pgio5Ki)?vZPyRe%BTGf0i5?q>k;4($g5~|&r-bQXhRpObtE5x%oC-tPukwIoh
z_8Ooz<lrZ0LGJ3x6`Jw*)1~RCcvvADlxpF#)|k{R62J&mt7eGk4b`R&=7Xi*wiONq
z4c_JdSS*mf8T_fNN{8qc(S@SBjC6~4Wbc6hY)_4mow*_U8n3n!JvekeNIIi@_=$QI
z_U^t$)_8@HVgLGsD5YEU6j`!=r?56nJ7`BzHAA64>fPb;f5O%I1FxW3wwQ{!u)pkv
zZ!mQ9jZ{tWDMX5n6-^5j>EgbBpej4vR~;!zL@2Rb4WXt)EmNNr@!;c>L#$OJNmkTa
zwQ;*KaDVn*p}mieRF<Ofr(z%xMh5qdEtGSyEihW{C|*+|!kO8#_nBuu0n7lOz+Cjy
zKJ!J}R6lyVH?iM57!zQuHk&VezS=x`X11k7EdG?+pRX=6HxBs~lHegHb&Y%&;NgQg
z=k%XxVZnI_r~2Ov@pPE1PiOlRCa0;(*}gHwS^R{#<77yriai1zX|rROF$WomNud~j
zT>fWV{;fJ5?SJK^;cC^~u&cVnJpa{d^W4{w;_Yhlkhf71+!yUZ_$E5>OVD-C*|pC+
z_qA&C%r}61mC4>?vbT`zT_pPo$-Y7i?u!m0`~u0UmZ4QYkEAam>EDp_WkkH7ws$9~
z?OT&n(@Sdc7v^OP(cCqatTAEhiT#9stJD0zKJ1QS2-@i~z3^Fy*>dI`U=&tO-x#tk
zG0)wDydl+)*T5S0MLQ9`g6s}KxS3yQ8UPBpQ|X~6VbH9!SE{Mqv8dLCXNg(#`U&VM
z9;M!b1u$|<6EooCXsfinO9>~#BM?go*W6HE8d?czEpY=AV<M#l5AKxHa%2te!Sq*I
zo=xj-Bn3|vaz^k1h$zJjNWt;+ZRUunew?j1S{ZXRcTC0;bG-l|$BR3`B+>LZ37bUB
zXwKhAgRxu_(@F^oiSut+Ka~=pJVK%pFk9~?1`GCr{WxGyd;6T`Q&DY~4!OxoGoL#%
z+YJcD&e;Ly1FVj}R-5M!cmo75h5_%1FlQqwWg|4ty9*VQ+8`KYq87m536|hPmH@iB
zl=*T;iz5G7h_@T+q57WGNaAVc4kU<K)(ME>ilsz@3rr1v`l6-~Clu3jDl_*aq}?KE
zM}U^=rRgsJ`@t>&gb9R$f1-MqZsruuuoAxEZj>Xq=p{_Zr-ONLDt<IvC2?m1MBf>@
z0;yQgYfv<&|8Jr@#bF`#qgdsAJ9ZWIHQ$k1MZHD{wmbL|q!m*3N{4w=73Wd^7U?k3
zV2zjN&zc-h=_UZ^5mS83Akvjqv)X=Uw$geWr`@AO#nJ`p4^k1~d!J`xf?uIxNs&Sd
z)WBnC?&QKc=s8g@tt%VD_LDv{cXW7ENE^6!uo+Pj-}mS>;5>sI-oDptaAqL6^-OBw
zhUcjX;WM4bM~-W^i-suH7=8?#agAXZ6c}PWk2ADRAP1GnqE;A!BE8^wMsIqt!m#TF
zq-Q+RV};=ybjG4S^sGPYO{&BsUCpE-K9K7B6HFoABJeJ@+(7C~J>IasFb5VB(_35u
zmWevhjoT3i6FH8e!Rkh0))|@Y1WT!hH*ww!nZ5tV1j0<ygz47fBkKg_j^|NMu~smJ
z3%YZ`<ySgY>}o^0#$~A<Z{TvX&ZU%GW>QR1pYc~5K6y?n(c~S*k}RQGhq5F{?P6i$
zr~ZRX-505YWk?iJM(7ouIIKX@;9UM(C^Xg`^q@lz&B5u>&@Ao1X>b7Znj!&(z}XV`
z3~54k095%XB-GAFeHVY({5|>0t{8v$b0}Mki+>ZAVepr4qiUl3<!pn$OrJ3LYmvt2
zFIR{}!qNRy_{*3W!eQp@aqOiusQhf6r-HxCAr$^{`aklQ$tJG9OwO47lw~)G-$X9+
zC&kP*%4Md3Ntby<#FyxGAir1t@unzO=GM?voEK8Oi2pcNs4$Md94W9v6d20_S8<`>
zFqir3BCW(2dUcn1MQ@3R^_EyaP_FySRo}z<z|GO+?O7_E`AA_)o{c!mtI?COi2ul2
zuI?26^3bQF{pIe9|B=6pnQQ8&psJ4cnBRB?HSpi_m>qXIG>_SRPmIT`wFh{i-|jKj
zN8HRo>tGPQXSWCTOs_ry{xVhb-W;KtUXOXpQwEQDIX&inz4a6P8DfvR%$m#m08E#D
z&y<T|UFH&jiFTR&PpBK;N`Wfldd!VTAw1@V@?pT~e1OO7)xv@i2<b5&hej>@-(G(?
zUHHr5q`=|+a;HxJuldU;;3X*KKjSMS$;>TGlfX%CU8cFObdbl#bCCDZL4NJO>m0u(
zo#V$Yq$1-x$5}9E%vV0WmwhMp;SE!)f9xFZdNSHM?jf^S=lEd|(MSp*1qaWq8c{qK
zFtKyI6igD$?cUwWT)Ts3Z6i&@Id-7hgU1mU>l|l;S+sLJ5E!F#+<ZY?=Qugy9B%{x
zo#Q7(c(`+XzF=T<j-O)*Vx8k(2=R31_<oHfo@U}W#|@&m@torqw`dAEty_1FCnls_
zBWV@TMx5hc3qU%@w*g4x9M6I3g9Tt7wBbi{jwcZ}5}?sJu0YXrhwKOC9Iu14KV0Yd
zcuMze&T(H+v2>0<VMWqwmd^2Rz;wpmXZ4|V+=Xqt|J%-S{U&NcII_8XjB$=H1<vRk
zf3q37k9Lm7Fj*q!_=Mi{!Z}{g^oKjg?>`~4HaN#`11GZ<N!yuJI>#6OM)u6Hp5%H~
zcp!DW9&hNm<2c6-uuRl}{$?ZMU?N{pH1yCZm|{l!!Qd$5qdUh>{W^g#c1@W3^mv0?
zd$@Dlp;N^csYeKzTBXMuxWsXeMSaG1Z=dhdN^~kp)LW9dRIBbBj}vuCch0c1C@LX%
zi%k6?^b-6L5=B^O&T$!%2G8No1Tul<CSt6Kc8>QVCgL2wO+a^!UnZbC$M7sMj>s2W
z-NC1jbFdXZvHQ#IA7(lI&pQ1Fu(u3f!JL_9wj`M|CtK9+$yV@CwocB$0PeA18P}7w
zAq$w`*P>dtxcu0Z!!h33e|2!{>_=|y4>{5|Y$MGppurm}Vk1~=U|>dv6*RcE&hC`#
z)mt5yalP+s@5bwNb=m1IY?`G%k^&N}nsT2K=vSxu_XY=I-C3M1QL$IrM-8NL+th!x
zGBwbeKGp9{$4<5HvdCP2pf=YpF>jp2S0H=?d#05HCh_&P68|*u{@U5jKp%8o#@E*j
ziMR!eM8_c!-(o`|u_@bEPn3nz16hWJTrpioA88PdOTdpq&piW0q<&hpCmEnq9>V<|
z7Y5lePlIjtI^W!{HoQzF>OV9L684gG;&n$iH&MDLTdX*!&r`W<uJ3LT%@&1D$E$;(
zKB=5%VLf_1Y^fIY+w&I72*M9hbIkb`yk#u*$5C0Sp@)$iZ<m$f{W&mSxA-ZCq84xU
zjZ^Vr)4F*A>h_InJLlBaH2W@<FUYMYHh2w$!zmFRsY!#_UV(epd)!m~o1OmWoc@>a
zRv2<|229Rwnwr=Q&zzjDcBfhK@{Q`BoaMx>iGQ-y8CYy_j#-SY^sm*8U#FNeOLNrj
zQn>gi9puIvOhKHdIK#Yb3HSsvg$_3MB-x)-{Zp{9JH@7Md^bfkJ)`<BFLGj&FWre(
zrtuQ#c3;tYacW>-XZz%IliI$~g5?+yaiSV1QvJnhfVnOa=CVhH<^F9iDSKWdSJC)N
z9T3Njd(PI<%S<l+<xOgL`znft%beN1Mg*mc)$U|gRLTC7Y^!-04|B00;AqC}%kk{;
z|B0@NOzK_=y?3{-2F8I$oDy;MJt$6$n8k?^=Ya$2vgcdPJ%hxtkrDy=`s^>YCi{3m
zd$G%(*Mq|YKgPStY1sJ1o89_~hgJ2rw=pL_L<-Dkf_1q3`-4|wXI?X!$l?DD4v+<X
zkFiteUjM=-h~)2n6n%R*_#9%^=WN5yj{7=_hy4)fJeV$Mw-WvckD>w5*4oe`ggTH$
zv@ZzN+cBUT**~GQ$!_pd0~d?;l)mTYwj0f%*E9|Nt9V-xXA-J-II4<ApKz)s8%9;a
zL;IgQ(bJ*LIR3&$hRH)pw#&aqZ9imb9>Ikuw7~c9QpC;R&XWY#qwkOUb!A(*wJ;2H
zrq;9@rYg(RdorL()sG|CuLhH$DK)?~$1)te54f@|TT@J;DU1dZubYAEn^0+)e_wDi
zn==;5V2(#@kKEavc2Lxe_yoZFcp3U;6d%~_#J2Ml<+<A1A{!1ofv(`~M_Kyr;E!oh
z-1n5?e!s6O<1C}aRZQtV6Z!8B9)ezb>$o%WI;s;dh|3NpaMxOz9xCUEywdFqT+e=i
zt6-VVmFwB;BU@10oq<bdA3;ejRgYw5Ia34GHtaCUlUmvvl7mqG-U`xQD|yY=><auC
zQ-pBT`;nL(Ox9kI#I7IS0zt}>z+`QbaGsbXbUE44;j<*-1<Bs|!DKNTxVy&!dToAi
zp1^eK^jSU2p!ytY10DVD;DeZt@QqtTALZ<xB>E_4cOUjqAQyeql*k+=ax6wW;bZBs
zMV;<BN$-1mPsK#u`_xYN^iEJVMJ*L$35Ju>$n+&V53lBQ2lsp)4$puQYdt3Bc@X};
zBTcXTVm4*DI9iImQVQhWTVLj549}RaMCK!DO&H}|fkj0}dY%WnQCF5`;nNW41wMM1
zz0dC8DUXOypAWqZbe#Psj?p|-xtfN>E#t4CT~QA9zb-$&u`*T-TnY=Bi{8Bbka;2c
zYw;NtD?0quuo(^p?7gk*@L40R{d!KuV9mNo)b*!B8Yj9*ah=1{M@Y?`B#avz1Y9_%
zm2U2MD4Ei|zkbw447eDJl;BMdhA|!-I<Tw6?ArY}QSFENHJ3lm+4#DPhW>en|CRPH
zDi@x%^o#eAcH!uyUs!&mD9zdar{EH7S2uoedi$1?rC;22y-D%!SoC81malu#+qZnv
zlia=~T<-s-WaGytmaNPl%TH}!f*_7!Vw>gB)0y`m2wjc|NixvwhpL*rNQm>FD`%Pf
zuc)<8p17>%e05{!l*>P@^6wsf!2EE>IhjwwJeH?e_-w(m{{uouw)Bu0V)_5N=!y0(
z`Zb^I-=?nYue3jDy1`GflI5!Dh7}4Qd-}0J{aRjc+h{9U4*is2uc&>`H_nw)!`K=#
zcicgrgIhuCYpEnaO7OBjp;lJjpDpH9{`<4rfK&q*O|j*Md0z2TzGGGYEfVbp{uV*n
zqj^*1pmn3ZZ^_pBY0OF;>ENJjby$=#%y9nl5G!4*AlQ%--kny*tk8&yH=3^-EF^kN
zW3PQ6<CQ;xj9>0?;b5>eS`=hIlQ_zO)2>2@5_2ZpCki1>4M#~p)5tM*&`o2xt?PGe
z(v71T+3<@(ZW^m2PBy@4*|>Z92+uKD&qY;nTGCKXx^Y%l@c}fbJE+ZoEKl(#;<GA1
zFB5372S-~GZSM+!>yOie!j`fB#xE49I6j=TL7W6C4*62a8kKNx;b4h-L&Ld=!-4kq
zgZKRbQ^*XK&SBq=R(1o7-if2YaDMT<BQ;=))a0{19J9tjS(b~DSu9r{b7m6DMFf<3
zSh*Z(@op4gGqn}@xXQzT%HbpDr~$1vP~n`Q0bu%E0!}zt$<cerBXk;gkR)wyy93@p
z3V*RK%6=r$SzoeggLyM1L=#aC?Wrj8G&b^-jVH{ndlun`I-yvt(|cw~P-y?8;0ch6
zAN%R<$q^Aanpu3H_3WM!qDBi;q-s#8Pr#JSurnH|m0beY`~4h{Z3BwVuL8|-(!LE9
zr>{T!!20tMlpg*0EZUZTx89%k0b1+N;pnJ=MQAJCp%N&ov;E5?-yj^O_YH-kge8wO
z_frnV-nB^>Mj9Se|9JdH)?4WB2H%Hy!V^iy>WI;IrGNYb)5n0dnm)>DzP<X`|A4NK
zADFzCKrn-xH?rO$Uzhm->i75mrRn!wP0zZ$-3GL@x0RFA4a*z&{+ppVSU(9}PSOaj
z6TR_Xb>%cP%WE-BSrk_LK8u60CakVB_YXeD+|aQkU9?Gi5B{6`f#_Ba;zj%Q{0m5r
z^3M))>h~`6DEw8fMZnq*g#LuIn{eJYFxg^|0p~ZqaflBaspiR8@QD(Z`tDtiQI~$W
zoWqF!Gc|yPo>mMfk7c_B=GEXVjCsI8<j1mkB$6I$iNKY^y`7q6wxoY%ZZu&v+3E`5
z|NVl>6?ib)3TjRPheoE!>3d7sC!x1Y6@eP)$W{eMycb}$+>)IGz-+lAyNKav3|&0c
zi;nkxA&d)S&uqaG>pf8{xf}zQT)zR!Hp$XTmh&XbCdtxb9z8g_{Vz2D74tF+ylHc0
zU^{@%%-6ODiNsfuG6M>EbhqyTf|S_kyQT|kN!TN}6))uk4w5i4z#V1;R*l$(fYT1n
zO;Fbz*>o*=OxR}5!Kp*@Xl*<(kM0n&jB0aZN;YFG)#ht4lQNHXVffT$fG7mgZs1R_
z9EKpY7#VV6wYWm$#M!G5C`aRO&e8K*k<CId-@RZ+&uVBCFQfWaWHVFp+JlhN&!dcZ
z9cP7j1BqO^NYSkXpXS2PJRF&=!34P}>mLb8;qZ!u!wdl_2n7^^WvVtTL0eUSjq36*
zcK;&*_b_|Ex)=)7WFaF~p*d5nK{YyXivKUGMP}_Hh^#e1#Bkh&XW?3E3(rwLB^I8g
zPZ_bd7{^juc#d)`vGA-V5*j&@>)e6%<<w1adnW>48rJ#vplgH6@af{X>m#;j9Z=zJ
zoWu`S--~``<zLw3)WA<22p*}~iotGOCX(9s2ao+v%w32Hen?7x`&y9v|E<UFc6JZ=
z4~^U*dNI0iM`VGB8M2Q%av3h&yd3!%r>qVXJb3Lrtn5wee}VZcMjdU@_o+Tu^xgK9
zT=azj1!u!1dWLYz2*4qv={W{KC?6~l(oE(>TF!vTKF{Rzo?~KGZ;JIs)4M`qpzkl}
zjjK1&jVxX!lSC#_`$)(nb|0xXlSv|zL|aG(L--z7rj6DAJ!Zoh{~NzEPEPdsSNoUA
zi{N;0Q^vnNoV{gd7plKIc`f>jp0l7m)t}r`puJ-E``>bzEW>OunJrF>Ig{NlCIn9O
z<9v-Sxo3bHID>0wsloXm6<-$OjubYRI$&XnBGzNE+`jZfu8HC}2<9JHn&p-X2AMYC
z_?jPkFkWh461YzjAEv3{3JW$_%CZ-WRtm2S1Fj2itpGJopaRFb0@YYWd<QRhYOWeS
z4UE|b{83X+A1y2kOtG3D#zqnrZRRn(gKwo^BS(09uI$Cc<q%gx9G2!+2yuwEa1?8U
zTsXv=jr=ik9ax`~g5Hx;fRc51Qi4xG6pGLs5ka17#A+r4;lAbIo>?VylEucQOW;~d
zodIquyl>p^G$s^Fbc1__GojWdT-jntvtJ}3WW_p|`GHcbLv{I1f@_B@o=4xnhgpI{
zenVGpFML(1T`t{k+TftT{=2nSKVG)_x3Df1eCIu!kBV&du%WX)>2cyQ?bm4Y*e319
znke=p@FvGIU=%5D<Xb<nA1yL3`z`1WUl#365c~C_#Ts!>Ju;(GYa*FsL^>8IvS+|y
z`ot)Hm_ChZ`fF(tsgi#2S}3h|zU(f81*DYwH<$Raq4-jXe?PW`w0(GO&UUk=M>!KL
zg|Xl~sW~&5wlo_Xg{U5`U-@Z!($xLfMFdq7Vr^yq78M(n$ma6dW&X;!AWrd@&by&Q
zEG{iCt<ts~YpT0T7h{^3#i~1jSw2GB*O~<0b?sIhn4+ov*;o=e(Fq4Y^I;;}d-Nt2
ztY(ex4sN(h3;+Bp)c8K|!bV+i0xH)T@UULL&-Y@u34I>2qC9E4>D{!U7;*N$A)CRU
znjsE2K(tI2;F~)|0WJ=GjuMIQql&&K^d3NMKbyXO#2dqUrB<JD_xpxJhgb#HIwbD*
zxrKW0){NZm`#O5R?^mL}qxbth@*S_Xe{E{*bHg!_?LHjm`5-u$Du+dKSrvwWz9jB;
z-+?m!m%-T~(jMvUzCJcAe{l6kZm8YO(jUIhcSxul-@iq@{5$sfj*&Jy2>GKvvEG5P
zBpp?!`d{E4Utkh?b?Js#Cb>DPtcG2gEtBAkNhb-5gqCR*v*iMKi<jEWqwmOWBMJOY
zxI7pZ_-2J$Z9f~%;@ybA2!w63C(RwV0sw#T!pNh2jDhFrw=pr!*Pq6Lp+mgm&OwZh
zC7Y#ax0?4uw7>z)frZa<43b`rMS3;xV)rmD9OJzVGx4c-GtQD)&6ymBF#d3b)Q$G~
zCB_~VugujbKD+3PSA(97V<T${>&|XAwaplth<uF5rJJcR4$Er$W5SPAe49CpataJ)
z8qTzEEpbgoTypar#Aze2q)TaDt_>uPJA_HB&o&Muw||I%WRG$BcpPg`m+Lgj)hmxY
zrE(8AQR=ZEH8x)d7Ac~ZG{kurZEKgFDLM!D5t~J0@WXcDe{TzJs5Xk>bM<0;KUV9k
zFOA-a`#>86Wn9#D+z+ArN5n^hHOTUZ`rZzsh|DL&UsK4!d5s%0*_c*x<ptlL7>x!J
zz|@qpHZ{QW7-qA@ktOjt2K;$g%yOU;5D6T{2pdjWsb~-izn#?adp3=gZhSQYD;IhW
zvysDG<}erA5PnZO_f-U^Infd5XiQqfMbQyO$iuDWk>s0t7+=2!-IQcG9Vx}0#)X)k
zN^VZzSVI4K4ltUnF-kTsTPdVYx)!UC`25r(*bP+7lb=O@sTObaO;o#6#K|jsgQor3
zEX8~)UfrJAorRX&Z6galh=Su(6i!DSOm5w#R&q6Q9_j#_)|bke<9Vy%H2C|1u?;>4
z6&9%sSwyYJ$cV?F77ThG*IorikM#@CurD}?)gJwQan%LiU@CiNme)l;ugfLBv2!e*
z?aw>$X&wI#j^Nz38PZczMr_G}Pb0|IS!$rc%7Zm77iP0A|4y|pPnB7HWAMzc^nA`S
z8`GiZTTh)@ym3*gtN8VW=R*;y!GA6zX)mSkWvzT;f2JvD#1`~TaH#RxLpbP%ovsf)
zV{oX`enACIvZ;ZEIDE!ULh}PV>`&rz3#s>yLUka2SS)86IDrXg2<xLED@x4z#8jdP
z8=EGViFR-XEFGI}Hgm_t$O<x>m%RnTss5*FCq*vv18=&LtGLg#D4qLsR(n@yBnTqy
ziE~tksCG<1vYe)%dIk#bTgB`hoRnDbd5e%Z!y(qA`Th;wp)*azzUrp)Rt_KREdH$J
z1DAgzU%<=4C#oQtvwdsW_p)02Y0IZ-;6hZ|1gGgah;n5SSFc@x%hIQsUY~0ES`AFE
z`D~)u(*Hg+kfoY>poQ5*YVz!K)$~`qn1W@#+5K1HgG2ZcRDiePDYO55J*zf2pyKsQ
z@$<;b_<58sz6Z^>i773|y_tBV6}<*)>K#$4JGK2E9ISxDYk|Z2L*M^FF<6{((QqRB
zVf$|tU1FJHT;Km!&I>;SMtD~y=DhHMlQ{#?&kNrR8tuGrvbqjx784q7l77p1;dGF}
zr81rue(NP<h3O_**8iUK!Ygk<-}LW0FMI;3zt?(??&rX&{&(!>wEpA=x}UQhecsXi
z9PuK-|F->{nW#F91>DcM?I!f4(fc`9ZZ+)ZOu8BSIm85qcd~;&x}RhCnx9yb{h$3q
zVLy=loCj90vSaphzNAAQwV$&b))U#!8M6|=(fu4O)3^T1e;lp1`oHJ>oQxY|=L0<d
z6T6>tunQeUck;UD4&TptJ;24@@3f!u6OjHN+t1;wHTdQG+FQ{-sQsMs8xrs5JhEJC
z^-=pdgYl)0==~hlr`*pO??;>e|9?Mc50v%;S})#sEWN5DzFzzk`v17=#W&M#^mW-6
zxvC6Da|MyT>$CdW@c+nqvE_QrP@~q1FMm09`6y(R>rBekE00_+UI<R~?!N(Pw11R%
zy_hrK|I6#e|F-fU>Gk4QI>h2g2RieZ^^qU^`r*gdX)Ppb{m}UlT1eFTVfQkS9ln0Z
zFRna@6J7t8)(`h_We^)C@zxLV*|q-omTV?|1Qp<Ic*^YmL4x(e=axp+4+o<r*u&gG
zV~T7jSBt+-U2>so<yliM#_sV2`1*SZj?#QyGPA`0)hu=8=`NsWxJG}CzlNC}G`FFi
zHh!J#JJG&N?svQV`|yqFGXMJ};lWtW+k}(BueW|6wmL4+{~(v~Z&HiDhYdSsNS>tJ
zBrN;r&ruB=)xc2=9M!;44II_LQ4Ji`z)=kx)xc2=9M!;44II_L4^;yu@%E^qWSw3%
z^U%n?4$A3$=9v;r-o58&;hu9QtgyXx<C5~TSAO)+>H}NXo~_~WNBP3xYh!MJ0w+Q&
zKSW(kQ4j%JDem%UG;zFa<!vI=&iKg3sDS5xc<CYj2!fD#75;t}uV2aVUK#F?Va+{S
z{1q}>BEw(FaK=TYE^C>0VQr;%g4JqO1njP>@KrZ9*H5r2m35xWYnnaPO@;Z2d-@bl
ziOV^8+SKxCGnI=PTdmFBD_XrRK5vz^qONv9L%p}bXU$PYTYWVZK5K1@wV}~xt*|yV
zF7h^88>_9pMU5jBpRz=`NO4y*SJc&c>#WngE#8Xe${OnwZ*zmUuEo00+uTyy*kDyk
z$BePt#|eR^R`{B07h8SJ6%8#-jV%y$qV+6m$)z)uSuGU{0G@fWwbtituJ9pc%h}d5
z>$L=p%~js!v#l4OIlr#4@^Vj0?UmlMFHy>;Pd{(^1VaLAeQS%)I^SzO`z)(nkCu6!
zM-~x+1<l?H<ii3sSZz9~%&n>x3J|jU8XK*370nC0*3+$xC{T4><05NwZOi4#wAT9h
znlgIjwW2JF%uYy*ijWr~CQ@`OMc0uG5g{})**(izC8`e@R$ks>o#Zaex3;u4H8nQ-
z#wznGT52mjEzn-Wf(a8mQ$3Z?kFUA4(r0aGt*a9iv=DVyr9^aldT!O}ElVov##UA;
z&8-c}jK;cFs?{p!Q2G{SqE(rW2W!sMiQ`&E!%D0r3l~^@D84mEz*55{3!twBq-?pO
zwW1kj;%#njYzDn|ai!N=)dD>>ds}K6>#AUB6%90(N}*wEi?3?JgoWNpAIOC!rOxXs
z7K>`k8LiB$@mgD3yq>1oh6Znyr>3#R=c)JBH#RS^N?xc@5L8(g)%t3zjE5=KHlY4u
z^it8(<ZY-@oDEgp#n#4FA8i$;w!o|Dcz$bjHR?=M0gU=eZ*${V>&!-7)C#=<Dk>|z
zEiH}Br&&eS7?bG+7G*zzky7IGdFz{eR$rsF#p{Em)%j|h>b%y9N@2`aG(@P$Yprao
zudisRvMy+DY;78AEj5CgeX?$AQAkK%0cjf+fXn5gRawEqySS;Ywz3vEXgX?alI>+I
z3NGr_3QMb~)5^(Q7t}S*m#~tPGue8I)iru7wU9H~de&K1+i2^kQPz_rmC%>o<|BoG
zD1zxp%DBcR-#9A2Zd_x7x1y<b917G_Tjy;amut(lkF}pZ-|MTe6_2Z{ZD?IQZhmdU
zxUplApt7#D$~%q*Ij+>Dg_;Ixnwro%O_;!_2@?eF%-pl(Q;x86trE{H)7vF_hEb<M
zk!S+{RFs~kwkn#}XzRtjywN0cFHt;mX3i*%v?XVCc`T+XdI(t8t@Y2AW-YYJ&?dt+
z8FtEWhA%hIGouOZxD~pr@-+FHJ+%!@X!~C0wA{+Ne5#|c3aYHFv)eTj^wicj)s@ev
zaL&l{l)I)CdprvoT0NDE7u$0^F7}H}jj)U*<+<hM$_$^q(8wPhh}Zd#)7U*zTYcWe
zp6^1A(MnNP<I@|w=F0MK!&f+X<w&?Q2ET2qL&UF^_()lEZMB;9dK%|nhW^4Mx|nh$
zLSWC;`bRxNuu=5<K9&5s@KrTlI)1yvTku6X<F!`8wktLKS{ZicYw&jsBjQEsihagZ
zZ~b}mFLRdn>Zda%f4(ZpiysE%)uqc}(_n$bk1n@P*V(4Uua$H*o6T;^wdL9JZ3VVM
z+jv`%t=Mj}+wHmbJbS*qz+Pw{Z!fYJvu)<)=H}(*=N9A^=8n%T$}P^b<=OLc^YZfY
z^9u3`^Ty{D<rU}K^6mM#`FZ*I`33of`Q!78@{0>>1@?m6g1mzKf`Wp=g7F1K1;vH7
zLVICuVP0W=VL@SG;rPO$!s79^@%Hh#<MYPnk1rTsIDY*2qVdH=wjz5`Zc$!Qeo;YD
zVbS=aqN3trh**s5i@~}W$%=te=6stbXWH}8r+TVu8!GBNRTaJpr@OMeeA*0OvA3aO
zex27-TkV|P(wv9U#%`-^K|>J3gL9^*yu1K?Vym}&VR^o9Nt3sHMxm#CR^7sKkEUVW
zeqX`o(|DoX6tmsbS6uG(wA660^Y|(jh&ba<MB3au-ENyO6{`1QRMIUpLSxUv0L)=k
zkLk6~`=4?Mwy}1*T;h4~%y{w5FkZSntX`_Yx;=<U{OIX)I;A~6UDneQFXOvpxLt;O
zWN7Qq=o~V1%P>+#Y5%zez4l*H$1wvVzlw>0x7j&uhTUTyFJ_p~DyEHEtP@p<9xIlU
zy*Lghv?%S;>+My%gvm>9@0}7(m*o<X`00|c<z|OKS!HOGp<9OYWC%MbF!rD5pPlZ*
zL@X?kQw1k_W)%~Yf7C5U<gAhM=>4EB=UTky!prefEwtULg$_NuO@j{;#m4Nlxwmu9
z92y)3t%cL4&9He2Fu6wysI9LrpEhMyoxqL9#J38Ac6qs{5@X7EHVV>?Z>aKMMqBT6
z)nXVy?2HnR_IP*&<@aVe5yOk98@*nBEX$$SOS*(t%P=CpJs&xWNk?zvK>77_+jKrL
z?ST9Fymb3seY*z7wgVGr(n%<<H-`4Ye0Bi;U1$s%)kkN8T7^>W9)nW#{B(UR#_1X3
zRfEHYyqfOS!g>Fxg-v>RzXnJ2q>nFg>bdHFww@tXum1N+x%GO}^dNHlm-Nsk%iYpc
z+YDD!(Ogzn?fmK9E2dV!v5L9a2aMAO{<_-vbX2YNMluoK(&VkIMZa>T@Ef&>VMT+l
z1-uTQ$3<rl6CX3HQ<UveUOg3Ug_j=g)$4J)L*P4QXpx~n#`&@RgLrp>_#`DoaN8#H
z{n18;fb}potIi!-{I=J%uuJDF@w&V^-lUgI#>et2>K~0sPC7Y_+Q?A)C~Yz-6Kgb-
zl3}V0`^d1L43ClFC>dJO7LNfn^?Dw>xKh_x4CV^>CWDLi%`h`sGWnQs$J86<=frFA
zuEXO+y;{JFX-~w>XVURG8UHBnYJBH4RY(E;9$M%^&&1Z+I-j#)vT&i`UvbES6YYd(
zpfxLf5mwe!w6u(+M3L57AbK>}iH_}cZ!~XIq#dYG7je?cmR?ZN++4Bba2A?RFkym-
zRwhI8Yr%(lq@JAkB}_bZPdyJ8aI%1Lh7xfD#Peu8f0uHyPIP{!;n|A&T+|Hn8Hjrj
z?!map8`Y>};XV(y8~6FRXW*WRdlv2?kc)CUaPuNe*{uX{je%s0r`!yA>9|ugP~x<7
zKax0|CI>L(<uw$%lM#{+Ln~m`Gxb7v5MpRg#{z;83mHhm@q#qO4F^n<*JU~Zw5&Jc
z_{{nz%ya_~G7WJfL6L!w{F#<K8L!{5Fw?W1h^K6Wk!mDD;#p7ROFo3pKu9{`D7zD(
z12^N&MM&9+qYP6J>M}4+&!1r|%=A|PPu@&_24G!Z<T(Zq^PG%Z!MY`NPP(fF%%8pI
z6avTm*v@!S2jd|lWw*#@^2aedfu|g_A=2=fwxmDPrua<yAqG6{OsAo}>Cd#ggUE@0
z>~0BUr9MaCrtD`yD(dwFiPLmR`_$}>{Q%=kxOJRW;t(inK{pcNNw`VNvgo*z@obg2
z-$}Y`z@%l|mym_<@wkWKri^@^gp!R$cq(qnehTg%$vX!jWu}~CaFd45)P<goZ80_-
zdFbg*$1`bS(~Sj=dP|hwIK+`AHk}PP)=8ptcEph;HeGI<bVfPz5Ko%ebos#19unnO
zfH>0V>Dpvn76QkzTXA<t+;}{*T#VD{ittR`vOaZOF`kJh{UoHNz9-<O{V|Sq#rAh5
zZsMtHwu!SOj<TfS*7<Scf#qW!x-945nX)rZr*q($`m^HJaV2<m;3mB;%S1f0?J!Q4
zr4-M^>#~&LnK)gRr6>nwEEhDGb0It%IMNWO)9L9a0mt&`cs;!e9OKyjnVvMn>2zP<
zNw;r?U!ye@;nw>E7jV4TC$Y^k-BkI^zG#|!W<S93LvPn^!}Iy_ne@{Q_!)-hnTF?C
zcxHRM0HNL|T!iOT+$?W0!a2B!qdZpJdi%c^&x|t}aC0RNL8Sd(f@jjQEP9`CDV|A7
zoZcsR@Jw39u}>g;A@13@DI=ftwmlEels%E{S0Iiwl-bxP%m*Bsjyzaa(pKUoO>DX<
z;HbAm`FRmXn%H#Jz_CserCWeF(!{2#iIdJKXD#AM6PxZb;Ajtt^1B>yq|wvqZK)18
zmYsE?x5Iiovs{eR=^F4%-LgJ)TqB-|Cq3ICZLbM8?T>M^t1A#T<0hWE=D64*aj~-a
zfM@xbhb~Jio+&%y^n4fMnfjy5I&Kl3i6^}-%VIpU?J!Q4WeJ{%*JZg<#P#ZhZJILv
z7&ql)JlizW5vR+nr@sm~mQTm)>8}BfaaZGJdeRW5)3Hy`?VF+ACzysMpRoc&tjpQc
z!{P0C4qgxrp9W)2zc3swGGlB*=th`>a1G*TBYX^D*6eWjAi^AkRiIytZ+F~*aOd1`
zxIY^7;!D5>;c|oygz1-t!}Ac<AZ%ki!dn=Ra1Fv$2p>bZ4&io$I}yHvFo^IV!gNnK
z{37_TY7U2U`l7A2fFHt~_Hg(?gtPIodU`+fh4|QkB?U0TY=kukX9K?uVG-bM2we!X
z@Ii>>#Q!WD-idJ4&%<HsF`&m+oP3B6BD@9RL4<1%uK6YKh~I_}sBH(l7@vVVh;TW=
z{;A-D(28&;!ZQ&r$9MRu5EkJJgewpR5k83UAi`}3)9(p~UqhIMa4*6dg#G(~FG4HA
z<p}c;u0gmB`L5$<w*lwiquRs!BOiQ~d>%p-ADM3gem24mgf$3PAzY4d9l})zpGLR_
z;aboyeh6|Stod^|ya)Kj2>;G-9rTI;YBBx@Nznkr|0Nu*LAVZo^TQ4NPK0#`m#;@X
z0l&Bl@@4?u20a0P5aB$)YyKJz{|4bIyu0@p@M{omXZUP5oPzpW^Bn3G@dtN+KkTaJ
zdB}y3*I+GBOjk}<Op7h1Vg1w6JJIo5fFF)~@yu{|9BInZEX3Jx-vS)eC$4P#mf>zY
z4<FS>-6$EBNf}w^nvYqO-lm*${28a_WuHVsrme%BH7guO(J_!`SjfK(_vVYj;oA`s
z*PfKrnUP+eL3-Y+ahJ^rhhc8wVwwkWJAh-`m1)W|(vcV-<6p$R8u1)+Wc-C9zBD79
zG=Imv2k}A<JQK$coxKJe)Fm##3%H#zI2&*;0yoe=R|XvU>AGZEey8_C;B>heR|i~B
zr-QiDGtx!g9l+c0zC8kQG5sn4rvazynYjCbTMQgbQ(V-27jQn{CJ`g_S1pP<Q~avP
zLDNYPbRVMKu@99xnJY+UX*x+qzv9BjVi1UnyoUo&fxC~Gi5ZrXjI5FjYkTsINlAC|
z(K0b3opfcO+l#jPZFH2s4s?s}#OL_P4;OK5!1;jtk-)${5Z(e@CvZZ?qD*d44(7EM
zakn7u+wvmaPS6d%D;&O?e4}N*%_zHqe(pD*`!;@*GY531;oFSH`ZyD~9N?f@agojq
zT(*IZ<*5SB3fvS@p*&g*$?_v^CgRXM#YG<MqumA`#Ie720jJv?%gDaFW)0djQ%09@
zo?b?#WuLzN{%ASbzdsF}ULLla{we5dfg3@7LhmpRG{q8Wr~C#V<8}KZZwGLjfde~n
z5jPXKwza*yZNSw4cNK7-lPX%)=X6<NT(kA(Y>?f7G%EVs1Ba*S(dnq)&7hn2aD02&
zgSaZheOvu9uXHHl!>)g<OB?9;H?wuUv20}kwgdOilx;E6+_ClB%f>!qHRv9khVco{
ztdlvY3)U4c)0J+Q=(W?5_vAU0WWDdsM;y!a82V%vDki1#BL{UpkxH|cWz1_&xiR^s
zq~z?R3@h5Sh(Y%`kLl*(ei8GMi(%9$JCP1~>gn7}cYRXQb9youMoETS%w=vty3;U^
z@ee|}4<qR&W>_a?<V?)4m1Go^WptX_(^m9ZnR;W&P2iJ!e_BRSNrp`jfQ*6&jvRj|
zOAvQWt(0ZkCsAb(vfPxE^sp`q`XXHxE7Esf77m|^jwa>rNT-#-D9hxG?MYFxZ0Z|d
z7S7Myki!R_bxXqGq2xLE)9=J{?YHoBf#){xRPiSATL@F~_r>E`mf?;PbDSx@nC{cS
zFAK7!^M!vrr?|l{s-0b`H<|JbEBX@9sGwgC`kN7^)WprdB*PJv{~ZbPca(wOD)8C4
zA{>5+<+&w>A1a!b*Jp)Z`(sVC3fP9R>gTz^XAk%^;fod2ead56IfQx8mcWNhR%#}E
zTatl;Fag`FXiRB_jXd+w4o<^-H4E)2WoL|Rnte{r*b{A^YD#=%??L&<b2)hK`~}8L
z46-RXpT(=c$r)YAQ3^bi8lPtucsaoHHMUpGXF1NL%mYuY-9k&y6}Xw&Q&(t3Uu2>(
zr1C`3ITv8PTG8h<Va{92dgzQRS4_Po{UyFs4l%cD0>8bO6F)<KkHzpitX@aOt=BUl
z7r%SH7~_?&_jk0iq5qkju{w#9ie$S<H_;NHl2#ZY+BfI^MHp*7rW^+&>C0ddOkQV5
zF6ul7b$#&n_)~b)W!B&0)lXSQTU4DVT@zmsZOBsS_A2n)jB!kq!IpsMcWkq?p{K#G
z>W|WfTygpR(>6q3rt?v0LmlAxPudXcstP>5dQ6t{L5;_Ett*!6H%R{&##5pDZE?%>
zPw9Rzc;4S1edgqF7_N}QK79(tLgF_A-xY%|1O7GOmp>5>dr3bj!*WxSGb8K9Wb}V4
zQ_3@PR;0pmuJ5B}6t$;K&Tuq{nm6`HXjEd3nvD$Cf)A=Ha$z<#kqhp}4d}*(%;2X}
zlnDc#NKxDu{jrbon2GRq(*XRz#rI4X?MP8JB>f!*^rw_m#I8$81?KUTn_!hZmu<@6
z;^L%ZUNb4@-=N`=cP5+GB`eP(!{<{6zdAVWy;Od@{jN0I_F-wyrO{t_A${<=L22)&
z^TUdF^|O67B<;C=0)NclUkprp{}_QE(C^lPY4;BJrRg^#)3#>Z3esI>^GlZG56l>)
zzZQ=xEO@-jLhOI>aie(LZb?Owmn=CTvs~LbQ28no<6dB3Djqur-T=9NG1Rhgm~!9H
zJVkkZsO68tl#hmvRg~MaEWaP7{58vixTlUw1-kS2RABym{1`mHbNm=Q-!u%Y?i`j1
zl3x!a$(mt;WZ2-PKkEC}VZVly9}l<OI#T&&IGF!ogys5?%El33{>cc-(viwtCwLHd
z=ZUF6zjI<LFahfrJg>8k!SmZzFyCiQ1<3&`NxrfQl96P7*T}oUeB()$k47mwPRhmi
zdQY~zIZFBI$*049PPRNVO4)m|2XUWdrvm-ZDXGA`cFGt$`$vtz^Mj-M;ft)JQbDq5
z6iK#?BFQtOU<dDw%0vzaMv3{k>FT7bldnc^rCmJZv=(<0&J2c=N1IOID&8rX=uRC2
zwwO#)S3;^+O#@y?GQDr|^={*V_KqY|*mScg{f5EH&rRq8x0uqe8>~EI!iKH#Lej9c
zL()D@dKu4~Q-=R!aN3@fdtg7;r}evSXxeLOnRgCNJCHVD#n8ST>AwKYoqdnFWoX*H
zeLqI+{mi`E^z5<9A<K%S?Z+zqL8k)PJ*XeD2@Oic^T&fyf&Xk!Kjikcz+5-@evC~2
zHPjp$(f9G82f^>5<1DwHplmtLrYN5uXIXxNvh4UVXeY;84vkRu9PdHghG7}|M<^c+
zOGV_LhNlAm#_%zC_K(Q;bcAxph%vx)kATs=IwBS1yGM}loe?AqjW`MRcEZ5BPk;k$
zRA;m<b^RO|6w%KogP<RNI``$IVZR)b_NmZMcgpbaptQGBehd99PwUq{H0_PF%)rpJ
zFVY5lactk~g??7|J!a|9wEyh;3iQ(f{ru%vB?$dIeyp;8;Hdzf9@G!nygVos&$|Yt
z0>5WaKjij-z<e@@`ni3m`Q;IP?-TmD`#8&WCn$fUe%?CH^7#m5-*M2-FORnbM<~x6
z??K%C!!q6;p}aaQ6_Kllrvm@i;bZW;e|W|lBcP=*z&uF(bdN{{`O_mvxMKtfU#5Nz
zju?2;x9TTsI<~mq-;<O}`n{W^+-w@LElK$=(}U0f`kmw<rv8J{Pc;o2icP50ViPnb
z@L^NVWvR<jlrNLapC>E+<U;%niR6L7WMxP4Kp@^uW@Iq=UeKfO8tE`UlcbzCSy65?
z4SFd_xz|Kf+mzG~*k_WKYfQt*$C)xgK%#!zQcbH(Ytc4jT-Y?F#Jr-f;>NDP1EztG
z^i}>V$=uync|LhC))*g8necR9<*C%ctNSW<re)pSS9vGBA80;K?}ylf>HQFUUEh9)
zUD0<1IYOp9WgParEPv~-{3^NM?*7VuCZmg1_N7h4^MmPoQBA+;Kk%vk%ESE!ZtIT&
zSK_Z;A>C-d=@Lv)-ZL!&qn;$oUz3$XNhhMKOCGpBS-C%XAQ0=5_er_Yjz@}BnpLKL
zJ4~j#P0&Hel#02@r>4|5lT7<fErv2ePg|fTbo95H20=G#Og{ymza;eoc1uK0VUtDq
zDdhWU^1$bkmER_xCCW2Q=>V=HdEl;O<+fy$ZA<dNSCW;#C8Oq8-c02o@OsEJ@DC|U
zx9Mw9y~HQ3`y-{J_~nT!uQ0x&KSwoiR0Bsfa8v_FHSirZusz=)D7P1A;aUmrk>P5I
z|BmdAk{#8+5!HY;o788Dy&?A*c<J%Z7`QqHu9urKSn|*=n?r<Rtpra+Yc&|Is<^V?
zi}D&Kezko!J{~V&n~c}@8Y~k3`8VN4J_eH<3=}DbqW0HdEc=LSO|k~VV-{D96inYc
z;=T>9AzBdm#Y|VbESh}UY!?2xWX$y*UfA9i7w5pdb`EohP{+?cUW2hTE3P)FNPRz6
z&;OgSR-T&UH2ScFb?1Grgx6+i@fx=y|GQJZ-xr&6p{(agGQ2>B)iPWt!|P>un+)%f
z;lncAD#Mp$_?`^+%dn4KEB~=F93{g-8BUVn1v0Fb;X)Z+FT>kpc#jMpmf=<zzAVG{
zWVm03eR5^~G8`qtLK#ky;RQ0Rmf=DfUN6JjWO$DZAC}=(8NMvT_hh(VhJEs6{xTdT
z!$KKOlHmn1td`+I8D1~L+hll;3?G)^RvEr5!}nykUxt0;cy_D|N6D~IhLdD?fefo<
zxKM`I%kVZC-Xp_UdzxHYI>DMVYd+rFYqi>KV{^yaPA_N`p#7R$+gMxvXo<#K*LWE^
zXZmO>-iI!6JFR7IeDQ$qb&I#6t?uSVtM+EJH3y+>Y|&UGFUlQ1IyTQ(I2pa(nj}Xo
z8e8>A%I3KE<Vb&HOvJYv^nNHBpBm|}qVau{c<r30<n{g`nm%38`<ZBb-$;KHjYn@N
z+fy|D7{wYF-(S(^Gtu+|BK>(Z9;XPp97dFQ=Gz}_JL2IjivFIAF;Oy3+UoDkMB@i4
zv-iZ~Gf3eUbL^Fj)p>oKF~%jM*Vo6FX#BB?LykMq_@PR?{x2D)MS^B+oQS5!C@05{
zX#DZY?1Ay<hbe7w@%rf3%Z0;8it=f=7o$BLD}uxIfE9FHgA{Iw8?Q42Fi7FHw(*)K
z@!YmHUKJA0t!Lwf^<rFu6mB0Ium2FhAcb4_#_Q)2?~b9rU*fq9Y`iu|JhyX=*Ygt3
z?OEgXuEcYT)p#A0cy5y#uVbiC$UiRze}cq!#^CJ|&uvKK#WPss!)-<5b)m#_yU=)D
zCh^=BG+tLrye$ULGYRC+Ejr`H?F!<#&1SqFmUwQR8LuZLo?BwZ3%ft)-Fn-*Rgc63
zh;NzMo^=R}D)Bi2KTNrKP>H|@ws;y3d_4P{Cg^+HyZ$~~wZQlG5BhwmUEnj6d9vTI
z%6#vVctzspN&I?=*Wbs}<#{6k{*c7$@AK*Nwjr1Rvb_5Hh59^gl*H@r7oH&VEtYuw
zJwAuT&y;xmeZzqg-yre&dxkpx28nOlu5qwR`rk=>r^MSNeyham?@4A#Jl2RsJ?eg`
zKL6e=@w#8C<FTY3x4wWBd~7lPYm&szi@^_(_*j2;4Dcq*@;hVgMBs-gMKS&DrIL^C
zPs?H{mkIj8iZzBlk^Fu^KTuf_)BliPJp23^==p|6?6`BE;B$EY|0h8|_^@$=XTf-?
zHFn(jo8WW!xbPA1BVliyTOCX&-hp9wJ{+5q&>rV4au8H_7KK+U@Vd=t8147Q1o%G#
zPyYIMFLZn6Ib^~AW`|$^GZ5D-_&M?T-vB)6_4oMo_O%6g@?ZXxL!{5v*eD-Kd~lnF
z*Tx~dvxkO8KJM!@{N0j18~Awn&J+0l%IY&Udfk6oDEa8`>+?JWuj9~xWa8~SeH_>G
zEd-wVHp%kxED5jK60fv71bm<P#hHGI*T27jnT@!f2Yw*<v`Kk%e=sQUlE@JBg}@eg
zwKXy0y9M}>Ng0a!DTko8$TZgjA5RbOCBP?RN*9m*0^o(7@6q_zNdB(@&-&8e@7MkB
zLy}MId;G`2VUEYY0eJG)zvlpR64%qflm9_kt{jPf9S>IMA$I=rck)T<uQ--E1f^Nh
z{}TRsCiv*{Ni-92@eBs}>)&V5?fFUI<H`Anq}RWTlP~%F2pwQN`f}h|F5Ax?f|BP)
zcnyFktS|k0CCwUIX$L+YpP!K)a_ZkF(&aoP@%r~fbo|LEIP-0jdeC`R0Wa!H_7C%9
zzT1GO9d4I)$a9apo)LKM+4wsI2Bz~g;wK0^+T$4xffi@l@iYT?Ay2c0M>UCSv&37Q
zG`!yK#$f=8$A1p+<kNM&M$a>myp{kj>hVd3fS(k<IBy~Gj%^y=E%7fV;2%tYKLmVc
z((%f?n0A*AAxENr;8_S>R`H9o+Q7$?e~O^bP`aLV2uhozf8zfYcdap!TvxfX0<+{{
zZ!8D_q-0HO9wF{@b@#j+De2jr9#6Bgv!m_t?t~!S?dh(WY47wS-PN-@8w4B0C`56{
z<_8cd5n3rf0+zx1BSQHDtb|3Zkbv`t7y*(E!CFv2`v)Q%Q25Td=Tz6@);Ken-jp;`
zU8nB*o_k*R);R)KKO#DhuL(RS=@tKf8uLTr(0|sJ^BpPYGl0`Ls2?S82)_OVaGKxB
zT!o+MJS<(`6!?oWU;K>$;E#Y1QTs1>75pDxivk}*?5_sk)E@PhrR(>FjP!Ri;BSHf
zjoMidJOtV2>)i~Ohsdo0IFG|0R~V}6>-gL3yxfp^S(iMI0Z#o&UM;|>oV!m~_!XU3
zr0Zv3kaMMfAK+Z?A5}P=;w||iq48IL8$*7JZ}~8xlwSS6{FlJrSVsBB()#b$k)F!A
zC3uTv!q;8E9|V0nIaT3j9p~eiXr5o0N04{E-U&F>d;N12e%8KRl=OF{96DD`*Y7ag
z{*L~?nF0SFz^R?;|48kvKZPG!SG1g82b|iYeqNrDm!B8-^-+Z(bmo?>zt1S=+YASt
z5j;6=ljq(52E_f9dE6HG#{qY>=amfjcLAq$eMj&oTz62RX`F8*`1N}Mr*Tk!Hkc;9
zRsiRD|Gf%7f5(Dzf5qj<L*({a2K;_}#6acT7XGXF`8?oM?`^>oZRfv9`u<ZDE}hQw
z(skh-Hof|-(RRLqjMT5Y<qD^JFaHPqM|!GP{VSnZzNT=H#5JDRGT@&AoXT01_GsQa
z8R`EQaOzj#YZb0<)>fOlc+$#aC&WLU((`M8Q+oB!<4OAG1g`#S6#gy1xnI{RoN|}{
z<GlGpwwy~}wQwDuhXJSbFMiCzb=?gCC;9M_`pc7YJ|pR09@zABCY`Pae$G8^OYZ^v
z*c(&!v;opny*EEy;r#74@GbYPjB<YRU6xNJ<->;n*D<#x*#Ezg0e>z7e&54(eAGYJ
zuSj8Q0#|=gXdYkJ0H^j}TCMQ2@|{1^a=v2WA$=3L`YBTQ+a7VZe;#lufA#aW9Hqn0
z0#5jFL)Hb*iLbxSDCb`?;BWbPTaNlyQ+)Uk;8btr4{W`<zFrWx`XM|f^?n<0*Z9Bn
z7YKjG_PP@?zrP4L(Vv@wS6c5P;I4AMDCxf}>DQ&+e`NUmp<hQ`*AK{ge_81NeUkp2
z43~$<?JVFlp6b_3+w(l&ByXSSS2(rGb^ic3=_yJ1{7y#sfAJ%f{%3Qa6}?`o{)u0*
z^{Rh3bce4G0PY%xdItPT2K<v5@Gk*Q^Q(TmlwZH+-R^o90jKop=j}(Ooqwrtp##eT
zFaNUbZ*rYh0C)9k1UQX91v8~f*TplO9_vf^k><UfQO>_+z~4{w2kpQ8oGstyTJSwO
z;MA|Xmn@vV7ow{JIMKZmvX8fF!MPif{^gHV7;;A7uL}IOzy-~74?b%9b^Pl#y~<0U
z0G#Soe`-3O_vLN+7rtuKD;_=!IHgzre{Yg{p9WmVL_mD|lBDl{M9Ps09>M})dM^C}
zy7KiH;8gz2kJ|Ll2)qfntNh=j^jH_Gl3ww4p<vs8Robuf*c13mU$f=ok*`<rgUY85
z;-c4&fss*r)ZeJK=TU~^`<6udbCUkVz?P%q|EGWxUa6nO6H>`50zdiJHocC+_W*bG
zcd6)xU&?@A0i4=@OYlMG_wO>&znTG`FS+aeAmCJf<@as-|5G~rX~1cIe>*Y1&t{ZE
zAMVk*DBQB;Xgf~;PUEKjA1}(dT?U-$RsXI!FQ1U~OER8IlKz`qzC1*3|1Rm(-=*St
zb;{PO{%{|XJWm4tU?ji({3OGHw~tjA^f`I)6~K9Xp0aT5*Sn_O<(y(T##89baVh5_
z;KZlsdjPr=e@1|xWJvtqQ&RqoawYcS3xM;u34Sih+ec>Xe9<|1x^x`g4><Fqzo{@>
z>m344<8U)kzT2NVc83kQKJN!`4h#RYUM>YGr$JL`&~zF!lLpPDK*cn~0ZLa`OjlS;
zS6E8-r<~4Mo=r8PoNnn<x)D?9vZf2EvZm9GfWye-I8UdGpH6pZI^EQnV$M9ieD2iz
zGF;$|HcZWg-o8z-Wz=)NN%<vS_GYXzcKEN~>NbKAJl~Ud@OrR3YfKxShucA}w~0^z
zjaL53fPB&q^46zyE>Fc8c?rkvI0-=BjI-eEq&@wz<qw;Kb{~#)UGFFa1U!W!oWd~u
z8qV8?d2!gDFJ!!j=l094mjOjW2=IoSZW^3x=-2&V1wM~cfV`K(s7Cr~5K&^#_J;;u
z3tg}FOqa@WWU_DarR2LlsyA>7?JP3(GGENmbB?EUJaz^l4N|aCm!Qo-FbohZAm7Zv
zZ?V4xXZ-N$9CY9+7iT<%XiBSRtiOEI!Ze@_qpLX@)*bkNZefI+Dae0yn?|6q$K$b=
z+a!<CrZwtx_K+p=1Yhv&AePja#q;xLtERfLU<?vJzVd{rE(vgH;e5_4d~jv{Z0$7O
z#WJ_zfFWiv2vPss;$pqJX4d9UEyE)=Tv%S1v}5}8g7Unvqvy4SVs#hoSgH3){ZUYD
zRw|D#*G`>YUpJ+EnO>;ZS@nmTa>2adaS3Z<H~Lww<*Ay9xOw)<h|qzhVp={S#Grcq
z3|y6y`*BRoW{>+9OgFa&y>72$F2FPUa1SWP_|?2z>h`WwcVivTdvi9^ft~uxct%{4
z?&GkW=06<Zq`&>h*w0zs2S2DfT{<h)C$d+#(g6Bm)m_~~-^s7EPFJbfYx#yfe<M55
z&6QGraJhuoGPPC}s0bh7ZPz?I{2m{vf9rA+4#~N(o|#=)IKKcQyH;JbKFi6`_3EIv
z*#>Fcs$mK_97J@in*9-|(GCYX;a=&8Bz(W0E>>61G-EwXq*y4}6`%#k$Q{<Px>soV
z;%eQmuI_ep#LL4E4}x&W33^6r)Je1$O#Fme<TIxNiqz7JFuH;#;i^A^d$w^H#t^T#
zfwaPAH%DC#wo+T%C7kohA)cBY&~Ugjx0yVk9ED8@_ADH|r}gO%ItVZj`0=&JLsJiC
z3`g2PV1;Nbo>~(W#A_l>0ErLnU<haS2+#qK_A|r|5I%sWJHD2SV2(_AX3U~A*oZfF
zH2i$H0LR|MBTl!mJYs&wDHMpQdIb<1M3n*42eCn4%zSr`10`Tw<_+37YtGu&CX5$@
zRz%1`+7EjaCB`ehd<8L~ghn5DQ0CA~8>EMZrIRr(6L7pQiz-6i_9cVF7o4-RTfJw<
zKPz!6sx)YbG10s11AU`&n=`d@hzZqdcMXL{qWK&%y)^meJ{d%6>Rmy67YV?S!u7Q}
z(j7Q-3@wg^*?_3jHO)rQ+^$r>v*%CMj7OqddeA0K&gT#S;ar#Kb`1+4BUZ=^LWK+=
zfgw%^CrX40Az~3_2E1U>U70lTL!7T2zbk9S6mb-Jil=(=l3E0v_Fpc_IWkk7t`(Ug
zCjy};FC?U!Y&@h+qus@*)q^r3gzdP<HqlM5WQjY_2I0#(z>Bqlp^z~#N(F(MuwA*T
zSOOr<B$1vZ8?Qucl!Km7SUshj6YVXt186$IptqM0CTt|B+9t*Hh{|Q|uq?Y(l2<k@
z*NpkJ--nSF3r466&~_`>wsAd@Y!H(%4pO4{GiGggO*|4BwZy=}ub^j$(+&;#N1?E4
zPgbkDtIa17<%iO>x4?gCWsK!Al{zC!6hWB~I1P$pd_grf5N9tALXpFsaAqpD#$AY$
zwNPgArfiUkPzdx&Rvbk8Rf2N0%s~f_IGhKy{7@u4+FYk}ptGi<Jn6nD6Ca0JNHaOs
zCd#Bx&Tcn`9Pg5ZK5eQX7^agGLJ$N#`DUZn+wmJ+77q_B)Udb@z8vyY(m<000}&!1
zZ<<Ynb4y?uq4`9qfhrXBo|Po1A+-)<;d*Z^PT2BR%j`{U?u>@psZPk4%@IMP_>DGP
zCWmn(Dq{^kY(cRGlb!Yk4YZE^y+V^ovHlAypgW`lG&b719^^xqgD|Zo)a$DW`j1tI
z7=2dY+Uac}fG5Yab5O$Z7#);8dj)1MO^R5F_<p2m+whg;4is%D2E}Q_q(XeBX=}Z!
z77Jb(iV&ro)j*e)9jt?nt`ooG^q$AT2q~r~bczD$PLwB9N`wh+4tzv4V^g?;0p9DW
zKZFuLCMNd^KV#;BeJVXt^M=}i#tMSg9OsRuwFAQ_+h-8}E<muGCIYkiN-*a*=qANh
zD)!rP(IUwrUPt5`6Y8SZM_5}jma*v?XvaZ|U1XbV7Af+nNT#S+ob|6l8E*#jgRS9w
zw}r@3!^J_bv)t%xv>MgbW@j~KlA059KF9AvD~3%I&>TgT<AmHw!x6InS#9wwEk!c$
z*@al9pW(}Du~eAmg;z3O(bgp<gL>J}+N*lrz{hq%mnq8rgR3-M`|dVz>J-EyXIh~f
zLQu26Hy%unt*dN{YitZ-h9S@~r!t&vs<5bgq^64Tcmr_>QM?i{cucj8)qH5)ZDn}`
zJ#D8@i>%>eww_?=5yRzX#BdqWnUX8whqLhA=ERuM-J2fuVcqjdT}J3qL|$g>YwfHi
z<(LRJ7f#jsel>}s;Z$7RK{-`al69{Xo|+@Y^GvG^EOta((u8=@;<NT~0_HWVaJD(7
zJEKlL*cp=6kuZ(AbnGTbUwz6rq@wPXxP_3Yt`a=qUWc}d7oh>pYpnY!tm0OB4LAF&
z>`DY+B5^>00Q+jGYnB1+t0E&}Cq%M%)Jfu65o@uI)>yB0XG#uhlseQ@bRff^GdAwg
zO^a%H<FNsi2T=;OY9|SehQ}s*#crqLHcy}fg;BSSaHte-yT*Gv&M31;SZ?{74a9JV
zKtOwVwL0vvuG)(Q=m0&0pA7tq2v5HxVO8V8vfV}sw<;-GD$!bNfw5A!%I6Lw_fi?r
zOA^M5?H1w#mPDKn?K1>`%_^k~*jB{ky>{EFqfMWyKM^4C_zWbPbM>>m)@aAKJ%jK-
zs@~e!)4CH4n;PuJ2Hhc(8RQ?<FCF_LuEif3*jCSgE~;v5cYCci3XAttlT<8hs(2-s
z!mqSjeizlWVM~j#<h&;vD+k@GLHP8u2*i$P@`F(`sCHcYH4$O(2P8dqWv5nLDwu9$
zRoUf>Nf)$E+L{!e-qvE%&q0E^J2}&SZIjVZj486E({IgFbmwY^w;PoTO&?TbpvBy>
zeGZYEq7u7TH*wXpHWx$p9PruiD%ym$^yFk{XFTc5B9vT^6(`$1EC*s*f~9jn$=VtR
zos#wINF2#d#%a8j675nRZxJ;c!$3zXJc0omdb2lDVL1d7s_i2zhw74u?=EFYURBFp
zY3`t^68LG<JVQq4Vf*zgG`!h$u;sye>(o4%i{mPqECg?cD0}R%z!aak;nd%s*mtCw
zKM;+Ep}U2Rxt$#o?s5Z6JNl&L(}AFrXyxcg3415D8|iiC<fA!|)MlqY)-vthRa%!T
zlIpB_G^#+ppr`C0bDes#NQV;{?ajUFV9*<!CX-j}Y=utBq-AR>Be5z89iFyW6SlzA
z>T|T{NT+=oBf1(4ERIgt!kiTU%?8Y(nRpeU$ZHPGQ|Rnrq*$_E*mEtakrQ5H7pdJF
zV#|BzmunCkPN&WDl<2@x1D&}T_-rKwql5ku*H-d$&I9L5Hkzh69I?QH*6^NJM)-8%
zFJsA9Q8y~xIt9?F@$ot4x(%F2Tw=4Wm2ll#d(~Opza;G^z4~42In)I1IX1gG?m3pw
zk?x&Emr#UoC(dgrBcGUB9o@%`?cw0OT-F|rid^G!J0d+E7|p9~2nB^9_Fes!XieA!
zfV2#Y8BSEiaduo?Y{D{+1z3HL$tGBf`{YQLjP%1eio=91>zvg>_Bkt}FHYSVNMiyR
z(yLS0C~9oQM^h<)1J93?RbZ~n*43*9C*p>^E@WPui`y+^F)+6QO=hwW-sj_N(Pe+n
zH1R9&Q@nq|yhv$O+P>zZXbJpvFKtM*Lu`Y9i8#-VOf|80Jg8!Zi>3xfgFoz>XvbAP
zW+Zn?2KC;~u-cBPvJQfLSUtldDi-pE8jejsB*1Cg$h`2buTl)FYkD5OiRj=AFP*bM
z*P=%&<E9PO#uQmo2YjFCUTI@(pZABO4h;%Eohi`?`4r0uPu=3=L{M$>4ka=UAiDZu
z=7_Hkueg;wb$f6&PFj=2)av=pz8suR?^6TF4mJT|A03hSxrVe=Oa}X~I8n{fM%rcs
z1;Qg`6Y5z+F?Z7s<`+;P!>wdm$Eh{J0v?GwMf{>Y!!S9_bOFv*46#eCm^?0v3y&(G
zl=QHJ2dwjh3yqzTUvFRYNxrs19?QEp6VXl`)nk>hM7wGcv6R*2u=$CenypT+Yb9v@
z*n^In_3@#R*=-MkQ3Hxm{20=NY3l2L&kzxh;=_*9;`<%*$}mSKMfUWG8v1mpgKzI}
zhpNc;ZT$tr@CW@|zS|4@JkFp#N}M&n)g9%rW4N8mxAwZoZ0`ZSp`tgt;C(p25PL9q
zhrRFyWsqO}ogkMd+hZ<I@=q?$L?J)u*~9VX^z!`5;|5>VET5ZSFsGhaS-^KS_1dpi
z?f$}}!+v{!uh@(`A@4zGn!LX)Uj%Kp&=7q>3!6Ad68ZShHpqS~WE-TvsZrDew2yn+
z=(L;2-$T3cFVCIfhUcNM<><RGI-<zmMgE}w;06W$_G}z*D(erARp^F0-@@3P_Q|Hz
z-*kr?3HEKReh{8NRsjSNo&<1`pT_^-1|W9fbK~59!)LYTzjLg@@9zlUHb0RMK6~kR
zsq&b6AAZoc;F@3k=TiJxx^7Aa`u>&rsrmIg)6;-aQq8Y^!I$0)ATIR-ZlBWqr|;j%
z2e;-|f4sM(f-g%(ZNH||`#Ro}Pj7uzzrEY=yF=Gqdt<-lRED-+z#Mm;;F@3k`>w-(
z4qex&)3~&L&9D9cu)I6Psm6ZEUn0c7rGCsQKQ$?t|094=73yCi^cP$J5SJ8VAMjt>
zp@3cdh~`(n!Y3s^$LQ9?xa)VodjDu5|1J40_!hpert7z;fssq|Dd^+)5v^bS&d=Vm
zDc+(9<(_Q+rzF3Qzxtoc-L@I7zg05IEm{BX0#5box82vjQQ?%=zrnX~yzP@sOTTp<
z{v5w4zt*q*k#9(T^_xn0=t|cA&wxeqt3S&Z{)v<4p4NixV`~2HCi1Jl<@J|s28t6O
zy|mp5dksIL^{Zdz8~<TbP+a-wl^p*!BlG=8Aj>`Uqxtsl+FXj~T87rI_qQYe1Cjjd
z=eZ#HljEiN^!_mNQ~R}k^&?r4{1jt0dYz0u;5YdPrnRH_)o=7m|7R1Pko@}nzSgVl
zdMr`D`j@`*J;`rx;eXAq_YWlUkNr?nui)=8(SFUR_oYOB^#`+l%;wj2Y6CQ%KCd7d
z!L<MC*Lqv>)BHrQO7sE0>r#Iq0oVL~0<OhH?};vQju)l=o8l1b9e{oaf7*V<s~-nU
k+s+x~U;m`7;j{2p5WTcsg%Nph<v+e|Q~p{aL*g;_|Jn)iR{#J2


From 69f39c55c378e39fdf483a0871fa648164bca8d0 Mon Sep 17 00:00:00 2001
From: Jeff Hammond <jeff.r.hammond@intel.com>
Date: Wed, 28 Oct 2020 07:23:11 -0700
Subject: [PATCH 66/66] never commit binaries

---
 Cxx11/nstream-multigpu-dpcpp-after | Bin 59936 -> 0 bytes
 1 file changed, 0 insertions(+), 0 deletions(-)
 delete mode 100755 Cxx11/nstream-multigpu-dpcpp-after

diff --git a/Cxx11/nstream-multigpu-dpcpp-after b/Cxx11/nstream-multigpu-dpcpp-after
deleted file mode 100755
index 5e6cb97dd3315eca7bd9206e136f7023375bf7d3..0000000000000000000000000000000000000000
GIT binary patch
literal 0
HcmV?d00001

literal 59936
zcmeIb34B|{wFi8?B_@mIga9t90tOr)#<G)OCoFOtC09gogq?)2Dvm72F5a+Y$DtGq
zwnKz5m=-8)X<xeYTKbyOmIexmvp@pf0xgu5Qc_Am!YpPBVfFX_&mvvP5-okDzxRC~
z*VdgmXU@!=IdkUBa_7#y+T~fCnUP`WE7LgJAhf^GDNyom81`ocsBq=RWW#CLjpK|7
zz+~g+6d`n_PrHqoGC;eziY^N-<K3yk@62=pBJ8AN94+o~S93_0@#2?Ld8NDNI0<Uk
z$d@qV<<M*A4VT?19PQ?;kf3(0@kD+-GTi8KN{@28PnMu|t??+EJMWU=ci!(59_?-w
z%oxTfiFheKDGs9c|By(y4>%Ltd=lW&u9hcx<ZrhM-<|0MMA%6uUTguyW$68TsGjjQ
z-5~=u-Qg4-?Vd@&;nFT?d7X!Nnstf!=({SOQKRxpCzsV!3|!h(*&C-fH?5sF=k(_K
z+09L@o!zs$%jeCWH>Wt*R$MB|&GbpTq<STz8%#!tA_gx~xQTFkzLRfv9x`=GQBHP-
zX=G<H>|Feo<G0ZD_)7=>`km&z*Gzis4*vrW-uJgJTzT>XJDz*}+Nf_z#nREdzGI$$
z^77S3uM2E-&$xX`)!m(+&FpqxcF!!=;~qp$d0hjBrl$xg2GgnVd%$EW{FhPTsqkfK
z=vSn{fBulv={yS_Q>8yA4gPCs@V|%fQ>D{5DK-9*G;+vEBR5Z)bgoXr&y{KDFG_>I
zJq<tqlZKxY(HK&d_ii+pRQTVf!M~XX|9F~ue>zP)4yGyB>NI?|rJ;X5O+DV9Mh<VL
z!JDvmspK%2Mn8+wl&dUF`h#ikKTK1uThib!PQ&NRY2=WZre01?lg?FX@Q<g#XQZjG
zx-|UXl_s5c)5z!OH0AQADc6tFw2N=1(c1-S_<uc3I}N1ar#4N#YtrQVP8$4^Y52K2
z4SsSOc}`E0{wrzl!)eO()im|U{>+YF@^v@p^Nk~oH9MUNLF)m{G!8fRsd0u~g<g()
zi62$?)e8S5g*VmsLgOD4=^tg>zRRg7rPBj_n1*!rD*6Hy>Qn7>*q%uLh_0`hiTGYs
z-u5K?y(-`2avg_!j>m7`35n^ff}E!rM;SdkB|abd@e0A7kk8GE&mxI7j#c`<B`KY3
z$boigsL-h>m4op{FjVh9^;C{A<{3WUx|X(9UoceH5%T!}wuc%!0(JGi%K{sGe)vKG
z!*^lz(%R4&KA*q4+u?AOuB{6;`4Od~sdb&(UmJ2b{Ec-TzEDS9Qz+>6yK3ujbDiOD
zYiY0R2)MjU{YYYkTe`KO(h{E!nY69<H3wSPg&KW<j*hkt8Cw1E^QrJH^VPMt2U_cy
zQwy@H4ON5!9W70*V7`mo10i{CY6E}c8FtO}HwWrETnH)kx!Z#Lg;dFFL-YJ#wzaLy
zx2n`p8r%>J1zLRm<~ILjWvy-NT{45V=Af%dWIYFrG^fm@2FaI6K9D>_+u~l~TT$Y3
z)y{+9!DSnZ($pFZbcEb3E>}%$+lui4_11uoT`7x76~m!&$ifG10(0E0O`$~&jsLjS
z>?i@#9f9`dI)A{`(juz>no=k07zJCgsv1O8p1QS7T@D9xXs!zeeW4BQ0hG6)%{88i
zN)l{JMabF=bo&GCp{BN0Ssszy+Q7P|R-eBv<ZncB_03+^3`9OpYuj3AwZASH0$xO@
zYepramVL3**c!UKeeHpcU|VZlb5m%8ud5`MimEhSL#g!WqpH}uw6@IGjMPxkW$m3I
z7h44z)?7aYfhOZ9gDBTG)dyOUM^i|v*4&2X&S0Z}YD3LIcMAPYk*|LR6l<<eHmlb4
zY!{GRVy##G%e78TmDa&k(<0m49DiG9NEPYhD$$&VCe?hAmZ%)GqF7y`z!ka@o7>jG
z_QWlQAa3XgSZfg`u0>k6;N=~m27`B_y=}dLfOURYE(SUb-^$kY$ktaA2zIsv7#Q5(
zZ&qO!R+svl=MXW6sk^*gHA|~&OMG)L?+kPXps+rMLGjl$!60<_5L=X8$C7jo$GSks
z=WlBb1-eyzYJz$7flysjv*QdCdgbkCYiPm*aGe{iVXiR7vi6gy%ca$AYS`eS(X48#
z4+y&x<2HS=WwemOS}nDt+STL_I7-PST5zbLt)qoBvT&WPX^V$!7;|1z(6_F=GflE(
zjdejZu27&gh^FeI06(_DqG^Z~u3YozD6?`LOq7)teXw(FOH;_#)Y9Gz%U<5l+3Kgs
za4+tvVNIUVSO-fT=y1WHimKJ3EAvCDK4BZkcB*PEVfIo4sq&uJ5@_+aZ-CNxmv*sr
zzyxZU$8A?a(Hvzh!XD{VTVgy>&Wb~HsZx^?c#2C!Xq#j!=wcb?(7HMt5+&?yVsTV8
zma{k{b$ep5RFG?qqpSiVs)q4$l%hYcYtbEj?Hu1~7#Wwt(GduBcC^a$Q)(FX#IN*Z
zh5H}LLRDbNdW<K0?Hz618~$+(Y4Pe>EiH%Qb=3Jol^yGXm96zPfy;x7JK9=2buDY_
z>s($xdMcJxS9--|fsWQdvrm?=J`nW#LJ1Y52<I)YT^VAtg~*oIE^DjrYz~-0kuds5
zEPK4B=d5q6OKSeIj8&!alBs%5)Ks$Qm=o)uU}l1$n8G^BARKg7=%xfdwN|96+?dL^
zO3O;-eZ1<0rSnVc+TIpy>h?j`(N(T%HR{&3!Op@!h1#0wV05R9IXc<yrjP;3U?604
z1zX!ObcA7+&BTBx1Ff_=Oj->^Tk4ux4O(8q7pSib)gg2(h77_q0@Ye?EUBvUl@*s5
zOFZs{Rld^V(u%mZcy7$^m?OQbSA%*^vBQx7Rv1;QS641{`y9n(2?3>vbPkocOa(*f
zOtBKDht`=`tINhZ>;&NDeFFRw#Y!D9m}KC>ltNHs3Oq3rjY+^vfDgm<*d<|11Q3pC
znn;s5OcoSV;L8P$R2c~8pPVFQ14kdz%26q10P_Ko((^9wNgI&N6yp)hOL%2~?l~1+
z0yup0ZAf^s@tBym7)IxjO<+6Mc-lh0P=%5H7D0cA5lx_<V4;^hF@Iil2RTEVWW1^9
z!&lD&JkiJkSETvfk1j)zbBt*UzFg2}8%Ha+Nx)ggsR|Cw`T~TTY0L-AYjnF)xRlO9
z;gh$67JQWjujiGNv&(|l^Gf0uTkv{bN&FHEUeC*j_ge6JUP-*$g74Ys6cF)To7Gpr
zuv2(3-BYzHL+lnj1QxrBEO<->V^@g<PfgNSxdqR>_2snSDLZ|c7Cd><m)C-q+ATv?
zTkzC(eXX(J&(%n{jTSsqB6hV~@TzJ>Shoc~B}Q!+Jr?{@3x1OYKh=UCvf%S9_}eXb
zn+3nwg4ept;5#k&X%_k|7QA(RaH|DxT~r^o;19K=v)6*3VZraS;19FlpS0i)x8V0%
z@JCqi5er_geK2^`g8z(#{-6baqy=y6a0-Yza+C$1Yr*ShUkuK-;E%D;7g+GeTJUxY
zo@*!iDzf118VR?=f}d%@ms{}1TkuW`{sar&wBQRZc&`P2q6NR&f<MWEUt__aY{55L
z@On*$!R;3OEDL?N1%HYK-($g_YQb-^;7_yQhb;Kn7X0lNe6a<;*@8dag1^&(FR|da
zSnv)DeyasvYQYa%@MRYKUJIVjYV@_wf}g9AaG$i`&$Hn7Tk!KN_=p8xZNZOP@Ml=?
z2QBz=3*Ol26cF{lLipq@cc)W$h@UTf@|M5TDLlk45I%V;*y$7=;?ER5d9&|y3J>vT
z37@<b?Q{wc@n;L4yp`;93J>w;2%o%_?{o?e@zN(i!?{yJ#8*m`xSKnj!X>^&`2OE<
zd&73@yJqi8x#mDl^uG+l>>mzgj_oshcjxXB1sI$AEYM>oK8L&QI469B8yObeKZfhX
zKN03|D!Na=j}gu!JS^Zx2xk%ABH*2b+0{lj3-~_5>|&!s0=}E@1j0Q6{yt%fHQFxV
zZxUu#8eJpcuMlPz8ubeJ3xwH4Mx6q_o-n({Xo-NYCCn}{Y8UVogxTdq^99^NIFGO)
z;Lj3f7Z)A<5Qr1k5@y#H-7nw^3A0O!?h|kgVRmKFVF8~@m|azLi+~prW)~IREa3Ts
z*)>In1YAm(T~f41z^4#qR}^g*@bQG%1x42g_(;O+dZJzdPbbVSC+ZaNB*N@!q9p>(
zB+M=*Y8UXkUkA*tC7Lhb*9jj>*bwlGgpVUU`T@)TEMYt0{Q~|IVRjwSeFA=rFuRQC
zuz(*Sd;;Mu0^UiOT|{)VfbS#Bt|2-k;JXQ*M7T%5-zR)B;dTLklQ6r0=o$fkg)mKj
z)GOdG5T?nGIt6?^VVe4AiGZ&qOcNiq3-}7cH0{xR0e28CCTs}!vxI5NqoePO`X@{i
z9^EhC3klP7NB0T1hA>TbbXdUW5~it+ZV~W8!Zgv*%>tfJn5H>8B;ZoQG`-Ot0iQyc
zrZw6w;NuC?q(;{W_(;MurBSbdrxT_LjXDK9i7-uPv_!y}glRIPb^*WpHNZ5L(R=~F
zPWWuXhJarrd=BB!_eA{@b`st%;6D+jDU9wD@MDA*5*`-tBZR96ZxQfL!ixxR7Vv$9
zU4(}Od^h36gnIycx8J<WX+(YoRou>JG}{Q?w|b}3SS{+`yS*fg@LN$;t9K0z4Jr6R
zu)cbi?Kp$>&GE83{OF}-_*t{}xl!*5_nzU=pwlq-?C25B9{XvqYll7i6~lOQi1fP}
zifzaBfdf1i+PVf=nP>4HI&>>hG?9mFCt_@W!_cmVI5F+xHbH;QE5Zqnnmb-O$J}u+
z%glJleDuT6v{(ugRSL=RnSak&Z$Sn|=b<aj@ZTd>K<E$U{0*3lOLmRRkMtwg$9bsT
zK70-2@pqJ;j2>l%_c#vRM{^iC4>I}%4QKDcLq0!oWa3sQ{NY`LRb&0TY_|;eKV`dh
zN8gT6cKFGQc5Uz3iL(5LNgc_g!h6DhiR?oH+akaLjATi4<d^S`jYSSeO*Pn#L#@`D
z;rF)H^&?&l0>HtNZNCyRo{3aS#Jp`2u4NL>L`o#$#BI3>ahycV*!F}%<Ou|ryJ**z
zjEh*GTeE*=7?ujMt;lg-0F17%aq#&M+lqH|<h)@!Z+KVqDwH5DE7n(o?fi!u1jXxu
z;(p{9r)U^@-FC`vqi>_Ew&QvXT;4Zq7Y-8{c^1gm0j#!g(=g<XOiD<h^8CtGwdi1-
zX81#M@Z!P}7X0ml5b5BRg?1BC{XS$T#XSk7zK=ak<N(qz!!MYFp+bAaO<-V7p*gUk
zFjr7Uo&d@ne#jg!%mHV_J#fc_QA9IQg?-yHFv<H|xe>~_zN%{EaAvnvB#;H~HY&oH
zx5Tz>)DwO?ayt1yU0(MNb2zim1D^6d6=R{C$PC1hTpbzXY7NtoT$MzAA`(sD$_Z2&
zu4a$t>Ufbr3a-BVw&dzHa!0NNL%o8>iwlcT%254QJ`bjXPuq&-F*a)3QI*?!Fe8*d
z;vT5V9W=+nO9^)_Fb9~!m^VK~j43k45d&3IL=3{6hv*mu=D@{;<^Q?ddUrc7s=Tz)
zw<}_zsF5n%Aj}avZ%6TV1#i=EiwmVyh)4<L!dMZf#Dy|)NP;}(>C(mJ5htEP;*S=^
zCzuBna+@qP3uq25D$F-4_SpIlM+HZDV|!gGn-iLmXijKB&qVHg3yLz>4D#@4h2~Z~
zZn~_o!`EPjk;0xug-0~B&zobylgm-yLyHQJg7tZx5pB@4N-0mX;#Fw<u~a=&`+rW!
z7NL*m-Ccs3zhsvg-X%&dSoz`sveHaeUJhM6zG_{$s4bUJ^<_fU%gq573ihg1*JE|-
zV%@q#-7XVqJ}E|BKuNfuNWy+wjG2H}(tuU2tXxrRUh~pHv|@Mo?eP7DUihSWm`C%#
z;a;Q?9827D7_LXYDVi}#By5y9a95VJQ7_y2o;nsb>hr=zxvEBv0Mn5fqPU^}79&O0
zu73l9fRTFkO`ZG&%#tIx$ZuHl135px6~+&S&>XnEeHZNl?BIIlk!T0E2<jw@BMs__
zDwEG6lLp(X!wt5pvkR#+9OxUg)y~K?6v#7BU+DA<gbK}N6>r-5Zo$06193PZ4$t8I
zh5JG5fhO8L;ZWfk>Z>RGswez>q(8>|9erS)iWr$D*nx$oVK0(=d;mH#{9sIIcjUwj
z`<IT91+w+A4~KD&a*{v^J;_MI&LxQM)yVSKrRctg(rvpF8FQBnS#mrUIg|qLJvbIR
zOV-&>$QP#>kqsiboVB-%7ixjxA=JqHyFk6|mrRz^H<|4HEEJNp^_>7ExR1u!gkZJ^
zg6AVozeX9}CE<ae7IHkatl}+O|IP43OA#gB`3n7G`3|yjlFKLM)q?bXk%_p}kYN^g
zfZZx=M+s~PTC@jo-Mzc>MRk=Ued@+Kj3%R}0*E&PJ$`WaJ_y=ZY<=HFnWSW%qh!Pg
z%11^}nth@)uS9+%82hP!&4F7Ap9Eg=HJ2f&>v0%!F)F65kGf^M2ZDrDF}d!+UDRi;
zNH$4N*+{M)WvY83e?Y0t0mX;t9RnyjDj@PhMC}{4^>G`W<o;E1FB;1?gm`kU|HAls
zou_yTO&~vV)NrjJPvSzB?(J74AIrhVo<320^3I0yMy2iQCAs20UEB|f`$BOq7xy9)
zaW*poE;g-pPxuvc@Rq_M0pB3fi@d=+1|%Un`sozBpa_3>Ulu5_N+HK0?UD86EK+k}
zH*IB0%vQ$61}+*%j16iM4CbO(?Z-RAcoa1_I4;3zPK!k;Q1#Vwe_;_CzY*$!g)6kf
zOCFli^H80@gEN-kNAPe|0uNJTQNV+N{0|~~mH#Mw|JnShblp$`D%~(f#8T;w?$=6p
z8dY{6=P=Y<vW33CKv`&u(oGfQDV6Tpm!;DE>6K4T>8@fP|D@7oVvZhDy2kVszAT}_
z&xzIEM^yNc2^Bsi7NwwJ=>Lko+4>$6<M+D?mCo7vb^s9*!(n;|D%zf{|Jw*0nQj$@
zt$#?QFmBLN5R1w-XzOnRS(LL$t5j_L#6%b1ru!3f;11EBxGSFSJTdw_nu2>^0!Ec%
z-hz0iLi_Hi7{NRV;mZa(bC>lW2)(G;w)JsgOy*x{+p(B-!`8o-15mEup}kcOEasT2
zGF;8D&Mi8Ncx|eZGrAaQ4MsZ=AMrT)LOfZh5YxOEH`!nwrIntJEF$l{BpS?fH;ivE
z|AkdTF{C-0Q@iE5+{<8aa@h{oAgbdjj!xEyK}bShXzL%v7%$2j`_ylXY*IF~&%9{q
zQ=3N+>3fJIMm`)Ho9>D~d(ioC%wy|AXJS-t<7{l?7>l097EsvtdMf@FYIMUs=h8O4
zOo_+qSc>>@ii3-;Rt@Rg8A~yrkrIt_=eI|0v}#1>Ez!>*6~X7S{^ux?7b45Rey<#^
zX4-D#va5UG>Ri1dat?(M?kg-uQTm5%H-1)z=j-s}5bh4|cJ)7J>uX2YR?rzLx$G<R
zkyL>ueG?g(10EFd)G3ALj%aqpUUztp?WPM5ZJGZ~xBs^ujPwuLYwn2HLk;jd9&?9(
zZNB{)^QS1y{>M5Sq%t)2LK$EjjmRsg3V~Y`{xEW$;5OxedL?q<fZEm<Mzrf)Rngnw
zB7;TY{f@^f-+tSYOXw@?Nw*+;8#iI!XNT|JAsFmsU}`vWDwZlW!M(-cq;f0AnT`V(
zGoFJ&QnS3CaC0HLE=;&~n7unNO?$-F|0-I@8@9Gg_VF$w`U*gfSr(uOsu~kUr_V%w
z`~s!FCvr$sw}NY81%FH9ObilPJ&{@pm=h$`k65M?7bB~r>BNJGpE}nCD%USYbgo~C
z<$ATw)e}AtSqp+R8IGc*CS|xHZHA9LFN=A6EW@9~GR)H%vY6C@$V-B~l*PPye6D{X
zk8;|VB-|A$*SnBj<OSAS`0wV9zuV35h`HmvV>krchic_z`bSye1kLcDB1a+y##>Vo
zNYr4{3}dwBI6$&PLB?55cO)!o=B~m!!GA)e#B_Ipqw(p=(ViK;p>PP%-TvR3gB@ex
zeZBi9nhyx>@c7N_{cvJ1+i_rIq1pTFLC1l(HE$Tglpjr~`L$f$ppVV3VLsdZ8p_%H
zS`lw0yp@~159OK_uXpalP}0_i)&d=$@|xo@#(&i8-I-xl?CX5P6aH!8?W~1+sI=)t
z^!DFBx+p!#MbQPQOfJB`pZ`tB+toj2+q5!Yj>s{UU4$tS=CUOeD8fRva|h3SnLuP2
zDrF?oG0e3R$ZSzz(Yb@CMIf@m5)z(q?%>ga5bab}`_U*mgNxKGc@gXYlJ+t+_ABor
zeB?-xQVI&0k(0ru&dAG*&Kj4|Po9$*nJSq+VX{~$!^{g8vm0b~g7Nfp%v8mOyA?5!
z8OnHvNQt@6ICpSHyqJ-4WIckeaToPrGvrBH#?wo(9BBxfjdrjUkFpfr$#$_o!#|Y_
z164%Sz|mO1Wfxd65?Z-+0I4<DTDi`!h`qI(Lt=cPweA)eWcr^3;WyxKu(g5k4cpay
zVvzx5r;Ymhvk+46E*RjaJ0Fa3H@Kp(J<j4EBYZbG#v<ogqDX&?tkHPIDuSrFX84a0
z7lW)U*Q8<j<MI2-U#<LNpn@6O0nMtd?@G!Tiy`gi;8kPcQ5u1Jf!aNL;0x$y#%Kh_
zM$R&OpFil(>+xoI%DZOR^Df%I=Uuda&%0><o_FoMq5XT_Mf>->i}t?<lK(KF{m*#U
zaRBXa%Ih!=X#b;~Z<wrPT)C)8$QiOgXV2cpux<J-=A51|RxSWK@W_B`L{Ib;t^v69
z2cWRl=C_40wMwi{teA1Bh+~K-TcUhkVh-F;$fxInl^F|e5P6|XRqDl27RhaW^N=}h
zBq@8}$>=;b(zhQAcIOYjZrV=4<A_UhzU?%O*KN}zL(pm4jbFeLfCt?Q8FoQ#C&UI*
zmf`S_8-j87K7{p}wV*c#vJ1~0n9|L>+7a*EfkoYrY+qqF0AV`q;QU^>`2Mi1k0Z9x
zUT1DblxtF4?;>Chz?hsnkX_E0PckMDPL0?n5VApP++O0?An8KuhmhK@dY!_5JNz%f
zZ)pLWf!fYTz>z^J)Zh&=VmOyxkzv>revwz$%qO1JX@<=L`elBmoeb_nI?OWy*L#u7
zb3gq1E`}fdVubO~Kq(Ioo*^PS*^9i+wuiYQX}Lf#72{1T^{KT94$emr1A}v{MS>(g
z#rO;%j8w-)F-MToqdtu6@%$FIN;v?o49i7bryIRH#`e}l-RbejVv%C{$dQO8XBTR5
zHx>&IG44{82R>|A_tJcXl4oeI<Jnm94DBz##ndJ~#fgvJ<z(jPAd7wtH|u!Z*1wtP
zjkv`->>+aiOZ1pUpfx^i>-!KZ2Jt}Z&qvr3*@i48P^_$e^=X=v2Vnw7I(J5Y$ONrz
zGjb8aF%p;g;u!$@o;7C0gSNiY*g()C8$|_YKMm<aL1Zp2$8&O4<8r(_a*BRvg84V*
zj~Q<4jzPQ0_bj*)NvXz)83NKlg9(U4s8s|+>!A^+iX6^a%v9N6CISb0&-UU8zi8Ti
z^gDCMvsq@Au-&5lOtDk_sB2U|Cg_2>d67%xp+B=;?kHs2;1jAQCOkvxg?<!vsL-c`
zr#}mIK@z7^RYHyOM@~q1`g52jwwQ~Cq3Xdi1IW~HXS_-VWXZ6k`W#dXOxXIclBl#>
zF@pIsms_dfD6f?tTmSzcL}w#-ifNYM$<{x}sGrBp%9^dei|7UsIo_?(T(T~0eKq7E
zbr<^)`jw)8J^LvtS5p5P;qDgQpGGdyfb2vgO9@+gPFvrK^xR<l3d_T){pb4o|M`=J
zA3VB#O!rTmKWwHRLk4$J2AgDGdW+~%2G7k1??rFg`|iZx1V$S<tM{)5-~J=LuiNr-
z+OS<jt!KV&TfOh2e!V+#JD=hhnhPb2TZXvtCXDChtM~N|k9EG?VA@(AYOt-%d8C4U
z-NiYN3Abo(gYB@rpn^N=2BFQb+b(z%UDpb<rG7Nt^I@p&N8%XuXKY7N4AZvcL-rsT
z6`Vg7ey8`ZS!VCMS;1VAVp33N_P+2w{10PdU@OX5%4}lG58x+%#wczVkLKcDKbntw
z^JqbXZN)w?@hIFU;r<Ekez<>w8-e>0h6LG2?bl|-+nx8D{pjkr!^j-W#=M=m{JoqK
z!+r-OH)S7Uu}D!lk$AN8MPQ*#uiGwu5J5RxL5$MgCB}^Ctbr`f$pW9YjXy!Ea?<}=
zFXrOV9V7A%D|sO2*(+F`c&N3fXVXrnksqU+!L_0zN%>n)ir6y0$abo0c-OY+q!6OR
z^!ocC+IG5*!$I@y%pm*>$|08?BG<`yspi%^$3U(u6d^&bESv#XvV0j6#iZ1TES4;v
zu35G`hx=<b5=eXwS0t!Yu04J24`gjm<gF+5?EETbGL@P9^^Y9#JodWVcFG?h#lwD#
zO;Hf>En*CY`p2#eIf4=eqn(6i<$Oy}U63;%+)JTp7vy|N_^EM7XQwDkq*n-K*R~s&
zA2(r;jaFm{Nh$HJktC_al*3Z;iDnZ-H1atvd@N+#lymc~Psl>%#|n8aGqtmj?*oU*
z|9iKpe2XMG0u_>+!{t90^Z1LP7AvU9^MB;w;*@Pq<i8=)5eF;&M}j=1;0r-t$-N_@
z++C~&n364oF+s|SWQ(YH3@X951OXqliO}a2eGd|dTp&o%a}n^Uc<qse!gpGsXW+`h
zTu;RZczTM|EAJO;hck6AVCif``(oGb#sl$n=D;ObK71<l3fJ~NvsH|rVm%C)AB(cm
zhOGSy*AH1(44xP%wtOi1md@{t3|Kpr&Re71NJWejxS&e$+E6S$pucAKL6qg9%8M&6
z;SP;Uc16B}kjQ4<zRKHeyxq*(4ZK~4+jfqKBM)F<)7)chycWBu_zDf@(T_#eLlh$m
zCB;`I#l49XD@kFO6dNSPlZg~%pwR1dav_fv;$DBh({P0kVj*uW_H1f`dp|_v%B{zM
zLM-I5e$y=Eb#}xT@kT<C`ytxM&w0C>w;$rReH-$KWRa`z3N8bBG4EPY=rtc;rQkXT
zD9CR`p=n}BzQ;*P7!Nt~QTm8^DyIHs@4=btYqtM4)A_~k|5xecudkBn1ewkt6m*-b
z7mZ0+(pP`SV%8Uyc*6BiRqJ|XC+5;}tuniCWUY*NG$T#}uaSGwN3``n2#R>*=x#>1
z71D?d@ixHQMkO5NDTPy_MN*V360qE!vi`n_+A;?`*h_%EugJt?8I$@Ih27^4W@m1v
zu6ru}8p<)zn((OmVAl!e;2niMK#MT5;xABPv|wToY}@z?dXSkt^2f)}SneZ;D*DG9
zGW%T5so90@9g%FNkjyT0?Eppt|3+Sa6XSI@dHuBlvGRz<bDyZ_I|?_865JsN$f(*u
zO!F!p>6|30#&&hq$P6>Ao+*n;xJAYgs(FhXIVWjn#a#m3IZ0~NOysRc;M-n?u8J--
z@|8!4zDv&g!gtB}qgAzR{bX3NftB#zC9wY<REt&hiL<{}@F^z{7WSXo_Yc{BB!PX7
zPAN&@DoO4qPDxTs0g@yM#Tz0?#WS}4@(j{KZOp;G!XAOermnLT*6yiz!PdV}K~7J_
ztG50n0#dyXA`Qz(=!LFAnYP;jM(RZ|Q02%OJ1+!t6))QQd7c_X@51fsjOgi1>3_jH
zQyb5FnZiomb@?RkvRtWn-wBQ-?|1%|RWP3S!UWz=1QZ!$F_VSYw+l0$NQVj%T=Z=t
z%BN6*mA-q4@(9#8er)|)5GvkCFvIy=gxXIbbEyP=S*2J)(dw-hB0*w2Bv(9)ZMoN>
zMHn-kh_xs39aK!T1-thmPqA?0IQ}(x8CF4(W6laAKU65mu_)J91S$o`_mN}X{w*B8
z0l`FnaS+`so|FAS?5b4HK&XPZqNLHU;Wm;va%4PQDRpRS<jvn8<^&y*sNEr3<Z%Y)
z#*>EKg`y+i{&4{;dg#!|w-_*GBzvTA<anLzI3Xb8&sj3A>>bOr_5U}<p4>b+?bi?u
zRvC`rQ!CU7VKKJFE@LyiGx80_v}16&sg+udnZ@ANo}Er(V9RFQdw-J=`K=IrPNNQw
z4L(DY#lUkC2cAbo?nFWyPOhPwdSBM#za+_?$ZYTsDMzwuY>CyM*!ZvCIDjg+2{%YT
zawv$Rf58wp`ahYtU57$N_rND=MvgmeeFF^lAV^_3{IvC7O)PJ~M%OF%O6Bt4MdEv<
z%kf>DgJH~Wq9;$l?Fwev$=m6?UB+7jZ*{maeih<JS4e=1YHTCX&uJKsLz${6#<e^f
zEc!>@3Yo%jxKS26#1qjyk$d3^{$rb)Y<;3T9#mE{w!ta-Eo8!|8&gENj$z}Xj08!)
z3iMPyY!z0!qCU|bq_IsYP1a3NpLCW7Apk7)tf6>OA)}NBS6i0@5nJVq?|@C(FKg>R
zSws|*C+qTRJVw%<SzG^G!tkpY1<~gLM*o7F5Hu%4gLufsJ<EOXGiaNt_`MiY3X<54
zJzL-RK@j=TBhYy++aNSb+X9!ZAJwJ|a{t3}<D2N;v|c=FS=9Z6w+5pl-y-CSX10SK
zC^@Hqw*H3{q-KE6Jxp7G@g~c4KFUQv%mB|704!w0DSVdp*LN2rBxitndgtX#Emj3p
ztTgL>en-NLE>8CmTi4|T($;q-@*254vOqAZ4a$5>S0Y6UC9R1As3>o2NK^Aw)#)v(
zcp`&>qnURur?T~LkBLFoeg7VTvRZ`xUlB#}3Wz7s1aZI+{Wfm@898)*oysHY6m6wa
zl=IcdiF;XN2`XGc(M%P1Ygzi{0RNxk6<Lc$y+`!>uSTxiLq_8|6l(s@@q#B8dS&3P
zhq(LU?Z{N9PJFeI`@^_henqXfcN>?Y4Oki0c=!!-V4^u-VlD>_HuF6L73Kg2uFhP~
zfZZI(FvA<!!tp@QHf<vxM8PRQL|f6+9~2V0k=+fDw0UrHMOe;%iLi}anUjyht^!+F
zZrIo3#E4)Gc0hIKizldv#b=skfhXLK{C**pio?Ca!2-?%aED!T=0NWzP?{CJLvTV9
z&9LxjdeY?Hhi=WdxBVI?3iXVMe*3ErBFn*F$WibYonYnO{*7F0FhS@z5Sfe$+fGbm
z8kr0C-U*UDy_63AvC6wUmkTR=@nyRch{*N3Nw#a-tC(@23EqeF$0Fasgm+sxN1V>f
zMb?orq)SVQamYc$U}f|Gh1Wy8SRG!!(jCU)*L&f8V}%cHhB(YUSzEyL$XVF1XNI#z
z=1PGrL+b8<JX?N-E#IAQn+D->2<)~)Somd)V7Ki8xyF?VQfws<{9YP+-%P&Wb<Im`
zQSR^)?l81-@fs74k$Ql!<uCTyW?|_X9w$9(8f^JkfzPkbx8<+0+ww0hvCX=;5Hwgw
z!4k2jumpE*#ppd7x<etE1J$NjfWAlotJZ|E+>B(o;w_fYSyz0Duo*6|{>N-LJ_;Al
zy$kJF3Z2??yjXt5wluy(hAlhgwjwz(w#}LmLwdQ5qmc=4&tu>9@HE(_Vd~G72h0RQ
z-10Gti6{{K7Rg7U3Xdlch(t<AP!X+Ws_j4{)l8f%7E2Kmw-EYDgqkQ9N*Ry6hS+Wy
zC(G7<RVE_8n|bvLRO`JMgz<U6UW{ke^Ye;FZGESJ1d)DkXHr=7?7gzE+;G}%g?5B~
zU(OIOlcPtJP^{A<xy~Kt?YgRDq|lk-A=WoRO^teG7jzL%E73FH85d`R?tvw_?t$gl
z`?nsI^d5GHeuH^pV<j`d<Cq?}M(AFafo&p&%jo(Jacm$lTvo@;#7POLxY@RAH$dZM
zTexb6YzrM|KWqzl<UAIMV#z(a3hBf-y90@i=j@BXg0ttDWB5<ldi0?KZ!G5LY_>x)
z)eEkGr+kPtaX!D8@(ynY@hpb7e9wn?WFi7Q@4&a(a}f7wxMMR#rdjcB=dJ_0GD1g#
zGMg#nxRET#vYARYQ^`I^8Q!-OWw>Vd7H}coZ%g211|r1`DBrjIU-ENHjGue40Gh;4
zG#C@@3BxHwdm~0_+csOx%&*9OcuJwvTv;oT?J1(xBI?L4Oc%va4_0X{GGO^%L<;c|
znuAMnE$>(jMSlRYc<_+reXHJ=R&#|;w7n8@z-B`A#KtPNY^-(du=SZ#{2ld$xmkEl
zZ4TmnMJ{(@i$imv8O55M!ROVeFFYP!z*orxMfff31YkrgF6LtgMiUb)z{Bb$kvw#L
zICOM;j|bm;k&mot`o;bZZa#WG;@Czph==eSDNGC>kN~EdFGdarjEC;rii`o>fzSp$
z9=ARpj%~2+I|2zu`OvmuC~1E+_CLri-0{r^@$C;{e|2d3$We)#t2-y_NO)e)Hi8kv
zQ=zUn3kAq&D-<F2+NiA$^Ch|eB4M-{e_pO5Cp|>KJ0-^^JVb!ylTRG<`yp<;+JXht
zeC&2>qz4sgREN(jinrYhF|yIgTlb&G9&S{CK)mb4{Sj9FZ2iY_RHUDA=tSZ>JJdt;
zgV=(BogJ1}J8k{X0jFaYM4uqkyL+|e5eF9$FnRQH$Ws?fIyT}S_xj;kDfWrPsgtHs
zols^Mj1u;>6pTP%A}bE`{zF+o$NvK_RgR*8B(!I2h~kPndcFeBz{$Ej<N4NZTi;DI
z=;2?QJN|~Yd;rZk%2pxTuRG%}db>%!t*-%uO9!%>&2V<%(t$<IqS4~f*l_3w-DpFH
zhz2_{p<zhx$HL$a`%z{<?>M>`$n|8r#<lz+yb0?LKN;z~kLrM3pA^hxvFeUJGShER
zc@y^MqkX7aj5p7C6t%1580)4WYsHJ_d&>vUY-YxMH30j`&?t50wm!S1ovPPJUS?Z3
z5_sKzS^2T`|3<WjaXiJhI?4S?-vb%9I>q0Iwe^3|8nqzWN3eHyxur#jc{z73!J2%+
z??K;lKesV)e?fx&P-{E`ZMn-TUb6MQ1S#NUTqw$CEb@S@=YBr<4&%cl5vqc5oLlQk
zK6T}&n68Z9kL2cD1tw|`gSg03(2Qk+b5Kbaqtijrzosh)=V4flXlLKZjE02gueSbH
z5NInCSCLqCDEnlBD%n19mZ@VFL{B2rySrd~Z3vb=;o2zr1z(QtgD|l}F!KGMV+<C+
zEk*rcqUR33&nogPXv+_sCU%PLapf|mEkDcLQzg8WwrSAOJsiv$d?6`%1KPBEU`nAU
z9C3$#W6s)Z-aCpS<GR|c*lX*%S{R21%^e?Pqw=-_!YJ7FpgD+I3crKbO%|B<O8T*h
z2zbZLh?us8?_lD>9sBvAJafkj*^xD<FZ9YIFfe0y7a%*4qwLcaM;=7M)bTC8m)o}s
zS>4A+^kUHzy;+nSyy62E8m5@O-Ny3lS)$6AKf%3cu`cgK_Z}>>vXqyK2DAt7yM$C%
zu6nx8pN!ZN^r!QiS_AS03ycyoFY+ONPqN-LLkv1rfru5o04TCa(*|StYNQ;MM?0A7
zh6!E9(xRR)C&vi_ZivO5@!+!XX@yDpw%v{SXk_X=*3lZ~`#hpW&jC3{7aH(k-*D(O
z+pK;ka<<JH^a|(JHNyE?yKn+MwplGhwppE<ZL>bV#S`u?0ooHDEQjOfd#wv?X7Bz{
z_pCjh@cZUqe?IVL*tO3bbYbe`+G}pLBexQfqiY!0VGpLB;U~=SBX}ui?02UBN%!F5
ze0LbL-AnfOzL($e8FR36KL(_Dgt|^B0%rZo_PfK?q6r<v$xP?O%Ij^La!2wo*YMzg
z1?*k_^Uo+N7w8tlg5*7voq>tbs5uyjh{60Nma%Mdd${JMy<m?6($#$aZepvqt?zG8
z`bx6-7N^P>9$)rT77Pz8@Q~XR-VZkNJFt+7wRGB_B5->zs|&#<2dvO{PvL6XA;t0a
z%M8V_iJ=xaK1Fbh)ELLhI3~Gv@0qye0jM#C##jYmhlBb?l9+v)VV?NV`<|`qWM-VJ
zGj^(sL8>w?K*pVuMovIG{U{c`hcdZg!o_tCRZTF1!J(%xSBS8pz7SpcevZPK<F=w}
z_2cCQKS61+tbZqDH*Q}5U(mW<jNH@<4ZZt6bPsw8$Ap#msz^>nJ+&7p0%1g=cQZx#
zY@1K?HUXKi7b0{xpOH#5w=2k}<0BJo`I*8{sRzA7jF<SJcM&RZ66MVb+!OgP<m3te
z)jU<M3vh~ZEk9Jo@`&W+gQ(RcLp_wU9*PoKLH0Nd0ne6&r+g$AOh|L7_LP()vEYFy
zOKg2Vp@rmt#`36p^v5jt#dyg872KF2AK+v@-6Io3VY7gMiQpdG#Da2iQ^W^#IgxiM
z&H+`RidThxbHY`Cu)nA<R-QR1UpA5F5bPEqsD5szfFgv*5b`-!@8&QoqH;G!0e5rE
zi0$GKJ3P9Hn<7*tawJNH7K*Yqiv1AZhr+lA&o6L?&(AdnO5{F>--Pnq;q`#MFahTm
zuy_+}(=u5+z>sa?z8sXU(X4m|B{*8}$wnXwI~AZSyuJu4lc<FyC1^!!Fg>O?@T}_v
zL>Qrvui3p9CARd=+Z$*tmm^H>rFeXc_Wd&E+Y$5q96svLb`}MXK&}=;Ey+{o1tS+L
zP*lJPkqs2U(WIND0&-C^ovsm+xYGqLRz2X*O%73E<16KK5h7YVX27zdjsgy*G~#DF
zWHI?rXSEC)1D~AIAAvBnUzY2QSZ6eqbs1P+&iU?VV`C)CY?W`iVzyeHG{rqz&sO6D
zBugYQh@L+3nWQQ1AvzMq^`C>ms#4rvA|&|?`Yx=hUK;&6sxRJGbN={$jNc#rh&BIA
z<So_&7L*m=w*ehLPb~7icM!TKYcDkKqJ$3T|6F;V{vTPM6BEnx5YVzbSU9$fo*Kk?
zbCu_N2G2UmjgD~@mXIs4bp2N4ipuc&E6u^#M+05!ne_qB=!`7C3#sq;AS-m7<0++o
zp7859J!4V$h03uR5Z^Am$n<pQi$ac<=>3Y;Gv>tkc4(_~#krr5ILCOOUY|<fQwe-3
zflnpysRTZiz^4-UR05w$;8O|we_sOpu95Y^lGW8oKdxdC$LngWIacB4vc{1(VoF?G
zn&zcl2_?dTU;nyN;_c4)H<Ubk;|AB+63%xHzWlSzZ$Gp}!MV=J#ZD3QnsVP!?#xRh
zUdF?^{52AGDtvpLgxiDC?NM;-n`-)lW+nWt;8O8XGxvoT&f)j8T-8g<3VkL1W>?Y&
z@K!eSJ7c9y^=?m-178Dk`D)MbNw4N(HP#q;jrK@4cawC9<CTS9uJFbEgefn&`S@uX
zKBrb3ksm;~RQj8*aSG5|v(#7VaWAP}=Bi#{T+r5O?+D=2i}==Jy<L26tR>JIvKJY%
z>>+$x&E6EWx3-1sb#{E_G0<UeYp{pbx6L#*7#A3|7gTxdUiERq`F05}5}z-eZ@1eG
zeXK4H(>1*KzFl*3pxKUZLgIt4{zki$V9?%$Z-U}$fOezm)KeXf(-(Q++G|(TxGI;~
z@gdy0`uX-s`&ssd_EYUae_eB3hy4_Lm9a8dw=OW>e&z}GCVV8aj-MY4o^3y~E8q{c
zb=c+SZ_l=0bY^ET;A_Q)6wkiIaMjc-ubFS5x3_c#L-w@+``KsN9XdE6g%|}t$QEkq
z3J7`m>sl!iByDeL>j>D@cLBA`TJ0Mk)W*8505B@k#8fHVU}IZnb3JpfZ|Z6aHmz+A
z*w=2bpJ2zA=lns$tnO@CD+R98hfE;|OF+EnB4CxZ@FW%&Vk8C>@dJ#_vzSyXJ|>5+
z<<4&DYz{R+O0(<R{q60u>lz@_V!z)I--=s|k7+_TRzW%Ny*O4C|2sqY(yG0#qoZ!a
zBtvE8>TU-Mp!GKf{FmX|pHK=Fw0tc-zT1@;q+}CpYwi@u);HA)UF(uL1&mr9qA@|E
z24B3h7cE<OdT<sKuk2c94>h#_CE!ym+UN;%1)67H80cs-P7!`P{q`l^mG<CeP57*F
zz2U|;ADfL+TH9J@3vVpolvA`C8`{f;P=&a&?RE9__@1ae)CScR+J-hEzFitjAZA7%
zNi1W}pD(`hD?d>wKT&L)SZ`Rr1T9GLfl5?Xr$1zG?QCw2%gH#gxzi{<y}jcy@oCZG
zMuQ)BL~=<<$PYOiN_XWKX6^W1_5As&6lhuNpl@jOt@f6>ZhRy7ia^mUqcViAGPj3V
zTzp~>4Fa0d4qe3uAlc^Z_^>JB1nl@Gbql`MXkXXS*4bWcud;%&8L<TT$RbThojnK<
zA{F^<NITL9bhkG*`J0eK0F7#cou6M6+E$Eest<Hi;~2H0u5}$gU3lS&+PLjq*<2H|
z()u%%_<H6U4qqw0Ug@eW^|{6wV#gV!zPV+_zx3f$VMn!H{S9{7@rrTaDC_8KrBcd|
z>FSP8+xY^lN%GR)uM+@n+^foq+f{juDp!9eJ(hlHSyQWM5b~3n_{3v}H7A`<w@Oc^
zD-y+xo7H&fe1<zDJT4#I-_42lcMI`VYnO<Po9b8gtMr2HO&u`wq8B(l2t&|>W_*P-
z7(#jLT0=oZ`?pn{;=`WQUuyP}U1u6Pe*ckIfeJsg&naN-3czw(6PDqd?vU;l6>pz%
zhm?D#a`~M|UOHR=mRk{bl3A{-OrC?CVdUYPlXocmG>o~(CEXn5^5Hn)Ny?q9+>?}h
zGTh0aX70=J5%(%jF`B!9bh8jke#_E^@7^;Vrt$Brmx;zq<94K}KK%;IB0gbT{O`)6
zxW26u9p)*gCAu*XS)-I$LS~yc@>`yi1j^{6mUj6Tb~ZJK+^tKR+t$`KyIZ^XwQ^W9
zH^c+F8IX#B(F?w$p2Tr%keB>XT$eB~us4>GUU3~d7N$4V;Qpg{dhwPVqb~M0&!5ll
zUeBN31SWEf>Ec^|DdMPBIal<&YE)^7Ex&y|f4&GtI{5}puHffuHODIc85BW%pkppR
z5$o2YQ}Nwi7D0S{7~fycF%A{qMDtx3H?|)kgX*O;vx!om{hjL*ay`_jlDwRu>cLZ5
z+Jw)skFN$%t{BS}p}JO-__`>cL&Uc|`I&cJuo#uUi(lFX&EW<dmR;vpTH!`^wdmM_
zwJSbGuI1#C(PX-L#^(~#^_24a&?yrv!I-~=Y=EEX##J)jIF_qQRZXHhstB~!LAQNP
z4er%}%U8(RLW^q-KV?tbOZ~)AzbWd}suTZwic8Q+zKrx}H?r_^!#WTq{woSk+e18I
z;=c;_H2gUKAf7PsY-6-TM+-Phz=x}_bKo)$+MXq#S`L>-<a|^eA{ew&MLL4^pJ>0d
zcS|5^>b*)|%ll*LzRY`usI#PWVygDfOPQ&Wufs*%C8d|5O@F+Umly>?*HyazR(+Rz
z%erNq+wnUWH9{RJ$8QmS>lKdrk%+Si-M~(F)QADiH4Gl>^%?w*!_UO80l!B4HsW_3
zeqX@vi})P|eWI>7@#96<4wpK|i|`3>?F4Y03Z6($-J=fhI#tmWN-zdfPNdP{v*Bl4
z4RhwqwxH8&gI`}qAWepmo~|7*+Xr=@@SzBq0QYb}=*R{Cq#@s=A#Nt_hrlHr@%#}_
zm$aPITVW0n2=m8qZuHf0jzubLW5n@C8oH$8dH`XD9}V~zxLQWXg1@5x6GuP$D8h_)
zEL_GTj_^zc+ZBAGf^|L^_6dGSKNIxx;IeGQGyZ(I<d=NRgcQz%%W&eE7ipHjWuC+l
zJ{K<IFb}3#4VS#@Gz0LHUc>7YOd7_&3@+pAGPNj}<z;xgf=NFU<-Y>1^ye6#hhOur
zaRUm+bafs#!%rTFTYxmR9<ZLNI}E!JKY8Uk=K;rbIo{$$9XJDdlh4T({}knC{HYdv
z9{dN9JKk**`B6{Uwn)eP3A3GPn0hnA0yCWLPlr=K*cLU+x?sB`d^UJx+T@GnC6B~0
zee!3;F%R--#W5f9t8rI?znOrK$B%g$8Ck+_hj%fgLY+DZKZdcr@^=>S%=cvc$cs*E
z1Ja^i6sa)s#khnujZX6v;B=a7_d3l};b&Piy-t%hj$urbaS3Z0rb(F=<EPW4?O>Xe
z+3EOE7Mh-Ekd}Cj(|kFA(`l5zulXv4pR&{Rny)h87{)Xim#~$F?O-l`tiKA-P|qsx
zI|D!BnGW050{ob71t>`4#P2Nph-X|~PnGbKE(7&Mza761j11WK476{VKGWvK_D($}
z548W((S>j|A1?T-R9JEv%$pZ&0@EOmXDdJT@f`e^-eS1a@g;Cg{IrhJPkJp2%8_Zf
z@ne|AQ|`1WOH~;4OX~x5$)mzFJ>|vnEW?jHuq+Ha55ML35x*EX#;w7R@foIdp;qB_
zdOH6Vz>_!Tuj`#@ti+FDnqKF>3OH;2=L2T`#OwT5!_W8()A?TjKk+)fe(*|}U4$QP
z62q@ixQpQ@zYNoSUIM@7Q@2I(c`1Gj)9GqHeZX1yTmzVV60iBJgP-x&;HUXq3qSEX
zJ<XFJIEIlo>O5(P({#ytME&Ar)x|}CsXLu;wJvtU--RE;tZ6V^@|%HQHGW#3z3?-Q
zdbrd-_B##uQI>?)!EID9`D7U5Xg*m^>QNJZ4AXes&OQqq<I^6}pNk*EE`!^QALFr3
zTHv-S9P5KW;@ja~jvvF?)Q@>GpAP&Ort>6!%!_!9)3ib07^d->zmUSy4$x2jJ_Hr%
zt+s$N<z<!sdcc(32DlX{6VtvDzt0JH0=T3O8e)u1T81Up32Av<fgjVl7VcR{D+_Kf
ze(Y<{!<}jODI6TZBVj9#S1|zB=ke3^d$sa2eh+@kqaUuW>y7YR>-stcQ<e;4e8#0*
zh+}vUej2Cie-m(|*LYpWVc;01>*0F%nTDp*cKRmZZorT9q_N70a%32<0sL4t>d&C^
zGp!r(W7&q_vTQfQ{Q`d0vVBp(EC<6FU-Lm6!<ml8k!R*}3x1^6c&)Fus<1-1{Aqo?
z4St3t>+6?*V;(vk=1E%OHBOg1<EX3!XQHv5gs|It$Hsc#FW59THYFQ%4tF1fV#1BU
zT@80N!Z*QfhHHk$#_oi>7w%rTMc0E4ZaG{Y#A3qbHuTkSc_L3Y+;X_L!}Y+u6Yd(g
zd*OD&eG={><Xd#(*w~eDH{CQgb_40*{uJ=uZAcf2YT_-|8BpA<aEHKG1m_U!1I+UX
zo`ai<69aNV_vGHOv5Vmr;83Ky;BNiZ*w|*IxAiw;V=pn^-;Rx)iTGQ84;S$oae81q
z+yWf7cmv#WxOc*hz&!}}AY4{-;~%gclogI^hIEXKD{734?);3SrcBJ`@hkbjAC2F^
zjbme{lV;JxeBw&*n{nOP7}yb4A?}Ot%fA+~M;VR0{Ka_%=h`N(&+ReJIdZ`%WrfF+
zkZIA5-Hy0y!$xIZes5-`D=!xwfDEVZ9z;0%6%~HI2(QY^CCy#<u})EBaS=C+-yGoB
z?syURd;Ch0a1r2618zE8UZi^;Kc=T;KwLh`z6iKO;OE7#Lg1X54(!(C<%;;!JL;C;
z2YAN!0{7+(V`Ff{W#V2BApeoEu{VeW-NL+rg?aXcc|{BJN-Fcp7v*_-C*Ck&Fz3eX
zo3b`$X6?(!E3eEe5#gW$ZGI)i;H9j$AdTJ7hYXe0#>}dz6Fj{lZssT|4>Y8E65*#k
zFgDf*zadg6sLZqXX5E;Xxh4-@Fp*0-HmJ~}V`JYOPj{P@t_XDRgYNs|>AtS%3J~T6
zUEgC$&d8=W(+g=yo|+N131J_V24#2)=<;!bfz~nN?gVa167GKBB1n&-;KjPy2V8dF
z*qEIN<bNS@r*84exWelZT0Svr%Lz^+OY8a^gi#hZK-WEJC)ts2IVm&99x_{$x28Ay
z#;lt%vkEiw?3JQEAiT=FHH>#Le&2@u;3*r~CEs?c`W5lKjJGi}^S3&htVS^|xCQb4
z40~|`8dvtBSUjs<EXmuFouC-+9-CS*wq(n(Mg(ad+%9cN_8s5Vyjas*lsA--kY;;k
z>NIHsJV=i^9>QrB^C{P@Y0_*@Nb>G9`rFR*_{L&A?As>FYj2wL65E53COz+&lp)gD
zjn~p>_p_fwda~Y7=E}Sxw4&ae8)W63mO)sxCsBVTUc^5d<?6#>Jke~#e<>wDOY(X$
z6ACzzm0D&!NQ*qR!?ok}*OQp0=X;tb<h~?tUxreqnORyZ1T*`<KQHR=El~V5*Nlx#
zB?3CU6go^i`+(I+_(j0)27VNML4fp&^YU-XbmtY^nB~f|4`#daif+hRlvlEGf|*y|
zJ8?;#vsEw;=?J}`bpZpyo=t%vE7%urcT5hgYau6qpP9NR+c;^)uP}R@x-;AGUU2sW
z<Ngf7`!c3JkZnAlalxb6#`erNQI4Nv=OA=zb`CHPWZwj7h;;JM@f(XLqsGp=UgENT
zpPjKQ+vo?>pE>E*=NZG9lfPMG{4(>djPI;6wq+mo+IdD#P6_;5a+YDNlQX0DLgVHM
z`I}c6Kc3LIca`yjiCw_#&pqb)TI2ddrvJ7k=Z-_B-d}6{_aSd1&COF7`uNmi{!n9#
zO`X1{Cg<k7srS_yU(Z9P#$Ts@i@Eg8coC$p96qzZ#`ygaGrzPv>#ZY>eycj`fr9I@
zfZBaj&V%O}4<Chj(l?LJdEh+btz&Y2cAoK<<8pp@p7FQi+^7|M?w8IperjK57+;;4
zd(C;qw`P78W2WO595~PT(g~Ay))+rH!3+PM!pRTR7>^Y~j>eZ~O?qXO@!>4{8z{pm
zQ-@dOY(3>!u<@1Ilb>H@d}lVT_Xowte4)np%IQx7|F&atPmM89dddsu8P}Cf9;`9`
zHt+V#_s%okE59}4rSpt?=ARAVD+^}B|L_6_{O>Nf1MzM<JLi3`@zt{@z3nx=bGGeu
zukq8f4>ycQ&bGZ#o%P4F55*T!g!esqZ#;+CubngVwd$;G=N$cNb=KH9Ga!O5Iwzs5
zPdO(&S)KK*%1KXDXZ^5p2K>)g&Vc{B3nwAFEemsy_0JaOz`uXtvD>S&eqA-`>(yB|
zEjsFf>a2GbO}e%^Ym+Mvn73Rr`>M0{EY1Vwr%Pt`RA)WDWH&|Pnf~0etY0ph{_L`>
zr<Xko0c>C1m+^P6vCB)_KT<RO+S;72*G|8?HfKxi?_i~S&!7I@1v$5#f1?=5WPU!w
z;6d3+*9yL!G5MJZ#*Z>4znO#cck{zJ#v>UUq2JKwDPPUV|7Di(gN&Py3gF3~oAhN2
z_A`2s4dHy_VfY@-oc?mA@l@uC0(bG^Y4_$D=c6~>o-u7lE|k8`Fn*jl<CR?F!OWQ-
z<QhF$N8npFuVl@?_7LO!>=}>e8h@T}<U_f}b-9xe@#fq~p!{m?B+z^(cM@oRlsgGD
z_vW%cN1i7ee}@eIo<05MT;uI*=07}f`WJJJ$0p7)jQ1u^zbV%k%tbT&^!ii+pGx3U
z34AJne^LU&g-$^^e4=zWD|nxBhZO#wOz!_TWayT}mFzx;Zi<)2e~<(piLt0PeBmSs
zPmvA=#!lfAV_WzR1|_WfwmVfHew3iXcvQJZDtB0g>p30ghP>YTaE!}HMkLco2P;PM
zDwymP9(4WU@@6@OtJuPLRN|Er%kMCWj@>a-kk_zNxagt9b*D<0<8xkOFaq}o0by;X
zz$tthfA9zib56`_Sls0^Kzem~ag2~CPp+cJ9(n;QaT}uwzVvXXO5s22?0+D2zVlT5
zE>`X;<u)j{OSv1Bdz*5<tK55(`;c;<Q10`}J)qnPGiCmVEB7Sj&QtDU<*rh0gL1o+
zyHUBfDfhd|y+^qZDfbEGKCj#Z%AIh$%3rxBDR-W77b|y_avPM}rQD6my-m5_Rqj2?
zeMq@aDEE2g9#HOt6PyOG!<BoIa_1>`v2s@_w?VmG%H62k+m!oV<=&&*hm`w-a-Uc3
z0p(6m_VaM%o}}D)%3ZA7RmyEpZkKX5D)%<!io#fKORB2o+lyAN#U9#Ddqr_samj2)
zNv8lyXGw(IxLs5;3p>#Rm0q`9zBGV6$L-jv-eE5-DRmS(X0Hu|>PpVA7Xd6Oo?Bc}
zTr#g@4o21g_{xHnyED@{j*vSicc;W>#q5tY5_ceKyOW5|F|>V3#7{6%wQKGq(e@yb
zKG)E8B@ur}%>E?eVf|D)O2kh#>?!e64Bc-g(oc=q??ika9)38jDB;h-js<Tx6+Yk4
z`)RF_vhcKD@2^e7PdD~{Emb;)8eF<dzOt}-qWcwVSQehJ>;5DWe|T&znTS8aNM-l3
zV6{iLJFTR`pT&if;Z*n|4e!oW_@j)Tlz83S8L=w^zHH;Qu^2*mW(s$_9OfuImnf~*
z5{2gyr1iQ`;kk@xy;>BWOM%v_M*xQ!T+*{%e2&B2P+Xd`Uf&hKp$3=Stk=B?&t)^~
z^(z3G*m0uu(5?dCQ+WOU7T4T(^+7<S*Y9)b@xTiTuixv^cvmLJG<gP3sOD87?uO9<
zJk#M<U3p;zKwQ69cz*enR}U)$*J)Wy=P2XmT}}Zjw6Q?o^J4Ft>3;rph36sDy!3d6
z&uz$$ejn@t5sGmQ%169@k4ulM4paEy9;cwx{C5DKN>9RqKHl#1{_}4Le7v3NamqH8
zeu-+ocE!)16khLZU!(BvDEy&)PJz*K_zVP2{*&?Z6khMYpQzIDD!ks`f2_jSDg2gA
zGJU(kU#akVpFbAp#C4m(>wWoJ{yzbp^*dbX6m)uAx<}#lJVE2120oQMBZ}UBqD)65
zhTDq@?@hvgpzz7_k3%O&{TWKqpW_AoFk`P8|LXMJzzhD9(qAd)XBb<O=+p5Z67<uJ
z=f0K5Kl4dd-fKb6-B`)?`Bst6csu!ZK|f=hz5S8GC)?+pBAxN}^GV?KGdyyjuh-Jx
zPl6)NguZoO=M<!cDnd2z$D`i$`!C;A_(tGUrT?uo_-6!uieW!lrhkY^=Pi}Kw^`!(
ze1X>yXi&^ozt{79i8kf|KOJ~OrK9H)9)VXx7N;c*eh~P4?ATnh(`li`GlewtZ>GUd
zLqSr>p&oehzj>WZpU-i4-LB||?M?yf+dXO0nT#O_>t(B|mm(D*f`w>1_)qR1%RoO3
z^m<&O#A$GTnTpRfY49P9pP9%fKZ8kr^m|d-K0FV+C~t?P*Lj_c2_x&vewxIefaiF;
zP7`?Px86f(@LyKx>^spZ$i=g9`0h?a|C==UchcaeLZvj%R(|ZjPs=>gSiRF}MH{n$
zpNSp1dM(|qLMsJ6&&XBvrTeKXMEX;VEvLwI_#Bkiw*(%~!jj~CpQ87k<P>z`SwDQa
zFtDlkEJ=f3D)7ixrGw@#uFs~S?*X3W8ddgiwW7Z}4gH_f;9r4aOwSxY?)`xDnNy5>
zRgXC;{llQL)RQ$QI|YW%mw9;vUiz)~OVi+g4m|a<K*?XPhdiE!e!eZWJeLVP#xqK8
zX#V0_n}+`WH25b}Iwh)H+FreshW;hAYsz7Np;P2{y3AG#cv9873ksGBzd8-RISu~1
zz_b18_xY828dqY0XL=?YcapvOb((ZO1fK0B*{)8SmYUCXY4EoL&wAAFOCGP}uq_S!
zK1Hw30{|Q1I*^8b5`>mYZl|Tep9lOjj8}VhIz_tqN<fWi=pP22?Z{N?Ke`=#n1=p1
z)H}<o-;bRua=~+K;8`z2buwS>f8uqs(i5-JE8VWYA@GvMdjBocLAxtyatbueptzm~
zp8a5QKk^3Yk*`zHi#<7rQ3M4>5yoBL2Lt(#&+WUM31KVJ(08Z7-;f6XGvJwivR>^F
z^k^@tooe3xkS3k?)8JQ9&l5P8K!?CjF?xcsTmeOME%2<ba%E?9Ke#zfI(vbi27TD9
z^g;LIe+8a$*6$U6U!^|@kDpWVbCSYyV~+J&l7_w>c(xrLF>Spz0#E+Eihs?|x6`Ea
zvPcK|aG6XeL+O9R5vlpSDh>YDH24?N;NMPzuVMdUEs*ker@;@U!9OSP7-y>b%~9#R
z2|Vj%O+c2H`+9htg`sw;e7$M#mkT`lyVIN^z7m`9!!-22QuM<~{mx&3w~G`KZ==9d
zuk`!zU|U>=pyMN-LxoO>(D#3Ihy@lDeSvO&pgrUZ@y$v{i7^i47>_C&kD4<cHFrE}
z-Z)h0_#8`1$5WkQ_?CE<FRb+7_1Mm}KDSSm%%_j%@QLF&e6iy>#=q9<`1c%6Gslku
zBwRIkAK2k5uU=HMC=m3oaCr$j&fswX-j240re>Vs;BIZer*l6sM&{wYT5qTW@7;c4
zSu83^nYzbuhI)HF*tD*-F4Wl(2#SK%h8%Nzi#uDz`4>K%(-Cl#`FJpb59eRtP?`?6
z<pds=qXfr$r~p?D-tP5Pwr=p@9F@A7rL|=~Bv$TQCgb^HM_#b72stC34G!g~$I7;Q
zaaXF7F02_=AU~WB(RNt?^=Hiwxgp)!kf+?|Yii>g%>Y-pV{cijmr(yr8bnd8uu6h(
z?I)R8twjpVY}F^0SzALxb6Z_~@%j!Ps?t&1w)V3)2*xPp`};l>h^B!D4y@;N_+lQg
zGCr^#O|7G;9j6$j3hQd}<IV6Es9A7)a9evQSd4R6_z<MHBuzLP?PaL~Lp=T^gb<$U
z<U{*zuMLE%>soNuia1zC7tDv#p*orZK_5;SNENif*P0>{4mE1`;rtjGje;tU7u44g
zSZ5^TI$MeLcZ7nW&W46!zk$OF0_$*o3{E=<wfOwac=Qtl1NCjbb>bKYUp-`o^gFu^
z%AgtNqSP0cm&~n5P2_7p6JR0gHi#l^Fd90*xUasmrDX%6SRk~grceT@&$qaya+%BL
zs$S$ntMV<WUg>k03TZB?F?@?IsIFY*u0mKs<oZNJ5K>1oR91ia;>ESD6}}af3q3Bj
z)#}=|G90qx@;jYNJnn^6t5^HVisy)c&^&)*M_X%KnQv98qcpeyVi7X&Usl%Iw%*m1
z5Tn=u8CYB2N1PyIF|!r2)5N(Li%O-5jGeVm-mXsla`4~-pE{t*#k0=lG@(auI3!A(
z`jOB*%oQgkIZAj)kq=tYy+L#{B|dF_%KUBh0UwX3;)xt0ZW#_YD#P((?s^x*gFdK<
zGSDyeCmpv_RqFCC^?wwFHuy|-PVn*$oPVLxWwNm{YEI(?OzbCQ_&gj}<Zs{L@^*Qb
zcC{G3fN1g-_9Pj&Vs9#n$u=x(b9sa6MPSw$=9m+cxUU(Sj-w-FBnMb!=MdT;@!%7d
z9W9}y2|ZIFv9?7aYC|{!z~9~Na5ze>M@hN;=vN&6#yT{j4pc$V?RVAI;pRGnji#<6
zK<OoFPpN}R3Te?c%#&wb&1vWe1Sq*K^lJ0u8B%U9s;AD4^FCan;$pIltJ0kHI8;sw
z^5gT!zD=HEMJ`)XuxYXSAEo5(<vyH+)70w28E$Nn{_Z;8T3DA>AJop@=yam3RW5Y<
z9K~e@PTj(Baw;!hX>n=sT*~9)bI(?kisg70{822&6+SIhmAh1^QPTNSvOS2S+^9Em
z0vJl9(gO}p9A#2lFvR1*aBf(m5}&Jfo-cuMB{6Yk8T3z$uF+f*1gDh7QN|X8v!K?s
z@?=5OJrC3C_MzbjWU^#yL!~7?UkK)Hy-%LwCr`IZ)=L8kphroJUbnWbBMF5rBG~4W
z11MD73b#neQo+Ri3)LAjO>@{P${Xu~z6P9h$R?{zlWhAgqbu0j-qF+=YDi=@CLpvs
z3?J9FwKWIoT1A`x*v(gPQ`;s-e>iF{<ZglWsBK%3SaZef3DB?1ZD{TcHYVw#Zsv{(
z))>!#YpFwDFOPy_o0S6r(KE}AxVdR9MY^gQ!(5u1y0uMR4vbsTJ>&2sVg1qnVTO>T
z7*Mo|SRJ>mYx1Y5V%aijY0~LfeKST6qPGa3Nu$s3``ViVx+J1%N*zM@s+aQVt}9hV
zu{Ri3N4hrk$#SLTfo>R2f2gu!U9hsXz9w*aaB)Xli>Iz-ZGD}~>u>RDQy;?7iH-_2
zk3cQgwSbGD-xp$aS%$+&eVC}snDLBtw&koAiqq|h^|Y}-S7}+vJoFgV80R}mWnRj}
z*Us^Y1Dza>jsWH{t+H3{Vgo|g6)&$tj4ecOTemitx>rOu&Hl?#Mtz4I0yxtT-8B2D
ze?@17<%J39ZW=Fl!3ewk21~bJ-|S5^q7Y<ls5$5!->;>zXZ{tiW^;YxY>Dr}*7b?~
ziPrYmpi}C4tZh5WV7{PuO08Ti$^AR42%Rd9nCuqS9gC?)I!Wj1=|PrOH$^sYdF{#&
zwCD^}{_@&oZS|ea0aMHdVb|FvS1ha2<4{P#G0*2y#v7_43_*%6Kb2@=rryhmX|qxb
zIp&mR1JlX5ejY=G@dD<&%Y5sb>I1D}fSY7ViX9v?SQI=>nOzuk2Lf>olznT8NokU-
zTn3~OXw{k!@0DYXMvdOY@Kjd<7ZId{Wbd-Jt{(k;Fr<@-jjz#3`f=Q3f(Q^dJ~mXX
zAXS4@L9RKDvWkz_9LE___JhHue`HHzdL>3=7>G(m)P0YrhJUGTjvw=t>mL6j#(fwA
z%ZPI;*%!;9UXo6ySVNjCrb42VLEq834i(ef?28R?q30Y})5LSa#Nn47bH>WAO3VQ$
z4*Yagw4;Z^`i%cF*K!~j=^wLEhQX0!Ii^XfLLH^FzOl}ui{rvjn{Fm?4NT6X9CTO=
zXlmHt>gZ_esKV^Vh1rR3E&9h;X~f`KOhvS<lVvP#Y72@bra5j*L8}}|%}f$~+>yRm
zlIjScD42(|ptDLjk{+k*^O}M_e|x8>BG^K|&mZg*Z691%T5PJWEMZ)NDMOlZiDmE}
zpD>8NPzyEf&{xjsL~nu`Ofic0`POxJ`!I(JwzXo|iJ4SaNz$MsWr=YpvM6yoOhy3q
z;<CU7pFBKwoYjgiIHi<9s6q~{QKczI-*f#K{dKrtph|siR6Bkc&uHTqvrW|)IIU~#
z<Y)_ozEGR5TWZ+9G={~*Z-vjhxXFuQJ~W}W+~<X5_jT2Yi6+*|*ST717y7P%!g7uz
z>}Imqa7uH~)imB%ete@d2Wv9*VrrMz7Z+m+ih+Pd;$j%9wL;r^ESk4qRiO!sKM<pJ
zcAa!8yBMx~<dTC<IyStLvl!j{gVc$Yt?R+A4+olewy>J;m;sxW|Ft&Bal2G2S53?K
z!uwDis>N~Hig_f@$Irmw=s2pm<0DKnq~Oz56JtUgOli>OjGvY85K8gDM6LadtJ_%S
zrSM^56Ca&pIK)A35C`FF8OGB>Tb2b8h7Yrgrt$M?CSAtiXWSC{*0r>?N@K~@HmkKs
zNSnPvqQzV^&SG*^v;~iW;KF_jw^930kU&SfQH;ag1I3vB&xZON#b|8B80<D0#q}Fn
z5m~w+EYC7TonD^+_z;FkNgX37Uwbpwhq)4H6mvXi6pLys?r4+CMZPLeW%Uvt763iV
zD;N0|uB={!CBRzug)TYgnyn63_N68i^D<3S9B5RFmyPvcL_^@vk7<_WIhbTfu4_t$
zw4Y3|1mI7UwyvegkN9oi8@FOn7{PckdNG4b&Yaon=W+i_m+$}ZnWB0;8QX`?cY%2&
z?}*mVA7!XvoB$8D;Kkza&U6C8yYec&T|n_$cHAp`4%`pm9UGm0B-1JI5rt?J5cfvP
zD_6PNSpX0BBIx*f|G!u5bJ$DfaPhe;dDrpvbIvN@NUG!O_XG;m1_%A#5=g|AT>hoN
z@|__aU%yXqDV}%p`mS_h{A)Vxu0}ZDLDH~(?;sb?t$B?~NAOP>X#N#ioQFlcj<4TO
zIH=+eE5c;?>GEHWaE2{ZboxE2t%^XucSRaJDvsr^<9`k~$^_dt<Yjj%S31-$>!tb7
zxGs3C@$D+U-7YD5k|OARIoiD@DZbvfzPV7wU%6bm`mW<?_&Rv3`Rn)O4hAI!wwonf
zN$iL-n;2iqU+<eVdSo;&_GMbH<os_%Ami&j0s6fSZ&=1ku5Z%v()exgTl3fNcdSwI
z^?q{^3Ag0@pG}Id_Ze@xL&o5_B-Sgr{G$l8=C9uu+50sa%N|n<32VM}n(rpX*YA}?
zz9lJ!R6Ex6$@xz~=GdAi+AwMK{^mRHk}<TNN+>Qj%|`*^V=G-OzJ5<-SjA74myV}h
zo>|25Yc}<M&V4#Q11(o_dJcqBL^{5H?`8iFWh9=9#Y^ui(fR6h<|pN^-;Wvnk&LJ5
zBs9MK=Oo3Cy+^Y}#^5<a)=THFT{9`Zcc)X3d+(O9(&aBharPhLGc8^Io}Eq+v_{2e
z{a7!j6@b51<zJG7*YWF;@H#oGn^Z&*W3S48FZQwVIu^eg{B*gsUa@&=-r<d1Lk~%B
cvED$cLUg{Ga2h<R;&0n8DK1WmkOUh44_ye<EC2ui