From 3f6cf1e39ff4563e4bb6255d955fa822eee7d84c Mon Sep 17 00:00:00 2001
From: Kevin <kpostlet@redhat.com>
Date: Fri, 3 Mar 2023 14:07:22 -0500
Subject: [PATCH 1/4] create classes for submitting and watching DDP jobs

Signed-off-by: Kevin <kpostlet@redhat.com>
---
 src/codeflare_sdk/cluster/cluster.py |  16 +++-
 src/codeflare_sdk/job/__init__.py    |   0
 src/codeflare_sdk/job/jobs.py        | 124 +++++++++++++++++++++++++++
 3 files changed, 139 insertions(+), 1 deletion(-)
 create mode 100644 src/codeflare_sdk/job/__init__.py
 create mode 100644 src/codeflare_sdk/job/jobs.py

diff --git a/src/codeflare_sdk/cluster/cluster.py b/src/codeflare_sdk/cluster/cluster.py
index b98eeb54..80fcd869 100644
--- a/src/codeflare_sdk/cluster/cluster.py
+++ b/src/codeflare_sdk/cluster/cluster.py
@@ -20,7 +20,7 @@
 
 from os import stat
 from time import sleep
-from typing import List, Optional, Tuple
+from typing import List, Optional, Tuple, Dict
 
 import openshift as oc
 from ray.job_submission import JobSubmissionClient
@@ -45,6 +45,8 @@ class Cluster:
     Note that currently, the underlying implementation is a Ray cluster.
     """
 
+    torchx_scheduler = "ray"
+
     def __init__(self, config: ClusterConfiguration):
         """
         Create the resource cluster object by passing in a ClusterConfiguration
@@ -268,6 +270,18 @@ def job_logs(self, job_id: str) -> str:
         client = JobSubmissionClient(dashboard_route)
         return client.get_job_logs(job_id)
 
+    def torchx_config(self, working_dir: str = None, requirements: str = None) -> Dict[str, str]:
+        dashboard_address = f"{self.cluster_dashboard_uri().lstrip('http://')}"
+        to_return = {
+            "cluster_name": self.config.name,
+            "dashboard_address": dashboard_address,
+        }
+        if working_dir:
+            to_return["working_dir"] = working_dir
+        if requirements:
+            to_return["requirements"] = requirements
+        return to_return
+
 
 def get_current_namespace() -> str:
     """
diff --git a/src/codeflare_sdk/job/__init__.py b/src/codeflare_sdk/job/__init__.py
new file mode 100644
index 00000000..e69de29b
diff --git a/src/codeflare_sdk/job/jobs.py b/src/codeflare_sdk/job/jobs.py
new file mode 100644
index 00000000..6fa12e94
--- /dev/null
+++ b/src/codeflare_sdk/job/jobs.py
@@ -0,0 +1,124 @@
+# Copyright 2023 IBM, Red Hat
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#      http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+
+import abc
+from typing import TYPE_CHECKING, Optional, Dict, List
+from pathlib import Path
+
+from torchx.components.dist import ddp
+from torchx.runner import get_runner
+from torchx.specs import AppHandle, parse_app_handle, AppDryRunInfo
+
+if TYPE_CHECKING:
+    from ..cluster.cluster import Cluster
+
+all_jobs: List["Job"] = []
+torchx_runner = get_runner()
+
+class JobDefinition(metaclass=abc.ABCMeta):
+    def _dry_run(self, cluster: "Cluster"):
+        pass
+
+    def submit(self, cluster: "Cluster"):
+        pass
+
+
+class Job(metaclass=abc.ABCMeta):
+    def status(self):
+        pass
+
+    def logs(self):
+        pass
+
+
+class DDPJobDefinition(JobDefinition):
+
+    def __init__(
+        self,
+        script: Optional[str] = None,
+        m: Optional[str]=None,
+        script_args: Optional[List[str]] = None,
+        name: Optional[str] = None,
+        cpu: Optional[int] = None,
+        gpu: Optional[int] = None,
+        memMB: Optional[int] = None,
+        h: Optional[str] = None,
+        j: Optional[str] = None,
+        env: Optional[Dict[str, str]] = None,
+        max_retries: int = 0,
+        mounts: Optional[List[str]] = None,
+        rdzv_port: int = 29500,
+        scheduler_args: Optional[Dict[str, str]] = None,
+    ):
+        if bool(script) == bool(m):  # logical XOR
+            raise ValueError("Exactly one of the following arguments must be defined: [script, m].")
+        self.script = script
+        self.m=m
+        self.script_args: List[str] = script_args if script_args is not None else []
+        self.name = name
+        self.cpu = cpu
+        self.gpu = gpu
+        self.memMB = memMB
+        self.h = h
+        self.j = j
+        self.env: Dict[str, str] = env if env is not None else dict()
+        self.max_retries = max_retries
+        self.mounts: List[str] = mounts if mounts is not None else []
+        self.rdzv_port = rdzv_port
+        self.scheduler_args: Dict[str, str] = scheduler_args if scheduler_args is not None else dict()
+
+    def _dry_run(self, cluster: "Cluster"):
+        j = f"{cluster.config.max_worker}x{max(cluster.config.gpu, 1)}"  # # of proc. = # of gpus
+        return torchx_runner.dryrun(
+            app=ddp(
+                *self.script_args,
+                script=self.script,
+                m=self.m,
+                name=self.name,
+                h=self.h,
+                cpu=self.cpu if self.cpu is not None else cluster.config.max_cpus,
+                gpu=self.gpu if self.gpu is not None else cluster.config.gpu,
+                memMB=self.memMB if self.memMB is not None else cluster.config.max_memory * 1024,
+                j=self.j if self.j is not None else j,
+                env=self.env,
+                max_retries=self.max_retries,
+                rdzv_port=self.rdzv_port,
+                mounts=self.mounts,
+            ),
+            scheduler=cluster.torchx_scheduler,
+            cfg=cluster.torchx_config(**self.scheduler_args),
+            workspace=f"file://{Path.cwd()}"
+        )
+
+    def submit(self, cluster: "Cluster") -> "Job":
+        return DDPJob(self, cluster)
+
+
+class DDPJob(Job):
+    def __init__(
+        self,
+        job_definition: "DDPJobDefinition",
+        cluster: "Cluster"
+    ):
+        self.job_definition = job_definition
+        self.cluster = cluster
+        self._app_handle = torchx_runner.schedule(job_definition._dry_run(cluster))
+        all_jobs.append(self)
+
+    def status(self) -> str:
+        return torchx_runner.status(self._app_handle)
+
+    def logs(self) -> str:
+        return "".join(torchx_runner.log_lines(self._app_handle, None))

From 60ef21d3a641dc6b42e214c5b2dd3d8f208cd333 Mon Sep 17 00:00:00 2001
From: Kevin <kpostlet@redhat.com>
Date: Fri, 3 Mar 2023 16:10:58 -0500
Subject: [PATCH 2/4] update demo notebook to use new job class

Signed-off-by: Kevin <kpostlet@redhat.com>
---
 demo-notebooks/batch-job/batch_mnist.ipynb | 1873 +-------------------
 src/codeflare_sdk/cluster/cluster.py       |    4 +-
 src/codeflare_sdk/job/jobs.py              |   26 +-
 3 files changed, 95 insertions(+), 1808 deletions(-)

diff --git a/demo-notebooks/batch-job/batch_mnist.ipynb b/demo-notebooks/batch-job/batch_mnist.ipynb
index 0b0c25f6..4d434640 100644
--- a/demo-notebooks/batch-job/batch_mnist.ipynb
+++ b/demo-notebooks/batch-job/batch_mnist.ipynb
@@ -2,7 +2,7 @@
  "cells": [
   {
    "cell_type": "code",
-   "execution_count": 12,
+   "execution_count": 1,
    "id": "b55bc3ea-4ce3-49bf-bb1f-e209de8ca47a",
    "metadata": {},
    "outputs": [],
@@ -14,7 +14,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 2,
    "id": "614daa0c",
    "metadata": {},
    "outputs": [],
@@ -38,10 +38,18 @@
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 3,
    "id": "0f4bc870-091f-4e11-9642-cba145710159",
    "metadata": {},
-   "outputs": [],
+   "outputs": [
+    {
+     "name": "stdout",
+     "output_type": "stream",
+     "text": [
+      "Written to: mnisttest.yaml\n"
+     ]
+    }
+   ],
    "source": [
     "# Create our cluster and submit appwrapper\n",
     "cluster = Cluster(ClusterConfiguration(name='mnisttest', min_worker=2, max_worker=2, min_cpus=8, max_cpus=8, min_memory=16, max_memory=16, gpu=4, instascale=True, machine_types=[\"m5.xlarge\", \"p3.8xlarge\"]))"
@@ -57,7 +65,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": null,
+   "execution_count": 4,
    "id": "f0884bbc-c224-4ca0-98a0-02dfa09c2200",
    "metadata": {},
    "outputs": [],
@@ -77,50 +85,20 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 17,
+   "execution_count": 11,
    "id": "3c1b4311-2e61-44c9-8225-87c2db11363d",
    "metadata": {},
    "outputs": [
     {
-     "data": {
-      "text/html": [
-       "<pre style=\"white-space:pre;overflow-x:auto;line-height:normal;font-family:Menlo,'DejaVu Sans Mono',consolas,'Courier New',monospace\">╭─────────────────────────╮\n",
-       "│ <span style=\"font-style: italic\"> </span><span style=\"font-weight: bold; font-style: italic\"> 🚀 List of CodeFlare</span><span style=\"font-style: italic\"> </span> │\n",
-       "│ <span style=\"font-style: italic\">  </span><span style=\"font-weight: bold; font-style: italic\">clusters in queue🚀</span><span style=\"font-style: italic\">  </span> │\n",
-       "│ +-----------+---------+ │\n",
-       "│ |<span style=\"font-weight: bold\"> Name      </span>|<span style=\"font-weight: bold\"> Status  </span>| │\n",
-       "│ +===========+=========+ │\n",
-       "│ |<span style=\"color: #008080; text-decoration-color: #008080\"> mnisttest </span>|<span style=\"color: #800080; text-decoration-color: #800080\"> pending </span>| │\n",
-       "│ |<span style=\"color: #008080; text-decoration-color: #008080\">           </span>|<span style=\"color: #800080; text-decoration-color: #800080\">         </span>| │\n",
-       "│ +-----------+---------+ │\n",
-       "╰─────────────────────────╯\n",
-       "</pre>\n"
-      ],
-      "text/plain": [
-       "╭─────────────────────────╮\n",
-       "│ \u001b[3m \u001b[0m\u001b[1;3m 🚀 List of CodeFlare\u001b[0m\u001b[3m \u001b[0m │\n",
-       "│ \u001b[3m  \u001b[0m\u001b[1;3mclusters in queue🚀\u001b[0m\u001b[3m  \u001b[0m │\n",
-       "│ +-----------+---------+ │\n",
-       "│ |\u001b[1m \u001b[0m\u001b[1mName     \u001b[0m\u001b[1m \u001b[0m|\u001b[1m \u001b[0m\u001b[1mStatus \u001b[0m\u001b[1m \u001b[0m| │\n",
-       "│ +===========+=========+ │\n",
-       "│ |\u001b[36m \u001b[0m\u001b[36mmnisttest\u001b[0m\u001b[36m \u001b[0m|\u001b[35m \u001b[0m\u001b[35mpending\u001b[0m\u001b[35m \u001b[0m| │\n",
-       "│ |\u001b[36m \u001b[0m\u001b[36m         \u001b[0m\u001b[36m \u001b[0m|\u001b[35m \u001b[0m\u001b[35m       \u001b[0m\u001b[35m \u001b[0m| │\n",
-       "│ +-----------+---------+ │\n",
-       "╰─────────────────────────╯\n"
-      ]
-     },
-     "metadata": {},
-     "output_type": "display_data"
-    },
-    {
-     "data": {
-      "text/plain": [
-       "(False, <CodeFlareClusterStatus.QUEUED: 2>)"
-      ]
-     },
-     "execution_count": 17,
-     "metadata": {},
-     "output_type": "execute_result"
+     "ename": "AttributeError",
+     "evalue": "'Cluster' object has no attribute 'is_ready'",
+     "output_type": "error",
+     "traceback": [
+      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
+      "\u001b[0;31mAttributeError\u001b[0m                            Traceback (most recent call last)",
+      "Cell \u001b[0;32mIn[11], line 1\u001b[0m\n\u001b[0;32m----> 1\u001b[0m \u001b[43mcluster\u001b[49m\u001b[38;5;241;43m.\u001b[39;49m\u001b[43mis_ready\u001b[49m()\n",
+      "\u001b[0;31mAttributeError\u001b[0m: 'Cluster' object has no attribute 'is_ready'"
+     ]
     }
    ],
    "source": [
@@ -158,51 +136,37 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 18,
+   "execution_count": 5,
    "id": "7fd45bc5-03c0-4ae5-9ec5-dd1c30f1a084",
    "metadata": {},
    "outputs": [
     {
      "data": {
       "text/html": [
-       "<pre style=\"white-space:pre;overflow-x:auto;line-height:normal;font-family:Menlo,'DejaVu Sans Mono',consolas,'Courier New',monospace\"><span style=\"font-style: italic\">                 </span><span style=\"font-weight: bold; font-style: italic\"> 🚀 List of CodeFlare clusters 🚀</span><span style=\"font-style: italic\">                  </span>\n",
+       "<pre style=\"white-space:pre;overflow-x:auto;line-height:normal;font-family:Menlo,'DejaVu Sans Mono',consolas,'Courier New',monospace\"><span style=\"font-style: italic\">                  </span><span style=\"font-weight: bold; font-style: italic\"> 🚀 CodeFlare Cluster Status 🚀</span><span style=\"font-style: italic\">                   </span>\n",
        "<span style=\"font-weight: bold\">                                                                    </span>\n",
        " ╭────────────────────────────────────────────────────────────────╮ \n",
-       " │   <span style=\"color: #c0c0c0; text-decoration-color: #c0c0c0; background-color: #008000; font-weight: bold\">Owner</span>                                                        │ \n",
+       " │   <span style=\"color: #c0c0c0; text-decoration-color: #c0c0c0; background-color: #008000; font-weight: bold\">Name</span>                                                         │ \n",
        " │   <span style=\"font-weight: bold; text-decoration: underline\">mnisttest</span>                                        Active ✅   │ \n",
        " │                                                                │ \n",
        " │   <span style=\"font-weight: bold\">URI:</span> ray://mnisttest-head-svc.default.svc:10001              │ \n",
        " │                                                                │ \n",
-       " │   <a href=\"ray-dashboard-mnisttest-default.apps.prepfullinstall.psap.aws.rhperfscale.org\" target=\"_blank\"><span style=\"color: #000080; text-decoration-color: #000080; text-decoration: underline\">Dashboard🔗</span></a>                                                  │ \n",
+       " │   <a href=\"ray-dashboard-mnisttest-default.apps.kpostoffice.dev.datahub.redhat.com\" target=\"_blank\"><span style=\"color: #000080; text-decoration-color: #000080; text-decoration: underline\">Dashboard🔗</span></a>                                                  │ \n",
        " │                                                                │ \n",
-       " │  <span style=\"font-style: italic\">                    Cluster Resources                     </span>    │ \n",
-       " │   ╭─ Workers ──╮  ╭───────── Worker specs(each) ─────────╮     │ \n",
-       " │   │ <span style=\"font-weight: bold\"> Min  Max </span> │  │ <span style=\"font-weight: bold\"> Memory      CPU         GPU        </span> │     │ \n",
-       " │   │ <span style=\"color: #008080; text-decoration-color: #008080\">     </span><span style=\"color: #800080; text-decoration-color: #800080\">     </span> │  │ <span style=\"color: #008080; text-decoration-color: #008080\">            </span><span style=\"color: #800080; text-decoration-color: #800080\">                        </span> │     │ \n",
-       " │   │ <span style=\"color: #008080; text-decoration-color: #008080\"> 2   </span><span style=\"color: #800080; text-decoration-color: #800080\"> 2   </span> │  │ <span style=\"color: #008080; text-decoration-color: #008080\"> 16G~16G    </span><span style=\"color: #800080; text-decoration-color: #800080\"> 8           4          </span> │     │ \n",
-       " │   │ <span style=\"color: #008080; text-decoration-color: #008080\">     </span><span style=\"color: #800080; text-decoration-color: #800080\">     </span> │  │ <span style=\"color: #008080; text-decoration-color: #008080\">            </span><span style=\"color: #800080; text-decoration-color: #800080\">                        </span> │     │ \n",
-       " │   ╰────────────╯  ╰──────────────────────────────────────╯     │ \n",
        " ╰────────────────────────────────────────────────────────────────╯ \n",
        "</pre>\n"
       ],
       "text/plain": [
-       "\u001b[3m                 \u001b[0m\u001b[1;3m 🚀 List of CodeFlare clusters 🚀\u001b[0m\u001b[3m                  \u001b[0m\n",
+       "\u001b[3m                  \u001b[0m\u001b[1;3m 🚀 CodeFlare Cluster Status 🚀\u001b[0m\u001b[3m                   \u001b[0m\n",
        "\u001b[1m \u001b[0m\u001b[1m                                                                  \u001b[0m\u001b[1m \u001b[0m\n",
        " ╭────────────────────────────────────────────────────────────────╮ \n",
-       " │   \u001b[1;37;42mOwner\u001b[0m                                                        │ \n",
+       " │   \u001b[1;37;42mName\u001b[0m                                                         │ \n",
        " │   \u001b[1;4mmnisttest\u001b[0m                                        Active ✅   │ \n",
        " │                                                                │ \n",
        " │   \u001b[1mURI:\u001b[0m ray://mnisttest-head-svc.default.svc:10001              │ \n",
        " │                                                                │ \n",
-       " │   \u001b]8;id=309861;ray-dashboard-mnisttest-default.apps.prepfullinstall.psap.aws.rhperfscale.org\u001b\\\u001b[4;34mDashboard🔗\u001b[0m\u001b]8;;\u001b\\                                                  │ \n",
+       " │   \u001b]8;id=464037;ray-dashboard-mnisttest-default.apps.kpostoffice.dev.datahub.redhat.com\u001b\\\u001b[4;34mDashboard🔗\u001b[0m\u001b]8;;\u001b\\                                                  │ \n",
        " │                                                                │ \n",
-       " │  \u001b[3m                    Cluster Resources                     \u001b[0m    │ \n",
-       " │   ╭─ Workers ──╮  ╭───────── Worker specs(each) ─────────╮     │ \n",
-       " │   │ \u001b[1m \u001b[0m\u001b[1mMin\u001b[0m\u001b[1m \u001b[0m\u001b[1m \u001b[0m\u001b[1mMax\u001b[0m\u001b[1m \u001b[0m │  │ \u001b[1m \u001b[0m\u001b[1mMemory    \u001b[0m\u001b[1m \u001b[0m\u001b[1m \u001b[0m\u001b[1mCPU       \u001b[0m\u001b[1m \u001b[0m\u001b[1m \u001b[0m\u001b[1mGPU       \u001b[0m\u001b[1m \u001b[0m │     │ \n",
-       " │   │ \u001b[36m \u001b[0m\u001b[36m   \u001b[0m\u001b[36m \u001b[0m\u001b[35m \u001b[0m\u001b[35m   \u001b[0m\u001b[35m \u001b[0m │  │ \u001b[36m \u001b[0m\u001b[36m          \u001b[0m\u001b[36m \u001b[0m\u001b[35m \u001b[0m\u001b[35m          \u001b[0m\u001b[35m \u001b[0m\u001b[35m \u001b[0m\u001b[35m          \u001b[0m\u001b[35m \u001b[0m │     │ \n",
-       " │   │ \u001b[36m \u001b[0m\u001b[36m2  \u001b[0m\u001b[36m \u001b[0m\u001b[35m \u001b[0m\u001b[35m2  \u001b[0m\u001b[35m \u001b[0m │  │ \u001b[36m \u001b[0m\u001b[36m16G~16G   \u001b[0m\u001b[36m \u001b[0m\u001b[35m \u001b[0m\u001b[35m8         \u001b[0m\u001b[35m \u001b[0m\u001b[35m \u001b[0m\u001b[35m4         \u001b[0m\u001b[35m \u001b[0m │     │ \n",
-       " │   │ \u001b[36m \u001b[0m\u001b[36m   \u001b[0m\u001b[36m \u001b[0m\u001b[35m \u001b[0m\u001b[35m   \u001b[0m\u001b[35m \u001b[0m │  │ \u001b[36m \u001b[0m\u001b[36m          \u001b[0m\u001b[36m \u001b[0m\u001b[35m \u001b[0m\u001b[35m          \u001b[0m\u001b[35m \u001b[0m\u001b[35m \u001b[0m\u001b[35m          \u001b[0m\u001b[35m \u001b[0m │     │ \n",
-       " │   ╰────────────╯  ╰──────────────────────────────────────╯     │ \n",
        " ╰────────────────────────────────────────────────────────────────╯ \n"
       ]
      },
@@ -212,10 +176,10 @@
     {
      "data": {
       "text/plain": [
-       "<RayClusterStatus.READY: 'ready'>"
+       "(<CodeFlareClusterStatus.READY: 1>, True)"
       ]
      },
-     "execution_count": 18,
+     "execution_count": 5,
      "metadata": {},
      "output_type": "execute_result"
     }
@@ -234,46 +198,12 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 19,
+   "execution_count": 5,
    "id": "3cc6183a-8f6e-4347-af91-d088ed422544",
    "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "environemnt before exec ddp from torchx {'LOGLEVEL': 'DEBUG', 'TORCH_DISTRIBUTED_DEBUG': 'DETAIL'}\n",
-      "\u001b[34mtorchx\u001b[0m \u001b[2m2022-11-04 15:04:31 INFO    \u001b[0m Checking for changes in workspace `file:///opt/app-root/src/codeflare/notebooks/jobs`...\n",
-      "\u001b[34mtorchx\u001b[0m \u001b[2m2022-11-04 15:04:31 INFO    \u001b[0m To disable workspaces pass: --workspace=\"\" from CLI or workspace=None programmatically.\n",
-      "\u001b[34mtorchx\u001b[0m \u001b[2m2022-11-04 15:04:31 INFO    \u001b[0m Built new image `/tmp/torchx_workspace3c_d437b` based on original image `ghcr.io/pytorch/torchx:0.3.0dev0` and changes in workspace `file:///opt/app-root/src/codeflare/notebooks/jobs` for role[0]=mnist.\n",
-      "\u001b[34mtorchx\u001b[0m \u001b[2m2022-11-04 15:04:31 WARNING \u001b[0m The Ray scheduler does not support port mapping.\n",
-      "\u001b[34mtorchx\u001b[0m \u001b[2m2022-11-04 15:04:31 INFO    \u001b[0m Uploading package gcs://_ray_pkg_ce2c3e935774455d.zip.\n",
-      "\u001b[34mtorchx\u001b[0m \u001b[2m2022-11-04 15:04:31 INFO    \u001b[0m Creating a file package for local directory '/tmp/torchx_workspace3c_d437b'.\n",
-      "ray://torchx/mnisttest-head-svc.default.svc:8265-mnist-jlm13hx5g53mk\n",
-      "\u001b[34mtorchx\u001b[0m \u001b[2m2022-11-04 15:04:31 INFO    \u001b[0m Launched app: ray://torchx/mnisttest-head-svc.default.svc:8265-mnist-jlm13hx5g53mk\n",
-      "\u001b[34mtorchx\u001b[0m \u001b[2m2022-11-04 15:04:31 INFO    \u001b[0m AppStatus:\n",
-      "  msg: PENDING\n",
-      "  num_restarts: -1\n",
-      "  roles:\n",
-      "  - replicas:\n",
-      "    - hostname: <NONE>\n",
-      "      id: 0\n",
-      "      role: ray\n",
-      "      state: !!python/object/apply:torchx.specs.api.AppState\n",
-      "      - 2\n",
-      "      structured_error_msg: <NONE>\n",
-      "    role: ray\n",
-      "  state: PENDING (2)\n",
-      "  structured_error_msg: <NONE>\n",
-      "  ui_url: null\n",
-      "\n",
-      "\u001b[34mtorchx\u001b[0m \u001b[2m2022-11-04 15:04:31 INFO    \u001b[0m Job URL: None\n",
-      "\u001b[0m"
-     ]
-    }
-   ],
+   "outputs": [],
    "source": [
-    "! torchx run -s ray -cfg dashboard_address=mnisttest-head-svc.default.svc:8265,requirements=requirements.txt dist.ddp -j 2x4 --gpu 4 --script mnist.py"
+    "from codeflare_sdk.job.jobs import DDPJobDefinition"
    ]
   },
   {
@@ -286,1726 +216,79 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 31,
+   "execution_count": 6,
    "id": "ced6ccd6-a17e-413a-a0e4-65004fc35463",
-   "metadata": {},
+   "metadata": {
+    "scrolled": true
+   },
    "outputs": [
     {
-     "name": "stdout",
+     "name": "stderr",
      "output_type": "stream",
      "text": [
-      "\u001b[37mJob submission server address\u001b[39m: \u001b[1mhttp://mnisttest-head-svc.default.svc:8265\u001b[22m\n",
-      "{'mnist-jlm13hx5g53mk': JobInfo(status='SUCCEEDED', entrypoint='python3 ray_driver.py', message='Job finished successfully.', error_type=None, start_time=1667574271415, end_time=1667574616127, metadata={}, runtime_env={'working_dir': 'gcs://_ray_pkg_ce2c3e935774455d.zip', 'pip': {'packages': ['pytorch_lightning==1.5.10', 'ray_lightning', 'torchmetrics==0.9.1', 'torchvision==0.12.0'], 'pip_check': False}, '_ray_commit': 'e4ce38d001dbbe09cd21c497fedd03d692b2be3e'})}\n",
-      "\u001b[0m"
+      "The Ray scheduler does not support port mapping.\n"
      ]
     }
    ],
    "source": [
-    "cluster.list_jobs()"
+    "job = DDPJobDefinition(script=\"mnist.py\", scheduler_args={\"requirements\": \"requirements.txt\"}).submit(cluster)"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 30,
+   "execution_count": 7,
    "id": "e5c0b0da-c22e-4142-b096-407ac8aebe5e",
    "metadata": {},
    "outputs": [
     {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\u001b[37mJob submission server address\u001b[39m: \u001b[1mhttp://mnisttest-head-svc.default.svc:8265\u001b[22m\n",
-      "\n",
-      "\u001b[32m-----------------------------------\u001b[39m\n",
-      "\u001b[32mJob 'mnist-jlm13hx5g53mk' succeeded\u001b[39m\n",
-      "\u001b[32m-----------------------------------\u001b[39m\n",
-      "\n",
-      "\u001b[0m"
-     ]
+     "data": {
+      "text/plain": [
+       "AppStatus:\n",
+       "  msg: !!python/object/apply:ray.dashboard.modules.job.common.JobStatus\n",
+       "  - FAILED\n",
+       "  num_restarts: -1\n",
+       "  roles:\n",
+       "  - replicas:\n",
+       "    - hostname: <NONE>\n",
+       "      id: 0\n",
+       "      role: ray\n",
+       "      state: !!python/object/apply:torchx.specs.api.AppState\n",
+       "      - 5\n",
+       "      structured_error_msg: <NONE>\n",
+       "    role: ray\n",
+       "  state: FAILED (5)\n",
+       "  structured_error_msg: <NONE>\n",
+       "  ui_url: null"
+      ]
+     },
+     "execution_count": 7,
+     "metadata": {},
+     "output_type": "execute_result"
     }
    ],
    "source": [
-    "cluster.job_status(\"mnist-jlm13hx5g53mk\")"
+    "job.status()"
    ]
   },
   {
    "cell_type": "code",
-   "execution_count": 29,
+   "execution_count": 8,
    "id": "264c1809-de72-4acf-b0f6-e67d345640f6",
    "metadata": {},
    "outputs": [
     {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "\u001b[37mJob submission server address\u001b[39m: \u001b[1mhttp://mnisttest-head-svc.default.svc:8265\u001b[22m\n",
-      "acrtors: [RayActor(name='mnist', command=['bash', '-c', \"python -m torch.distributed.run --rdzv_backend static --rdzv_endpoint $TORCHX_RANK0_HOST:49782 --rdzv_id 'mnist-jlm13hx5g53mk' --nnodes 2 --nproc_per_node 4 --node_rank '0' --tee 3 --role '' mnist.py\"], env={'LOGLEVEL': 'DEBUG', 'TORCH_DISTRIBUTED_DEBUG': 'DETAIL'}, num_cpus=2, num_gpus=4), RayActor(name='mnist', command=['bash', '-c', \"python -m torch.distributed.run --rdzv_backend static --rdzv_endpoint $TORCHX_RANK0_HOST:49782 --rdzv_id 'mnist-jlm13hx5g53mk' --nnodes 2 --nproc_per_node 4 --node_rank '1' --tee 3 --role '' mnist.py\"], env={'LOGLEVEL': 'DEBUG', 'TORCH_DISTRIBUTED_DEBUG': 'DETAIL'}, num_cpus=2, num_gpus=4)]\n",
-      "Waiting for placement group to start.\n",
-      "here and rank is 0 and 10.131.66.16 49782\n",
-      "finally setting actor remote address and port 10.131.66.16 49782\n",
-      "here and rank is 1 and 10.131.66.16 49782\n",
-      "setting actor remote address and port 10.131.66.16 49782\n",
-      "finally setting actor remote address and port 10.131.66.16 49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m get_actor_address_and_port before:  10.131.66.16 42903\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m get_actor_address_and_port:  10.131.66.16 42903\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m set_address_and_port:  10.131.66.16 49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m get_actor_address_and_port before:  10.131.66.16 53621\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m get_actor_address_and_port:  10.131.66.16 53621\n",
-      "running ray.wait on [ObjectRef(32b0eec39cfa87ac523554acce28b667f9bc98bb0200000001000000), ObjectRef(80b655a2d9b04d4074fb8e3cef07ab2b3516f40e0200000001000000)]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m cmd: ['bash', '-c', \"python -m torch.distributed.run --rdzv_backend static --rdzv_endpoint $TORCHX_RANK0_HOST:49782 --rdzv_id 'mnist-jlm13hx5g53mk' --nnodes 2 --nproc_per_node 4 --node_rank '0' --tee 3 --role '' mnist.py\"]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m worker env: {'NV_LIBCUBLAS_DEV_VERSION': '11.3.1.68-1', 'NV_CUDA_COMPAT_PACKAGE': 'cuda-compat-11-2', 'RAY_IP': 'mnisttest-head-svc', 'MNISTTEST_HEAD_SVC_SERVICE_PORT_GCS': '6379', 'NV_CUDNN_PACKAGE_DEV': 'libcudnn8-dev=8.1.1.33-1+cuda11.2', 'LC_ALL': 'C.UTF-8', 'LD_LIBRARY_PATH': '/usr/local/nvidia/lib:/usr/local/nvidia/lib64', 'NV_LIBNCCL_DEV_PACKAGE': 'libnccl-dev=2.8.4-1+cuda11.2', 'REDIS_PASSWORD': '', 'MNISTTEST_HEAD_SVC_PORT_8265_TCP_PORT': '8265', 'RAY_USAGE_STATS_ENABLED': '0', 'LANG': 'C.UTF-8', 'TZ': 'America/Los_Angeles', 'NV_LIBNPP_DEV_PACKAGE': 'libnpp-dev-11-2=11.2.1.68-1', 'HOSTNAME': 'mnisttest-worker-small-group-mnisttest-wzz2l', 'MNISTTEST_HEAD_SVC_PORT_8265_TCP': 'tcp://172.30.163.155:8265', 'OLDPWD': '/home/ray/workspace', 'MNISTTEST_HEAD_SVC_PORT_10001_TCP_ADDR': '172.30.163.155', 'RAY_CLIENT_MODE': '0', 'RAY_JOB_ID': '02000000', 'MNISTTEST_HEAD_SVC_PORT_6379_TCP_ADDR': '172.30.163.155', 'MNISTTEST_HEAD_SVC_PORT_8265_TCP_ADDR': '172.30.163.155', 'NV_LIBNPP_VERSION': '11.2.1.68-1', 'MNISTTEST_HEAD_SVC_PORT_6379_TCP_PROTO': 'tcp', 'NVIDIA_VISIBLE_DEVICES': 'GPU-d3e8af45-f80b-98a8-dcd8-d3b428c4a4c2,GPU-15e57e64-c38b-9923-8f4a-6c098fdbc062,GPU-d14042c5-219c-5419-9511-ac62c72f90d1,GPU-b0d6ba11-ccb2-c4fb-89ad-01c50e6d393c', 'VIRTUAL_ENV': '/tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/pip/3510e0c008a5c3627e4d2408c8b93ed71be6c3e1/virtualenv', 'NV_LIBCUSPARSE_VERSION': '11.3.1.68-1', 'MNISTTEST_HEAD_SVC_SERVICE_PORT_DASHBOARD': '8265', 'MNISTTEST_HEAD_SVC_SERVICE_PORT_CLIENT': '10001', 'KUBERNETES_PORT_443_TCP_PROTO': 'tcp', 'MNISTTEST_HEAD_SVC_PORT_6379_TCP_PORT': '6379', 'KUBERNETES_PORT_443_TCP_ADDR': '172.30.0.1', 'NV_LIBCUBLAS_DEV_PACKAGE': 'libcublas-dev-11-2=11.3.1.68-1', 'NCCL_VERSION': '2.8.4-1', 'KUBERNETES_PORT': 'tcp://172.30.0.1:443', 'PWD': '/tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/working_dir_files/_ray_pkg_ce2c3e935774455d', 'NVARCH': 'x86_64', 'NV_LIBCUSPARSE_DEV_VERSION': '11.3.1.68-1', 'HOME': '/home/ray', 'RAY_RAYLET_PID': '19', 'NV_ML_REPO_URL': 'https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64', 'NV_LIBNCCL_PACKAGE_VERSION': '2.8.4-1', 'SPT_NOENV': '1', 'KUBERNETES_SERVICE_PORT_HTTPS': '443', 'NV_LIBNCCL_PACKAGE': 'libnccl2=2.8.4-1+cuda11.2', 'NV_LIBNCCL_DEV_PACKAGE_NAME': 'libnccl-dev', 'KUBERNETES_PORT_443_TCP_PORT': '443', 'NV_CUDA_LIB_VERSION': '11.2.0-1', 'NV_ML_REPO_ENABLED': '1', 'NV_LIBNPP_PACKAGE': 'libnpp-11-2=11.2.1.68-1', 'NV_LIBNCCL_PACKAGE_NAME': 'libnccl2', 'LIBRARY_PATH': '/usr/local/cuda/lib64/stubs', 'NV_NVTX_VERSION': '11.2.67-1', 'MNISTTEST_HEAD_SVC_PORT_10001_TCP': 'tcp://172.30.163.155:10001', 'NV_LIBCUBLAS_VERSION': '11.3.1.68-1', 'RAY_ADDRESS': 'mnisttest-head-svc:6379', 'NV_LIBCUBLAS_PACKAGE': 'libcublas-11-2=11.3.1.68-1', 'KUBERNETES_PORT_443_TCP': 'tcp://172.30.0.1:443', 'NV_CUDNN_VERSION': '8.1.1.33', 'RAY_PORT': '6379', 'NV_CUDA_CUDART_DEV_VERSION': '11.2.72-1', 'MNISTTEST_HEAD_SVC_PORT_6379_TCP': 'tcp://172.30.163.155:6379', 'MNISTTEST_HEAD_SVC_PORT_8265_TCP_PROTO': 'tcp', 'MNISTTEST_HEAD_SVC_PORT_10001_TCP_PORT': '10001', 'TERM': 'xterm', 'MNISTTEST_HEAD_SVC_SERVICE_PORT': '6379', 'NV_NVML_DEV_VERSION': '11.2.67-1', 'CUDA_VERSION': '11.2.0', 'NV_LIBCUBLAS_PACKAGE_NAME': 'libcublas-11-2', 'NSS_SDB_USE_CACHE': 'no', 'NVIDIA_DRIVER_CAPABILITIES': 'compute,utility', 'MY_POD_IP': '10.131.66.16', 'SHLVL': '1', 'PYTHONPATH': ':/tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/working_dir_files/_ray_pkg_ce2c3e935774455d:/home/ray/workspace::/home/ray/workspace:', 'NV_LIBCUBLAS_DEV_PACKAGE_NAME': 'libcublas-dev-11-2', 'NVIDIA_REQUIRE_CUDA': 'cuda>=11.2 brand=tesla,driver>=418,driver<419 brand=tesla,driver>=440,driver<441 driver>=450', 'NV_LIBNPP_DEV_VERSION': '11.2.1.68-1', 'KUBERNETES_SERVICE_PORT': '443', 'NV_CUDA_CUDART_VERSION': '11.2.72-1', 'NV_CUDNN_PACKAGE_NAME': 'libcudnn8', 'PATH': '/tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/pip/3510e0c008a5c3627e4d2408c8b93ed71be6c3e1/virtualenv/bin:/home/ray/anaconda3/bin:/home/ray/anaconda3/bin:/usr/local/nvidia/bin:/usr/local/cuda/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin', 'NV_LIBNCCL_DEV_PACKAGE_VERSION': '2.8.4-1', 'MNISTTEST_HEAD_SVC_PORT': 'tcp://172.30.163.155:6379', 'PS1': '(virtualenv) ', 'MNISTTEST_HEAD_SVC_PORT_10001_TCP_PROTO': 'tcp', 'MNISTTEST_HEAD_SVC_SERVICE_HOST': '172.30.163.155', 'KUBERNETES_SERVICE_HOST': '172.30.0.1', 'NV_CUDNN_PACKAGE': 'libcudnn8=8.1.1.33-1+cuda11.2', 'OMP_NUM_THREADS': '1', 'PYTHONBREAKPOINT': 'ray.util.rpdb.set_trace', 'CUDA_VISIBLE_DEVICES': '0,1,2,3', 'LOGLEVEL': 'DEBUG', 'TORCH_DISTRIBUTED_DEBUG': 'DETAIL', 'TORCHX_RANK0_HOST': '10.131.66.16'}\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m set_address_and_port:  10.131.66.16 49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m cmd: ['bash', '-c', \"python -m torch.distributed.run --rdzv_backend static --rdzv_endpoint $TORCHX_RANK0_HOST:49782 --rdzv_id 'mnist-jlm13hx5g53mk' --nnodes 2 --nproc_per_node 4 --node_rank '1' --tee 3 --role '' mnist.py\"]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m worker env: {'NV_LIBCUBLAS_DEV_VERSION': '11.3.1.68-1', 'NV_CUDA_COMPAT_PACKAGE': 'cuda-compat-11-2', 'RAY_IP': 'mnisttest-head-svc', 'MNISTTEST_HEAD_SVC_SERVICE_PORT_GCS': '6379', 'NV_CUDNN_PACKAGE_DEV': 'libcudnn8-dev=8.1.1.33-1+cuda11.2', 'LC_ALL': 'C.UTF-8', 'LD_LIBRARY_PATH': '/usr/local/nvidia/lib:/usr/local/nvidia/lib64', 'NV_LIBNCCL_DEV_PACKAGE': 'libnccl-dev=2.8.4-1+cuda11.2', 'REDIS_PASSWORD': '', 'MNISTTEST_HEAD_SVC_PORT_8265_TCP_PORT': '8265', 'RAY_USAGE_STATS_ENABLED': '0', 'LANG': 'C.UTF-8', 'TZ': 'America/Los_Angeles', 'NV_LIBNPP_DEV_PACKAGE': 'libnpp-dev-11-2=11.2.1.68-1', 'HOSTNAME': 'mnisttest-worker-small-group-mnisttest-hfm8l', 'MNISTTEST_HEAD_SVC_PORT_8265_TCP': 'tcp://172.30.163.155:8265', 'OLDPWD': '/home/ray/workspace', 'MNISTTEST_HEAD_SVC_PORT_10001_TCP_ADDR': '172.30.163.155', 'RAY_CLIENT_MODE': '0', 'RAY_JOB_ID': '02000000', 'MNISTTEST_HEAD_SVC_PORT_6379_TCP_ADDR': '172.30.163.155', 'MNISTTEST_HEAD_SVC_PORT_8265_TCP_ADDR': '172.30.163.155', 'NV_LIBNPP_VERSION': '11.2.1.68-1', 'MNISTTEST_HEAD_SVC_PORT_6379_TCP_PROTO': 'tcp', 'NVIDIA_VISIBLE_DEVICES': 'GPU-48fae530-6bda-e366-3423-864fe847ff3b,GPU-5d8d79bb-5c38-4ef7-0ea8-c91297cbc59f,GPU-8c8b3c0b-ccf8-c06c-f253-0bb90285c4cb,GPU-a8a4e808-841d-c212-2686-a2bd227279b3', 'VIRTUAL_ENV': '/tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/pip/3510e0c008a5c3627e4d2408c8b93ed71be6c3e1/virtualenv', 'NV_LIBCUSPARSE_VERSION': '11.3.1.68-1', 'MNISTTEST_HEAD_SVC_SERVICE_PORT_DASHBOARD': '8265', 'MNISTTEST_HEAD_SVC_SERVICE_PORT_CLIENT': '10001', 'KUBERNETES_PORT_443_TCP_PROTO': 'tcp', 'MNISTTEST_HEAD_SVC_PORT_6379_TCP_PORT': '6379', 'KUBERNETES_PORT_443_TCP_ADDR': '172.30.0.1', 'NV_LIBCUBLAS_DEV_PACKAGE': 'libcublas-dev-11-2=11.3.1.68-1', 'NCCL_VERSION': '2.8.4-1', 'KUBERNETES_PORT': 'tcp://172.30.0.1:443', 'PWD': '/tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/working_dir_files/_ray_pkg_ce2c3e935774455d', 'NVARCH': 'x86_64', 'NV_LIBCUSPARSE_DEV_VERSION': '11.3.1.68-1', 'HOME': '/home/ray', 'RAY_RAYLET_PID': '19', 'NV_ML_REPO_URL': 'https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64', 'NV_LIBNCCL_PACKAGE_VERSION': '2.8.4-1', 'SPT_NOENV': '1', 'KUBERNETES_SERVICE_PORT_HTTPS': '443', 'NV_LIBNCCL_PACKAGE': 'libnccl2=2.8.4-1+cuda11.2', 'NV_LIBNCCL_DEV_PACKAGE_NAME': 'libnccl-dev', 'KUBERNETES_PORT_443_TCP_PORT': '443', 'NV_CUDA_LIB_VERSION': '11.2.0-1', 'NV_ML_REPO_ENABLED': '1', 'NV_LIBNPP_PACKAGE': 'libnpp-11-2=11.2.1.68-1', 'NV_LIBNCCL_PACKAGE_NAME': 'libnccl2', 'LIBRARY_PATH': '/usr/local/cuda/lib64/stubs', 'NV_NVTX_VERSION': '11.2.67-1', 'MNISTTEST_HEAD_SVC_PORT_10001_TCP': 'tcp://172.30.163.155:10001', 'NV_LIBCUBLAS_VERSION': '11.3.1.68-1', 'RAY_ADDRESS': 'mnisttest-head-svc:6379', 'NV_LIBCUBLAS_PACKAGE': 'libcublas-11-2=11.3.1.68-1', 'KUBERNETES_PORT_443_TCP': 'tcp://172.30.0.1:443', 'NV_CUDNN_VERSION': '8.1.1.33', 'RAY_PORT': '6379', 'NV_CUDA_CUDART_DEV_VERSION': '11.2.72-1', 'MNISTTEST_HEAD_SVC_PORT_6379_TCP': 'tcp://172.30.163.155:6379', 'MNISTTEST_HEAD_SVC_PORT_8265_TCP_PROTO': 'tcp', 'MNISTTEST_HEAD_SVC_PORT_10001_TCP_PORT': '10001', 'TERM': 'xterm', 'MNISTTEST_HEAD_SVC_SERVICE_PORT': '6379', 'NV_NVML_DEV_VERSION': '11.2.67-1', 'CUDA_VERSION': '11.2.0', 'NV_LIBCUBLAS_PACKAGE_NAME': 'libcublas-11-2', 'NSS_SDB_USE_CACHE': 'no', 'NVIDIA_DRIVER_CAPABILITIES': 'compute,utility', 'MY_POD_IP': '10.128.68.15', 'SHLVL': '1', 'PYTHONPATH': ':/tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/working_dir_files/_ray_pkg_ce2c3e935774455d:/home/ray/workspace::/home/ray/workspace:', 'NV_LIBCUBLAS_DEV_PACKAGE_NAME': 'libcublas-dev-11-2', 'NVIDIA_REQUIRE_CUDA': 'cuda>=11.2 brand=tesla,driver>=418,driver<419 brand=tesla,driver>=440,driver<441 driver>=450', 'NV_LIBNPP_DEV_VERSION': '11.2.1.68-1', 'KUBERNETES_SERVICE_PORT': '443', 'NV_CUDA_CUDART_VERSION': '11.2.72-1', 'NV_CUDNN_PACKAGE_NAME': 'libcudnn8', 'PATH': '/tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/pip/3510e0c008a5c3627e4d2408c8b93ed71be6c3e1/virtualenv/bin:/home/ray/anaconda3/bin:/home/ray/anaconda3/bin:/usr/local/nvidia/bin:/usr/local/cuda/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin', 'NV_LIBNCCL_DEV_PACKAGE_VERSION': '2.8.4-1', 'MNISTTEST_HEAD_SVC_PORT': 'tcp://172.30.163.155:6379', 'PS1': '(virtualenv) ', 'MNISTTEST_HEAD_SVC_PORT_10001_TCP_PROTO': 'tcp', 'MNISTTEST_HEAD_SVC_SERVICE_HOST': '172.30.163.155', 'KUBERNETES_SERVICE_HOST': '172.30.0.1', 'NV_CUDNN_PACKAGE': 'libcudnn8=8.1.1.33-1+cuda11.2', 'OMP_NUM_THREADS': '1', 'PYTHONBREAKPOINT': 'ray.util.rpdb.set_trace', 'CUDA_VISIBLE_DEVICES': '0,1,2,3', 'LOGLEVEL': 'DEBUG', 'TORCH_DISTRIBUTED_DEBUG': 'DETAIL', 'TORCHX_RANK0_HOST': '10.131.66.16'}\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.launcher.api:Starting elastic_operator with launch configs:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   entrypoint       : mnist.py\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   min_nodes        : 2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   max_nodes        : 2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   nproc_per_node   : 4\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   run_id           : mnist-jlm13hx5g53mk\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   rdzv_backend     : static\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   rdzv_endpoint    : 10.131.66.16:49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   rdzv_configs     : {'rank': 1, 'timeout': 900}\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   max_restarts     : 0\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   monitor_interval : 5\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   log_dir          : None\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   metrics_cfg      : {}\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.elastic.agent.server.local_elastic_agent:log directory set to: /tmp/torchelastic_d2kdqlka/mnist-jlm13hx5g53mk_r9bujvap\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:[] starting workers for entrypoint: python\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:[] Rendezvous'ing worker group\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.launcher.api:Starting elastic_operator with launch configs:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   entrypoint       : mnist.py\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   min_nodes        : 2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   max_nodes        : 2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   nproc_per_node   : 4\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   run_id           : mnist-jlm13hx5g53mk\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   rdzv_backend     : static\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   rdzv_endpoint    : 10.131.66.16:49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   rdzv_configs     : {'rank': 0, 'timeout': 900}\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   max_restarts     : 0\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   monitor_interval : 5\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   log_dir          : None\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   metrics_cfg      : {}\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.elastic.agent.server.local_elastic_agent:log directory set to: /tmp/torchelastic_d4z71nty/mnist-jlm13hx5g53mk_nxz_och1\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:[] starting workers for entrypoint: python\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:[] Rendezvous'ing worker group\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:[] Rendezvous complete for workers. Result:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   restart_count=0\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   master_addr=10.131.66.16\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   master_port=49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   group_rank=1\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   group_world_size=2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   local_ranks=[0, 1, 2, 3]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   role_ranks=[4, 5, 6, 7]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   global_ranks=[4, 5, 6, 7]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   role_world_sizes=[8, 8, 8, 8]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m   global_world_sizes=[8, 8, 8, 8]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:[] Starting worker group\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.elastic.multiprocessing:Setting worker0 reply file to: /tmp/torchelastic_d2kdqlka/mnist-jlm13hx5g53mk_r9bujvap/attempt_0/0/error.json\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.elastic.multiprocessing:Setting worker1 reply file to: /tmp/torchelastic_d2kdqlka/mnist-jlm13hx5g53mk_r9bujvap/attempt_0/1/error.json\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.elastic.multiprocessing:Setting worker2 reply file to: /tmp/torchelastic_d2kdqlka/mnist-jlm13hx5g53mk_r9bujvap/attempt_0/2/error.json\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.elastic.multiprocessing:Setting worker3 reply file to: /tmp/torchelastic_d2kdqlka/mnist-jlm13hx5g53mk_r9bujvap/attempt_0/3/error.json\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:[] Rendezvous complete for workers. Result:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   restart_count=0\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   master_addr=10.131.66.16\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   master_port=49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   group_rank=0\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   group_world_size=2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   local_ranks=[0, 1, 2, 3]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   role_ranks=[0, 1, 2, 3]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   global_ranks=[0, 1, 2, 3]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   role_world_sizes=[8, 8, 8, 8]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m   global_world_sizes=[8, 8, 8, 8]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:[] Starting worker group\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.elastic.multiprocessing:Setting worker0 reply file to: /tmp/torchelastic_d4z71nty/mnist-jlm13hx5g53mk_nxz_och1/attempt_0/0/error.json\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.elastic.multiprocessing:Setting worker1 reply file to: /tmp/torchelastic_d4z71nty/mnist-jlm13hx5g53mk_nxz_och1/attempt_0/1/error.json\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.elastic.multiprocessing:Setting worker2 reply file to: /tmp/torchelastic_d4z71nty/mnist-jlm13hx5g53mk_nxz_och1/attempt_0/2/error.json\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.elastic.multiprocessing:Setting worker3 reply file to: /tmp/torchelastic_d4z71nty/mnist-jlm13hx5g53mk_nxz_och1/attempt_0/3/error.json\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [3]:prior to running the trainer\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [3]:MASTER_ADDR: is  10.131.66.16\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [3]:MASTER_PORT: is  49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [3]:GROUP:  2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [3]:LOCAL:  4\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:prior to running the trainer\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:MASTER_ADDR: is  10.131.66.16\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:MASTER_PORT: is  49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:GROUP:  2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:LOCAL:  4\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Downloading MNIST dataset...\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [2]:prior to running the trainer\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [2]:MASTER_ADDR: is  10.131.66.16\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [2]:MASTER_PORT: is  49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [2]:GROUP:  2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [2]:LOCAL:  4\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [1]:prior to running the trainer\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [1]:MASTER_ADDR: is  10.131.66.16\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [1]:MASTER_PORT: is  49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [1]:GROUP:  2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [1]:LOCAL:  4\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to ./MNIST/raw/train-images-idx3-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Extracting ./MNIST/raw/train-images-idx3-ubyte.gz to ./MNIST/raw\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz to ./MNIST/raw/train-labels-idx1-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Extracting ./MNIST/raw/train-labels-idx1-ubyte.gz to ./MNIST/raw\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz to ./MNIST/raw/t10k-images-idx3-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Extracting ./MNIST/raw/t10k-images-idx3-ubyte.gz to ./MNIST/raw\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz to ./MNIST/raw/t10k-labels-idx1-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Extracting ./MNIST/raw/t10k-labels-idx1-ubyte.gz to ./MNIST/raw\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validation sanity check: 0it [00:00, ?it/s][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validation sanity check:   0%|          | 0/2 [00:00<?, ?it/s][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validation sanity check: 100%|██████████| 2/2 [00:00<00:00, 11.31it/s][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                                      \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Training: 0it [00:00, ?it/s]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Training:   0%|          | 0/30 [00:00<?, ?it/s]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 0:   0%|          | 0/30 [00:00<?, ?it/s] [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 0:  67%|██████▋   | 20/30 [00:01<00:00, 12.35it/s]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 0:  67%|██████▋   | 20/30 [00:01<00:00, 12.35it/s, loss=2.2, v_num=0][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.32it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 0: 100%|██████████| 30/30 [00:02<00:00, 12.94it/s, loss=2.1, v_num=0, val_loss=1.900, val_acc=0.482]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 0: 100%|██████████| 30/30 [00:02<00:00, 12.94it/s, loss=2.1, v_num=0, val_loss=1.900, val_acc=0.482][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 0:   0%|          | 0/30 [00:00<?, ?it/s, loss=2.1, v_num=0, val_loss=1.900, val_acc=0.482]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 1:   0%|          | 0/30 [00:00<?, ?it/s, loss=2.1, v_num=0, val_loss=1.900, val_acc=0.482][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 1:  67%|██████▋   | 20/30 [00:01<00:00, 11.57it/s, loss=2.1, v_num=0, val_loss=1.900, val_acc=0.482]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 1:  67%|██████▋   | 20/30 [00:01<00:00, 11.57it/s, loss=1.72, v_num=0, val_loss=1.900, val_acc=0.482][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.50it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 1: 100%|██████████| 30/30 [00:02<00:00, 12.27it/s, loss=1.56, v_num=0, val_loss=1.290, val_acc=0.751]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 1: 100%|██████████| 30/30 [00:02<00:00, 12.26it/s, loss=1.56, v_num=0, val_loss=1.290, val_acc=0.751]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 1:   0%|          | 0/30 [00:00<?, ?it/s, loss=1.56, v_num=0, val_loss=1.290, val_acc=0.751]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 2:   0%|          | 0/30 [00:00<?, ?it/s, loss=1.56, v_num=0, val_loss=1.290, val_acc=0.751][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 2:  67%|██████▋   | 20/30 [00:01<00:00, 12.22it/s, loss=1.56, v_num=0, val_loss=1.290, val_acc=0.751]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 2:  67%|██████▋   | 20/30 [00:01<00:00, 12.22it/s, loss=1.18, v_num=0, val_loss=1.290, val_acc=0.751][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.89it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 2: 100%|██████████| 30/30 [00:02<00:00, 12.84it/s, loss=1.07, v_num=0, val_loss=0.833, val_acc=0.819]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 2: 100%|██████████| 30/30 [00:02<00:00, 12.84it/s, loss=1.07, v_num=0, val_loss=0.833, val_acc=0.819]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 2:   0%|          | 0/30 [00:00<?, ?it/s, loss=1.07, v_num=0, val_loss=0.833, val_acc=0.819]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 3:   0%|          | 0/30 [00:00<?, ?it/s, loss=1.07, v_num=0, val_loss=0.833, val_acc=0.819][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 3:  67%|██████▋   | 20/30 [00:01<00:00, 11.72it/s, loss=1.07, v_num=0, val_loss=0.833, val_acc=0.819]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 3:  67%|██████▋   | 20/30 [00:01<00:00, 11.72it/s, loss=0.837, v_num=0, val_loss=0.833, val_acc=0.819][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.48it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 3: 100%|██████████| 30/30 [00:02<00:00, 12.53it/s, loss=0.778, v_num=0, val_loss=0.615, val_acc=0.853]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 3: 100%|██████████| 30/30 [00:02<00:00, 12.52it/s, loss=0.778, v_num=0, val_loss=0.615, val_acc=0.853]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 3:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.778, v_num=0, val_loss=0.615, val_acc=0.853]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 4:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.778, v_num=0, val_loss=0.615, val_acc=0.853][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 4:  67%|██████▋   | 20/30 [00:01<00:00, 12.62it/s, loss=0.778, v_num=0, val_loss=0.615, val_acc=0.853]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 4:  67%|██████▋   | 20/30 [00:01<00:00, 12.62it/s, loss=0.657, v_num=0, val_loss=0.615, val_acc=0.853][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.41it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 4: 100%|██████████| 30/30 [00:02<00:00, 13.17it/s, loss=0.623, v_num=0, val_loss=0.503, val_acc=0.870]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 4: 100%|██████████| 30/30 [00:02<00:00, 13.16it/s, loss=0.623, v_num=0, val_loss=0.503, val_acc=0.870]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 4:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.623, v_num=0, val_loss=0.503, val_acc=0.870]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 5:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.623, v_num=0, val_loss=0.503, val_acc=0.870][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 5:  67%|██████▋   | 20/30 [00:01<00:00, 12.06it/s, loss=0.623, v_num=0, val_loss=0.503, val_acc=0.870]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 5:  67%|██████▋   | 20/30 [00:01<00:00, 12.06it/s, loss=0.56, v_num=0, val_loss=0.503, val_acc=0.870] [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.54it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 5: 100%|██████████| 30/30 [00:02<00:00, 12.73it/s, loss=0.55, v_num=0, val_loss=0.433, val_acc=0.883]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 5: 100%|██████████| 30/30 [00:02<00:00, 12.72it/s, loss=0.55, v_num=0, val_loss=0.433, val_acc=0.883]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 5:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.55, v_num=0, val_loss=0.433, val_acc=0.883]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 6:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.55, v_num=0, val_loss=0.433, val_acc=0.883][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 6:  67%|██████▋   | 20/30 [00:01<00:00, 12.19it/s, loss=0.55, v_num=0, val_loss=0.433, val_acc=0.883]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 6:  67%|██████▋   | 20/30 [00:01<00:00, 12.19it/s, loss=0.497, v_num=0, val_loss=0.433, val_acc=0.883]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.80it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 6: 100%|██████████| 30/30 [00:02<00:00, 12.78it/s, loss=0.484, v_num=0, val_loss=0.390, val_acc=0.891]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 6: 100%|██████████| 30/30 [00:02<00:00, 12.77it/s, loss=0.484, v_num=0, val_loss=0.390, val_acc=0.891]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 6:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.484, v_num=0, val_loss=0.390, val_acc=0.891]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 7:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.484, v_num=0, val_loss=0.390, val_acc=0.891][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 7:  67%|██████▋   | 20/30 [00:01<00:00, 12.63it/s, loss=0.484, v_num=0, val_loss=0.390, val_acc=0.891]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 7:  67%|██████▋   | 20/30 [00:01<00:00, 12.63it/s, loss=0.455, v_num=0, val_loss=0.390, val_acc=0.891][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.56it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 7: 100%|██████████| 30/30 [00:02<00:00, 13.31it/s, loss=0.451, v_num=0, val_loss=0.359, val_acc=0.898]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 7: 100%|██████████| 30/30 [00:02<00:00, 13.31it/s, loss=0.451, v_num=0, val_loss=0.359, val_acc=0.898]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 7:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.451, v_num=0, val_loss=0.359, val_acc=0.898]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 8:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.451, v_num=0, val_loss=0.359, val_acc=0.898][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 8:  67%|██████▋   | 20/30 [00:01<00:00, 12.29it/s, loss=0.451, v_num=0, val_loss=0.359, val_acc=0.898]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 8:  67%|██████▋   | 20/30 [00:01<00:00, 12.29it/s, loss=0.406, v_num=0, val_loss=0.359, val_acc=0.898][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.47it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 8: 100%|██████████| 30/30 [00:02<00:00, 12.81it/s, loss=0.408, v_num=0, val_loss=0.335, val_acc=0.903]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 8: 100%|██████████| 30/30 [00:02<00:00, 12.81it/s, loss=0.408, v_num=0, val_loss=0.335, val_acc=0.903]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 8:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.408, v_num=0, val_loss=0.335, val_acc=0.903]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 9:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.408, v_num=0, val_loss=0.335, val_acc=0.903][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 9:  67%|██████▋   | 20/30 [00:01<00:00, 11.78it/s, loss=0.408, v_num=0, val_loss=0.335, val_acc=0.903]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 9:  67%|██████▋   | 20/30 [00:01<00:00, 11.78it/s, loss=0.395, v_num=0, val_loss=0.335, val_acc=0.903][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.49it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 9: 100%|██████████| 30/30 [00:02<00:00, 12.44it/s, loss=0.381, v_num=0, val_loss=0.316, val_acc=0.906]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 9: 100%|██████████| 30/30 [00:02<00:00, 12.44it/s, loss=0.381, v_num=0, val_loss=0.316, val_acc=0.906][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 9:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.381, v_num=0, val_loss=0.316, val_acc=0.906]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 10:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.381, v_num=0, val_loss=0.316, val_acc=0.906][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 10:  67%|██████▋   | 20/30 [00:01<00:00, 12.47it/s, loss=0.381, v_num=0, val_loss=0.316, val_acc=0.906]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 10:  67%|██████▋   | 20/30 [00:01<00:00, 12.46it/s, loss=0.374, v_num=0, val_loss=0.316, val_acc=0.906][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.06it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 10: 100%|██████████| 30/30 [00:02<00:00, 12.75it/s, loss=0.368, v_num=0, val_loss=0.303, val_acc=0.909]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 10: 100%|██████████| 30/30 [00:02<00:00, 12.75it/s, loss=0.368, v_num=0, val_loss=0.303, val_acc=0.909]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 10:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.368, v_num=0, val_loss=0.303, val_acc=0.909]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 11:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.368, v_num=0, val_loss=0.303, val_acc=0.909][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 11:  67%|██████▋   | 20/30 [00:01<00:00, 12.33it/s, loss=0.368, v_num=0, val_loss=0.303, val_acc=0.909]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 11:  67%|██████▋   | 20/30 [00:01<00:00, 12.33it/s, loss=0.344, v_num=0, val_loss=0.303, val_acc=0.909][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.43it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 11: 100%|██████████| 30/30 [00:02<00:00, 12.93it/s, loss=0.349, v_num=0, val_loss=0.291, val_acc=0.913]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 11: 100%|██████████| 30/30 [00:02<00:00, 12.92it/s, loss=0.349, v_num=0, val_loss=0.291, val_acc=0.913][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 11:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.349, v_num=0, val_loss=0.291, val_acc=0.913]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 12:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.349, v_num=0, val_loss=0.291, val_acc=0.913][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 12:  67%|██████▋   | 20/30 [00:01<00:00, 12.58it/s, loss=0.349, v_num=0, val_loss=0.291, val_acc=0.913]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 12:  67%|██████▋   | 20/30 [00:01<00:00, 12.58it/s, loss=0.347, v_num=0, val_loss=0.291, val_acc=0.913][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.32it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 12: 100%|██████████| 30/30 [00:02<00:00, 12.94it/s, loss=0.344, v_num=0, val_loss=0.279, val_acc=0.914]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 12: 100%|██████████| 30/30 [00:02<00:00, 12.93it/s, loss=0.344, v_num=0, val_loss=0.279, val_acc=0.914]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 12:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.344, v_num=0, val_loss=0.279, val_acc=0.914]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 13:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.344, v_num=0, val_loss=0.279, val_acc=0.914][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 13:  67%|██████▋   | 20/30 [00:01<00:00, 12.30it/s, loss=0.344, v_num=0, val_loss=0.279, val_acc=0.914]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 13:  67%|██████▋   | 20/30 [00:01<00:00, 12.30it/s, loss=0.342, v_num=0, val_loss=0.279, val_acc=0.914][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.52it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 13: 100%|██████████| 30/30 [00:02<00:00, 12.88it/s, loss=0.335, v_num=0, val_loss=0.270, val_acc=0.916]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 13: 100%|██████████| 30/30 [00:02<00:00, 12.87it/s, loss=0.335, v_num=0, val_loss=0.270, val_acc=0.916]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 13:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.335, v_num=0, val_loss=0.270, val_acc=0.916]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 14:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.335, v_num=0, val_loss=0.270, val_acc=0.916][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 14:  67%|██████▋   | 20/30 [00:01<00:00, 12.13it/s, loss=0.335, v_num=0, val_loss=0.270, val_acc=0.916]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 14:  67%|██████▋   | 20/30 [00:01<00:00, 12.13it/s, loss=0.332, v_num=0, val_loss=0.270, val_acc=0.916][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 16.66it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 14: 100%|██████████| 30/30 [00:02<00:00, 12.62it/s, loss=0.322, v_num=0, val_loss=0.260, val_acc=0.920]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 14: 100%|██████████| 30/30 [00:02<00:00, 12.61it/s, loss=0.322, v_num=0, val_loss=0.260, val_acc=0.920]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 14:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.322, v_num=0, val_loss=0.260, val_acc=0.920]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 15:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.322, v_num=0, val_loss=0.260, val_acc=0.920][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 15:  67%|██████▋   | 20/30 [00:01<00:00, 12.13it/s, loss=0.322, v_num=0, val_loss=0.260, val_acc=0.920]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 15:  67%|██████▋   | 20/30 [00:01<00:00, 12.13it/s, loss=0.321, v_num=0, val_loss=0.260, val_acc=0.920][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.45it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 15: 100%|██████████| 30/30 [00:02<00:00, 12.74it/s, loss=0.319, v_num=0, val_loss=0.252, val_acc=0.922]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 15: 100%|██████████| 30/30 [00:02<00:00, 12.73it/s, loss=0.319, v_num=0, val_loss=0.252, val_acc=0.922]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 15:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.319, v_num=0, val_loss=0.252, val_acc=0.922]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 16:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.319, v_num=0, val_loss=0.252, val_acc=0.922][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 16:  67%|██████▋   | 20/30 [00:01<00:00, 12.04it/s, loss=0.319, v_num=0, val_loss=0.252, val_acc=0.922]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 16:  67%|██████▋   | 20/30 [00:01<00:00, 12.04it/s, loss=0.303, v_num=0, val_loss=0.252, val_acc=0.922][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.22it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 16: 100%|██████████| 30/30 [00:02<00:00, 12.68it/s, loss=0.295, v_num=0, val_loss=0.247, val_acc=0.924]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 16: 100%|██████████| 30/30 [00:02<00:00, 12.67it/s, loss=0.295, v_num=0, val_loss=0.247, val_acc=0.924]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 16:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.295, v_num=0, val_loss=0.247, val_acc=0.924]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 17:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.295, v_num=0, val_loss=0.247, val_acc=0.924][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 17:  67%|██████▋   | 20/30 [00:01<00:00, 12.16it/s, loss=0.295, v_num=0, val_loss=0.247, val_acc=0.924]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 17:  67%|██████▋   | 20/30 [00:01<00:00, 12.15it/s, loss=0.289, v_num=0, val_loss=0.247, val_acc=0.924][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.48it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 17: 100%|██████████| 30/30 [00:02<00:00, 12.81it/s, loss=0.286, v_num=0, val_loss=0.237, val_acc=0.928]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 17: 100%|██████████| 30/30 [00:02<00:00, 12.80it/s, loss=0.286, v_num=0, val_loss=0.237, val_acc=0.928]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 17:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.286, v_num=0, val_loss=0.237, val_acc=0.928]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 18:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.286, v_num=0, val_loss=0.237, val_acc=0.928][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 18:  67%|██████▋   | 20/30 [00:01<00:00, 12.45it/s, loss=0.286, v_num=0, val_loss=0.237, val_acc=0.928]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 18:  67%|██████▋   | 20/30 [00:01<00:00, 12.44it/s, loss=0.298, v_num=0, val_loss=0.237, val_acc=0.928][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.73it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 18: 100%|██████████| 30/30 [00:02<00:00, 13.06it/s, loss=0.303, v_num=0, val_loss=0.230, val_acc=0.930]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 18: 100%|██████████| 30/30 [00:02<00:00, 13.06it/s, loss=0.303, v_num=0, val_loss=0.230, val_acc=0.930]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 18:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.303, v_num=0, val_loss=0.230, val_acc=0.930]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 19:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.303, v_num=0, val_loss=0.230, val_acc=0.930][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 19:  67%|██████▋   | 20/30 [00:01<00:00, 12.78it/s, loss=0.303, v_num=0, val_loss=0.230, val_acc=0.930]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 19:  67%|██████▋   | 20/30 [00:01<00:00, 12.78it/s, loss=0.275, v_num=0, val_loss=0.230, val_acc=0.930][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 11.98it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 19: 100%|██████████| 30/30 [00:02<00:00, 12.18it/s, loss=0.268, v_num=0, val_loss=0.225, val_acc=0.931]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 19: 100%|██████████| 30/30 [00:02<00:00, 12.15it/s, loss=0.268, v_num=0, val_loss=0.225, val_acc=0.931][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 19:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.268, v_num=0, val_loss=0.225, val_acc=0.931]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 20:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.268, v_num=0, val_loss=0.225, val_acc=0.931][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 20:  67%|██████▋   | 20/30 [00:04<00:02,  4.58it/s, loss=0.268, v_num=0, val_loss=0.225, val_acc=0.931]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 20:  67%|██████▋   | 20/30 [00:04<00:02,  4.58it/s, loss=0.272, v_num=0, val_loss=0.225, val_acc=0.931][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00,  6.21it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 20: 100%|██████████| 30/30 [00:06<00:00,  4.80it/s, loss=0.271, v_num=0, val_loss=0.217, val_acc=0.935]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 20: 100%|██████████| 30/30 [00:06<00:00,  4.79it/s, loss=0.271, v_num=0, val_loss=0.217, val_acc=0.935][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 20:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.271, v_num=0, val_loss=0.217, val_acc=0.935]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 21:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.271, v_num=0, val_loss=0.217, val_acc=0.935][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 21:  67%|██████▋   | 20/30 [00:02<00:01,  7.33it/s, loss=0.271, v_num=0, val_loss=0.217, val_acc=0.935]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 21:  67%|██████▋   | 20/30 [00:02<00:01,  7.33it/s, loss=0.266, v_num=0, val_loss=0.217, val_acc=0.935][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.86it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 21: 100%|██████████| 30/30 [00:03<00:00,  8.80it/s, loss=0.249, v_num=0, val_loss=0.213, val_acc=0.936]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 21: 100%|██████████| 30/30 [00:03<00:00,  8.80it/s, loss=0.249, v_num=0, val_loss=0.213, val_acc=0.936]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 21:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.249, v_num=0, val_loss=0.213, val_acc=0.936]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 22:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.249, v_num=0, val_loss=0.213, val_acc=0.936][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 22:  67%|██████▋   | 20/30 [00:01<00:00, 12.47it/s, loss=0.249, v_num=0, val_loss=0.213, val_acc=0.936]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 22:  67%|██████▋   | 20/30 [00:01<00:00, 12.47it/s, loss=0.245, v_num=0, val_loss=0.213, val_acc=0.936][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.65it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 22: 100%|██████████| 30/30 [00:02<00:00, 13.10it/s, loss=0.241, v_num=0, val_loss=0.206, val_acc=0.939]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 22: 100%|██████████| 30/30 [00:02<00:00, 13.09it/s, loss=0.241, v_num=0, val_loss=0.206, val_acc=0.939]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 22:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.241, v_num=0, val_loss=0.206, val_acc=0.939]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 23:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.241, v_num=0, val_loss=0.206, val_acc=0.939][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 23:  67%|██████▋   | 20/30 [00:01<00:00, 12.39it/s, loss=0.241, v_num=0, val_loss=0.206, val_acc=0.939]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 23:  67%|██████▋   | 20/30 [00:01<00:00, 12.38it/s, loss=0.247, v_num=0, val_loss=0.206, val_acc=0.939][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.76it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 23: 100%|██████████| 30/30 [00:02<00:00, 12.99it/s, loss=0.246, v_num=0, val_loss=0.201, val_acc=0.940]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 23: 100%|██████████| 30/30 [00:02<00:00, 12.99it/s, loss=0.246, v_num=0, val_loss=0.201, val_acc=0.940]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 23:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.246, v_num=0, val_loss=0.201, val_acc=0.940]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 24:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.246, v_num=0, val_loss=0.201, val_acc=0.940][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 24:  67%|██████▋   | 20/30 [00:01<00:00, 12.54it/s, loss=0.246, v_num=0, val_loss=0.201, val_acc=0.940]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 24:  67%|██████▋   | 20/30 [00:01<00:00, 12.54it/s, loss=0.234, v_num=0, val_loss=0.201, val_acc=0.940][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.21it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 24: 100%|██████████| 30/30 [00:02<00:00, 13.12it/s, loss=0.225, v_num=0, val_loss=0.195, val_acc=0.940]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 24: 100%|██████████| 30/30 [00:02<00:00, 13.12it/s, loss=0.225, v_num=0, val_loss=0.195, val_acc=0.940]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 24:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.225, v_num=0, val_loss=0.195, val_acc=0.940]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 25:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.225, v_num=0, val_loss=0.195, val_acc=0.940][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 25:  67%|██████▋   | 20/30 [00:01<00:00, 12.48it/s, loss=0.225, v_num=0, val_loss=0.195, val_acc=0.940]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 25:  67%|██████▋   | 20/30 [00:01<00:00, 12.48it/s, loss=0.252, v_num=0, val_loss=0.195, val_acc=0.940][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.87it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 25: 100%|██████████| 30/30 [00:02<00:00, 13.10it/s, loss=0.238, v_num=0, val_loss=0.190, val_acc=0.943]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 25: 100%|██████████| 30/30 [00:02<00:00, 13.10it/s, loss=0.238, v_num=0, val_loss=0.190, val_acc=0.943]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 25:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.238, v_num=0, val_loss=0.190, val_acc=0.943]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 26:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.238, v_num=0, val_loss=0.190, val_acc=0.943][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 26:  67%|██████▋   | 20/30 [00:01<00:00, 12.52it/s, loss=0.238, v_num=0, val_loss=0.190, val_acc=0.943]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 26:  67%|██████▋   | 20/30 [00:01<00:00, 12.52it/s, loss=0.242, v_num=0, val_loss=0.190, val_acc=0.943][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.58it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 26: 100%|██████████| 30/30 [00:02<00:00, 13.14it/s, loss=0.241, v_num=0, val_loss=0.186, val_acc=0.942]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 26: 100%|██████████| 30/30 [00:02<00:00, 13.13it/s, loss=0.241, v_num=0, val_loss=0.186, val_acc=0.942]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 26:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.241, v_num=0, val_loss=0.186, val_acc=0.942]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 27:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.241, v_num=0, val_loss=0.186, val_acc=0.942][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 27:  67%|██████▋   | 20/30 [00:01<00:00, 12.06it/s, loss=0.241, v_num=0, val_loss=0.186, val_acc=0.942]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 27:  67%|██████▋   | 20/30 [00:01<00:00, 12.05it/s, loss=0.207, v_num=0, val_loss=0.186, val_acc=0.942][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.61it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 27: 100%|██████████| 30/30 [00:02<00:00, 12.74it/s, loss=0.212, v_num=0, val_loss=0.182, val_acc=0.944]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 27: 100%|██████████| 30/30 [00:02<00:00, 12.73it/s, loss=0.212, v_num=0, val_loss=0.182, val_acc=0.944]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 27:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.212, v_num=0, val_loss=0.182, val_acc=0.944]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 28:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.212, v_num=0, val_loss=0.182, val_acc=0.944][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 28:  67%|██████▋   | 20/30 [00:01<00:00, 12.48it/s, loss=0.212, v_num=0, val_loss=0.182, val_acc=0.944]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 28:  67%|██████▋   | 20/30 [00:01<00:00, 12.48it/s, loss=0.219, v_num=0, val_loss=0.182, val_acc=0.944][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.57it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 28: 100%|██████████| 30/30 [00:02<00:00, 13.11it/s, loss=0.216, v_num=0, val_loss=0.178, val_acc=0.947]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 28: 100%|██████████| 30/30 [00:02<00:00, 13.11it/s, loss=0.216, v_num=0, val_loss=0.178, val_acc=0.947]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 28:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.216, v_num=0, val_loss=0.178, val_acc=0.947]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 29:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.216, v_num=0, val_loss=0.178, val_acc=0.947][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 29:  67%|██████▋   | 20/30 [00:01<00:00, 12.43it/s, loss=0.216, v_num=0, val_loss=0.178, val_acc=0.947]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 29:  67%|██████▋   | 20/30 [00:01<00:00, 12.43it/s, loss=0.218, v_num=0, val_loss=0.178, val_acc=0.947][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.27it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 29: 100%|██████████| 30/30 [00:02<00:00, 12.99it/s, loss=0.214, v_num=0, val_loss=0.174, val_acc=0.948]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 29: 100%|██████████| 30/30 [00:02<00:00, 12.98it/s, loss=0.214, v_num=0, val_loss=0.174, val_acc=0.948]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 29:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.214, v_num=0, val_loss=0.174, val_acc=0.948]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 30:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.214, v_num=0, val_loss=0.174, val_acc=0.948][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 30:  67%|██████▋   | 20/30 [00:01<00:00, 12.52it/s, loss=0.214, v_num=0, val_loss=0.174, val_acc=0.948]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 30:  67%|██████▋   | 20/30 [00:01<00:00, 12.51it/s, loss=0.205, v_num=0, val_loss=0.174, val_acc=0.948][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.59it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 30: 100%|██████████| 30/30 [00:02<00:00, 12.94it/s, loss=0.199, v_num=0, val_loss=0.169, val_acc=0.949]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 30: 100%|██████████| 30/30 [00:02<00:00, 12.94it/s, loss=0.199, v_num=0, val_loss=0.169, val_acc=0.949]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 30:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.199, v_num=0, val_loss=0.169, val_acc=0.949]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 31:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.199, v_num=0, val_loss=0.169, val_acc=0.949][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 31:  67%|██████▋   | 20/30 [00:01<00:00, 12.22it/s, loss=0.199, v_num=0, val_loss=0.169, val_acc=0.949]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 31:  67%|██████▋   | 20/30 [00:01<00:00, 12.21it/s, loss=0.198, v_num=0, val_loss=0.169, val_acc=0.949][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.59it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 31: 100%|██████████| 30/30 [00:02<00:00, 12.94it/s, loss=0.2, v_num=0, val_loss=0.166, val_acc=0.951]  \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 31: 100%|██████████| 30/30 [00:02<00:00, 12.94it/s, loss=0.2, v_num=0, val_loss=0.166, val_acc=0.951][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 31:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.2, v_num=0, val_loss=0.166, val_acc=0.951]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 32:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.2, v_num=0, val_loss=0.166, val_acc=0.951][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 32:  67%|██████▋   | 20/30 [00:01<00:00, 12.55it/s, loss=0.2, v_num=0, val_loss=0.166, val_acc=0.951]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 32:  67%|██████▋   | 20/30 [00:01<00:00, 12.55it/s, loss=0.193, v_num=0, val_loss=0.166, val_acc=0.951][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.68it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 32: 100%|██████████| 30/30 [00:02<00:00, 13.09it/s, loss=0.203, v_num=0, val_loss=0.163, val_acc=0.950]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 32: 100%|██████████| 30/30 [00:02<00:00, 13.09it/s, loss=0.203, v_num=0, val_loss=0.163, val_acc=0.950]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 32:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.203, v_num=0, val_loss=0.163, val_acc=0.950]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 33:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.203, v_num=0, val_loss=0.163, val_acc=0.950][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 33:  67%|██████▋   | 20/30 [00:01<00:00, 12.44it/s, loss=0.203, v_num=0, val_loss=0.163, val_acc=0.950]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 33:  67%|██████▋   | 20/30 [00:01<00:00, 12.44it/s, loss=0.205, v_num=0, val_loss=0.163, val_acc=0.950][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.73it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 33: 100%|██████████| 30/30 [00:02<00:00, 13.07it/s, loss=0.201, v_num=0, val_loss=0.159, val_acc=0.952]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 33: 100%|██████████| 30/30 [00:02<00:00, 13.07it/s, loss=0.201, v_num=0, val_loss=0.159, val_acc=0.952]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 33:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.201, v_num=0, val_loss=0.159, val_acc=0.952]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 34:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.201, v_num=0, val_loss=0.159, val_acc=0.952][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 34:  67%|██████▋   | 20/30 [00:01<00:00, 12.60it/s, loss=0.201, v_num=0, val_loss=0.159, val_acc=0.952]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 34:  67%|██████▋   | 20/30 [00:01<00:00, 12.60it/s, loss=0.183, v_num=0, val_loss=0.159, val_acc=0.952][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.69it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 34: 100%|██████████| 30/30 [00:02<00:00, 13.16it/s, loss=0.189, v_num=0, val_loss=0.156, val_acc=0.951]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 34: 100%|██████████| 30/30 [00:02<00:00, 13.15it/s, loss=0.189, v_num=0, val_loss=0.156, val_acc=0.951]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 34:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.189, v_num=0, val_loss=0.156, val_acc=0.951]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 35:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.189, v_num=0, val_loss=0.156, val_acc=0.951][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 35:  67%|██████▋   | 20/30 [00:01<00:00, 12.54it/s, loss=0.189, v_num=0, val_loss=0.156, val_acc=0.951]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 35:  67%|██████▋   | 20/30 [00:01<00:00, 12.54it/s, loss=0.182, v_num=0, val_loss=0.156, val_acc=0.951][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.73it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 35: 100%|██████████| 30/30 [00:02<00:00, 13.13it/s, loss=0.197, v_num=0, val_loss=0.153, val_acc=0.953]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 35: 100%|██████████| 30/30 [00:02<00:00, 13.12it/s, loss=0.197, v_num=0, val_loss=0.153, val_acc=0.953]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 35:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.197, v_num=0, val_loss=0.153, val_acc=0.953]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 36:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.197, v_num=0, val_loss=0.153, val_acc=0.953][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 36:  67%|██████▋   | 20/30 [00:01<00:00, 12.61it/s, loss=0.197, v_num=0, val_loss=0.153, val_acc=0.953]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 36:  67%|██████▋   | 20/30 [00:01<00:00, 12.61it/s, loss=0.206, v_num=0, val_loss=0.153, val_acc=0.953][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.73it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 36: 100%|██████████| 30/30 [00:02<00:00, 13.13it/s, loss=0.2, v_num=0, val_loss=0.150, val_acc=0.954]  \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 36: 100%|██████████| 30/30 [00:02<00:00, 13.13it/s, loss=0.2, v_num=0, val_loss=0.150, val_acc=0.954][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 36:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.2, v_num=0, val_loss=0.150, val_acc=0.954]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 37:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.2, v_num=0, val_loss=0.150, val_acc=0.954][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 37:  67%|██████▋   | 20/30 [00:01<00:00, 12.43it/s, loss=0.2, v_num=0, val_loss=0.150, val_acc=0.954]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 37:  67%|██████▋   | 20/30 [00:01<00:00, 12.43it/s, loss=0.178, v_num=0, val_loss=0.150, val_acc=0.954][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.39it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 37: 100%|██████████| 30/30 [00:02<00:00, 12.80it/s, loss=0.178, v_num=0, val_loss=0.147, val_acc=0.955]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 37: 100%|██████████| 30/30 [00:02<00:00, 12.79it/s, loss=0.178, v_num=0, val_loss=0.147, val_acc=0.955]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 37:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.178, v_num=0, val_loss=0.147, val_acc=0.955]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 38:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.178, v_num=0, val_loss=0.147, val_acc=0.955][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 38:  67%|██████▋   | 20/30 [00:01<00:00, 12.05it/s, loss=0.178, v_num=0, val_loss=0.147, val_acc=0.955]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 38:  67%|██████▋   | 20/30 [00:01<00:00, 12.05it/s, loss=0.173, v_num=0, val_loss=0.147, val_acc=0.955][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.72it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 38: 100%|██████████| 30/30 [00:02<00:00, 12.76it/s, loss=0.174, v_num=0, val_loss=0.144, val_acc=0.955]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 38: 100%|██████████| 30/30 [00:02<00:00, 12.75it/s, loss=0.174, v_num=0, val_loss=0.144, val_acc=0.955]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 38:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.174, v_num=0, val_loss=0.144, val_acc=0.955]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 39:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.174, v_num=0, val_loss=0.144, val_acc=0.955][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 39:  67%|██████▋   | 20/30 [00:01<00:00, 11.81it/s, loss=0.174, v_num=0, val_loss=0.144, val_acc=0.955]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 39:  67%|██████▋   | 20/30 [00:01<00:00, 11.80it/s, loss=0.176, v_num=0, val_loss=0.144, val_acc=0.955][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.69it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 39: 100%|██████████| 30/30 [00:02<00:00, 12.58it/s, loss=0.177, v_num=0, val_loss=0.142, val_acc=0.955]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 39: 100%|██████████| 30/30 [00:02<00:00, 12.57it/s, loss=0.177, v_num=0, val_loss=0.142, val_acc=0.955]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 39:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.177, v_num=0, val_loss=0.142, val_acc=0.955]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 40:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.177, v_num=0, val_loss=0.142, val_acc=0.955][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 40:  67%|██████▋   | 20/30 [00:01<00:00, 11.96it/s, loss=0.177, v_num=0, val_loss=0.142, val_acc=0.955]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 40:  67%|██████▋   | 20/30 [00:01<00:00, 11.95it/s, loss=0.178, v_num=0, val_loss=0.142, val_acc=0.955][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.93it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 40: 100%|██████████| 30/30 [00:02<00:00, 12.58it/s, loss=0.172, v_num=0, val_loss=0.138, val_acc=0.956]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 40: 100%|██████████| 30/30 [00:02<00:00, 12.57it/s, loss=0.172, v_num=0, val_loss=0.138, val_acc=0.956]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 40:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.172, v_num=0, val_loss=0.138, val_acc=0.956]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 41:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.172, v_num=0, val_loss=0.138, val_acc=0.956][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 41:  67%|██████▋   | 20/30 [00:01<00:00, 12.51it/s, loss=0.172, v_num=0, val_loss=0.138, val_acc=0.956]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 41:  67%|██████▋   | 20/30 [00:01<00:00, 12.50it/s, loss=0.169, v_num=0, val_loss=0.138, val_acc=0.956][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.62it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 41: 100%|██████████| 30/30 [00:02<00:00, 13.15it/s, loss=0.167, v_num=0, val_loss=0.136, val_acc=0.957]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 41: 100%|██████████| 30/30 [00:02<00:00, 13.14it/s, loss=0.167, v_num=0, val_loss=0.136, val_acc=0.957]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 41:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.167, v_num=0, val_loss=0.136, val_acc=0.957]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 42:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.167, v_num=0, val_loss=0.136, val_acc=0.957][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 42:  67%|██████▋   | 20/30 [00:01<00:00, 12.83it/s, loss=0.167, v_num=0, val_loss=0.136, val_acc=0.957]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 42:  67%|██████▋   | 20/30 [00:01<00:00, 12.82it/s, loss=0.173, v_num=0, val_loss=0.136, val_acc=0.957][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.61it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 42: 100%|██████████| 30/30 [00:02<00:00, 13.44it/s, loss=0.174, v_num=0, val_loss=0.133, val_acc=0.958]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 42: 100%|██████████| 30/30 [00:02<00:00, 13.43it/s, loss=0.174, v_num=0, val_loss=0.133, val_acc=0.958]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 42:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.174, v_num=0, val_loss=0.133, val_acc=0.958]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 43:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.174, v_num=0, val_loss=0.133, val_acc=0.958][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 43:  67%|██████▋   | 20/30 [00:01<00:00, 12.65it/s, loss=0.174, v_num=0, val_loss=0.133, val_acc=0.958]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 43:  67%|██████▋   | 20/30 [00:01<00:00, 12.64it/s, loss=0.169, v_num=0, val_loss=0.133, val_acc=0.958][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.80it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 43: 100%|██████████| 30/30 [00:02<00:00, 13.32it/s, loss=0.166, v_num=0, val_loss=0.131, val_acc=0.958]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 43: 100%|██████████| 30/30 [00:02<00:00, 13.32it/s, loss=0.166, v_num=0, val_loss=0.131, val_acc=0.958]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 43:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.166, v_num=0, val_loss=0.131, val_acc=0.958]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 44:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.166, v_num=0, val_loss=0.131, val_acc=0.958][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 44:  67%|██████▋   | 20/30 [00:01<00:00, 12.57it/s, loss=0.166, v_num=0, val_loss=0.131, val_acc=0.958]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 44:  67%|██████▋   | 20/30 [00:01<00:00, 12.57it/s, loss=0.159, v_num=0, val_loss=0.131, val_acc=0.958][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.79it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 44: 100%|██████████| 30/30 [00:02<00:00, 12.99it/s, loss=0.148, v_num=0, val_loss=0.129, val_acc=0.959]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 44: 100%|██████████| 30/30 [00:02<00:00, 12.98it/s, loss=0.148, v_num=0, val_loss=0.129, val_acc=0.959]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 44:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.148, v_num=0, val_loss=0.129, val_acc=0.959]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 45:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.148, v_num=0, val_loss=0.129, val_acc=0.959][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 45:  67%|██████▋   | 20/30 [00:01<00:00, 12.51it/s, loss=0.148, v_num=0, val_loss=0.129, val_acc=0.959]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 45:  67%|██████▋   | 20/30 [00:01<00:00, 12.50it/s, loss=0.145, v_num=0, val_loss=0.129, val_acc=0.959][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.81it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 45: 100%|██████████| 30/30 [00:02<00:00, 13.11it/s, loss=0.143, v_num=0, val_loss=0.126, val_acc=0.960]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 45: 100%|██████████| 30/30 [00:02<00:00, 13.10it/s, loss=0.143, v_num=0, val_loss=0.126, val_acc=0.960]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 45:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.143, v_num=0, val_loss=0.126, val_acc=0.960]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 46:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.143, v_num=0, val_loss=0.126, val_acc=0.960][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 46:  67%|██████▋   | 20/30 [00:01<00:00, 12.55it/s, loss=0.143, v_num=0, val_loss=0.126, val_acc=0.960]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 46:  67%|██████▋   | 20/30 [00:01<00:00, 12.54it/s, loss=0.154, v_num=0, val_loss=0.126, val_acc=0.960][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.48it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 46: 100%|██████████| 30/30 [00:02<00:00, 13.12it/s, loss=0.153, v_num=0, val_loss=0.124, val_acc=0.959]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 46: 100%|██████████| 30/30 [00:02<00:00, 13.11it/s, loss=0.153, v_num=0, val_loss=0.124, val_acc=0.959]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 46:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.153, v_num=0, val_loss=0.124, val_acc=0.959]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 47:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.153, v_num=0, val_loss=0.124, val_acc=0.959][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 47:  67%|██████▋   | 20/30 [00:01<00:00, 12.22it/s, loss=0.153, v_num=0, val_loss=0.124, val_acc=0.959]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 47:  67%|██████▋   | 20/30 [00:01<00:00, 12.22it/s, loss=0.152, v_num=0, val_loss=0.124, val_acc=0.959][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.76it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 47: 100%|██████████| 30/30 [00:02<00:00, 12.94it/s, loss=0.148, v_num=0, val_loss=0.121, val_acc=0.962]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 47: 100%|██████████| 30/30 [00:02<00:00, 12.93it/s, loss=0.148, v_num=0, val_loss=0.121, val_acc=0.962]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 47:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.148, v_num=0, val_loss=0.121, val_acc=0.962]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 48:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.148, v_num=0, val_loss=0.121, val_acc=0.962][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 48:  67%|██████▋   | 20/30 [00:01<00:00, 12.72it/s, loss=0.148, v_num=0, val_loss=0.121, val_acc=0.962]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 48:  67%|██████▋   | 20/30 [00:01<00:00, 12.72it/s, loss=0.148, v_num=0, val_loss=0.121, val_acc=0.962][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.79it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 48: 100%|██████████| 30/30 [00:02<00:00, 13.32it/s, loss=0.145, v_num=0, val_loss=0.121, val_acc=0.961]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 48: 100%|██████████| 30/30 [00:02<00:00, 13.31it/s, loss=0.145, v_num=0, val_loss=0.121, val_acc=0.961]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 48:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.145, v_num=0, val_loss=0.121, val_acc=0.961]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 49:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.145, v_num=0, val_loss=0.121, val_acc=0.961][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 49:  67%|██████▋   | 20/30 [00:01<00:00, 12.58it/s, loss=0.145, v_num=0, val_loss=0.121, val_acc=0.961]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 49:  67%|██████▋   | 20/30 [00:01<00:00, 12.58it/s, loss=0.151, v_num=0, val_loss=0.121, val_acc=0.961][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.74it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 49: 100%|██████████| 30/30 [00:02<00:00, 13.16it/s, loss=0.154, v_num=0, val_loss=0.118, val_acc=0.963]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 49: 100%|██████████| 30/30 [00:02<00:00, 13.15it/s, loss=0.154, v_num=0, val_loss=0.118, val_acc=0.963]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 49:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.154, v_num=0, val_loss=0.118, val_acc=0.963]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 50:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.154, v_num=0, val_loss=0.118, val_acc=0.963][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 50:  67%|██████▋   | 20/30 [00:01<00:00, 12.53it/s, loss=0.154, v_num=0, val_loss=0.118, val_acc=0.963]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 50:  67%|██████▋   | 20/30 [00:01<00:00, 12.53it/s, loss=0.144, v_num=0, val_loss=0.118, val_acc=0.963][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.74it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 50: 100%|██████████| 30/30 [00:02<00:00, 13.10it/s, loss=0.138, v_num=0, val_loss=0.116, val_acc=0.964]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 50: 100%|██████████| 30/30 [00:02<00:00, 13.09it/s, loss=0.138, v_num=0, val_loss=0.116, val_acc=0.964]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 50:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.138, v_num=0, val_loss=0.116, val_acc=0.964]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 51:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.138, v_num=0, val_loss=0.116, val_acc=0.964][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 51:  67%|██████▋   | 20/30 [00:01<00:00, 12.57it/s, loss=0.138, v_num=0, val_loss=0.116, val_acc=0.964]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 51:  67%|██████▋   | 20/30 [00:01<00:00, 12.57it/s, loss=0.146, v_num=0, val_loss=0.116, val_acc=0.964][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.82it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 51: 100%|██████████| 30/30 [00:02<00:00, 13.21it/s, loss=0.141, v_num=0, val_loss=0.114, val_acc=0.963]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 51: 100%|██████████| 30/30 [00:02<00:00, 13.20it/s, loss=0.141, v_num=0, val_loss=0.114, val_acc=0.963]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 51:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.141, v_num=0, val_loss=0.114, val_acc=0.963]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 52:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.141, v_num=0, val_loss=0.114, val_acc=0.963][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 52:  67%|██████▋   | 20/30 [00:01<00:00, 12.47it/s, loss=0.141, v_num=0, val_loss=0.114, val_acc=0.963]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 52:  67%|██████▋   | 20/30 [00:01<00:00, 12.46it/s, loss=0.141, v_num=0, val_loss=0.114, val_acc=0.963][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.78it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 52: 100%|██████████| 30/30 [00:02<00:00, 13.05it/s, loss=0.151, v_num=0, val_loss=0.112, val_acc=0.964]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 52: 100%|██████████| 30/30 [00:02<00:00, 13.04it/s, loss=0.151, v_num=0, val_loss=0.112, val_acc=0.964]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 52:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.151, v_num=0, val_loss=0.112, val_acc=0.964]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 53:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.151, v_num=0, val_loss=0.112, val_acc=0.964][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 53:  67%|██████▋   | 20/30 [00:01<00:00, 12.27it/s, loss=0.151, v_num=0, val_loss=0.112, val_acc=0.964]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 53:  67%|██████▋   | 20/30 [00:01<00:00, 12.26it/s, loss=0.155, v_num=0, val_loss=0.112, val_acc=0.964][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.70it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 53: 100%|██████████| 30/30 [00:02<00:00, 12.94it/s, loss=0.153, v_num=0, val_loss=0.110, val_acc=0.964]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 53: 100%|██████████| 30/30 [00:02<00:00, 12.94it/s, loss=0.153, v_num=0, val_loss=0.110, val_acc=0.964]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 53:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.153, v_num=0, val_loss=0.110, val_acc=0.964]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 54:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.153, v_num=0, val_loss=0.110, val_acc=0.964][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 54:  67%|██████▋   | 20/30 [00:01<00:00, 12.44it/s, loss=0.153, v_num=0, val_loss=0.110, val_acc=0.964]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 54:  67%|██████▋   | 20/30 [00:01<00:00, 12.44it/s, loss=0.152, v_num=0, val_loss=0.110, val_acc=0.964][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.86it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 54: 100%|██████████| 30/30 [00:02<00:00, 12.97it/s, loss=0.151, v_num=0, val_loss=0.109, val_acc=0.965]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 54: 100%|██████████| 30/30 [00:02<00:00, 12.96it/s, loss=0.151, v_num=0, val_loss=0.109, val_acc=0.965][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 54:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.151, v_num=0, val_loss=0.109, val_acc=0.965]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 55:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.151, v_num=0, val_loss=0.109, val_acc=0.965][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 55:  67%|██████▋   | 20/30 [00:01<00:00, 12.70it/s, loss=0.151, v_num=0, val_loss=0.109, val_acc=0.965]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 55:  67%|██████▋   | 20/30 [00:01<00:00, 12.69it/s, loss=0.129, v_num=0, val_loss=0.109, val_acc=0.965][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.64it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 55: 100%|██████████| 30/30 [00:02<00:00, 13.30it/s, loss=0.128, v_num=0, val_loss=0.107, val_acc=0.966]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 55: 100%|██████████| 30/30 [00:02<00:00, 13.30it/s, loss=0.128, v_num=0, val_loss=0.107, val_acc=0.966]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 55:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.128, v_num=0, val_loss=0.107, val_acc=0.966]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 56:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.128, v_num=0, val_loss=0.107, val_acc=0.966][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 56:  67%|██████▋   | 20/30 [00:01<00:00, 12.38it/s, loss=0.128, v_num=0, val_loss=0.107, val_acc=0.966]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 56:  67%|██████▋   | 20/30 [00:01<00:00, 12.38it/s, loss=0.136, v_num=0, val_loss=0.107, val_acc=0.966][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.83it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 56: 100%|██████████| 30/30 [00:02<00:00, 13.05it/s, loss=0.125, v_num=0, val_loss=0.105, val_acc=0.967]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 56: 100%|██████████| 30/30 [00:02<00:00, 13.04it/s, loss=0.125, v_num=0, val_loss=0.105, val_acc=0.967]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 56:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.125, v_num=0, val_loss=0.105, val_acc=0.967]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 57:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.125, v_num=0, val_loss=0.105, val_acc=0.967][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 57:  67%|██████▋   | 20/30 [00:01<00:00, 12.41it/s, loss=0.125, v_num=0, val_loss=0.105, val_acc=0.967]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 57:  67%|██████▋   | 20/30 [00:01<00:00, 12.40it/s, loss=0.128, v_num=0, val_loss=0.105, val_acc=0.967][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.55it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 57: 100%|██████████| 30/30 [00:02<00:00, 13.05it/s, loss=0.134, v_num=0, val_loss=0.104, val_acc=0.968]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 57: 100%|██████████| 30/30 [00:02<00:00, 13.04it/s, loss=0.134, v_num=0, val_loss=0.104, val_acc=0.968][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 57:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.134, v_num=0, val_loss=0.104, val_acc=0.968]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 58:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.134, v_num=0, val_loss=0.104, val_acc=0.968][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 58:  67%|██████▋   | 20/30 [00:01<00:00, 12.58it/s, loss=0.134, v_num=0, val_loss=0.104, val_acc=0.968]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 58:  67%|██████▋   | 20/30 [00:01<00:00, 12.58it/s, loss=0.143, v_num=0, val_loss=0.104, val_acc=0.968][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.78it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 58: 100%|██████████| 30/30 [00:02<00:00, 13.16it/s, loss=0.142, v_num=0, val_loss=0.102, val_acc=0.968]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 58: 100%|██████████| 30/30 [00:02<00:00, 13.16it/s, loss=0.142, v_num=0, val_loss=0.102, val_acc=0.968]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 58:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.142, v_num=0, val_loss=0.102, val_acc=0.968]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 59:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.142, v_num=0, val_loss=0.102, val_acc=0.968][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 59:  67%|██████▋   | 20/30 [00:01<00:00, 12.61it/s, loss=0.142, v_num=0, val_loss=0.102, val_acc=0.968]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 59:  67%|██████▋   | 20/30 [00:01<00:00, 12.61it/s, loss=0.121, v_num=0, val_loss=0.102, val_acc=0.968][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.65it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 59: 100%|██████████| 30/30 [00:02<00:00, 13.18it/s, loss=0.121, v_num=0, val_loss=0.100, val_acc=0.968]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 59: 100%|██████████| 30/30 [00:02<00:00, 13.17it/s, loss=0.121, v_num=0, val_loss=0.100, val_acc=0.968]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 59:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.121, v_num=0, val_loss=0.100, val_acc=0.968]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 60:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.121, v_num=0, val_loss=0.100, val_acc=0.968][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 60:  67%|██████▋   | 20/30 [00:01<00:00, 12.32it/s, loss=0.121, v_num=0, val_loss=0.100, val_acc=0.968]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 60:  67%|██████▋   | 20/30 [00:01<00:00, 12.32it/s, loss=0.133, v_num=0, val_loss=0.100, val_acc=0.968][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.83it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 60: 100%|██████████| 30/30 [00:02<00:00, 12.99it/s, loss=0.139, v_num=0, val_loss=0.0989, val_acc=0.969]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 60: 100%|██████████| 30/30 [00:02<00:00, 12.98it/s, loss=0.139, v_num=0, val_loss=0.0989, val_acc=0.969][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 60:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.139, v_num=0, val_loss=0.0989, val_acc=0.969]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 61:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.139, v_num=0, val_loss=0.0989, val_acc=0.969][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 61:  67%|██████▋   | 20/30 [00:01<00:00, 12.66it/s, loss=0.139, v_num=0, val_loss=0.0989, val_acc=0.969]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 61:  67%|██████▋   | 20/30 [00:01<00:00, 12.65it/s, loss=0.137, v_num=0, val_loss=0.0989, val_acc=0.969][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.85it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 61: 100%|██████████| 30/30 [00:02<00:00, 13.09it/s, loss=0.143, v_num=0, val_loss=0.0964, val_acc=0.969]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 61: 100%|██████████| 30/30 [00:02<00:00, 13.09it/s, loss=0.143, v_num=0, val_loss=0.0964, val_acc=0.969][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 61:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.143, v_num=0, val_loss=0.0964, val_acc=0.969]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 62:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.143, v_num=0, val_loss=0.0964, val_acc=0.969][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 62:  67%|██████▋   | 20/30 [00:01<00:00, 12.63it/s, loss=0.143, v_num=0, val_loss=0.0964, val_acc=0.969]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 62:  67%|██████▋   | 20/30 [00:01<00:00, 12.62it/s, loss=0.136, v_num=0, val_loss=0.0964, val_acc=0.969][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.77it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 62: 100%|██████████| 30/30 [00:02<00:00, 13.16it/s, loss=0.132, v_num=0, val_loss=0.0958, val_acc=0.970]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 62: 100%|██████████| 30/30 [00:02<00:00, 13.15it/s, loss=0.132, v_num=0, val_loss=0.0958, val_acc=0.970][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 62:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.132, v_num=0, val_loss=0.0958, val_acc=0.970]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 63:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.132, v_num=0, val_loss=0.0958, val_acc=0.970][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 63:  67%|██████▋   | 20/30 [00:01<00:00, 12.32it/s, loss=0.132, v_num=0, val_loss=0.0958, val_acc=0.970]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 63:  67%|██████▋   | 20/30 [00:01<00:00, 12.32it/s, loss=0.115, v_num=0, val_loss=0.0958, val_acc=0.970][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.87it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 63: 100%|██████████| 30/30 [00:02<00:00, 12.72it/s, loss=0.12, v_num=0, val_loss=0.0946, val_acc=0.971] \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 63: 100%|██████████| 30/30 [00:02<00:00, 12.71it/s, loss=0.12, v_num=0, val_loss=0.0946, val_acc=0.971]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 63:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.12, v_num=0, val_loss=0.0946, val_acc=0.971]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 64:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.12, v_num=0, val_loss=0.0946, val_acc=0.971][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 64:  67%|██████▋   | 20/30 [00:01<00:00, 12.55it/s, loss=0.12, v_num=0, val_loss=0.0946, val_acc=0.971]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 64:  67%|██████▋   | 20/30 [00:01<00:00, 12.55it/s, loss=0.114, v_num=0, val_loss=0.0946, val_acc=0.971][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.74it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 64: 100%|██████████| 30/30 [00:02<00:00, 13.12it/s, loss=0.12, v_num=0, val_loss=0.0933, val_acc=0.971] \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 64: 100%|██████████| 30/30 [00:02<00:00, 13.11it/s, loss=0.12, v_num=0, val_loss=0.0933, val_acc=0.971]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 64:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.12, v_num=0, val_loss=0.0933, val_acc=0.971]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 65:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.12, v_num=0, val_loss=0.0933, val_acc=0.971][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 65:  67%|██████▋   | 20/30 [00:01<00:00, 12.59it/s, loss=0.12, v_num=0, val_loss=0.0933, val_acc=0.971]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 65:  67%|██████▋   | 20/30 [00:01<00:00, 12.58it/s, loss=0.12, v_num=0, val_loss=0.0933, val_acc=0.971][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.84it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 65: 100%|██████████| 30/30 [00:02<00:00, 13.17it/s, loss=0.119, v_num=0, val_loss=0.0909, val_acc=0.972]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 65: 100%|██████████| 30/30 [00:02<00:00, 13.16it/s, loss=0.119, v_num=0, val_loss=0.0909, val_acc=0.972]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 65:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.119, v_num=0, val_loss=0.0909, val_acc=0.972]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 66:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.119, v_num=0, val_loss=0.0909, val_acc=0.972][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 66:  67%|██████▋   | 20/30 [00:01<00:00, 12.02it/s, loss=0.119, v_num=0, val_loss=0.0909, val_acc=0.972]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 66:  67%|██████▋   | 20/30 [00:01<00:00, 12.02it/s, loss=0.118, v_num=0, val_loss=0.0909, val_acc=0.972][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.59it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 66: 100%|██████████| 30/30 [00:02<00:00, 12.76it/s, loss=0.111, v_num=0, val_loss=0.0897, val_acc=0.972]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 66: 100%|██████████| 30/30 [00:02<00:00, 12.76it/s, loss=0.111, v_num=0, val_loss=0.0897, val_acc=0.972]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 66:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.111, v_num=0, val_loss=0.0897, val_acc=0.972]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 67:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.111, v_num=0, val_loss=0.0897, val_acc=0.972][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 67:  67%|██████▋   | 20/30 [00:01<00:00, 12.56it/s, loss=0.111, v_num=0, val_loss=0.0897, val_acc=0.972]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 67:  67%|██████▋   | 20/30 [00:01<00:00, 12.56it/s, loss=0.114, v_num=0, val_loss=0.0897, val_acc=0.972][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.66it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 67: 100%|██████████| 30/30 [00:02<00:00, 12.95it/s, loss=0.114, v_num=0, val_loss=0.0885, val_acc=0.973]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 67: 100%|██████████| 30/30 [00:02<00:00, 12.94it/s, loss=0.114, v_num=0, val_loss=0.0885, val_acc=0.973]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 67:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.114, v_num=0, val_loss=0.0885, val_acc=0.973]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 68:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.114, v_num=0, val_loss=0.0885, val_acc=0.973][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 68:  67%|██████▋   | 20/30 [00:01<00:00, 12.63it/s, loss=0.114, v_num=0, val_loss=0.0885, val_acc=0.973]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 68:  67%|██████▋   | 20/30 [00:01<00:00, 12.63it/s, loss=0.122, v_num=0, val_loss=0.0885, val_acc=0.973][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.67it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 68: 100%|██████████| 30/30 [00:02<00:00, 12.97it/s, loss=0.122, v_num=0, val_loss=0.0876, val_acc=0.973]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 68: 100%|██████████| 30/30 [00:02<00:00, 12.97it/s, loss=0.122, v_num=0, val_loss=0.0876, val_acc=0.973]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 68:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.122, v_num=0, val_loss=0.0876, val_acc=0.973]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 69:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.122, v_num=0, val_loss=0.0876, val_acc=0.973][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 69:  67%|██████▋   | 20/30 [00:01<00:00, 12.58it/s, loss=0.122, v_num=0, val_loss=0.0876, val_acc=0.973]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 69:  67%|██████▋   | 20/30 [00:01<00:00, 12.58it/s, loss=0.129, v_num=0, val_loss=0.0876, val_acc=0.973][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.71it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 69: 100%|██████████| 30/30 [00:02<00:00, 13.15it/s, loss=0.125, v_num=0, val_loss=0.0872, val_acc=0.972]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 69: 100%|██████████| 30/30 [00:02<00:00, 13.14it/s, loss=0.125, v_num=0, val_loss=0.0872, val_acc=0.972]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 69:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.125, v_num=0, val_loss=0.0872, val_acc=0.972]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 70:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.125, v_num=0, val_loss=0.0872, val_acc=0.972][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 70:  67%|██████▋   | 20/30 [00:01<00:00, 12.61it/s, loss=0.125, v_num=0, val_loss=0.0872, val_acc=0.972]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 70:  67%|██████▋   | 20/30 [00:01<00:00, 12.61it/s, loss=0.111, v_num=0, val_loss=0.0872, val_acc=0.972][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.75it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 70: 100%|██████████| 30/30 [00:02<00:00, 13.21it/s, loss=0.115, v_num=0, val_loss=0.0853, val_acc=0.973]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 70: 100%|██████████| 30/30 [00:02<00:00, 13.20it/s, loss=0.115, v_num=0, val_loss=0.0853, val_acc=0.973]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 70:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.115, v_num=0, val_loss=0.0853, val_acc=0.973]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 71:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.115, v_num=0, val_loss=0.0853, val_acc=0.973][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 71:  67%|██████▋   | 20/30 [00:01<00:00, 12.09it/s, loss=0.115, v_num=0, val_loss=0.0853, val_acc=0.973]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 71:  67%|██████▋   | 20/30 [00:01<00:00, 12.09it/s, loss=0.113, v_num=0, val_loss=0.0853, val_acc=0.973][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.81it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 71: 100%|██████████| 30/30 [00:02<00:00, 12.84it/s, loss=0.115, v_num=0, val_loss=0.0841, val_acc=0.973]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 71: 100%|██████████| 30/30 [00:02<00:00, 12.84it/s, loss=0.115, v_num=0, val_loss=0.0841, val_acc=0.973]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 71:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.115, v_num=0, val_loss=0.0841, val_acc=0.973]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 72:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.115, v_num=0, val_loss=0.0841, val_acc=0.973][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 72:  67%|██████▋   | 20/30 [00:01<00:00, 12.41it/s, loss=0.115, v_num=0, val_loss=0.0841, val_acc=0.973]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 72:  67%|██████▋   | 20/30 [00:01<00:00, 12.41it/s, loss=0.12, v_num=0, val_loss=0.0841, val_acc=0.973] [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.71it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 72: 100%|██████████| 30/30 [00:02<00:00, 13.03it/s, loss=0.118, v_num=0, val_loss=0.0833, val_acc=0.974]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 72: 100%|██████████| 30/30 [00:02<00:00, 13.02it/s, loss=0.118, v_num=0, val_loss=0.0833, val_acc=0.974]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 72:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.118, v_num=0, val_loss=0.0833, val_acc=0.974]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 73:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.118, v_num=0, val_loss=0.0833, val_acc=0.974][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 73:  67%|██████▋   | 20/30 [00:01<00:00, 12.31it/s, loss=0.118, v_num=0, val_loss=0.0833, val_acc=0.974]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 73:  67%|██████▋   | 20/30 [00:01<00:00, 12.31it/s, loss=0.117, v_num=0, val_loss=0.0833, val_acc=0.974][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.69it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 73: 100%|██████████| 30/30 [00:02<00:00, 12.94it/s, loss=0.116, v_num=0, val_loss=0.0817, val_acc=0.975]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 73: 100%|██████████| 30/30 [00:02<00:00, 12.93it/s, loss=0.116, v_num=0, val_loss=0.0817, val_acc=0.975]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 73:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.116, v_num=0, val_loss=0.0817, val_acc=0.975]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 74:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.116, v_num=0, val_loss=0.0817, val_acc=0.975][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 74:  67%|██████▋   | 20/30 [00:01<00:00, 12.59it/s, loss=0.116, v_num=0, val_loss=0.0817, val_acc=0.975]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 74:  67%|██████▋   | 20/30 [00:01<00:00, 12.59it/s, loss=0.114, v_num=0, val_loss=0.0817, val_acc=0.975][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.44it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 74: 100%|██████████| 30/30 [00:02<00:00, 13.08it/s, loss=0.11, v_num=0, val_loss=0.0803, val_acc=0.976] \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 74: 100%|██████████| 30/30 [00:02<00:00, 13.07it/s, loss=0.11, v_num=0, val_loss=0.0803, val_acc=0.976]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 74:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.11, v_num=0, val_loss=0.0803, val_acc=0.976]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 75:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.11, v_num=0, val_loss=0.0803, val_acc=0.976][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 75:  67%|██████▋   | 20/30 [00:01<00:00, 12.34it/s, loss=0.11, v_num=0, val_loss=0.0803, val_acc=0.976]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 75:  67%|██████▋   | 20/30 [00:01<00:00, 12.34it/s, loss=0.102, v_num=0, val_loss=0.0803, val_acc=0.976][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 16.46it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 75: 100%|██████████| 30/30 [00:02<00:00, 12.77it/s, loss=0.0973, v_num=0, val_loss=0.0803, val_acc=0.974]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 75: 100%|██████████| 30/30 [00:02<00:00, 12.77it/s, loss=0.0973, v_num=0, val_loss=0.0803, val_acc=0.974]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 75:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0973, v_num=0, val_loss=0.0803, val_acc=0.974]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 76:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0973, v_num=0, val_loss=0.0803, val_acc=0.974][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 76:  67%|██████▋   | 20/30 [00:01<00:00, 12.73it/s, loss=0.0973, v_num=0, val_loss=0.0803, val_acc=0.974]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 76:  67%|██████▋   | 20/30 [00:01<00:00, 12.72it/s, loss=0.106, v_num=0, val_loss=0.0803, val_acc=0.974] [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.82it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 76: 100%|██████████| 30/30 [00:02<00:00, 13.38it/s, loss=0.106, v_num=0, val_loss=0.0792, val_acc=0.975]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 76: 100%|██████████| 30/30 [00:02<00:00, 13.37it/s, loss=0.106, v_num=0, val_loss=0.0792, val_acc=0.975]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 76:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.106, v_num=0, val_loss=0.0792, val_acc=0.975]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 77:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.106, v_num=0, val_loss=0.0792, val_acc=0.975][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 77:  67%|██████▋   | 20/30 [00:01<00:00, 12.57it/s, loss=0.106, v_num=0, val_loss=0.0792, val_acc=0.975]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 77:  67%|██████▋   | 20/30 [00:01<00:00, 12.57it/s, loss=0.107, v_num=0, val_loss=0.0792, val_acc=0.975][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.31it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 77: 100%|██████████| 30/30 [00:02<00:00, 13.03it/s, loss=0.107, v_num=0, val_loss=0.0781, val_acc=0.976]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 77: 100%|██████████| 30/30 [00:02<00:00, 13.03it/s, loss=0.107, v_num=0, val_loss=0.0781, val_acc=0.976][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 77:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.107, v_num=0, val_loss=0.0781, val_acc=0.976]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 78:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.107, v_num=0, val_loss=0.0781, val_acc=0.976][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 78:  67%|██████▋   | 20/30 [00:01<00:00, 12.42it/s, loss=0.107, v_num=0, val_loss=0.0781, val_acc=0.976]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 78:  67%|██████▋   | 20/30 [00:01<00:00, 12.42it/s, loss=0.1, v_num=0, val_loss=0.0781, val_acc=0.976]  [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.66it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 78: 100%|██████████| 30/30 [00:02<00:00, 13.08it/s, loss=0.102, v_num=0, val_loss=0.0763, val_acc=0.976]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 78: 100%|██████████| 30/30 [00:02<00:00, 13.08it/s, loss=0.102, v_num=0, val_loss=0.0763, val_acc=0.976][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 78:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.102, v_num=0, val_loss=0.0763, val_acc=0.976]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 79:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.102, v_num=0, val_loss=0.0763, val_acc=0.976][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 79:  67%|██████▋   | 20/30 [00:01<00:00, 12.51it/s, loss=0.102, v_num=0, val_loss=0.0763, val_acc=0.976]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 79:  67%|██████▋   | 20/30 [00:01<00:00, 12.50it/s, loss=0.118, v_num=0, val_loss=0.0763, val_acc=0.976][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.51it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 79: 100%|██████████| 30/30 [00:02<00:00, 13.15it/s, loss=0.106, v_num=0, val_loss=0.0762, val_acc=0.977]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 79: 100%|██████████| 30/30 [00:02<00:00, 13.14it/s, loss=0.106, v_num=0, val_loss=0.0762, val_acc=0.977][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 79:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.106, v_num=0, val_loss=0.0762, val_acc=0.977]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 80:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.106, v_num=0, val_loss=0.0762, val_acc=0.977][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 80:  67%|██████▋   | 20/30 [00:01<00:00, 12.58it/s, loss=0.106, v_num=0, val_loss=0.0762, val_acc=0.977]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 80:  67%|██████▋   | 20/30 [00:01<00:00, 12.57it/s, loss=0.106, v_num=0, val_loss=0.0762, val_acc=0.977][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.76it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 80: 100%|██████████| 30/30 [00:02<00:00, 13.06it/s, loss=0.106, v_num=0, val_loss=0.075, val_acc=0.977] \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 80: 100%|██████████| 30/30 [00:02<00:00, 13.06it/s, loss=0.106, v_num=0, val_loss=0.075, val_acc=0.977]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 80:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.106, v_num=0, val_loss=0.075, val_acc=0.977]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 81:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.106, v_num=0, val_loss=0.075, val_acc=0.977][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 81:  67%|██████▋   | 20/30 [00:01<00:00, 12.39it/s, loss=0.106, v_num=0, val_loss=0.075, val_acc=0.977]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 81:  67%|██████▋   | 20/30 [00:01<00:00, 12.38it/s, loss=0.106, v_num=0, val_loss=0.075, val_acc=0.977][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.48it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 81: 100%|██████████| 30/30 [00:02<00:00, 13.05it/s, loss=0.105, v_num=0, val_loss=0.0738, val_acc=0.976]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 81: 100%|██████████| 30/30 [00:02<00:00, 13.04it/s, loss=0.105, v_num=0, val_loss=0.0738, val_acc=0.976]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 81:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.105, v_num=0, val_loss=0.0738, val_acc=0.976]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 82:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.105, v_num=0, val_loss=0.0738, val_acc=0.976][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 82:  67%|██████▋   | 20/30 [00:01<00:00, 12.35it/s, loss=0.105, v_num=0, val_loss=0.0738, val_acc=0.976]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 82:  67%|██████▋   | 20/30 [00:01<00:00, 12.35it/s, loss=0.105, v_num=0, val_loss=0.0738, val_acc=0.976][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.57it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 82: 100%|██████████| 30/30 [00:02<00:00, 12.98it/s, loss=0.102, v_num=0, val_loss=0.0729, val_acc=0.977]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 82: 100%|██████████| 30/30 [00:02<00:00, 12.97it/s, loss=0.102, v_num=0, val_loss=0.0729, val_acc=0.977]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 82:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.102, v_num=0, val_loss=0.0729, val_acc=0.977]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 83:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.102, v_num=0, val_loss=0.0729, val_acc=0.977][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 83:  67%|██████▋   | 20/30 [00:01<00:00, 12.74it/s, loss=0.102, v_num=0, val_loss=0.0729, val_acc=0.977]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 83:  67%|██████▋   | 20/30 [00:01<00:00, 12.74it/s, loss=0.105, v_num=0, val_loss=0.0729, val_acc=0.977][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.72it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 83: 100%|██████████| 30/30 [00:02<00:00, 13.17it/s, loss=0.103, v_num=0, val_loss=0.0722, val_acc=0.979]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 83: 100%|██████████| 30/30 [00:02<00:00, 13.16it/s, loss=0.103, v_num=0, val_loss=0.0722, val_acc=0.979]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 83:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.103, v_num=0, val_loss=0.0722, val_acc=0.979]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 84:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.103, v_num=0, val_loss=0.0722, val_acc=0.979][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 84:  67%|██████▋   | 20/30 [00:01<00:00, 12.58it/s, loss=0.103, v_num=0, val_loss=0.0722, val_acc=0.979]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 84:  67%|██████▋   | 20/30 [00:01<00:00, 12.57it/s, loss=0.0952, v_num=0, val_loss=0.0722, val_acc=0.979][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.87it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 84: 100%|██████████| 30/30 [00:02<00:00, 13.11it/s, loss=0.0987, v_num=0, val_loss=0.0703, val_acc=0.979]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 84: 100%|██████████| 30/30 [00:02<00:00, 13.11it/s, loss=0.0987, v_num=0, val_loss=0.0703, val_acc=0.979]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 84:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0987, v_num=0, val_loss=0.0703, val_acc=0.979]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 85:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0987, v_num=0, val_loss=0.0703, val_acc=0.979][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 85:  67%|██████▋   | 20/30 [00:01<00:00, 12.56it/s, loss=0.0987, v_num=0, val_loss=0.0703, val_acc=0.979]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 85:  67%|██████▋   | 20/30 [00:01<00:00, 12.56it/s, loss=0.0953, v_num=0, val_loss=0.0703, val_acc=0.979][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.79it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 85: 100%|██████████| 30/30 [00:02<00:00, 13.11it/s, loss=0.0925, v_num=0, val_loss=0.070, val_acc=0.980] \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 85: 100%|██████████| 30/30 [00:02<00:00, 13.11it/s, loss=0.0925, v_num=0, val_loss=0.070, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 85:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0925, v_num=0, val_loss=0.070, val_acc=0.980]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 86:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0925, v_num=0, val_loss=0.070, val_acc=0.980][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 86:  67%|██████▋   | 20/30 [00:01<00:00, 12.09it/s, loss=0.0925, v_num=0, val_loss=0.070, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 86:  67%|██████▋   | 20/30 [00:01<00:00, 12.09it/s, loss=0.0999, v_num=0, val_loss=0.070, val_acc=0.980][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.42it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 86: 100%|██████████| 30/30 [00:02<00:00, 12.70it/s, loss=0.107, v_num=0, val_loss=0.0691, val_acc=0.979]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 86: 100%|██████████| 30/30 [00:02<00:00, 12.69it/s, loss=0.107, v_num=0, val_loss=0.0691, val_acc=0.979]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 86:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.107, v_num=0, val_loss=0.0691, val_acc=0.979]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 87:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.107, v_num=0, val_loss=0.0691, val_acc=0.979][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 87:  67%|██████▋   | 20/30 [00:01<00:00, 12.43it/s, loss=0.107, v_num=0, val_loss=0.0691, val_acc=0.979]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 87:  67%|██████▋   | 20/30 [00:01<00:00, 12.43it/s, loss=0.0981, v_num=0, val_loss=0.0691, val_acc=0.979][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.62it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 87: 100%|██████████| 30/30 [00:02<00:00, 13.00it/s, loss=0.101, v_num=0, val_loss=0.0682, val_acc=0.980] \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 87: 100%|██████████| 30/30 [00:02<00:00, 13.00it/s, loss=0.101, v_num=0, val_loss=0.0682, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 87:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.101, v_num=0, val_loss=0.0682, val_acc=0.980]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 88:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.101, v_num=0, val_loss=0.0682, val_acc=0.980][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 88:  67%|██████▋   | 20/30 [00:01<00:00, 12.35it/s, loss=0.101, v_num=0, val_loss=0.0682, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 88:  67%|██████▋   | 20/30 [00:01<00:00, 12.35it/s, loss=0.0962, v_num=0, val_loss=0.0682, val_acc=0.980][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 17.11it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 88: 100%|██████████| 30/30 [00:02<00:00, 12.90it/s, loss=0.0998, v_num=0, val_loss=0.0678, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 88: 100%|██████████| 30/30 [00:02<00:00, 12.90it/s, loss=0.0998, v_num=0, val_loss=0.0678, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 88:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0998, v_num=0, val_loss=0.0678, val_acc=0.980]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 89:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0998, v_num=0, val_loss=0.0678, val_acc=0.980][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 89:  67%|██████▋   | 20/30 [00:01<00:00, 12.26it/s, loss=0.0998, v_num=0, val_loss=0.0678, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 89:  67%|██████▋   | 20/30 [00:01<00:00, 12.25it/s, loss=0.0937, v_num=0, val_loss=0.0678, val_acc=0.980][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.53it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 89: 100%|██████████| 30/30 [00:02<00:00, 12.90it/s, loss=0.0936, v_num=0, val_loss=0.0669, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 89: 100%|██████████| 30/30 [00:02<00:00, 12.89it/s, loss=0.0936, v_num=0, val_loss=0.0669, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 89:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0936, v_num=0, val_loss=0.0669, val_acc=0.980]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 90:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0936, v_num=0, val_loss=0.0669, val_acc=0.980][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 90:  67%|██████▋   | 20/30 [00:01<00:00, 12.52it/s, loss=0.0936, v_num=0, val_loss=0.0669, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 90:  67%|██████▋   | 20/30 [00:01<00:00, 12.52it/s, loss=0.0899, v_num=0, val_loss=0.0669, val_acc=0.980][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.40it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 90: 100%|██████████| 30/30 [00:02<00:00, 13.04it/s, loss=0.0926, v_num=0, val_loss=0.0663, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 90: 100%|██████████| 30/30 [00:02<00:00, 13.03it/s, loss=0.0926, v_num=0, val_loss=0.0663, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 90:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0926, v_num=0, val_loss=0.0663, val_acc=0.980]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 91:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0926, v_num=0, val_loss=0.0663, val_acc=0.980][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 91:  67%|██████▋   | 20/30 [00:01<00:00, 12.59it/s, loss=0.0926, v_num=0, val_loss=0.0663, val_acc=0.980]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 91:  67%|██████▋   | 20/30 [00:01<00:00, 12.59it/s, loss=0.0976, v_num=0, val_loss=0.0663, val_acc=0.980][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.62it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 91: 100%|██████████| 30/30 [00:02<00:00, 13.14it/s, loss=0.092, v_num=0, val_loss=0.0647, val_acc=0.982] \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 91: 100%|██████████| 30/30 [00:02<00:00, 13.14it/s, loss=0.092, v_num=0, val_loss=0.0647, val_acc=0.982]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 91:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.092, v_num=0, val_loss=0.0647, val_acc=0.982]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 92:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.092, v_num=0, val_loss=0.0647, val_acc=0.982][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 92:  67%|██████▋   | 20/30 [00:01<00:00, 12.32it/s, loss=0.092, v_num=0, val_loss=0.0647, val_acc=0.982]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 92:  67%|██████▋   | 20/30 [00:01<00:00, 12.31it/s, loss=0.0883, v_num=0, val_loss=0.0647, val_acc=0.982][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.72it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 92: 100%|██████████| 30/30 [00:02<00:00, 12.97it/s, loss=0.0853, v_num=0, val_loss=0.0646, val_acc=0.979]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 92: 100%|██████████| 30/30 [00:02<00:00, 12.96it/s, loss=0.0853, v_num=0, val_loss=0.0646, val_acc=0.979]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 92:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0853, v_num=0, val_loss=0.0646, val_acc=0.979]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 93:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0853, v_num=0, val_loss=0.0646, val_acc=0.979][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 93:  67%|██████▋   | 20/30 [00:01<00:00, 12.43it/s, loss=0.0853, v_num=0, val_loss=0.0646, val_acc=0.979]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 93:  67%|██████▋   | 20/30 [00:01<00:00, 12.42it/s, loss=0.0891, v_num=0, val_loss=0.0646, val_acc=0.979][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.78it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 93: 100%|██████████| 30/30 [00:02<00:00, 12.98it/s, loss=0.092, v_num=0, val_loss=0.0633, val_acc=0.981] \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 93: 100%|██████████| 30/30 [00:02<00:00, 12.98it/s, loss=0.092, v_num=0, val_loss=0.0633, val_acc=0.981]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 93:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.092, v_num=0, val_loss=0.0633, val_acc=0.981]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 94:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.092, v_num=0, val_loss=0.0633, val_acc=0.981][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 94:  67%|██████▋   | 20/30 [00:01<00:00, 11.85it/s, loss=0.092, v_num=0, val_loss=0.0633, val_acc=0.981]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 94:  67%|██████▋   | 20/30 [00:01<00:00, 11.85it/s, loss=0.0881, v_num=0, val_loss=0.0633, val_acc=0.981][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.49it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 94: 100%|██████████| 30/30 [00:02<00:00, 12.52it/s, loss=0.092, v_num=0, val_loss=0.0627, val_acc=0.982] \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:prior to running the trainer\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:MASTER_ADDR: is  10.131.66.16\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:MASTER_PORT: is  49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:GROUP:  2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:LOCAL:  4\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Downloading MNIST dataset...\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [1]:prior to running the trainer\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [1]:MASTER_ADDR: is  10.131.66.16\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [1]:MASTER_PORT: is  49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [1]:GROUP:  2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [1]:LOCAL:  4\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [2]:prior to running the trainer\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [2]:MASTER_ADDR: is  10.131.66.16\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [2]:MASTER_PORT: is  49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [2]:GROUP:  2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [2]:LOCAL:  4\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [3]:prior to running the trainer\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [3]:MASTER_ADDR: is  10.131.66.16\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [3]:MASTER_PORT: is  49782\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [3]:GROUP:  2\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [3]:LOCAL:  4\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to ./MNIST/raw/train-images-idx3-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Extracting ./MNIST/raw/train-images-idx3-ubyte.gz to ./MNIST/raw\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz to ./MNIST/raw/train-labels-idx1-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Extracting ./MNIST/raw/train-labels-idx1-ubyte.gz to ./MNIST/raw\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz to ./MNIST/raw/t10k-images-idx3-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Extracting ./MNIST/raw/t10k-images-idx3-ubyte.gz to ./MNIST/raw\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz to ./MNIST/raw/t10k-labels-idx1-ubyte.gz\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Extracting ./MNIST/raw/t10k-labels-idx1-ubyte.gz to ./MNIST/raw\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [1]:initializing distributed: GLOBAL_RANK: 5, MEMBER: 6/8\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [2]:initializing distributed: GLOBAL_RANK: 6, MEMBER: 7/8\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [3]:initializing distributed: GLOBAL_RANK: 7, MEMBER: 8/8\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:  0%|          | 0/9912422 [00:00<?, ?it/s][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]: 32%|███▏      | 3206144/9912422 [00:00<00:00, 32060476.88it/s][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:9913344it [00:00, 54643536.53it/s]                             \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:  0%|          | 0/28881 [00:00<?, ?it/s]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:29696it [00:00, 3404883.73it/s]          \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:  0%|          | 0/1648877 [00:00<?, ?it/s][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]: 81%|████████▏ | 1342464/1648877 [00:00<00:00, 12934776.25it/s]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:1649664it [00:00, 14026877.81it/s]                             \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:  0%|          | 0/4542 [00:00<?, ?it/s]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:5120it [00:00, 33979171.65it/s]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:initializing distributed: GLOBAL_RANK: 4, MEMBER: 5/8\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [1]:LOCAL_RANK: 1 - CUDA_VISIBLE_DEVICES: [0,1,2,3]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [1]:Missing logger folder: /tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/working_dir_files/_ray_pkg_ce2c3e935774455d/lightning_logs\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [2]:LOCAL_RANK: 2 - CUDA_VISIBLE_DEVICES: [0,1,2,3]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [2]:Missing logger folder: /tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/working_dir_files/_ray_pkg_ce2c3e935774455d/lightning_logs\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:Missing logger folder: /tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/working_dir_files/_ray_pkg_ce2c3e935774455d/lightning_logs\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [3]:LOCAL_RANK: 3 - CUDA_VISIBLE_DEVICES: [0,1,2,3]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [3]:Missing logger folder: /tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/working_dir_files/_ray_pkg_ce2c3e935774455d/lightning_logs\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [1]:[W reducer.cpp:1289] Warning: find_unused_parameters=True was specified in DDP constructor, but did not find any unused parameters in the forward pass. This flag results in an extra traversal of the autograd graph every iteration,  which can adversely affect performance. If your model indeed never has any unused parameters in the forward pass, consider turning this flag off. Note that this warning may be a false positive if your model has flow control causing later iterations to have unused parameters. (function operator())\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [2]:[W reducer.cpp:1289] Warning: find_unused_parameters=True was specified in DDP constructor, but did not find any unused parameters in the forward pass. This flag results in an extra traversal of the autograd graph every iteration,  which can adversely affect performance. If your model indeed never has any unused parameters in the forward pass, consider turning this flag off. Note that this warning may be a false positive if your model has flow control causing later iterations to have unused parameters. (function operator())\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [0]:[W reducer.cpp:1289] Warning: find_unused_parameters=True was specified in DDP constructor, but did not find any unused parameters in the forward pass. This flag results in an extra traversal of the autograd graph every iteration,  which can adversely affect performance. If your model indeed never has any unused parameters in the forward pass, consider turning this flag off. Note that this warning may be a false positive if your model has flow control causing later iterations to have unused parameters. (function operator())\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m [3]:[W reducer.cpp:1289] Warning: find_unused_parameters=True was specified in DDP constructor, but did not find any unused parameters in the forward pass. This flag results in an extra traversal of the autograd graph every iteration,  which can adversely affect performance. If your model indeed never has any unused parameters in the forward pass, consider turning this flag off. Note that this warning may be a false positive if your model has flow control causing later iterations to have unused parameters. (function operator())\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:[] worker group successfully finished. Waiting 300 seconds for other agents to finish.\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:Local worker group finished (SUCCEEDED). Waiting 300 seconds for other agents to finish\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.128.68.15)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:Done waiting for other agents. Elapsed: 0.0041942596435546875 seconds\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 94: 100%|██████████| 30/30 [00:02<00:00, 12.51it/s, loss=0.092, v_num=0, val_loss=0.0627, val_acc=0.982]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 94:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.092, v_num=0, val_loss=0.0627, val_acc=0.982]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 95:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.092, v_num=0, val_loss=0.0627, val_acc=0.982][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 95:  67%|██████▋   | 20/30 [00:01<00:00, 12.38it/s, loss=0.092, v_num=0, val_loss=0.0627, val_acc=0.982]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 95:  67%|██████▋   | 20/30 [00:01<00:00, 12.37it/s, loss=0.0935, v_num=0, val_loss=0.0627, val_acc=0.982][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.53it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 95: 100%|██████████| 30/30 [00:02<00:00, 13.08it/s, loss=0.0922, v_num=0, val_loss=0.0621, val_acc=0.982]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 95: 100%|██████████| 30/30 [00:02<00:00, 13.08it/s, loss=0.0922, v_num=0, val_loss=0.0621, val_acc=0.982]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 95:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0922, v_num=0, val_loss=0.0621, val_acc=0.982]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 96:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0922, v_num=0, val_loss=0.0621, val_acc=0.982][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 96:  67%|██████▋   | 20/30 [00:01<00:00, 12.59it/s, loss=0.0922, v_num=0, val_loss=0.0621, val_acc=0.982]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 96:  67%|██████▋   | 20/30 [00:01<00:00, 12.59it/s, loss=0.0862, v_num=0, val_loss=0.0621, val_acc=0.982][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.73it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 96: 100%|██████████| 30/30 [00:02<00:00, 13.16it/s, loss=0.0828, v_num=0, val_loss=0.0609, val_acc=0.983]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 96: 100%|██████████| 30/30 [00:02<00:00, 13.15it/s, loss=0.0828, v_num=0, val_loss=0.0609, val_acc=0.983]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 96:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0828, v_num=0, val_loss=0.0609, val_acc=0.983]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 97:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0828, v_num=0, val_loss=0.0609, val_acc=0.983][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 97:  67%|██████▋   | 20/30 [00:01<00:00, 12.52it/s, loss=0.0828, v_num=0, val_loss=0.0609, val_acc=0.983]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 97:  67%|██████▋   | 20/30 [00:01<00:00, 12.52it/s, loss=0.0949, v_num=0, val_loss=0.0609, val_acc=0.983][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.77it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 97: 100%|██████████| 30/30 [00:02<00:00, 13.18it/s, loss=0.0924, v_num=0, val_loss=0.0595, val_acc=0.982]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 97: 100%|██████████| 30/30 [00:02<00:00, 13.18it/s, loss=0.0924, v_num=0, val_loss=0.0595, val_acc=0.982]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 97:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0924, v_num=0, val_loss=0.0595, val_acc=0.982]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 98:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0924, v_num=0, val_loss=0.0595, val_acc=0.982][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 98:  67%|██████▋   | 20/30 [00:01<00:00, 12.33it/s, loss=0.0924, v_num=0, val_loss=0.0595, val_acc=0.982]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 98:  67%|██████▋   | 20/30 [00:01<00:00, 12.33it/s, loss=0.0817, v_num=0, val_loss=0.0595, val_acc=0.982][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 18.97it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 98: 100%|██████████| 30/30 [00:02<00:00, 12.97it/s, loss=0.0881, v_num=0, val_loss=0.0605, val_acc=0.981]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 98: 100%|██████████| 30/30 [00:02<00:00, 12.96it/s, loss=0.0881, v_num=0, val_loss=0.0605, val_acc=0.981][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 98:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0881, v_num=0, val_loss=0.0605, val_acc=0.981]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 99:   0%|          | 0/30 [00:00<?, ?it/s, loss=0.0881, v_num=0, val_loss=0.0605, val_acc=0.981][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 99:  67%|██████▋   | 20/30 [00:01<00:00, 12.74it/s, loss=0.0881, v_num=0, val_loss=0.0605, val_acc=0.981]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 99:  67%|██████▋   | 20/30 [00:01<00:00, 12.74it/s, loss=0.0761, v_num=0, val_loss=0.0605, val_acc=0.981][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 0it [00:00, ?it/s]\u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating:   0%|          | 0/3 [00:00<?, ?it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Validating: 100%|██████████| 3/3 [00:00<00:00, 19.83it/s]\u001b[A[0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 99: 100%|██████████| 30/30 [00:02<00:00, 13.37it/s, loss=0.0796, v_num=0, val_loss=0.0593, val_acc=0.983]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:                                                         \u001b[A\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 99: 100%|██████████| 30/30 [00:02<00:00, 13.36it/s, loss=0.0796, v_num=0, val_loss=0.0593, val_acc=0.983]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Epoch 99: 100%|██████████| 30/30 [00:02<00:00, 13.27it/s, loss=0.0796, v_num=0, val_loss=0.0593, val_acc=0.983]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:GPU available: True, used: True\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:TPU available: False, using: 0 TPU cores\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:IPU available: False, using: 0 IPUs\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [2]:initializing distributed: GLOBAL_RANK: 2, MEMBER: 3/8\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [1]:initializing distributed: GLOBAL_RANK: 1, MEMBER: 2/8\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [3]:initializing distributed: GLOBAL_RANK: 3, MEMBER: 4/8\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:  0%|          | 0/9912422 [00:00<?, ?it/s][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]: 61%|██████    | 6011904/9912422 [00:00<00:00, 59181211.37it/s][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:9913344it [00:00, 65856745.70it/s]                             \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:  0%|          | 0/28881 [00:00<?, ?it/s]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:29696it [00:00, 2800163.03it/s]          \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:  0%|          | 0/1648877 [00:00<?, ?it/s][0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:1649664it [00:00, 27676879.96it/s]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:  0%|          | 0/4542 [00:00<?, ?it/s]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:5120it [00:00, 35971250.39it/s]         \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:initializing distributed: GLOBAL_RANK: 0, MEMBER: 1/8\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:----------------------------------------------------------------------------------------------------\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:distributed_backend=nccl\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:All distributed processes registered. Starting with 8 processes\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:----------------------------------------------------------------------------------------------------\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [2]:LOCAL_RANK: 2 - CUDA_VISIBLE_DEVICES: [0,1,2,3]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [2]:Missing logger folder: /tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/working_dir_files/_ray_pkg_ce2c3e935774455d/lightning_logs\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [1]:LOCAL_RANK: 1 - CUDA_VISIBLE_DEVICES: [0,1,2,3]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [1]:Missing logger folder: /tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/working_dir_files/_ray_pkg_ce2c3e935774455d/lightning_logs\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [3]:LOCAL_RANK: 3 - CUDA_VISIBLE_DEVICES: [0,1,2,3]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [3]:Missing logger folder: /tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/working_dir_files/_ray_pkg_ce2c3e935774455d/lightning_logs\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3]\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:Missing logger folder: /tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/working_dir_files/_ray_pkg_ce2c3e935774455d/lightning_logs\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:  | Name          | Type       | Params\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:---------------------------------------------\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:0 | model         | Sequential | 55.1 K\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:1 | val_accuracy  | Accuracy   | 0     \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:2 | test_accuracy | Accuracy   | 0     \n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:---------------------------------------------\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:55.1 K    Trainable params\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:0         Non-trainable params\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:55.1 K    Total params\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:0.220     Total estimated model params size (MB)\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:/tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/pip/3510e0c008a5c3627e4d2408c8b93ed71be6c3e1/virtualenv/lib/python3.8/site-packages/pytorch_lightning/trainer/data_loading.py:132: UserWarning: The dataloader, val_dataloader 0, does not have many workers which may be a bottleneck. Consider increasing the value of the `num_workers` argument` (try 32 which is the number of cpus on this machine) in the `DataLoader` init to improve performance.\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:  rank_zero_warn(\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:/tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/pip/3510e0c008a5c3627e4d2408c8b93ed71be6c3e1/virtualenv/lib/python3.8/site-packages/pytorch_lightning/trainer/data_loading.py:132: UserWarning: The dataloader, train_dataloader, does not have many workers which may be a bottleneck. Consider increasing the value of the `num_workers` argument` (try 32 which is the number of cpus on this machine) in the `DataLoader` init to improve performance.\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:  rank_zero_warn(\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:/tmp/ray/session_2022-11-04_08-02-48_207951_7/runtime_resources/pip/3510e0c008a5c3627e4d2408c8b93ed71be6c3e1/virtualenv/lib/python3.8/site-packages/pytorch_lightning/trainer/data_loading.py:432: UserWarning: The number of training samples (27) is smaller than the logging interval Trainer(log_every_n_steps=50). Set a lower value for log_every_n_steps if you want to see logs for the training epoch.\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:  rank_zero_warn(\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [2]:[W reducer.cpp:1289] Warning: find_unused_parameters=True was specified in DDP constructor, but did not find any unused parameters in the forward pass. This flag results in an extra traversal of the autograd graph every iteration,  which can adversely affect performance. If your model indeed never has any unused parameters in the forward pass, consider turning this flag off. Note that this warning may be a false positive if your model has flow control causing later iterations to have unused parameters. (function operator())\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [1]:[W reducer.cpp:1289] Warning: find_unused_parameters=True was specified in DDP constructor, but did not find any unused parameters in the forward pass. This flag results in an extra traversal of the autograd graph every iteration,  which can adversely affect performance. If your model indeed never has any unused parameters in the forward pass, consider turning this flag off. Note that this warning may be a false positive if your model has flow control causing later iterations to have unused parameters. (function operator())\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [3]:[W reducer.cpp:1289] Warning: find_unused_parameters=True was specified in DDP constructor, but did not find any unused parameters in the forward pass. This flag results in an extra traversal of the autograd graph every iteration,  which can adversely affect performance. If your model indeed never has any unused parameters in the forward pass, consider turning this flag off. Note that this warning may be a false positive if your model has flow control causing later iterations to have unused parameters. (function operator())\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m [0]:[W reducer.cpp:1289] Warning: find_unused_parameters=True was specified in DDP constructor, but did not find any unused parameters in the forward pass. This flag results in an extra traversal of the autograd graph every iteration,  which can adversely affect performance. If your model indeed never has any unused parameters in the forward pass, consider turning this flag off. Note that this warning may be a false positive if your model has flow control causing later iterations to have unused parameters. (function operator())\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:[] worker group successfully finished. Waiting 300 seconds for other agents to finish.\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:Local worker group finished (SUCCEEDED). Waiting 300 seconds for other agents to finish\n",
-      "\u001b[2m\u001b[36m(CommandActor pid=123, ip=10.131.66.16)\u001b[0m INFO:torch.distributed.elastic.agent.server.api:Done waiting for other agents. Elapsed: 0.0004851818084716797 seconds\n",
-      "running ray.wait on [ObjectRef(32b0eec39cfa87ac523554acce28b667f9bc98bb0200000001000000)]\n",
-      "\u001b[0m"
-     ]
+     "data": {
+      "text/plain": [
+       "'[RayActor(name=\\'mnist\\', command=[\\'bash\\', \\'-c\\', \"python -m torch.distributed.run --rdzv_backend static --rdzv_endpoint $TORCHX_RANK0_HOST:49782 --rdzv_id \\'mnist-nm426236fqknz\\' --nnodes 2 --nproc_per_node 1 --node_rank \\'0\\' --tee 3 --role \\'\\' mnist.py\"], env={\\'LOGLEVEL\\': \\'DEBUG\\', \\'TORCH_DISTRIBUTED_DEBUG\\': \\'DETAIL\\', \\'TORCHX_JOB_ID\\': \\'ray://torchx/mnist-nm426236fqknz\\'}, num_cpus=1, num_gpus=0, min_replicas=2), RayActor(name=\\'mnist\\', command=[\\'bash\\', \\'-c\\', \"python -m torch.distributed.run --rdzv_backend static --rdzv_endpoint $TORCHX_RANK0_HOST:49782 --rdzv_id \\'mnist-nm426236fqknz\\' --nnodes 2 --nproc_per_node 1 --node_rank \\'1\\' --tee 3 --role \\'\\' mnist.py\"], env={\\'LOGLEVEL\\': \\'DEBUG\\', \\'TORCH_DISTRIBUTED_DEBUG\\': \\'DETAIL\\', \\'TORCHX_JOB_ID\\': \\'ray://torchx/mnist-nm426236fqknz\\'}, num_cpus=1, num_gpus=0, min_replicas=2)]\\n2023-03-03 13:08:48,406\\tINFO worker.py:1230 -- Using address 10.129.2.222:6379 set in the environment variable RAY_ADDRESS\\n2023-03-03 13:08:48,406\\tINFO worker.py:1342 -- Connecting to existing Ray cluster at address: 10.129.2.222:6379...\\n2023-03-03 13:08:48,413\\tINFO worker.py:1519 -- Connected to Ray cluster. View the dashboard at \\x1b[1m\\x1b[32mhttp://10.129.2.222:8265 \\x1b[39m\\x1b[22m\\nWaiting for minimum placement group to start.\\nSuccessfully created placement groups\\nSuccessfully placed command actors\\nEntering main loop, start executing the script on worker nodes\\nrunning ray.wait on [ObjectRef(4482c0d3e15a41a806094fedcf394a8e91a4a2b10500000001000000), ObjectRef(9f79440f8f098da04ea4d79eb7ab2872e23b3c2b0500000001000000)]\\nrunning ray.wait on [ObjectRef(4482c0d3e15a41a806094fedcf394a8e91a4a2b10500000001000000), ObjectRef(d980cb79d3ebbeee4ea4d79eb7ab2872e23b3c2b0500000001000000)]\\nTraceback (most recent call last):\\n  File \"ray_driver.py\", line 312, in <module>\\n    main()\\n  File \"ray_driver.py\", line 308, in main\\n    driver.run()\\n  File \"ray_driver.py\", line 293, in run\\n    terminal = self._step()\\n  File \"ray_driver.py\", line 245, in _step\\n    result = ray.get(object_ref)\\n  File \"/home/ray/anaconda3/lib/python3.8/site-packages/ray/_private/client_mode_hook.py\", line 105, in wrapper\\n    return func(*args, **kwargs)\\n  File \"/home/ray/anaconda3/lib/python3.8/site-packages/ray/_private/worker.py\", line 2289, in get\\n    raise value.as_instanceof_cause()\\nray.exceptions.RayTaskError(RuntimeError): \\x1b[36mray::CommandActor.exec_module()\\x1b[39m (pid=3315, ip=10.129.2.222, repr=<ray_driver.CommandActor object at 0x7f7811062640>)\\n  File \"ray_driver.py\", line 76, in exec_module\\n    raise RuntimeError(\\nRuntimeError: Either MASTER_ADDR or MASTER_PORT are not set. This is most likely bug in torchxOpen issue at https://github.com/pytorch/torchx\\n'"
+      ]
+     },
+     "execution_count": 8,
+     "metadata": {},
+     "output_type": "execute_result"
     }
    ],
    "source": [
-    "cluster.job_logs(\"mnist-jlm13hx5g53mk\")"
+    "print(job.logs())"
    ]
   },
   {
@@ -2039,7 +322,7 @@
  ],
  "metadata": {
   "kernelspec": {
-   "display_name": "Python 3.9.7 64-bit",
+   "display_name": "Python 3 (ipykernel)",
    "language": "python",
    "name": "python3"
   },
diff --git a/src/codeflare_sdk/cluster/cluster.py b/src/codeflare_sdk/cluster/cluster.py
index 80fcd869..b727e0cb 100644
--- a/src/codeflare_sdk/cluster/cluster.py
+++ b/src/codeflare_sdk/cluster/cluster.py
@@ -270,7 +270,9 @@ def job_logs(self, job_id: str) -> str:
         client = JobSubmissionClient(dashboard_route)
         return client.get_job_logs(job_id)
 
-    def torchx_config(self, working_dir: str = None, requirements: str = None) -> Dict[str, str]:
+    def torchx_config(
+        self, working_dir: str = None, requirements: str = None
+    ) -> Dict[str, str]:
         dashboard_address = f"{self.cluster_dashboard_uri().lstrip('http://')}"
         to_return = {
             "cluster_name": self.config.name,
diff --git a/src/codeflare_sdk/job/jobs.py b/src/codeflare_sdk/job/jobs.py
index 6fa12e94..b95a9ba0 100644
--- a/src/codeflare_sdk/job/jobs.py
+++ b/src/codeflare_sdk/job/jobs.py
@@ -27,6 +27,7 @@
 all_jobs: List["Job"] = []
 torchx_runner = get_runner()
 
+
 class JobDefinition(metaclass=abc.ABCMeta):
     def _dry_run(self, cluster: "Cluster"):
         pass
@@ -44,11 +45,10 @@ def logs(self):
 
 
 class DDPJobDefinition(JobDefinition):
-
     def __init__(
         self,
         script: Optional[str] = None,
-        m: Optional[str]=None,
+        m: Optional[str] = None,
         script_args: Optional[List[str]] = None,
         name: Optional[str] = None,
         cpu: Optional[int] = None,
@@ -63,9 +63,11 @@ def __init__(
         scheduler_args: Optional[Dict[str, str]] = None,
     ):
         if bool(script) == bool(m):  # logical XOR
-            raise ValueError("Exactly one of the following arguments must be defined: [script, m].")
+            raise ValueError(
+                "Exactly one of the following arguments must be defined: [script, m]."
+            )
         self.script = script
-        self.m=m
+        self.m = m
         self.script_args: List[str] = script_args if script_args is not None else []
         self.name = name
         self.cpu = cpu
@@ -77,7 +79,9 @@ def __init__(
         self.max_retries = max_retries
         self.mounts: List[str] = mounts if mounts is not None else []
         self.rdzv_port = rdzv_port
-        self.scheduler_args: Dict[str, str] = scheduler_args if scheduler_args is not None else dict()
+        self.scheduler_args: Dict[str, str] = (
+            scheduler_args if scheduler_args is not None else dict()
+        )
 
     def _dry_run(self, cluster: "Cluster"):
         j = f"{cluster.config.max_worker}x{max(cluster.config.gpu, 1)}"  # # of proc. = # of gpus
@@ -90,7 +94,9 @@ def _dry_run(self, cluster: "Cluster"):
                 h=self.h,
                 cpu=self.cpu if self.cpu is not None else cluster.config.max_cpus,
                 gpu=self.gpu if self.gpu is not None else cluster.config.gpu,
-                memMB=self.memMB if self.memMB is not None else cluster.config.max_memory * 1024,
+                memMB=self.memMB
+                if self.memMB is not None
+                else cluster.config.max_memory * 1024,
                 j=self.j if self.j is not None else j,
                 env=self.env,
                 max_retries=self.max_retries,
@@ -99,7 +105,7 @@ def _dry_run(self, cluster: "Cluster"):
             ),
             scheduler=cluster.torchx_scheduler,
             cfg=cluster.torchx_config(**self.scheduler_args),
-            workspace=f"file://{Path.cwd()}"
+            workspace=f"file://{Path.cwd()}",
         )
 
     def submit(self, cluster: "Cluster") -> "Job":
@@ -107,11 +113,7 @@ def submit(self, cluster: "Cluster") -> "Job":
 
 
 class DDPJob(Job):
-    def __init__(
-        self,
-        job_definition: "DDPJobDefinition",
-        cluster: "Cluster"
-    ):
+    def __init__(self, job_definition: "DDPJobDefinition", cluster: "Cluster"):
         self.job_definition = job_definition
         self.cluster = cluster
         self._app_handle = torchx_runner.schedule(job_definition._dry_run(cluster))

From 022bc761f5f95619bc01d4791e41323db1f1c78a Mon Sep 17 00:00:00 2001
From: Michael Clifford <mcliffor@redhat.com>
Date: Thu, 23 Mar 2023 13:57:43 -0400
Subject: [PATCH 3/4] added job tests (#1)

* WIP job tests

* added unit tests for Jobs

* add more specificity to tests
---
 tests/unit_test.py | 195 +++++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 195 insertions(+)

diff --git a/tests/unit_test.py b/tests/unit_test.py
index 95051400..bd9261c4 100644
--- a/tests/unit_test.py
+++ b/tests/unit_test.py
@@ -16,6 +16,7 @@
 import sys
 import filecmp
 import os
+import re
 
 parent = Path(__file__).resolve().parents[1]
 sys.path.append(str(parent) + "/src")
@@ -46,10 +47,20 @@
     RayClusterStatus,
     CodeFlareClusterStatus,
 )
+from codeflare_sdk.job.jobs import (
+    JobDefinition,
+    Job,
+    DDPJobDefinition,
+    DDPJob,
+    torchx_runner,
+)
 import openshift
 from openshift import OpenShiftPythonException
 from openshift.selector import Selector
 import ray
+from torchx.specs import AppDryRunInfo, AppDef
+from torchx.runner import get_runner, Runner
+from torchx.schedulers.ray_scheduler import RayJob
 import pytest
 
 
@@ -1535,6 +1546,7 @@ def test_cluster_status(mocker):
     mocker.patch(
         "codeflare_sdk.cluster.cluster._ray_cluster_status", return_value=fake_ray
     )
+
     status, ready = cf.status()
     assert status == CodeFlareClusterStatus.STARTING
     assert ready == False
@@ -1594,3 +1606,186 @@ def test_cmd_line_generation():
 def test_cleanup():
     os.remove("test.yaml")
     os.remove("raytest2.yaml")
+
+
+def test_jobdefinition_coverage():
+    abstract = JobDefinition()
+    cluster = Cluster(test_config_creation())
+    abstract._dry_run(cluster)
+    abstract.submit(cluster)
+
+
+def test_job_coverage():
+    abstract = Job()
+    abstract.status()
+    abstract.logs()
+
+
+def test_DDPJobDefinition_creation():
+    ddp = DDPJobDefinition(
+        script="test.py",
+        m=None,
+        script_args=["test"],
+        name="test",
+        cpu=1,
+        gpu=0,
+        memMB=1024,
+        h=None,
+        j="2x1",
+        env={"test": "test"},
+        max_retries=0,
+        mounts=[],
+        rdzv_port=29500,
+        scheduler_args={"requirements": "test"},
+    )
+    assert ddp.script == "test.py"
+    assert ddp.m == None
+    assert ddp.script_args == ["test"]
+    assert ddp.name == "test"
+    assert ddp.cpu == 1
+    assert ddp.gpu == 0
+    assert ddp.memMB == 1024
+    assert ddp.h == None
+    assert ddp.j == "2x1"
+    assert ddp.env == {"test": "test"}
+    assert ddp.max_retries == 0
+    assert ddp.mounts == []
+    assert ddp.rdzv_port == 29500
+    assert ddp.scheduler_args == {"requirements": "test"}
+    return ddp
+
+
+def test_DDPJobDefinition_dry_run():
+    """
+    Test that the dry run method returns the correct type: AppDryRunInfo,
+    that the attributes of the returned object are of the correct type,
+    and that the values from cluster and job definition are correctly passed.
+    """
+    ddp = test_DDPJobDefinition_creation()
+    cluster = Cluster(test_config_creation())
+    ddp_job = ddp._dry_run(cluster)
+    assert type(ddp_job) == AppDryRunInfo
+    assert ddp_job._fmt is not None
+    assert type(ddp_job.request) == RayJob
+    assert type(ddp_job._app) == AppDef
+    assert type(ddp_job._cfg) == type(dict())
+    assert type(ddp_job._scheduler) == type(str())
+
+    assert ddp_job.request.app_id.startswith("test")
+    assert ddp_job.request.working_dir.startswith("/tmp/torchx_workspace")
+    assert ddp_job.request.cluster_name == "unit-test-cluster"
+    assert ddp_job.request.requirements == "test"
+
+    assert ddp_job._app.roles[0].resource.cpu == 1
+    assert ddp_job._app.roles[0].resource.gpu == 0
+    assert ddp_job._app.roles[0].resource.memMB == 1024
+
+    assert ddp_job._cfg["cluster_name"] == "unit-test-cluster"
+    assert ddp_job._cfg["requirements"] == "test"
+
+    assert ddp_job._scheduler == "ray"
+
+
+def test_DDPJobDefinition_dry_run_no_resource_args():
+    """
+    Test that the dry run correctly gets resources from the cluster object
+    when the job definition does not specify resources.
+    """
+    cluster = Cluster(test_config_creation())
+    ddp = DDPJobDefinition(
+        script="test.py",
+        m=None,
+        script_args=["test"],
+        name="test",
+        h=None,
+        env={"test": "test"},
+        max_retries=0,
+        mounts=[],
+        rdzv_port=29500,
+        scheduler_args={"requirements": "test"},
+    )
+    ddp_job = ddp._dry_run(cluster)
+
+    assert ddp_job._app.roles[0].resource.cpu == cluster.config.max_cpus
+    assert ddp_job._app.roles[0].resource.gpu == cluster.config.gpu
+    assert ddp_job._app.roles[0].resource.memMB == cluster.config.max_memory * 1024
+    assert (
+        parse_j(ddp_job._app.roles[0].args[1])
+        == f"{cluster.config.max_worker}x{cluster.config.gpu}"
+    )
+
+
+def test_DDPJobDefinition_submit(mocker):
+    """
+    Tests that the submit method returns the correct type: DDPJob
+    And that the attributes of the returned object are of the correct type
+    """
+    ddp_def = test_DDPJobDefinition_creation()
+    cluster = Cluster(test_config_creation())
+    mocker.patch(
+        "codeflare_sdk.job.jobs.torchx_runner.schedule",
+        return_value="fake-dashboard-url",
+    )  # a fake app_handle
+    ddp_job = ddp_def.submit(cluster)
+    assert type(ddp_job) == DDPJob
+    assert type(ddp_job.job_definition) == DDPJobDefinition
+    assert type(ddp_job.cluster) == Cluster
+    assert type(ddp_job._app_handle) == str
+    assert ddp_job._app_handle == "fake-dashboard-url"
+
+
+def test_DDPJob_creation(mocker):
+    ddp_def = test_DDPJobDefinition_creation()
+    cluster = Cluster(test_config_creation())
+    mocker.patch(
+        "codeflare_sdk.job.jobs.torchx_runner.schedule",
+        return_value="fake-dashboard-url",
+    )  # a fake app_handle
+    ddp_job = DDPJob(ddp_def, cluster)
+    assert type(ddp_job) == DDPJob
+    assert type(ddp_job.job_definition) == DDPJobDefinition
+    assert type(ddp_job.cluster) == Cluster
+    assert type(ddp_job._app_handle) == str
+    assert ddp_job._app_handle == "fake-dashboard-url"
+    _, args, kwargs = torchx_runner.schedule.mock_calls[0]
+    assert type(args[0]) == AppDryRunInfo
+    job_info = args[0]
+    assert type(job_info.request) == RayJob
+    assert type(job_info._app) == AppDef
+    assert type(job_info._cfg) == type(dict())
+    assert type(job_info._scheduler) == type(str())
+    return ddp_job
+
+
+def test_DDPJob_status(mocker):
+    ddp_job = test_DDPJob_creation(mocker)
+    mocker.patch(
+        "codeflare_sdk.job.jobs.torchx_runner.status", return_value="fake-status"
+    )
+    assert ddp_job.status() == "fake-status"
+    _, args, kwargs = torchx_runner.status.mock_calls[0]
+    assert args[0] == "fake-dashboard-url"
+
+
+def test_DDPJob_logs(mocker):
+    ddp_job = test_DDPJob_creation(mocker)
+    mocker.patch(
+        "codeflare_sdk.job.jobs.torchx_runner.log_lines", return_value="fake-logs"
+    )
+    assert ddp_job.logs() == "fake-logs"
+    _, args, kwargs = torchx_runner.log_lines.mock_calls[0]
+    assert args[0] == "fake-dashboard-url"
+
+
+def parse_j(cmd):
+
+    pattern = r"--nnodes\s+\d+\s+--nproc_per_node\s+\d+"
+    match = re.search(pattern, cmd)
+    if match:
+        substring = match.group(0)
+    else:
+        return None
+    args = substring.split()
+    max_worker = args[1]
+    gpu = args[3]
+    return f"{max_worker}x{gpu}"

From 103be3cba8ea22b022eece611e9eb5f49037e086 Mon Sep 17 00:00:00 2001
From: Kevin <kpostlet@redhat.com>
Date: Thu, 23 Mar 2023 14:45:53 -0400
Subject: [PATCH 4/4] add torchx to requirements file

Signed-off-by: Kevin <kpostlet@redhat.com>
---
 requirements.txt | 1 +
 1 file changed, 1 insertion(+)

diff --git a/requirements.txt b/requirements.txt
index d0bbd2c9..59f8082d 100644
--- a/requirements.txt
+++ b/requirements.txt
@@ -1,3 +1,4 @@
 openshift-client==1.0.18
 rich==12.5.1
 ray[default]==2.1.0
+git+https://github.com/project-codeflare/torchx@6517d5b060e4fe32b9ad41019c3bef647095c35f#egg=torchx
\ No newline at end of file