securefederatedai · alexey-gruzdev · Aug 26, 2021 · May 28, 2021 · May 28, 2021 · Jun 10, 2021
diff --git a/openfl-workspace/keras_nlp/src/nlp_dataloader.py b/openfl-workspace/keras_nlp/src/nlp_dataloader.py
@@ -90,7 +90,7 @@ def get_valid_data_size(self):
         """
         return self.X_valid[0].shape[0]
 
-    # TODO: first param sould be self. it should be added or renamed
+    @staticmethod
     def _batch_generator(X1, X2, y, idxs, batch_size, num_batches):
         """
         Generate batch of data.

diff --git a/openfl-workspace/tf_cnn_histology/plan/plan.yaml b/openfl-workspace/tf_cnn_histology/plan/plan.yaml
@@ -61,5 +61,4 @@ tasks:
       batch_size: 32
       epochs: 1
       metrics:
-      - loss
-      num_batches: 1
+      - loss
diff --git a/openfl-workspace/workspace/plan/defaults/tasks_tensorflow.yaml b/openfl-workspace/workspace/plan/defaults/tasks_tensorflow.yaml
@@ -18,6 +18,6 @@ train:
   function : train_batches
   kwargs   :
     batch_size  : 32
-    num_batches : 1
     metrics     :
     - loss
+    epochs      : 1
diff --git a/openfl-workspace/workspace/plan/defaults/tasks_torch.yaml b/openfl-workspace/workspace/plan/defaults/tasks_torch.yaml
@@ -17,3 +17,4 @@ train:
   kwargs   :
     metrics     :
     - loss
+    epochs : 1
diff --git a/openfl/federated/task/runner_keras.py b/openfl/federated/task/runner_keras.py
@@ -60,7 +60,8 @@ def rebuild_model(self, round_num, input_tensor_dict, validation=False):
         else:
             self.set_tensor_dict(input_tensor_dict, with_opt_vars=False)
 
-    def train(self, col_name, round_num, input_tensor_dict, metrics, num_batches=None, **kwargs):
+    def train(self, col_name, round_num, input_tensor_dict,
+              metrics, epochs=1, batch_size=1, **kwargs):
         """
         Perform the training for a specified number of batches.
 
@@ -77,10 +78,11 @@ def train(self, col_name, round_num, input_tensor_dict, metrics, num_batches=Non
 
         # rebuild model with updated weights
         self.rebuild_model(round_num, input_tensor_dict)
-
-        results = self.train_iteration(self.data_loader.get_train_loader(num_batches),
-                                       metrics=metrics,
-                                       **kwargs)
+        for epoch in range(epochs):
+            self.logger.info(f'Run {epoch} epoch of {round_num} round')
+            results = self.train_iteration(self.data_loader.get_train_loader(batch_size),
+                                           metrics=metrics,
+                                           **kwargs)
 
         # output metric tensors (scalar)
         origin = col_name

diff --git a/openfl/federated/task/runner_pt.py b/openfl/federated/task/runner_pt.py
@@ -129,7 +129,7 @@ def validate(self, col_name, round_num, input_tensor_dict,
         return output_tensor_dict, {}
 
     def train_batches(self, col_name, round_num, input_tensor_dict,
-                      num_batches=None, use_tqdm=False, **kwargs):
+                      num_batches=None, use_tqdm=False, epochs=1, **kwargs):
         """Train batches.
 
         Train the model on the requested number of batches.
@@ -150,10 +150,12 @@ def train_batches(self, col_name, round_num, input_tensor_dict,
         # set to "training" mode
         self.train()
         self.to(self.device)
-        loader = self.data_loader.get_train_loader(num_batches)
-        if use_tqdm:
-            loader = tqdm.tqdm(loader, desc='train epoch')
-        metric = self.train_epoch(loader)
+        for epoch in range(epochs):
+            self.logger.info(f'Run {epoch} epoch of {round_num} round')
+            loader = self.data_loader.get_train_loader(num_batches)
+            if use_tqdm:
+                loader = tqdm.tqdm(loader, desc='train epoch')
+            metric = self.train_epoch(loader)
         # Output metric tensors (scalar)
         origin = col_name
         tags = ('trained',)

diff --git a/openfl/federated/task/runner_tf.py b/openfl/federated/task/runner_tf.py
@@ -84,7 +84,7 @@ def rebuild_model(self, round_num, input_tensor_dict, validation=False):
             self.set_tensor_dict(input_tensor_dict, with_opt_vars=False)
 
     def train_batches(self, col_name, round_num, input_tensor_dict,
-                      num_batches, use_tqdm=False, **kwargs):
+                      epochs=1, use_tqdm=False, **kwargs):
         """
         Perform the training for a specified number of batches.
 
@@ -107,22 +107,17 @@ def train_batches(self, col_name, round_num, input_tensor_dict,
         self.rebuild_model(round_num, input_tensor_dict)
 
         tf.keras.backend.set_learning_phase(True)
-
         losses = []
-        batch_num = 0
 
-        while batch_num < num_batches:
+        for epoch in range(epochs):
+            self.logger.info(f'Run {epoch} epoch of {round_num} round')
             # get iterator for batch draws (shuffling happens here)
             gen = self.data_loader.get_train_loader(batch_size)
             if use_tqdm:
                 gen = tqdm.tqdm(gen, desc='training epoch')
 
             for (X, y) in gen:
-                if batch_num >= num_batches:
-                    break
-                else:
-                    losses.append(self.train_batch(X, y))
-                    batch_num += 1
+                losses.append(self.train_batch(X, y))
 
         # Output metric tensors (scalar)
         origin = col_name