ray-project · sven1977 · Jan 10, 2022 · Jan 7, 2022
@@ -57,6 +57,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(Trainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["entropy_coeff"] < 0:

@@ -210,6 +210,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(Trainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["num_gpus"] > 1:

@@ -105,6 +105,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(SACTrainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["num_gpus"] > 1:

@@ -195,7 +195,7 @@ def get_default_policy_class(self,
 
     @override(SimpleQTrainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
-
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["model"]["custom_model"]:

@@ -132,6 +132,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(SimpleQTrainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         # Update effective batch size to include n-step

@@ -111,6 +111,7 @@ def validate_config(self, config: TrainerConfigDict) -> None:
         Rewrites rollout_fragment_length to take into account burn-in and
         max_seq_len truncation.
         """
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["replay_sequence_length"] != -1:

@@ -120,6 +120,7 @@ def get_default_config(cls) -> TrainerConfigDict:
     def validate_config(self, config: TrainerConfigDict) -> None:
         """Checks and updates the config based on settings.
         """
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["exploration_config"]["type"] == "ParameterNoise":

@@ -194,6 +194,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(Trainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         config["action_repeat"] = config["env_config"]["frame_skip"]

@@ -210,6 +210,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(Trainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["num_gpus"] > 1:

@@ -169,6 +169,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(Trainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["num_gpus"] > 1:

@@ -33,6 +33,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(MARWILTrainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["beta"] != 0.0:

@@ -82,6 +82,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(Trainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["num_gpus"] > 1:

@@ -345,6 +345,9 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(Trainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
+        super().validate_config(config)
+
         if config["num_gpus"] > 1:
             raise ValueError("`num_gpus` > 1 not yet supported for MB-MPO!")
         if config["framework"] != "torch":

@@ -115,6 +115,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(SimpleQTrainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["framework"] != "torch":

@@ -45,6 +45,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(SACTrainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["replay_sequence_length"] != -1:

@@ -193,6 +193,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(DQNTrainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["use_state_preprocessor"] != DEPRECATED_VALUE:

@@ -159,6 +159,7 @@ def get_default_config(cls) -> TrainerConfigDict:
 
     @override(Trainer)
     def validate_config(self, config: TrainerConfigDict) -> None:
+        # Call super's validation method.
         super().validate_config(config)
 
         if config["num_gpus"] > 1:

@@ -149,7 +149,7 @@ def _init(self, config: TrainerConfigDict,
 
         @override(Trainer)
         def validate_config(self, config: PartialTrainerConfigDict):
-            # Call super (Trainer) validation method first.
+            # Call super's validation method.
             Trainer.validate_config(self, config)
             # Then call user defined one, if any.
             if validate_config is not None:

@@ -167,6 +167,8 @@ def validate_config(self, config: TrainerConfigDict) -> None:
         This hook is called explicitly prior to TrainOneStep() in the execution
         setups for DQN and APEX.
         """
+        # Call super's validation method.
+        super().validate_config(config)
 
         def f(batch, workers, config):
             policies = dict(workers.local_worker()

@@ -475,7 +475,7 @@ def valid_module(class_path):
         ma_policies = config["multiagent"]["policies"]
         if ma_policies:
             for pid, policy_spec in ma_policies.copy().items():
-                assert isinstance(policy_spec, (PolicySpec, list, tuple))
+                assert isinstance(policy_spec, PolicySpec)
                 # Class is None -> Use `policy_cls`.
                 if policy_spec.policy_class is None:
                     ma_policies[pid] = ma_policies[pid]._replace(