extend hl experiment builder

2024-03-12 11:43:52 +01:00 · 2024-03-12 11:43:52 +01:00 · 5762d2c2e0
commit 5762d2c2e0
parent 734119ec00
1 changed files with 82 additions and 1 deletions
--- a/tianshou/highlevel/experiment.py
+++ b/tianshou/highlevel/experiment.py
@ -2,7 +2,8 @@ import os
 import pickle
 from abc import abstractmethod
 from collections.abc import Sequence
-from dataclasses import dataclass
+from copy import copy
+from dataclasses import dataclass, asdict
 from pprint import pformat
 from typing import Self

@ -86,6 +87,33 @@ from tianshou.utils.string import ToStringMixin
 log = logging.getLogger(__name__)


+def shortener(input_string: str | None = None,
+              length: int = 1
+              ):
+    """Shorten the input string by keeping only the first `length` characters of each word.
+
+    If the input string is None or empty, return "default".
+    """
+    if input_string is None or len(input_string) == 0:
+        return "default"
+    output_parts = []
+
+    for part in input_string.split(","):
+        key, value = part.split("=")
+        modified_key = ""
+
+        key_parts = key.split(".")
+        for key_part in key_parts:
+            for word in key_part.split("_"):
+                modified_key += word[:length] + "_"
+            modified_key = modified_key[:-1] + "."
+        modified_key = modified_key[:-1]
+
+        output_parts.append(f"{modified_key}={value}")
+
+    return ",".join(output_parts)
+
+
@dataclass
 class ExperimentConfig:
    """Generic config for setting up the experiment, not RL or training specific."""
@ -338,6 +366,22 @@ class ExperimentBuilder:
        self._policy_wrapper_factory: PolicyWrapperFactory | None = None
        self._trainer_callbacks: TrainerCallbacks = TrainerCallbacks()

+    @property
+    def experiment_config(self):
+        return self._config
+
+    @experiment_config.setter
+    def experiment_config(self, experiment_config: ExperimentConfig):
+        self._config = experiment_config
+
+    @property
+    def sampling_config(self):
+        return self._sampling_config
+
+    @sampling_config.setter
+    def sampling_config(self, sampling_config: SamplingConfig):
+        self._sampling_config = sampling_config
+
    def with_logger_factory(self, logger_factory: LoggerFactory) -> Self:
        """Allows to customize the logger factory to use.

@ -442,6 +486,43 @@ class ExperimentBuilder:
        )
        return experiment

+    def build_default_seeded_experiments(self, num_experiments: int) -> dict[str, Experiment]:
+        """Creates a dict of experiments with non-overlapping seeds, starting from the configured seed.
+
+        The keys of the dict are the experiment names, which are derived from the seeds used in the experiments.
+        """
+
+        configured_experiment_config = copy(self.experiment_config)
+        configured_experiment_seed = configured_experiment_config.seed
+        configured_sampling_config = copy(self.sampling_config)
+        configured_train_seed = configured_sampling_config.train_seed
+        num_train_envs = configured_sampling_config.num_train_envs
+
+        seeded_experiments = {}
+        for i in range(num_experiments):
+            experiment_seed = configured_experiment_seed + i
+            new_experiment_config_dict = asdict(configured_experiment_config)
+            new_experiment_config_dict["seed"] = experiment_seed
+
+            new_train_seed = i * num_train_envs + configured_train_seed
+            new_sampling_config_dict = asdict(configured_sampling_config)
+            new_sampling_config_dict["train_seed"] = new_train_seed
+
+            self.experiment_config = ExperimentConfig(**new_experiment_config_dict)
+            self.sampling_config = SamplingConfig(**new_sampling_config_dict)
+            exp = self.build()
+
+            full_name = ",".join([f"experiment_seed={exp.config.seed}",
+                                  f"train_seed={exp.sampling_config.train_seed}",
+                                  f"test_seed={exp.sampling_config.test_seed}"])
+            experiment_name = shortener(full_name, 4)
+            seeded_experiments[experiment_name] = exp
+
+        # restore original config
+        self.experiment_config = configured_experiment_config
+        self.sampling_config = configured_sampling_config
+        return seeded_experiments
+

 class _BuilderMixinActorFactory(ActorFutureProviderProtocol):
    def __init__(self, continuous_actor_type: ContinuousActorType):