Tianshou/examples/mujoco/mujoco_env.py

import warnings

import gym

from tianshou.env import ShmemVectorEnv, VectorEnvNormObs

try:
    import envpool
except ImportError:
    envpool = None


def make_mujoco_env(task, seed, training_num, test_num, obs_norm):
    """Wrapper function for Mujoco env.

    If EnvPool is installed, it will automatically switch to EnvPool's Mujoco env.

    :return: a tuple of (single env, training envs, test envs).
    """
    if envpool is not None:
        train_envs = env = envpool.make_gym(task, num_envs=training_num, seed=seed)
        test_envs = envpool.make_gym(task, num_envs=test_num, seed=seed)
    else:
        warnings.warn(
            "Recommend using envpool (pip install envpool) "
            "to run Mujoco environments more efficiently."
        )
        env = gym.make(task)
        train_envs = ShmemVectorEnv(
            [lambda: gym.make(task) for _ in range(training_num)]
        )
        test_envs = ShmemVectorEnv([lambda: gym.make(task) for _ in range(test_num)])
        env.seed(seed)
        train_envs.seed(seed)
        test_envs.seed(seed)
    if obs_norm:
        # obs norm wrapper
        train_envs = VectorEnvNormObs(train_envs)
        test_envs = VectorEnvNormObs(test_envs, update_obs_rms=False)
        test_envs.set_obs_rms(train_envs.get_obs_rms())
    return env, train_envs, test_envs
Add vecenv wrappers for obs_norm to support running mujoco experiment with envpool (#628) - add VectorEnvWrapper and VectorEnvNormObs - obs_rms store in policy save/load - align mujoco scripts with atari: obs_norm, envpool, wandb and README 2022-05-05 07:55:15 -04:00			`import warnings`

Add show_progress option for trainer (#641) - A DummyTqdm class added to utils: it replicates the interface used by trainers, but does not show the progress bar; - Added a show_progress argument to the base trainer: when show_progress == True, dummy_tqdm is used in place of tqdm. 2022-05-17 17:41:59 +02:00			`import gym`

			`from tianshou.env import ShmemVectorEnv, VectorEnvNormObs`

Add vecenv wrappers for obs_norm to support running mujoco experiment with envpool (#628) - add VectorEnvWrapper and VectorEnvNormObs - obs_rms store in policy save/load - align mujoco scripts with atari: obs_norm, envpool, wandb and README 2022-05-05 07:55:15 -04:00			`try:`
			`import envpool`
			`except ImportError:`
			`envpool = None`


			`def make_mujoco_env(task, seed, training_num, test_num, obs_norm):`
			`"""Wrapper function for Mujoco env.`

			`If EnvPool is installed, it will automatically switch to EnvPool's Mujoco env.`

			`:return: a tuple of (single env, training envs, test envs).`
			`"""`
			`if envpool is not None:`
			`train_envs = env = envpool.make_gym(task, num_envs=training_num, seed=seed)`
Fix num_envs=test_num (#653) * fix num_envs=test_num * fix mypy 2022-05-29 23:38:47 -05:00			`test_envs = envpool.make_gym(task, num_envs=test_num, seed=seed)`
Add vecenv wrappers for obs_norm to support running mujoco experiment with envpool (#628) - add VectorEnvWrapper and VectorEnvNormObs - obs_rms store in policy save/load - align mujoco scripts with atari: obs_norm, envpool, wandb and README 2022-05-05 07:55:15 -04:00			`else:`
			`warnings.warn(`
			`"Recommend using envpool (pip install envpool) "`
			`"to run Mujoco environments more efficiently."`
			`)`
			`env = gym.make(task)`
			`train_envs = ShmemVectorEnv(`
			`[lambda: gym.make(task) for _ in range(training_num)]`
			`)`
			`test_envs = ShmemVectorEnv([lambda: gym.make(task) for _ in range(test_num)])`
			`env.seed(seed)`
			`train_envs.seed(seed)`
			`test_envs.seed(seed)`
			`if obs_norm:`
			`# obs norm wrapper`
			`train_envs = VectorEnvNormObs(train_envs)`
			`test_envs = VectorEnvNormObs(test_envs, update_obs_rms=False)`
			`test_envs.set_obs_rms(train_envs.get_obs_rms())`
			`return env, train_envs, test_envs`