Tianshou/tianshou/highlevel/module/critic.py

from abc import ABC, abstractmethod
from collections.abc import Sequence

from torch import nn

from tianshou.highlevel.env import Environments, EnvType
from tianshou.highlevel.module.actor import ActorFuture
from tianshou.highlevel.module.core import TDevice, init_linear_orthogonal
from tianshou.highlevel.module.module_opt import ModuleOpt
from tianshou.highlevel.optim import OptimizerFactory
from tianshou.utils.net import continuous, discrete
from tianshou.utils.net.common import BaseActor, EnsembleLinear, Net
from tianshou.utils.string import ToStringMixin


class CriticFactory(ToStringMixin, ABC):
    @abstractmethod
    def create_module(
        self,
        envs: Environments,
        device: TDevice,
        use_action: bool,
        discrete_last_size_use_action_shape: bool = False,
    ) -> nn.Module:
        """:param envs: the environments
        :param device: the torch device
        :param use_action: whether to (additionally) expect the action as input
        :param discrete_last_size_use_action_shape: whether, for the discrete case, the output dimension shall use the action shape
        :return: the module
        """

    def create_module_opt(
        self,
        envs: Environments,
        device: TDevice,
        use_action: bool,
        optim_factory: OptimizerFactory,
        lr: float,
        discrete_last_size_use_action_shape: bool = False,
    ) -> ModuleOpt:
        module = self.create_module(
            envs,
            device,
            use_action,
            discrete_last_size_use_action_shape=discrete_last_size_use_action_shape,
        )
        opt = optim_factory.create_optimizer(module, lr)
        return ModuleOpt(module, opt)


class CriticFactoryDefault(CriticFactory):
    """A critic factory which, depending on the type of environment, creates a suitable MLP-based critic."""

    DEFAULT_HIDDEN_SIZES = (64, 64)

    def __init__(self, hidden_sizes: Sequence[int] = DEFAULT_HIDDEN_SIZES):
        self.hidden_sizes = hidden_sizes

    def create_module(
        self,
        envs: Environments,
        device: TDevice,
        use_action: bool,
        discrete_last_size_use_action_shape=False,
    ) -> nn.Module:
        factory: CriticFactory
        env_type = envs.get_type()
        match env_type:
            case EnvType.CONTINUOUS:
                factory = CriticFactoryContinuousNet(self.hidden_sizes)
            case EnvType.DISCRETE:
                factory = CriticFactoryDiscreteNet(self.hidden_sizes)
            case _:
                raise ValueError(f"{env_type} not supported")
        return factory.create_module(
            envs,
            device,
            use_action,
            discrete_last_size_use_action_shape=discrete_last_size_use_action_shape,
        )


class CriticFactoryContinuousNet(CriticFactory):
    def __init__(self, hidden_sizes: Sequence[int]):
        self.hidden_sizes = hidden_sizes

    def create_module(
        self,
        envs: Environments,
        device: TDevice,
        use_action: bool,
        discrete_last_size_use_action_shape=False,
    ) -> nn.Module:
        action_shape = envs.get_action_shape() if use_action else 0
        net_c = Net(
            envs.get_observation_shape(),
            action_shape=action_shape,
            hidden_sizes=self.hidden_sizes,
            concat=use_action,
            activation=nn.Tanh,
            device=device,
        )
        critic = continuous.Critic(net_c, device=device).to(device)
        init_linear_orthogonal(critic)
        return critic


class CriticFactoryDiscreteNet(CriticFactory):
    def __init__(self, hidden_sizes: Sequence[int]):
        self.hidden_sizes = hidden_sizes

    def create_module(
        self,
        envs: Environments,
        device: TDevice,
        use_action: bool,
        discrete_last_size_use_action_shape=False,
    ) -> nn.Module:
        action_shape = envs.get_action_shape() if use_action else 0
        net_c = Net(
            envs.get_observation_shape(),
            action_shape=action_shape,
            hidden_sizes=self.hidden_sizes,
            concat=use_action,
            activation=nn.Tanh,
            device=device,
        )
        last_size = envs.get_action_shape() if discrete_last_size_use_action_shape else 1
        critic = discrete.Critic(net_c, device=device, last_size=last_size).to(device)
        init_linear_orthogonal(critic)
        return critic


class CriticFactoryReuseActor(CriticFactory):
    """A critic factory which reuses the actor's preprocessing component.

    This class is for internal use in experiment builders only.
    """

    def __init__(self, actor_future: ActorFuture):
        """:param actor_future: the object, which will hold the actor instance later when the critic is to be created"""
        self.actor_future = actor_future

    def _tostring_excludes(self) -> list[str]:
        return ["actor_future"]

    def create_module(
        self,
        envs: Environments,
        device: TDevice,
        use_action: bool,
        discrete_last_size_use_action_shape=False,
    ) -> nn.Module:
        actor = self.actor_future.actor
        if not isinstance(actor, BaseActor):
            raise ValueError(
                f"Option critic_use_action can only be used if actor is of type {BaseActor.__class__.__name__}",
            )
        if envs.get_type().is_discrete():
            last_size = envs.get_action_shape() if discrete_last_size_use_action_shape else 1
            return discrete.Critic(
                actor.get_preprocess_net(),
                device=device,
                last_size=last_size,
            ).to(device)
        elif envs.get_type().is_continuous():
            return continuous.Critic(actor.get_preprocess_net(), device=device).to(device)
        else:
            raise ValueError


class CriticEnsembleFactory:
    @abstractmethod
    def create_module(
        self,
        envs: Environments,
        device: TDevice,
        ensemble_size: int,
        use_action: bool,
    ) -> nn.Module:
        pass

    def create_module_opt(
        self,
        envs: Environments,
        device: TDevice,
        ensemble_size: int,
        use_action: bool,
        optim_factory: OptimizerFactory,
        lr: float,
    ) -> ModuleOpt:
        module = self.create_module(envs, device, ensemble_size, use_action)
        opt = optim_factory.create_optimizer(module, lr)
        return ModuleOpt(module, opt)


class CriticEnsembleFactoryDefault(CriticEnsembleFactory):
    """A critic ensemble factory which, depending on the type of environment, creates a suitable MLP-based critic."""

    DEFAULT_HIDDEN_SIZES = (64, 64)

    def __init__(self, hidden_sizes: Sequence[int] = DEFAULT_HIDDEN_SIZES):
        self.hidden_sizes = hidden_sizes

    def create_module(
        self,
        envs: Environments,
        device: TDevice,
        ensemble_size: int,
        use_action: bool,
    ) -> nn.Module:
        env_type = envs.get_type()
        factory: CriticEnsembleFactory
        match env_type:
            case EnvType.CONTINUOUS:
                factory = CriticEnsembleFactoryContinuousNet(self.hidden_sizes)
            case EnvType.DISCRETE:
                raise NotImplementedError("No default is implemented for the discrete case")
            case _:
                raise ValueError(f"{env_type} not supported")
        return factory.create_module(
            envs,
            device,
            ensemble_size,
            use_action,
        )


class CriticEnsembleFactoryContinuousNet(CriticEnsembleFactory):
    def __init__(self, hidden_sizes: Sequence[int]):
        self.hidden_sizes = hidden_sizes

    def create_module(
        self,
        envs: Environments,
        device: TDevice,
        ensemble_size: int,
        use_action: bool,
    ) -> nn.Module:
        def linear_layer(x: int, y: int) -> EnsembleLinear:
            return EnsembleLinear(ensemble_size, x, y)

        action_shape = envs.get_action_shape() if use_action else 0
        net_c = Net(
            envs.get_observation_shape(),
            action_shape=action_shape,
            hidden_sizes=self.hidden_sizes,
            concat=use_action,
            activation=nn.Tanh,
            device=device,
            linear_layer=linear_layer,
        )
        critic = continuous.Critic(
            net_c,
            device=device,
            linear_layer=linear_layer,
            flatten_input=False,
        ).to(device)
        init_linear_orthogonal(critic)
        return critic
Add support for discrete PPO * Refactored module `module` (split into submodules) * Basic support for discrete environments * Implement Atari env. factory * Implement DQN-based actor factory * Implement notion of reusing agent preprocessing network for critic * Add example atari_ppo_hl 2023-09-28 20:07:52 +02:00			`from abc import ABC, abstractmethod`
			`from collections.abc import Sequence`

			`from torch import nn`

			`from tianshou.highlevel.env import Environments, EnvType`
Support discrete SAC in high-level API * Changed machanism for reusing actor's preprocessing module in critics to avoid special handling in AgentFactory implementations, improving separation of concerns: - Added CriticFactoryReuseActor as the new critic factory - Added ActorFactoryTransientStorageDecorator to pass on the actor data - Added helper classes ActorFuture, ActorFutureProviderProtocol * Add example atari_sac_hl 2023-10-10 19:11:49 +02:00			`from tianshou.highlevel.module.actor import ActorFuture`
Add support for discrete PPO * Refactored module `module` (split into submodules) * Basic support for discrete environments * Implement Atari env. factory * Implement DQN-based actor factory * Implement notion of reusing agent preprocessing network for critic * Add example atari_ppo_hl 2023-09-28 20:07:52 +02:00			`from tianshou.highlevel.module.core import TDevice, init_linear_orthogonal`
Support PG/Reinforce in high-level API * Add example mujoco_reinforce_hl * Extended functionality of ActorFactory to support creation of ModuleOpt 2023-10-10 12:55:25 +02:00			`from tianshou.highlevel.module.module_opt import ModuleOpt`
			`from tianshou.highlevel.optim import OptimizerFactory`
Change high-level DQN interface to expect an actor instead of a critic, because that is what is functionally required 2023-10-05 19:21:08 +02:00			`from tianshou.utils.net import continuous, discrete`
Support discrete SAC in high-level API * Changed machanism for reusing actor's preprocessing module in critics to avoid special handling in AgentFactory implementations, improving separation of concerns: - Added CriticFactoryReuseActor as the new critic factory - Added ActorFactoryTransientStorageDecorator to pass on the actor data - Added helper classes ActorFuture, ActorFutureProviderProtocol * Add example atari_sac_hl 2023-10-10 19:11:49 +02:00			`from tianshou.utils.net.common import BaseActor, EnsembleLinear, Net`
Log full experiment configuration, adding string representations to relevant classes 2023-10-03 21:14:22 +02:00			`from tianshou.utils.string import ToStringMixin`
Add support for discrete PPO * Refactored module `module` (split into submodules) * Basic support for discrete environments * Implement Atari env. factory * Implement DQN-based actor factory * Implement notion of reusing agent preprocessing network for critic * Add example atari_ppo_hl 2023-09-28 20:07:52 +02:00

Log full experiment configuration, adding string representations to relevant classes 2023-10-03 21:14:22 +02:00			`class CriticFactory(ToStringMixin, ABC):`
Add support for discrete PPO * Refactored module `module` (split into submodules) * Basic support for discrete environments * Implement Atari env. factory * Implement DQN-based actor factory * Implement notion of reusing agent preprocessing network for critic * Add example atari_ppo_hl 2023-09-28 20:07:52 +02:00			`@abstractmethod`
Support discrete SAC in high-level API * Changed machanism for reusing actor's preprocessing module in critics to avoid special handling in AgentFactory implementations, improving separation of concerns: - Added CriticFactoryReuseActor as the new critic factory - Added ActorFactoryTransientStorageDecorator to pass on the actor data - Added helper classes ActorFuture, ActorFutureProviderProtocol * Add example atari_sac_hl 2023-10-10 19:11:49 +02:00			`def create_module(`
			`self,`
			`envs: Environments,`
			`device: TDevice,`
			`use_action: bool,`
			`discrete_last_size_use_action_shape: bool = False,`
			`) -> nn.Module:`
			`""":param envs: the environments`
			`:param device: the torch device`
			`:param use_action: whether to (additionally) expect the action as input`
			`:param discrete_last_size_use_action_shape: whether, for the discrete case, the output dimension shall use the action shape`
			`:return: the module`
			`"""`
Add support for discrete PPO * Refactored module `module` (split into submodules) * Basic support for discrete environments * Implement Atari env. factory * Implement DQN-based actor factory * Implement notion of reusing agent preprocessing network for critic * Add example atari_ppo_hl 2023-09-28 20:07:52 +02:00
Simplify critic/agent with optimizer generation After adding a function to create ModuleOpt instances directly from AgentFactory and CriticFactory, * several mixins for AgentFactories are no longer needed (deleted) * additional abstractions for ModuleOptFactories are no longer needed (deleted) 2023-10-10 13:12:25 +02:00			`def create_module_opt(`
			`self,`
			`envs: Environments,`
			`device: TDevice,`
			`use_action: bool,`
			`optim_factory: OptimizerFactory,`
			`lr: float,`
Support discrete SAC in high-level API * Changed machanism for reusing actor's preprocessing module in critics to avoid special handling in AgentFactory implementations, improving separation of concerns: - Added CriticFactoryReuseActor as the new critic factory - Added ActorFactoryTransientStorageDecorator to pass on the actor data - Added helper classes ActorFuture, ActorFutureProviderProtocol * Add example atari_sac_hl 2023-10-10 19:11:49 +02:00			`discrete_last_size_use_action_shape: bool = False,`
Simplify critic/agent with optimizer generation After adding a function to create ModuleOpt instances directly from AgentFactory and CriticFactory, * several mixins for AgentFactories are no longer needed (deleted) * additional abstractions for ModuleOptFactories are no longer needed (deleted) 2023-10-10 13:12:25 +02:00			`) -> ModuleOpt:`
Support discrete SAC in high-level API * Changed machanism for reusing actor's preprocessing module in critics to avoid special handling in AgentFactory implementations, improving separation of concerns: - Added CriticFactoryReuseActor as the new critic factory - Added ActorFactoryTransientStorageDecorator to pass on the actor data - Added helper classes ActorFuture, ActorFutureProviderProtocol * Add example atari_sac_hl 2023-10-10 19:11:49 +02:00			`module = self.create_module(`
			`envs,`
			`device,`
			`use_action,`
			`discrete_last_size_use_action_shape=discrete_last_size_use_action_shape,`
			`)`
Simplify critic/agent with optimizer generation After adding a function to create ModuleOpt instances directly from AgentFactory and CriticFactory, * several mixins for AgentFactories are no longer needed (deleted) * additional abstractions for ModuleOptFactories are no longer needed (deleted) 2023-10-10 13:12:25 +02:00			`opt = optim_factory.create_optimizer(module, lr)`
			`return ModuleOpt(module, opt)`

Add support for discrete PPO * Refactored module `module` (split into submodules) * Basic support for discrete environments * Implement Atari env. factory * Implement DQN-based actor factory * Implement notion of reusing agent preprocessing network for critic * Add example atari_ppo_hl 2023-09-28 20:07:52 +02:00
			`class CriticFactoryDefault(CriticFactory):`
			`"""A critic factory which, depending on the type of environment, creates a suitable MLP-based critic."""`

			`DEFAULT_HIDDEN_SIZES = (64, 64)`

			`def __init__(self, hidden_sizes: Sequence[int] = DEFAULT_HIDDEN_SIZES):`
			`self.hidden_sizes = hidden_sizes`

Support discrete SAC in high-level API * Changed machanism for reusing actor's preprocessing module in critics to avoid special handling in AgentFactory implementations, improving separation of concerns: - Added CriticFactoryReuseActor as the new critic factory - Added ActorFactoryTransientStorageDecorator to pass on the actor data - Added helper classes ActorFuture, ActorFutureProviderProtocol * Add example atari_sac_hl 2023-10-10 19:11:49 +02:00			`def create_module(`
			`self,`
			`envs: Environments,`
			`device: TDevice,`
			`use_action: bool,`
			`discrete_last_size_use_action_shape=False,`
			`) -> nn.Module:`
Support REDQ in high-level API * Implement example mujoco_redq_hl * Add abstraction CriticEnsembleFactory with default implementations to suit REDQ * Fix type annotation of linear_layer in Net, MLP, Critic (was incompatible with REDQ usage) 2023-10-10 15:49:05 +02:00			`factory: CriticFactory`
Add support for discrete PPO * Refactored module `module` (split into submodules) * Basic support for discrete environments * Implement Atari env. factory * Implement DQN-based actor factory * Implement notion of reusing agent preprocessing network for critic * Add example atari_ppo_hl 2023-09-28 20:07:52 +02:00			`env_type = envs.get_type()`
Support REDQ in high-level API * Implement example mujoco_redq_hl * Add abstraction CriticEnsembleFactory with default implementations to suit REDQ * Fix type annotation of linear_layer in Net, MLP, Critic (was incompatible with REDQ usage) 2023-10-10 15:49:05 +02:00			`match env_type:`
			`case EnvType.CONTINUOUS:`
			`factory = CriticFactoryContinuousNet(self.hidden_sizes)`
			`case EnvType.DISCRETE:`
			`factory = CriticFactoryDiscreteNet(self.hidden_sizes)`
			`case _:`
			`raise ValueError(f"{env_type} not supported")`
Support discrete SAC in high-level API * Changed machanism for reusing actor's preprocessing module in critics to avoid special handling in AgentFactory implementations, improving separation of concerns: - Added CriticFactoryReuseActor as the new critic factory - Added ActorFactoryTransientStorageDecorator to pass on the actor data - Added helper classes ActorFuture, ActorFutureProviderProtocol * Add example atari_sac_hl 2023-10-10 19:11:49 +02:00			`return factory.create_module(`
			`envs,`
			`device,`
			`use_action,`
			`discrete_last_size_use_action_shape=discrete_last_size_use_action_shape,`
			`)`
Add support for discrete PPO * Refactored module `module` (split into submodules) * Basic support for discrete environments * Implement Atari env. factory * Implement DQN-based actor factory * Implement notion of reusing agent preprocessing network for critic * Add example atari_ppo_hl 2023-09-28 20:07:52 +02:00

Change high-level DQN interface to expect an actor instead of a critic, because that is what is functionally required 2023-10-05 19:21:08 +02:00			`class CriticFactoryContinuousNet(CriticFactory):`
			`def __init__(self, hidden_sizes: Sequence[int]):`
			`self.hidden_sizes = hidden_sizes`

Support discrete SAC in high-level API * Changed machanism for reusing actor's preprocessing module in critics to avoid special handling in AgentFactory implementations, improving separation of concerns: - Added CriticFactoryReuseActor as the new critic factory - Added ActorFactoryTransientStorageDecorator to pass on the actor data - Added helper classes ActorFuture, ActorFutureProviderProtocol * Add example atari_sac_hl 2023-10-10 19:11:49 +02:00			`def create_module(`
			`self,`
			`envs: Environments,`
			`device: TDevice,`
			`use_action: bool,`
			`discrete_last_size_use_action_shape=False,`
			`) -> nn.Module:`
Change high-level DQN interface to expect an actor instead of a critic, because that is what is functionally required 2023-10-05 19:21:08 +02:00			`action_shape = envs.get_action_shape() if use_action else 0`
			`net_c = Net(`
			`envs.get_observation_shape(),`
			`action_shape=action_shape,`
			`hidden_sizes=self.hidden_sizes,`
			`concat=use_action,`
			`activation=nn.Tanh,`
			`device=device,`
			`)`
			`critic = continuous.Critic(net_c, device=device).to(device)`
			`init_linear_orthogonal(critic)`
			`return critic`
Add support for discrete PPO * Refactored module `module` (split into submodules) * Basic support for discrete environments * Implement Atari env. factory * Implement DQN-based actor factory * Implement notion of reusing agent preprocessing network for critic * Add example atari_ppo_hl 2023-09-28 20:07:52 +02:00

Change high-level DQN interface to expect an actor instead of a critic, because that is what is functionally required 2023-10-05 19:21:08 +02:00			`class CriticFactoryDiscreteNet(CriticFactory):`
Add support for discrete PPO * Refactored module `module` (split into submodules) * Basic support for discrete environments * Implement Atari env. factory * Implement DQN-based actor factory * Implement notion of reusing agent preprocessing network for critic * Add example atari_ppo_hl 2023-09-28 20:07:52 +02:00			`def __init__(self, hidden_sizes: Sequence[int]):`
			`self.hidden_sizes = hidden_sizes`

Support discrete SAC in high-level API * Changed machanism for reusing actor's preprocessing module in critics to avoid special handling in AgentFactory implementations, improving separation of concerns: - Added CriticFactoryReuseActor as the new critic factory - Added ActorFactoryTransientStorageDecorator to pass on the actor data - Added helper classes ActorFuture, ActorFutureProviderProtocol * Add example atari_sac_hl 2023-10-10 19:11:49 +02:00			`def create_module(`
			`self,`
			`envs: Environments,`
			`device: TDevice,`
			`use_action: bool,`
			`discrete_last_size_use_action_shape=False,`
			`) -> nn.Module:`
Add support for discrete PPO * Refactored module `module` (split into submodules) * Basic support for discrete environments * Implement Atari env. factory * Implement DQN-based actor factory * Implement notion of reusing agent preprocessing network for critic * Add example atari_ppo_hl 2023-09-28 20:07:52 +02:00			`action_shape = envs.get_action_shape() if use_action else 0`
			`net_c = Net(`
			`envs.get_observation_shape(),`
			`action_shape=action_shape,`
			`hidden_sizes=self.hidden_sizes,`
			`concat=use_action,`
			`activation=nn.Tanh,`
			`device=device,`
			`)`
Support discrete SAC in high-level API * Changed machanism for reusing actor's preprocessing module in critics to avoid special handling in AgentFactory implementations, improving separation of concerns: - Added CriticFactoryReuseActor as the new critic factory - Added ActorFactoryTransientStorageDecorator to pass on the actor data - Added helper classes ActorFuture, ActorFutureProviderProtocol * Add example atari_sac_hl 2023-10-10 19:11:49 +02:00			`last_size = envs.get_action_shape() if discrete_last_size_use_action_shape else 1`
			`critic = discrete.Critic(net_c, device=device, last_size=last_size).to(device)`
Add support for discrete PPO * Refactored module `module` (split into submodules) * Basic support for discrete environments * Implement Atari env. factory * Implement DQN-based actor factory * Implement notion of reusing agent preprocessing network for critic * Add example atari_ppo_hl 2023-09-28 20:07:52 +02:00			`init_linear_orthogonal(critic)`
			`return critic`
Support REDQ in high-level API * Implement example mujoco_redq_hl * Add abstraction CriticEnsembleFactory with default implementations to suit REDQ * Fix type annotation of linear_layer in Net, MLP, Critic (was incompatible with REDQ usage) 2023-10-10 15:49:05 +02:00

Support discrete SAC in high-level API * Changed machanism for reusing actor's preprocessing module in critics to avoid special handling in AgentFactory implementations, improving separation of concerns: - Added CriticFactoryReuseActor as the new critic factory - Added ActorFactoryTransientStorageDecorator to pass on the actor data - Added helper classes ActorFuture, ActorFutureProviderProtocol * Add example atari_sac_hl 2023-10-10 19:11:49 +02:00			`class CriticFactoryReuseActor(CriticFactory):`
			`"""A critic factory which reuses the actor's preprocessing component.`

			`This class is for internal use in experiment builders only.`
			`"""`

			`def __init__(self, actor_future: ActorFuture):`
			`""":param actor_future: the object, which will hold the actor instance later when the critic is to be created"""`
			`self.actor_future = actor_future`

			`def _tostring_excludes(self) -> list[str]:`
			`return ["actor_future"]`

			`def create_module(`
			`self,`
			`envs: Environments,`
			`device: TDevice,`
			`use_action: bool,`
			`discrete_last_size_use_action_shape=False,`
			`) -> nn.Module:`
			`actor = self.actor_future.actor`
			`if not isinstance(actor, BaseActor):`
			`raise ValueError(`
			`f"Option critic_use_action can only be used if actor is of type {BaseActor.__class__.__name__}",`
			`)`
			`if envs.get_type().is_discrete():`
			`last_size = envs.get_action_shape() if discrete_last_size_use_action_shape else 1`
			`return discrete.Critic(`
			`actor.get_preprocess_net(),`
			`device=device,`
			`last_size=last_size,`
			`).to(device)`
			`elif envs.get_type().is_continuous():`
			`return continuous.Critic(actor.get_preprocess_net(), device=device).to(device)`
			`else:`
			`raise ValueError`


Support REDQ in high-level API * Implement example mujoco_redq_hl * Add abstraction CriticEnsembleFactory with default implementations to suit REDQ * Fix type annotation of linear_layer in Net, MLP, Critic (was incompatible with REDQ usage) 2023-10-10 15:49:05 +02:00			`class CriticEnsembleFactory:`
			`@abstractmethod`
			`def create_module(`
			`self,`
			`envs: Environments,`
			`device: TDevice,`
			`ensemble_size: int,`
			`use_action: bool,`
			`) -> nn.Module:`
			`pass`

			`def create_module_opt(`
			`self,`
			`envs: Environments,`
			`device: TDevice,`
			`ensemble_size: int,`
			`use_action: bool,`
			`optim_factory: OptimizerFactory,`
			`lr: float,`
			`) -> ModuleOpt:`
			`module = self.create_module(envs, device, ensemble_size, use_action)`
			`opt = optim_factory.create_optimizer(module, lr)`
			`return ModuleOpt(module, opt)`


			`class CriticEnsembleFactoryDefault(CriticEnsembleFactory):`
			`"""A critic ensemble factory which, depending on the type of environment, creates a suitable MLP-based critic."""`

			`DEFAULT_HIDDEN_SIZES = (64, 64)`

			`def __init__(self, hidden_sizes: Sequence[int] = DEFAULT_HIDDEN_SIZES):`
			`self.hidden_sizes = hidden_sizes`

			`def create_module(`
			`self,`
			`envs: Environments,`
			`device: TDevice,`
			`ensemble_size: int,`
			`use_action: bool,`
			`) -> nn.Module:`
			`env_type = envs.get_type()`
			`factory: CriticEnsembleFactory`
			`match env_type:`
			`case EnvType.CONTINUOUS:`
			`factory = CriticEnsembleFactoryContinuousNet(self.hidden_sizes)`
			`case EnvType.DISCRETE:`
			`raise NotImplementedError("No default is implemented for the discrete case")`
			`case _:`
			`raise ValueError(f"{env_type} not supported")`
			`return factory.create_module(`
			`envs,`
			`device,`
			`ensemble_size,`
			`use_action,`
			`)`


			`class CriticEnsembleFactoryContinuousNet(CriticEnsembleFactory):`
			`def __init__(self, hidden_sizes: Sequence[int]):`
			`self.hidden_sizes = hidden_sizes`

			`def create_module(`
			`self,`
			`envs: Environments,`
			`device: TDevice,`
			`ensemble_size: int,`
			`use_action: bool,`
			`) -> nn.Module:`
			`def linear_layer(x: int, y: int) -> EnsembleLinear:`
			`return EnsembleLinear(ensemble_size, x, y)`

			`action_shape = envs.get_action_shape() if use_action else 0`
			`net_c = Net(`
			`envs.get_observation_shape(),`
			`action_shape=action_shape,`
			`hidden_sizes=self.hidden_sizes,`
			`concat=use_action,`
			`activation=nn.Tanh,`
			`device=device,`
			`linear_layer=linear_layer,`
			`)`
			`critic = continuous.Critic(`
			`net_c,`
			`device=device,`
			`linear_layer=linear_layer,`
			`flatten_input=False,`
			`).to(device)`
			`init_linear_orthogonal(critic)`
			`return critic`