add __all__

2018-05-20 22:36:04 +08:00 · 2018-05-20 22:36:04 +08:00 · 6f206759ab
commit 6f206759ab
parent eb8c82636e
18 changed files with 74 additions and 6 deletions
--- a/tianshou/core/losses.py
+++ b/tianshou/core/losses.py
@ -1,5 +1,11 @@
 import tensorflow as tf

+__all__ = [
+    'ppo_clip',
+    'REINFORCE',
+    'value_mse'
+]
+

 def ppo_clip(policy, clip_param):
    """
--- a/tianshou/core/opt.py
+++ b/tianshou/core/opt.py
@ -1,5 +1,9 @@
 import tensorflow as tf

+__all__ = [
+    'DPG',
+]
+

 def DPG(policy, action_value):
    """
--- a/tianshou/core/policy/base.py
+++ b/tianshou/core/policy/base.py
@ -1,7 +1,7 @@
 from __future__ import absolute_import
 from __future__ import division

-import tensorflow as tf
+__all__ = []


 class PolicyBase(object):
--- a/tianshou/core/policy/deterministic.py
+++ b/tianshou/core/policy/deterministic.py
@ -1,10 +1,13 @@
 import tensorflow as tf
-import logging

 from .base import PolicyBase
 from ..random import OrnsteinUhlenbeckProcess
 from ..utils import identify_dependent_variables

+__all__ = [
+    'Deterministic',
+]
+

 class Deterministic(PolicyBase):
    """
--- a/tianshou/core/policy/distributional.py
+++ b/tianshou/core/policy/distributional.py
@ -1,8 +1,11 @@
 import tensorflow as tf
-import logging
 from .base import PolicyBase
 from ..utils import identify_dependent_variables

+__all__ = [
+    'Distributional',
+]
+

 class Distributional(PolicyBase):
    """
--- a/tianshou/core/policy/dqn.py
+++ b/tianshou/core/policy/dqn.py
@ -4,6 +4,10 @@ from .base import PolicyBase
 import tensorflow as tf
 import numpy as np

+__all__ = [
+    'DQN',
+]
+

 class DQN(PolicyBase):
    """
--- a/tianshou/core/random.py
+++ b/tianshou/core/random.py
@ -5,6 +5,11 @@ adapted from keras-rl
 from __future__ import division
 import numpy as np

+__all__ = [
+    'GaussianWhiteNoiseProcess',
+    'OrnsteinUhlenbeckProcess',
+]
+

 class RandomProcess(object):
    """
--- a/tianshou/core/utils.py
+++ b/tianshou/core/utils.py
@ -1,5 +1,9 @@
 import tensorflow as tf

+__all__ = [
+    'get_soft_update_op',
+]
+

 def identify_dependent_variables(tensor, candidate_variables):
    """
--- a/tianshou/core/value_function/action_value.py
+++ b/tianshou/core/value_function/action_value.py
@ -1,10 +1,14 @@
 from __future__ import absolute_import
-import logging
 import tensorflow as tf

 from .base import ValueFunctionBase
 from ..utils import identify_dependent_variables

+__all__ = [
+    'ActionValue',
+    'DQN',
+]
+

 class ActionValue(ValueFunctionBase):
    """
--- a/tianshou/core/value_function/base.py
+++ b/tianshou/core/value_function/base.py
@ -2,6 +2,9 @@ from __future__ import absolute_import

 import tensorflow as tf

+__all__ = []
+
+
 class ValueFunctionBase(object):
    """
    Base class for value functions, including S-values and Q-values. The only
--- a/tianshou/core/value_function/state_value.py
+++ b/tianshou/core/value_function/state_value.py
@ -1,11 +1,14 @@
 from __future__ import absolute_import

 import tensorflow as tf
-import logging

 from .base import ValueFunctionBase
 from ..utils import identify_dependent_variables

+__all__ = [
+    'StateValue',
+]
+

 class StateValue(ValueFunctionBase):
    """
--- a/tianshou/data/advantage_estimation.py
+++ b/tianshou/data/advantage_estimation.py
@ -1,5 +1,12 @@
 import logging
-import numpy as np
+
+__all__ = [
+    'full_return',
+    'nstep_return',
+    'nstep_q_return',
+    'ddpg_return',
+]
+

 STATE = 0
 ACTION = 1
--- a/tianshou/data/data_buffer/base.py
+++ b/tianshou/data/data_buffer/base.py
@ -1,3 +1,4 @@
+__all__ = []


 class DataBufferBase(object):
--- a/tianshou/data/data_buffer/batch_set.py
+++ b/tianshou/data/data_buffer/batch_set.py
@ -4,6 +4,11 @@ import logging

 from .base import DataBufferBase

+__all__ = [
+    'BatchSet'
+]
+
+
 STATE = 0
 ACTION = 1
 REWARD = 2
--- a/tianshou/data/data_buffer/replay_buffer_base.py
+++ b/tianshou/data/data_buffer/replay_buffer_base.py
@ -1,5 +1,8 @@
 from .base import DataBufferBase

+__all__ = []
+
+
 class ReplayBufferBase(DataBufferBase):
    """
    Base class for replay buffer.
--- a/tianshou/data/data_buffer/vanilla.py
+++ b/tianshou/data/data_buffer/vanilla.py
@ -3,6 +3,11 @@ import numpy as np

 from .replay_buffer_base import ReplayBufferBase

+__all__ = [
+    'VanillaReplayBuffer',
+]
+
+
 STATE = 0
 ACTION = 1
 REWARD = 2
--- a/tianshou/data/data_collector.py
+++ b/tianshou/data/data_collector.py
@ -7,6 +7,10 @@ from .data_buffer.batch_set import BatchSet
 from .utils import internal_key_match
 from ..core.policy.deterministic import Deterministic

+__all__ = [
+    'DataCollector',
+]
+

 class DataCollector(object):
    """
--- a/tianshou/data/tester.py
+++ b/tianshou/data/tester.py
@ -4,6 +4,10 @@ import gym
 import logging
 import numpy as np

+__all__ = [
+    'test_policy_in_env',
+]
+

 def test_policy_in_env(policy, env, num_timesteps=0, num_episodes=0,
                       discount_factor=0.99, seed=0, episode_cutoff=None):