add __all__

2018-05-20 22:36:04 +08:00 · 2018-05-20 22:36:04 +08:00 · 6f206759ab
commit 6f206759ab
parent eb8c82636e
18 changed files with 74 additions and 6 deletions
--- a/tianshou/core/losses.py
+++ b/tianshou/core/losses.py
@ -1,5 +1,11 @@
 import tensorflow as tf
 __all__ = [
    'ppo_clip',
    'REINFORCE',
    'value_mse'
 ]
 def ppo_clip(policy, clip_param):
    """
--- a/tianshou/core/opt.py
+++ b/tianshou/core/opt.py
@ -1,5 +1,9 @@
 import tensorflow as tf
 __all__ = [
    'DPG',
 ]
 def DPG(policy, action_value):
    """
--- a/tianshou/core/policy/base.py
+++ b/tianshou/core/policy/base.py
@ -1,7 +1,7 @@
 from __future__ import absolute_import
 from __future__ import division
-import tensorflow as tf
+__all__ = []
 class PolicyBase(object):
--- a/tianshou/core/policy/deterministic.py
+++ b/tianshou/core/policy/deterministic.py
@ -1,10 +1,13 @@
 import tensorflow as tf
 import logging
 from .base import PolicyBase
 from ..random import OrnsteinUhlenbeckProcess
 from ..utils import identify_dependent_variables
 __all__ = [
    'Deterministic',
 ]
 class Deterministic(PolicyBase):
    """
--- a/tianshou/core/policy/distributional.py
+++ b/tianshou/core/policy/distributional.py
@ -1,8 +1,11 @@
 import tensorflow as tf
 import logging
 from .base import PolicyBase
 from ..utils import identify_dependent_variables
 __all__ = [
    'Distributional',
 ]
 class Distributional(PolicyBase):
    """
--- a/tianshou/core/policy/dqn.py
+++ b/tianshou/core/policy/dqn.py
@ -4,6 +4,10 @@ from .base import PolicyBase
 import tensorflow as tf
 import numpy as np
 __all__ = [
    'DQN',
 ]
 class DQN(PolicyBase):
    """
--- a/tianshou/core/random.py
+++ b/tianshou/core/random.py
@ -5,6 +5,11 @@ adapted from keras-rl
 from __future__ import division
 import numpy as np
 __all__ = [
    'GaussianWhiteNoiseProcess',
    'OrnsteinUhlenbeckProcess',
 ]
 class RandomProcess(object):
    """
--- a/tianshou/core/utils.py
+++ b/tianshou/core/utils.py
@ -1,5 +1,9 @@
 import tensorflow as tf
 __all__ = [
    'get_soft_update_op',
 ]
 def identify_dependent_variables(tensor, candidate_variables):
    """
--- a/tianshou/core/value_function/action_value.py
+++ b/tianshou/core/value_function/action_value.py
@ -1,10 +1,14 @@
 from __future__ import absolute_import
 import logging
 import tensorflow as tf
 from .base import ValueFunctionBase
 from ..utils import identify_dependent_variables
 __all__ = [
    'ActionValue',
    'DQN',
 ]
 class ActionValue(ValueFunctionBase):
    """
--- a/tianshou/core/value_function/base.py
+++ b/tianshou/core/value_function/base.py
@ -2,6 +2,9 @@ from __future__ import absolute_import
 import tensorflow as tf
 __all__ = []
 class ValueFunctionBase(object):
    """
    Base class for value functions, including S-values and Q-values. The only
--- a/tianshou/core/value_function/state_value.py
+++ b/tianshou/core/value_function/state_value.py
@ -1,11 +1,14 @@
 from __future__ import absolute_import
 import tensorflow as tf
 import logging
 from .base import ValueFunctionBase
 from ..utils import identify_dependent_variables
 __all__ = [
    'StateValue',
 ]
 class StateValue(ValueFunctionBase):
    """
--- a/tianshou/data/advantage_estimation.py
+++ b/tianshou/data/advantage_estimation.py
@ -1,5 +1,12 @@
 import logging
-import numpy as np
+
 __all__ = [
    'full_return',
    'nstep_return',
    'nstep_q_return',
    'ddpg_return',
 ]
 STATE = 0
 ACTION = 1
--- a/tianshou/data/data_buffer/base.py
+++ b/tianshou/data/data_buffer/base.py
@ -1,3 +1,4 @@
 __all__ = []
 class DataBufferBase(object):
--- a/tianshou/data/data_buffer/batch_set.py
+++ b/tianshou/data/data_buffer/batch_set.py
@ -4,6 +4,11 @@ import logging
 from .base import DataBufferBase
 __all__ = [
    'BatchSet'
 ]
 STATE = 0
 ACTION = 1
 REWARD = 2
--- a/tianshou/data/data_buffer/replay_buffer_base.py
+++ b/tianshou/data/data_buffer/replay_buffer_base.py
@ -1,5 +1,8 @@
 from .base import DataBufferBase
 __all__ = []
 class ReplayBufferBase(DataBufferBase):
    """
    Base class for replay buffer.
--- a/tianshou/data/data_buffer/vanilla.py
+++ b/tianshou/data/data_buffer/vanilla.py
@ -3,6 +3,11 @@ import numpy as np
 from .replay_buffer_base import ReplayBufferBase
 __all__ = [
    'VanillaReplayBuffer',
 ]
 STATE = 0
 ACTION = 1
 REWARD = 2
--- a/tianshou/data/data_collector.py
+++ b/tianshou/data/data_collector.py
@ -7,6 +7,10 @@ from .data_buffer.batch_set import BatchSet
 from .utils import internal_key_match
 from ..core.policy.deterministic import Deterministic
 __all__ = [
    'DataCollector',
 ]
 class DataCollector(object):
    """
--- a/tianshou/data/tester.py
+++ b/tianshou/data/tester.py
@ -4,6 +4,10 @@ import gym
 import logging
 import numpy as np
 __all__ = [
    'test_policy_in_env',
 ]
 def test_policy_in_env(policy, env, num_timesteps=0, num_episodes=0,
                       discount_factor=0.99, seed=0, episode_cutoff=None):
`@ -1,3 +1,4 @@`
		`__all__ = []`


	`class DataBufferBase(object):`	`class DataBufferBase(object):`