Tianshou/README.md at 595e62e111f61966795eff05b07f62f8de1d3aeb - Tianshou - Gitea: Git with a cup of tea

hongshaorou/Tianshou

Tongzheng Ren 595e62e111 architecture design

2017-11-06 15:15:44 +08:00

20 lines

108 B

Markdown

Raw Blame History

 # Optimizer for policy gradient methods
 TODO:
 vanilla
 baseline
 REINFORCE
 TRPO
 PPO
 GAE
 NAF
 DPG
 ACKTR