Tianshou/README.md at 6a4adac1a0e9f8b6b20ee06e7fa7ca256128e212 - Tianshou - Gitea: Git with a cup of tea

hongshaorou/Tianshou

Tongzheng Ren 6a4adac1a0 Optimizer

2017-11-06 13:39:36 +08:00

11 lines

111 B

Markdown

Raw Blame History

 # Optimizer for policy gradient methods
 TODO:
 vanilla
 introduce a baseline
 REINFORCE
 TRPO
 PPO
 GAE
 NAF
 DPG
 ACKTR