hongshaorou/Tianshou

History

Tongzheng Ren 595e62e111 architecture design

2017-11-06 15:15:44 +08:00

..

README.md

architecture design

2017-11-06 15:15:44 +08:00

README.md

Optimizer for policy gradient methods

TODO:

vanilla

baseline

REINFORCE

TRPO

PPO

GAE

NAF

DPG

ACKTR