architecture design
This commit is contained in:
parent
4e4a7b74c1
commit
595e62e111
24
tianshou/core/README.md
Normal file
24
tianshou/core/README.md
Normal file
@ -0,0 +1,24 @@
|
|||||||
|
# Core
|
||||||
|
|
||||||
|
## Optimizer
|
||||||
|
TODO:
|
||||||
|
|
||||||
|
### policy based:
|
||||||
|
|
||||||
|
Vanilla
|
||||||
|
|
||||||
|
Baseline
|
||||||
|
|
||||||
|
TRPO
|
||||||
|
|
||||||
|
PPO
|
||||||
|
|
||||||
|
NAF
|
||||||
|
|
||||||
|
GAE
|
||||||
|
|
||||||
|
DPG
|
||||||
|
|
||||||
|
### value based:
|
||||||
|
|
||||||
|
TD
|
@ -1,11 +1,20 @@
|
|||||||
# Optimizer for policy gradient methods
|
# Optimizer for policy gradient methods
|
||||||
TODO:
|
TODO:
|
||||||
|
|
||||||
vanilla
|
vanilla
|
||||||
introduce a baseline
|
|
||||||
|
baseline
|
||||||
|
|
||||||
REINFORCE
|
REINFORCE
|
||||||
|
|
||||||
TRPO
|
TRPO
|
||||||
|
|
||||||
PPO
|
PPO
|
||||||
|
|
||||||
GAE
|
GAE
|
||||||
|
|
||||||
NAF
|
NAF
|
||||||
|
|
||||||
DPG
|
DPG
|
||||||
|
|
||||||
ACKTR
|
ACKTR
|
Loading…
x
Reference in New Issue
Block a user