architecture design
This commit is contained in:
parent
4e4a7b74c1
commit
595e62e111
24
tianshou/core/README.md
Normal file
24
tianshou/core/README.md
Normal file
@ -0,0 +1,24 @@
|
||||
# Core
|
||||
|
||||
## Optimizer
|
||||
TODO:
|
||||
|
||||
### policy based:
|
||||
|
||||
Vanilla
|
||||
|
||||
Baseline
|
||||
|
||||
TRPO
|
||||
|
||||
PPO
|
||||
|
||||
NAF
|
||||
|
||||
GAE
|
||||
|
||||
DPG
|
||||
|
||||
### value based:
|
||||
|
||||
TD
|
@ -1,11 +1,20 @@
|
||||
# Optimizer for policy gradient methods
|
||||
TODO:
|
||||
|
||||
vanilla
|
||||
introduce a baseline
|
||||
|
||||
baseline
|
||||
|
||||
REINFORCE
|
||||
|
||||
TRPO
|
||||
|
||||
PPO
|
||||
|
||||
GAE
|
||||
|
||||
NAF
|
||||
|
||||
DPG
|
||||
ACKTR
|
||||
|
||||
ACKTR
|
Loading…
x
Reference in New Issue
Block a user