Daily Journal

O Futuro da Informação

Variance reduction for policy gradient with action-dependent factorized baselines

20 de março, 2018 às 04:00
OpenAI Blog