Daily Journal

O Futuro da Informação

Equivalence between policy gradients and soft Q-learning

21 de abril, 2017 às 04:00
OpenAI Blog