Xinyan Yan

Chat Image Generator Video Music Voice Chat Photo Editor

Featured Co-authors

research

∙ 07/06/2020

Online policy optimization (OPO) views policy optimization for sequentia...

research

∙ 08/08/2019

Policy gradient methods have demonstrated success in reinforcement learn...

research

∙ 10/15/2018

We present a predictor-corrector framework, called PicCoLO, that can tra...

research

∙ 06/12/2018

Sample efficiency is critical in solving real-world reinforcement learni...

research

∙ 05/26/2018

Imitation learning (IL) consists of a set of tools that leverage expert ...

research

∙ 10/15/2017

Policy evaluation or value function or Q-function approximation is a key...

Success!

An error occurred