Shentao Yang | DeepAI

Chat Image Generator Video Music Voice Chat Photo Editor

Featured Co-authors

Caiming Xiong
210 publications
Mingyuan Zhou
110 publications
Huan Wang
82 publications
Jianguo Zhang
43 publications
Zhendong Wang
29 publications
Yihao Feng
24 publications
Congying Xia
23 publications
Huangjie Zheng
22 publications
Shujian Zhang
17 publications

research

∙ 06/01/2023

Preference-grounded Token-level Guidance for Language Model Fine-tuning

Aligning language models (LMs) with preferences is an important problem ...

0 Shentao Yang, et al. ∙

research

∙ 02/20/2023

Fantastic Rewards and How to Tame Them: A Case Study on Reward Learning for Task-oriented Dialogue Systems

When learning task-oriented dialogue (ToD) agents, reinforcement learnin...

0 Yihao Feng, et al. ∙

research

∙ 10/12/2022

A Unified Framework for Alternating Offline Model Training and Policy Learning

In offline model-based reinforcement learning (offline MBRL), we learn a...

0 Shentao Yang, et al. ∙

research

∙ 06/14/2022

Regularizing a Model-based Policy Stationary Distribution to Stabilize Offline Reinforcement Learning

Offline reinforcement learning (RL) extends the paradigm of classical RL...

0 Shentao Yang, et al. ∙

research

∙ 02/19/2022

A Regularized Implicit Policy for Offline Reinforcement Learning

Offline reinforcement learning enables learning from a fixed dataset, wi...

0 Shentao Yang, et al. ∙

Success!

An error occurred