投稿问答最小化  关闭

万维书刊APP下载

超越Stable Diffusion:扩散模型的大规模强化学习

2024/1/30 17:13:33  阅读:39 发布者:

来自 Pinterest 公司和麻省理工学院(MIT)的研究团队提出了一种有效的可扩展算法,利用强化学习(RL)在多个多样的奖励函数(如人类偏好、组合性和公平性)上改进扩散模型。这一方法显著超过现有方法,可以使扩散模型更符合人类偏好。

论文链接:

https://arxiv.org/abs/2401.12244

转自:“学术头条”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com