服务教育科研，促进学术发展！欢迎您，请登录 | 免费注册
设为首页收藏本站联系我们

投稿问答最小化 关闭

投稿有问题？问问网友吧！

·名人符号论文期刊推荐 0回答

·不歧视硕士在读独作的质量较好的期刊 3回答

·大约三天前投稿，显示“成功”，但是状... 2回答

·有没有社科类的有关生成式人工智能的选... 2回答

高级搜索 SCI/E搜索推荐

今日更新期刊信息3条，本周累计更新6867条，本年累计更新15538条。

您的位置：万维书刊网 >> 学术资讯 >> 学界研圈

用语言对齐多模态信息，北大腾讯等提出LanguageBind，刷新多个榜单

2024/1/27 11:07:03　阅读：70　发布者：

视频语言（VL）预训练在多个下游任务中取得了显著的改进。然而，目前的VL预训练框架很难扩展到视觉和语言之外的多种模式（N种模式，N>；=3）。因此，我们提出了LanguageBind，将语言作为不同模态之间的绑定，因为语言模态已经得到了很好的探索，并且包含了丰富的语义。具体来说，我们冻结通过VL预训练获得的语言编码器，然后通过对比学习为其他模态训练编码器。结果，所有模态都映射到一个共享的特征空间，实现了多模态语义对齐。（DOI：arXiv:2310.01852）

转自：“鲸锐学术”微信公众号

如有侵权，请联系本站删除！

上一篇： 49所高校共同发起！中国新闻传播学自主知识体系联盟成立
下一篇： 宁夏医科大学：一次性塑料餐具热暴露对人体肠道菌群和代谢物的影响

学界研圈热门文章

本站推荐

上海交通大学宋萍课题组高薪招聘4名博士后和2名科研助理

最近更新

万维QQ投稿交流群招募志愿者

版权所有 Copyright@2009-2015| 豫ICP证合字09037080号

纯自助论文投稿平台 E-mail：eshukan@163.com