您的位置：万维书刊网 >> 学术资讯 >> 学界研圈

ConTextual：评估大型多模态模型中对上下文敏感的富文本视觉推理

2024/1/30 17:11:24　阅读：103　发布者：

来自加州大学洛杉矶分校的研究团队提出了一个评估大型多模态模型（LMMs）执行上下文敏感文本丰富的视觉推理能力（context-sensitive text-rich visual reasoning）指令的新基准—— ConTextual。研究表明，表现最好的 LMM、GPT-4V(ision) 的整体性能仍然落后于人类。

论文链接：

https://arxiv.org/abs/2401.13311

转自：“学术头条”微信公众号

如有侵权，请联系本站删除！

上一篇： AgentBoard：多轮LLM智能体分析评估框架
下一篇： WebVoyager：利用大型多模态模型构建端到端网络智能体

学界研圈热门文章

泪目！胡爷爷老了,那十年,原来我们经历了那么多
一篇文章带你了解ITT、PP、FAS的概念
导师评价网
2023年两院院士增选或将启动，几个变化令人期待！
最新！第五轮学科评估，这些高校A+
金属有机骨架增强型CO2高效选择性电解制乙烯
西安市教育局初三年级教师备考技能提升培训开启
272名教师获奖！2022年宝钢教育奖揭晓
复旦大学：《严正声明》
一文看懂文献综述的写作结构、方法、步骤与常见问题

本站推荐

上海交通大学宋萍课题组高薪招聘4名博士后和2名科研助理

投稿问答最小化 关闭

ConTextual：评估大型多模态模型中对上下文敏感的富文本视觉推理

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化 关闭

ConTextual：评估大型多模态模型中对上下文敏感的富文本视觉推理

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化关闭