投稿问答最小化  关闭

万维书刊APP下载

AgentBoard:多轮LLM智能体分析评估框架

2024/1/30 17:11:45  阅读:32 发布者:

来自香港大学、浙江大学、上海交通大学、清华大学的研究团队及其合作者提出了一个分析评估大型语言模型(LLM)智能体的开创性的综合基准和配套开源评估框架—— AgentBoardAgentBoard 在揭开智能体行为的神秘面纱和加速开发更强大的 LLM 智能体方面迈出了重要一步。

论文链接:

https://arxiv.org/abs/2401.13178

转自:“学术头条”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com