AgentBoard:多轮LLM智能体分析评估框架
2024/1/30 17:11:45 阅读:40 发布者:
来自香港大学、浙江大学、上海交通大学、清华大学的研究团队及其合作者提出了一个分析评估大型语言模型(LLM)智能体的开创性的综合基准和配套开源评估框架—— AgentBoard。AgentBoard 在揭开智能体行为的神秘面纱和加速开发更强大的 LLM 智能体方面迈出了重要一步。
论文链接:
https://arxiv.org/abs/2401.13178
转自:“学术头条”微信公众号
如有侵权,请联系本站删除!