近年来,大模型的能力边界不断拓展,为基于大模型的新应用、新服务、新业态夯实了坚实的技术基础。智能体作为大模型的重要应用形态,可以将大模型的技术能力转化为实际问题的解决能力,是打通业务场景和人类交互的桥梁。目前,智能体正逐步渗透到大模型应用的各个层面,有望重塑大模型产业生态,驱动人工智能产业变革。
中国信息通信研究院(以下简称“中国信通院”)人工智能研究所高度关注智能体技术及应用发展动态,联合业界多家单位共同编制并发布了《智能体技术要求与评估方法》系列标准,覆盖智能体平台和工具、智能体技术能力、智能体应用服务、金融智能体、政务智能体、手机智能体、数据分析智能体、运维智能体等多个方向。此外,中国信通院依据上述标准开展智能体评估工作,截至目前,已为15家企业提供17项智能体专项评估服务。
2025年1月,北京百度网讯科技有限公司参与中国信通院组织的智能体评估,其产品百度大模型应用开发平台(百度智能云千帆AppBuilder)顺利通过智能体平台和工具评估并最终获得当前最高评级4 级。此次评估,依据标准《智能体技术要求与评估方法 第1部分:平台和工具》,围绕智能体平台管理和运营、智能体开发和管理、API服务和管理三个方面开展。其中,平台管理和运营关注智能体平台对用户管理、数据管理、安全管理等任务的支持度,智能体开发和管理关注智能体平台在开发、管理、发布等方面的能力,API服务和管理关注智能体平台在API服务和性能上的成熟度。
【百度大模型应用开发平台(百度智能云千帆AppBuilder)介绍】
(以下介绍信息由北京百度网讯科技有限公司提供)
百度大模型应用开发平台(百度智能云千帆AppBuilder)是基于大模型搭建AI原生应用的工作台,旨在降低AI原生应用的开发门槛,赋能开发者和企业快速实现应用搭建。平台提供了RAG(检索增强生成)、Agent(智能体)等应用框架,内置了文档问答、表格问答、多轮对话、生成创作等多种应用组件,还包括百度搜索和百度地图等特色组件,以及文本处理、图像处理和语音处理等传统AI组件,支持零代码、低代码、全代码三种开发方式,满足不同开发能力的开发者和企业的场景需求。目前,百度大模型应用开发平台(百度智能云千帆AppBuilder)已在政务、电力能源、制造、金融、教育等行业进行了项目落地。
图 1 百度大模型应用开发平台(百度智能云千帆AppBuilder)
【评估介绍】
智能体评估涵盖通用智能体、行业智能体和任务智能体三大方向,具体范围如下:
通用智能体
关注智能体平台和工具、智能体技术能力、智能体应用服务三个模块,全面评估通用智能体的管理、开发和使用过程,各项技术能力及性能,智能体服务的质量和效果。
行业智能体
面向金融智能体、政务智能体、汽车智能体、手机智能体、办公智能体等行业智能体,全面评估智能体在不同的行业领域的应用效能和技术支持度。
任务智能体
聚焦数据分析智能体、客服智能体、运维智能体、营销智能体等任务智能体,立足不同任务场景特点,结合智能体的能力特性,从技术到应用展开全面评估。
图 2 智能体标准体系
图 3 评估通过企业清单
中国信通院智能体评估工作持续进行中,欢迎各方单位参与。
评估联系人
陶老师,18951766189
taoqiuyu@caict.ac.cn
周老师,13773372013
zhoujing3@caict.ac.cn
-END-