人工智能关键技术和应用评测工业和信息化部重点实验室

评测新闻

火热报名中 | 基于大模型的智能应用首批评估正式启动，标准宣贯会顺利召开

发布时间：2024-03-25

作者：中国信通院

近年来，大模型技术持续走深向实，随着语言、视觉、语音、多模态等各类大模型能力的不断迭代升级，模型应用范围持续扩大，已赋能智能推荐、智能助手、智能客服等智能应用，为人工智能应用的落地提供了新的范式和思路。如在知识管理系统中，大模型可有效提升知识抽取、知识挖掘等任务的效率和精度；在智能助手中，大模型可增强产品语义理解、图文生成、对话交互等能力。

为进一步推动大模型与人工智能应用的融合发展，促进大模型在智能推荐、智能检索、智能助手、智能客服、知识管理、文档处理等应用中的落地，中国信息通信研究院（以下简称“中国信通院”）人工智能研究中心正式启动基于大模型的智能应用首批评估，并于2024年2月23日下午线上召开了标准宣贯会。来自澜码科技、未来式智能、滴普科技、中金电信、佳都科技、即科集团、OPPO、浪潮科技、中科世通亨奇、交通银行、南威软件、钛媒体、亚信科技、中原银行、中兴通讯、燧原科技、商汤科技等企业的50余位专家代表参会，围绕基于大模型智能应用系列标准进行了充分研讨。

图 1 基于大模型的智能应用标准宣贯会

中国信通院南京新一代人工智能研究院高级业务主管张丹主持本次会议，并介绍了可信AI大模型标准体系。中国信通院持续高度关注大模型发展态势，多措并举推进大模型落地。一是依托AI重点实验室组建大模型工作组，已吸纳成员单位近170家，二是持续完善大模型标准体系，从大模型技术、工程化、可信、应用成熟度和行业赋能等方面开展研究，三是开展大模型标准符合性验证工作，目前已开展2轮评估，累计为30余家单位提供60余次大模型模块测试。

图 2 大模型标准体系

中国信通院南京新一代人工智能研究院业务主管陶秋雨详细解读了基于大模型的智能应用标准体系，该标准体系目前涵盖以下八个部分：

1、大模型+知识管理：面向基于大模型的知识图谱、知识库、知识管理相关产品及应用，评估大模型在知识构建、知识计算、知识应用等方面的应用效果，涵盖3个能力域，20余个能力项；

2、大模型+智能对话：面向基于大模型的智能对话相关产品及应用，评估大模型在对话类型、对话功能、对话性能、对话体验等方面的应用效果，涵盖4个能力域，20余个能力项；

3、大模型+智能客服：面向基于大模型的智能客服相关产品及应用，评估大模型在文本客服、语音客服、视频客服等方面的应用效果，涵盖3个能力域，20余个能力项；

4、大模型+智能文档处理：面向智能文档处理系统、智能文档处理平台、文档智能审阅系统、智能文档分析平台等产品及应用，评估大模型在文档信息抽取、文档生成、文档对比、文档审核等方面的应用效果，涵盖5个能力域，30余个能力项；

5、大模型+智能助手：面向基于大模型的智能助手相关产品及应用，评估大模型在理解、生成、推理、学习等多模态任务上的应用效果，涵盖3个能力域，20余个能力项；

6、大模型+智能搜索：面向基于大模型的智能搜索相关产品及应用，评估大模型在搜索功能、搜索性能、搜索优化、搜索服务等方面的应用效果，涵盖4个能力域，20余个能力项；

7、大模型+智能推荐：面向基于大模型的智能推荐相关产品及应用，从用户侧和平台侧综合评估大模型在推荐方式、模态支持、推荐准确性、推荐实时性等方面的应用效果，涵盖3个能力域，20余个能力项；

8、大模型+商业智能系统：面向基于大模型的商业智能系统相关产品及应用，评估大模型在智能接入、智能交互、智能分析、智能管理等方面的应用效果，涵盖4个能力域，20余个能力项。

图 3 基于大模型的智能应用评估体系

下一步，中国信通院将继续完善基于大模型的智能应用标准体系，并计划于2024年3月正式开展评估工作，目前已启动测试报名，首批成果拟于2024年6月中旬发布，欢迎各方单位和专家参与。

图 4 时间安排

评估联系人

陶老师，18951766189（微信同号），

taoqiuyu@caict.ac.cn

张老师，19852822678（微信同号），

zhangdan3@caict.ac.cn