人工智能关键技术和应用评测工业和信息化部重点实验室

评测新闻

中国信通院正式启动开源大模型落地实践指南编制工作

发布时间：2024-03-25

作者：中国信通院

近年来，大模型的技术能力和产业应用均取得显著进展，其开源开放热度也随之高涨。国际方面，Meta发布的开源大模型Llama 2以其独特的自适应学习和优异性能，为自然语言处理领域带来了新的突破；Mistral AI开源的Mixtral 8x7B是具有开放权重的稀疏专家混合模型，在多语言、长文本处理任务方面表现突出；谷歌近期推出的Gemma 2B和Gemma 7B开源大模型在各项基准测试中也表现优异。国内方面，智谱、百川、阿里、昆仑万维等企业和科研机构发布的开源大模型也各具特色，智谱发布的新一代对话预训练模型 ChatGLM3-6B 支持工具调用、代码执行和Agent任务等复杂场景；百川智能开源的Baichuan 2 采用2.6万亿Tokens 高质量多语言数据语料进行训练，其语义理解、数学能力相比上一代有所增强。

开源大模型具备较高的可定制性和可移植性，且成本相对可控，进一步降低了大模型的应用门槛。但当前各方主体在实际应用过程中存在技术选型、运营部署等诸多疑惑，需要行业落地指南作为参考依据。

中国信通院高度关注大模型技术发展态势，已构建大模型标准体系3.0、面向行业的大模型标准体系，并于2023年年底发布《大模型落地路线图RD²LM框架》，全方位分析大模型在落地过程中面临的基础设施、数据资源、模型算法、应用效能等问题，探索适合大模型落地的最佳方法。为促进开源大模型技术健康发展、应用走实，中国信通院将依托大模型落地路线图，正式启动开源大模型落地实践指南编制工作，欢迎感兴趣的单位参与。

开源大模型落地实践指南拟从开源大模型的现状剖析、能力建设、应用部署、运维管理四方面着手，全方位分析开源大模型在落地过程中面临的基础设施、数据资源、模型算法、应用合规等问题，探索适合开源大模型的最佳落地策略。在现状剖析方面，全面剖析开源大模型发展现状和场景需求；能力建设方面，分析开源大模型关键技术进展、设计贴合战略规划和业务需求的建设方案；应用部署方面，分析开源大模型原生应用路线，构建开源大模型全栈应用成熟评估体系；运维管理方面，梳理开源大模型的监测体系、运维体系、管理体系，为运营能力建设提供参考。

联系人

吴老师 15927505636

wusiqi@caict.ac.cn

张老师 15722924458

zhangxueqiang@caict.ac.cn