登录通行证
欢迎注册帐户
欢迎找回帐户

评测新闻

返回 新闻详情

评测新闻

中国信通院正式启动开源大模型落地实践指南编制工作

发布时间:2024-03-25

作者:中国信通院

近年来,大模型的技术能力和产业应用均取得显著进展,其开源开放热度也随之高涨。国际方面,Meta发布的开源大模型Llama 2以其独特的自适应学习和优异性能,为自然语言处理领域带来了新的突破;Mistral AI开源的Mixtral 8x7B是具有开放权重的稀疏专家混合模型,在多语言、长文本处理任务方面表现突出;谷歌近期推出的Gemma 2B和Gemma 7B开源大模型在各项基准测试中也表现优异。国内方面,智谱、百川、阿里、昆仑万维等企业和科研机构发布的开源大模型也各具特色,智谱发布的新一代对话预训练模型 ChatGLM3-6B 支持工具调用、代码执行和Agent任务等复杂场景;百川智能开源的Baichuan 2 采用2.6万亿Tokens 高质量多语言数据语料进行训练,其语义理解、数学能力相比上一代有所增强。

开源大模型具备较高的可定制性和可移植性,且成本相对可控,进一步降低了大模型的应用门槛。但当前各方主体在实际应用过程中存在技术选型、运营部署等诸多疑惑,需要行业落地指南作为参考依据。

中国信通院高度关注大模型技术发展态势,已构建大模型标准体系3.0、面向行业的大模型标准体系,并于2023年年底发布《大模型落地路线图RD2LM框架》,全方位分析大模型在落地过程中面临的基础设施、数据资源、模型算法、应用效能等问题,探索适合大模型落地的最佳方法。为促进开源大模型技术健康发展、应用走实,中国信通院将依托大模型落地路线图,正式启动开源大模型落地实践指南编制工作,欢迎感兴趣的单位参与。

开源大模型落地实践指南拟从开源大模型的现状剖析、能力建设、应用部署、运维管理四方面着手,全方位分析开源大模型在落地过程中面临的基础设施、数据资源、模型算法、应用合规等问题,探索适合开源大模型的最佳落地策略。在现状剖析方面,全面剖析开源大模型发展现状和场景需求;能力建设方面,分析开源大模型关键技术进展、设计贴合战略规划和业务需求的建设方案;应用部署方面,分析开源大模型原生应用路线,构建开源大模型全栈应用成熟评估体系;运维管理方面,梳理开源大模型的监测体系、运维体系、管理体系,为运营能力建设提供参考。

9.png

联系人

吴老师 15927505636

wusiqi@caict.ac.cn

张老师 15722924458

zhangxueqiang@caict.ac.cn