登录通行证
欢迎注册帐户
欢迎找回帐户

评测新闻

返回 新闻详情

评测新闻

可信AI观察|大模型架构与能力双轮驱动,擘画智能应用生态发展蓝图

发布时间:2024-03-25

作者:中国信通院

2024年1月,工业和信息化部、教育部、科学技术部等七部门联合印发《关于推动未来产业创新发展的实施意见》,提出应加强前瞻谋划部署,加速类脑智能、群体智能、大模型等深度赋能。近年来,大模型训练和推理过程持续迭代优化,模型性能不断创出新高,为基于大模型的新应用、新服务、新业态夯实了技术基础,为促进数字经济与实体经济深度融合开辟了新路径。


观察1:大模型底层架构迭代创新,持续提升大模型训练推理能力

近年来,大模型在底层架构、模型能力、产业应用方面均取得长足发展。底层架构方面,从Transformer原生到Transformer与RNN、CNN等模型的高效融合,进一步优化大模型的训练效率和推理能力,Mamba、RWKV、InternImage等新型模型架构开始出现,并出现MOE模型、PEG模型等新的研究方向。模型能力方面,大语言模型和多模态大模型成为当前大模型发展的两条主要路径。百川智能发布超千亿参数大语言模型Baichuan3,在CMMLU、MCMLE等中文基准榜单上表现超越GPT-4。Google发布的多模态大模型Gemini Ultra在32个基准测试中的30个上超越当前最先进的结果,并在MMLU测试中得分达90.0。产业应用方面,大模型从理解到生成,从感知到决策正在加快融入业务场景,发展智能应用。大模型应用的发展前景从技术驱动走向价值驱动已达成社会共识,智能体(AI Agent)、检索增强生成(RAG)、生成式BI等方向的探索,展现出大模型应用的巨大潜力。


观察2:大模型行业应用效能显著,全面实现降本增效提质

各行业着力加强大模型底层架构与业务场景融合创新,突出能效、整合特征,打通产学研用链条闭环,实现提质增效。近年来,大模型效能外溢,应用路径和商业模式趋于成熟。据头豹研究院联合沙利文发布的《2023年中国AI大模型应用案例研究报告》显示,大模型应用已率先渗透至互联网、金融等数字化程度较高的行业,医疗、交通、能源、制造等行业潜在渗透空间大。应用领域上,各行业积极拥抱新技术,借助大模型突破发展瓶颈,实现大模型的落地变现,汇成大模型应用蓝海。如科大讯飞推出讯飞星火认知大模型,携手保险、银行、汽车、通信、能源等领域龙头企业,共同打造大模型赋能的应用标杆。应用场景上,大模型已在多个场景下的多个任务实现快速落地。据沙丘社区调研数据显示,知识管理(22%)场景成为大模型落地的重点方向,数据分析(13%)、内容创作(12%)、对话交互(9%)等通用场景占比较高。度小满推出的国内首个千亿级金融大模型“轩辕”,聚焦营销、客服、风控、办公、研发多个应用场景,在代码助手方面,代码生成采纳率达到42%。


观察3:智能体重构人机交互模式,打通大模型落地最后一公里

智能体基于大模型等人工智能核心技术,能够精准感知环境,科学做出决策,采取有效行动。在大模型加持下,智能体相关产业蓬勃发展,显著加速社会生产力变革,引起国内外广泛关注。国外,NVIDIA、Google、Amazon均已推出智能体相关产品,如Eureka、Robotic Agent、Amazon Bedrock Agents等。国内,智能体技术发展如火如荼,产品百花齐放,如阿里云的ModelScopeGPT、实在智能的TARS-RPA-Agent、澜码科技的Ask XBot以及联汇的OmBot欧姆智能体等。通过大模型的能力革新和新型人机协同模式赋能,智能体将不断拓展应用生态边界,成为人工智能应用落地的新范式。据MarketsandMarkets数据预测,到2024年全球自主智能体市场规模将达到29.92亿美元,2019年至2024年的复合增长率将达到54%。


观察4:RAG充分融合外部知识源,有效缓解大模型幻觉问题

大模型加速迭代升级,逐步从粗放式增长迈向精细化发展阶段,应用场景更具专业性和细致性。通用大模型普遍存在的知识局限、生成幻觉和数据安全等问题已无法满足实际业务需求。通过运用数据检索、信息增强、模型生成技术将RAG与大模型深度融合,可有效缓解生成式人工智能的幻觉问题,为内容创建提供一种变革性策略。能力效果上,RAG通过外挂知识库,可保持专业知识更新,增强大模型的生成、理解、记忆、决策能力。Microsoft团队的实验数据显示,RAG在Mistral 7B、Llama2 7B和Orca2 7B三个模型上的准确度分别达到87.5%、58.5%、87.6%,而微调的结果分别为50.4%、21.9%、51.1%,表明使用RAG与基础模型作为生成器的性能显著优于仅进行微调。业务场景上,百度、腾讯云、百川智能、昆仑万维、Microsoft、LlamaIndex等国内外企业纷纷推出大模型与RAG结合的解决方案,给用户带来全新的体验。


观察5:端侧软硬层面双轮驱动,全面夯实端侧大模型落地基础

大模型技术持续走深向实,轻量化、多模态等技术的不断升级,有效加速了人工智能的需求向端侧迁移。通过将计算和推理任务从云端转移到终端,端侧智能具备独立性、低时延、高可靠等优势,逐渐成为实现万物智能的重要方式,满足大模型在隐私保护、实时响应、网络负载、灵活部署等方面的要求,开拓更多交互新体验。软件层面,大模型通过模型剪枝、知识蒸馏、模型量化、低秩适应等技术实现轻量化、小型化,便于本地化部署和运行。硬件层面,终端设备搭载传感器、模组、芯片、底层算法等,聚焦感知、传输、计算和推理能力。端侧大模型协同终端数据,可高效稳定运行于PC、手机、汽车等终端。如盘古大模型接入HarmonyOS 4,可为用户带来智慧终端交互、高阶生产力效率、个性化服务等全新体验。


联系人:


张老师 15722924458 

zhangxueqiang@caict.ac.cn


张老师 19852822678 

zhangdan3@caict.ac.cn