登录通行证
欢迎注册帐户
欢迎找回帐户

联盟动态

返回 新闻详情

联盟动态

2023 AIIA先锋案例|大模型驱动下的智能代码助手提效实践

发布时间:2024-03-25

作者:中国信通院

2023年12月7日,2023 AIIA人工智能十大先锋应用案例在中国人工智能产业发展联盟(AIIA)第十次全体会议上正式发布,由北京百度网讯科技有限公司申报的案例“大模型驱动下的智能代码助手提效实践”成功入选。


案例背景


随着软件应用的广泛普及,从移动应用到企业级系统,开发人员面临着越来越大的压力。复杂的业务逻辑、多变的用户需求以及快速迭代的项目周期,都要求开发人员具备高效、精准的编码能力。同时,在软件开发中,代码质量至关重要。它不仅影响软件的功能性,还直接关系到系统的稳定性、安全性和可维护性。因此,提高代码质量是每个开发人员的核心目标。另一方面,人工智能技术在过去的十年里经历了巨大的变革。随着计算能力的提升和大数据的普及,AI已经从理论阶段走向了实际应用阶段。特别是在机器学习领域,AI已经展现出了超越传统算法的性能。机器学习使用神经网络模拟人脑的工作方式,使得机器能够从大量数据中自我学习并优化决策过程。


人工智能和机器学习技术的突破性进展为智能代码助手的开发提供了坚实的基础。这些技术使得智能代码助手能够更好地理解代码、预测编码意图并提供准确的建议,从而大大提高了编码效率和代码质量。


在这样的背景下,百度推出了大模型驱动的智能代码助手Comate。Comate能够根据用户代码上下文,自动续写或生成完整的代码片段。从而减少开发人员的手动编写工作量,使其能够专注于更有创造性的编码任务。此外,Comate能够理解代码逻辑和编程规范,提供高质量的代码建议,从而减少错误、提高软件性能并增强系统的稳定性。通过提高编码效率和代码质量,Comate有助于降低软件开发过程中的成本,包括人力成本、时间成本和因错误修复而产生的额外成本。


成果亮点


百度Comate是基于大模型的智能代码助手,让开发者的编码更快、更好、更简单,为开发者自动生成完整的、且更符合实际研发场景的代码行或整个代码块,帮助每一位开发者轻松完成研发任务。


百度Comate从2022年9月发布第一个版本后,持续迭代打磨产品功能,截止目前形成了功能完备、开箱即用的产品功能矩阵,支持单行推荐、多行推荐、多条推荐、代码知识问答、代码生成、注释生成、代码解释、函数拆分、优化和重构等一系列编码相关的能力,支持100+种开发语言,支持VS Code、IntelliJ IDEA、GoLand、PyCharm、Android Studio、Xcode等当前主流的IDE,覆盖了前、后、移动端,软、硬件等不同的开发场景,满足业务的多样性。


11.png

百度Comate在理解能力和生成能力方面较为突出,自建代码大模型在公开评测集上得分均优于同规模其他大模型。Comate在预训练阶段引入代码相关性和依赖关系学习,有效支持项目级代码生成,代码推荐精度达到国内/国际领先水平。通过量化优化、推理加速等技术,相关产品在推理速度方面居业界领先水平。另外,Comate在支持多方位度数据分析功能并实现了全方位的安全加固保证代码生成的安全。


在推荐效果方面,Comate使用百度ERNIE-Code代码大模型进行实时自动补全推理,ERNIE-Code使用先进的算法、规模庞大的代码数据集训练而来,在HumanEval、MBPP等公开评测集上得分均优于同规模其他大模型。在ERNIE-Code代码大模型加持下,Comate更能理解目标,生成更精准。同时,Comate基于本地的用户行为分析模型,优化了请求和缓存机制,并对生成结果进行质量检测与优化,打造更流畅的用户使用体验。


在产品功能方面,Comate功能完备,开箱即用,具备全面的产品矩阵。实时代码推荐响应快速,通过模型量化、推理加速等技术,使模型平均推理时延小于300毫秒,确保推理跟上编码速度。通过引入AST语法解析技术,可识别不同场景,触发不同推荐策略:可根据上下文推理出单行代码、多行代码,根据相邻文件及其他背景信息初始化代码文件整体框架,并支持根据函数注释或函数签名直接补全完整函数。除实时代码推荐外,侧边栏辅助区支持更高级的代码生成任务,侧边栏交互流畅,可便捷触发单测生成、注释生成、代码优化、代码解释、自然语言生成代码等能力。


在安全性方面,Comate在模型侧、产品侧均做了严格的安全策略:通过对模型训练数据及推理内容风险检测与过滤,确保推理内容安全,无涉政或违法风险;插件侧将代码中的密码密钥等敏感信息脱敏后再请求服务,确保用户代码隐私安全,无泄露风险;增加中间人数据挟持防护能力,防止中间人挟持用户回传的代码及敏感信息。


在数据驱动方面,Comate具备多维度数据分析功能,多角度呈现组织和个人的推荐量、采纳量、采纳率、留存率、响应时间、代码生成占比等指标数据,以数据驱动研发效能提升。


未来,Comate将持续强化模型和数据建设,并支持业务私域知识接入,与编程现场相结合实现模型推理质量与准确性提升。还将增强开放性,上线Comate开放平台,支业务共建和开发基于业务场景的能力。从通过开放平台,可以根据个性化需求,定制智能研发能力。


此外,百度Comate将于近日正式发布Comate AutoWork,AutoWork通过文心大模型思维链能力及基于RAG的代码智能检索技术,实现了从需求到代码的生成。开发者仅需要把需求文档写好,剩下的由AutoWork自主思考、拆解需求并执行任务,完成代码的生成。

22.png

Comate AutoWork将渗透到研发全链路,开发者仅需明确目标和需求,后续研发过程例如需求拆解、制定计划、生成代码、调试运行等步骤,不仅可以顺序执行,而且中间的任何一个步骤,都可以单独拆出来无缝集成到开发者现有的代码库/工作流中。这种新型的软件开发范式,会带来开发效率数百倍的提升。


应用实效


自2023年逐步开始在百度内通过专项落地、运营推广等方式加速产品在百度内的使用覆盖与深入使用,截止目前,在百度内各产品研发团队均已经得到广泛使用,覆盖80%+开发者,整体采纳率达到40%+,由Comate生成的代码占比达到20%,如百度飞桨、百度网盘、百度健康、智能云研发团队等通过深入使用Comate工具产品,在智能代码生成、UT生成、代码注释生成等方面提效明显,头部用户采纳率达到60%+。尤其是百度网盘、百度地图等产品研发团队基于Comate工具产品,结合自身APP端研发场景,协同建设了更适合业务场景的智能编码能力,加强了Comate在多研发场景下的支持效果。


此外,除内部开发者外,百度Comate也对外发布了SaaS服务和私有化服务,面向个人用户和企业用户开放。基于SaaS的服务模式无需企业自行采购和准备模型运行的硬件资源,减轻了企业采购的成本。按照使用人数的计费方式也让产品的使用和计费更灵活,整体使用成本大幅下降,解决了以往需要自己训练、部署模型等高技术要求、高成本、高人力投入等方面的问题。让企业能够开箱即用,简单直观的提升研发效率,加速研发过程。而私有化版可以将整套服务部署在私有云中,由于模型和服务部署在本地,最大程度上保证了代码和数据安全性。同时也支持代码精调服务,使模型具有更高的推理准确度。


在23年10月份推出Comate SaaS版后,目前累计注册企业9000家,累计注册用户数万名。此外,涵盖金融、汽车、互联网、高端制造等在内的数十家大型企业已与Comate达成私有化部署合作。


中国人工智能产业发展联盟(AIIA)是在国家发改委、科技部、工信部、网信办指导下,由中国信息通信研究院等单位发起的行业组织,立足于搭建全球化的人工智能生态合作平台。

“2024 AIIA联盟十大先锋案例”征集工作即将启动,继续挖掘并培育更多的人工智能应用标杆案例,为数字经济高质量发展和赋能新型工业化提供更多助力。