中国信通院公布 AI 代码大模型评估，阿里云、华为、等首批通过

IDC资讯
2024-06-12

6 月 11 日消息，中国信息通信研究院公布了可信 AI 代码大模型评估的首轮评估名单，阿里云通义灵码、华为云盘古等国产 AI 大模型均入选并首批通过。

此次大模型评估以《智能化软件工程技术和应用要求第 1 部分：代码大模型》标准为依据，围绕通用能力、专用场景能力、应用成熟度，为模型能力提升和企业选型提供规范性参考。

IT之家注：《智能化软件工程技术和应用要求第 1 部分：代码大模型》（标准编号 AIIA / PG 0110-2023）标准于 2024 年 1 月 25 日正式发布，该标准由中国信通院与中国工商银行联合牵头发起，涵盖通用能力、专用场景能力和应用成熟度三大部分，包括 100 多个能力要求。

此次验证，依据标准开展，评价指标覆盖 6 大通用能力场景、7 大专用能力场景、3 大服务成熟度，多维度验证研发大模型在研发场景能力和人效优化效果方面的场景丰富度，重点考察研发大模型在代码理解、代码生成和补全、研发问答、单元测试用例生成等方面的能力支持度，全方位评估研发大模型在数据合规性、模型成熟度、服务成熟度方面的应用成熟度。

目前，华为云盘古大模型、阿里云 AI 编程助手通义灵码、中国电信星辰政务大模型等首批通过评估，并在全部 100 多个能力评估中表现优秀，获得 4 + 评级。

公开资料显示，AI 代码大模型首轮评估于今年 3 月启动，主要面向适用于金融、科技、互联网、电信、软件等各行业，生产、使用或计划使用代码大模型的企业，评估结果旨在为模型厂商提供代码大模型能力的评价和指导标准，以及为模型应用方提供有效衡量其能力水平的标准依据。

田鑫，专业的企业组网服务商，致力于为企业提供企业组网（SD-WAN、MPLS、云互联）、数据中心、网络安全、系统集成服务、ICT解决方案、行业IT解决方案等相关服务。

更多相关内容推荐：
人民日报：让算力早日像水和电一样即取即用
算力如何成为数字经济的“万金油”？
算力中心建在热电厂内北京人工智能公共算力平台（上庄）发布
北京亦庄1000P人工智能算力中心一季度内上线，全国首个数据基础制度先行区建设初“现”成果