6月17日,月之暗面(Moonshot AI)发布全新开源代码大模型Kimi-Dev-72B,在AI软件工程基准测试SWE-bench Verified上取得60.4%的成绩,刷新了全球开源模型的最好成绩(SOTA)。

据悉,Kimi-Dev-72B专为软件工程任务设计,参数量为72B,在SWE-bench Verified测试中超越了刚刚发布不久的DeepSeek-R1-0528(57.6%),后者参数量高达671B。

据介绍,Kimi-Dev-72B采用大规模强化学习训练,能够在现实代码环境中自动修复Docker存储库,确保在完整测试套件通过后才给予奖励,以提升模型输出的正确性和鲁棒性,贴合真实软件开发标准。
目前,Kimi-Dev-72B模型权重、源代码已在Hugging Face与GitHub平台开源,并面向开发者社区开放下载部署。(袁宁)
本文来自网易科技报道,更多资讯和深度内容,关注我们。
