华为云盘古大模型5.5发布：全栈昇腾训练

6月20日消息，在今日举办的华为开发者大会HDC 2025上，华为常务董事、华为云计算CEO张平安正式发布盘古大模型5.5。

据悉，此次升级覆盖自然语言理解（NLP）、计算机视觉（CV）、预测、多模态与科学计算五大基础模型，强化行业应用能力，全面提升训推效率与智能深度。

张平安强调，盘古大模型5.5完全基于华为自研昇腾全栈软硬件训练体系打造，标志着昇腾架构具备支撑世界一流大模型的完整能力。

在NLP方向，全新发布的718B深度思考模型采用256专家MoE架构，在知识推理、工具调用、数学计算等核心任务上能力跃升。盘古自研的通算掩盖、全局动态均衡、分组混合专家MoGE等关键算法，实现了高效训推，训练MFU与单卡推理吞吐均达业界领先水准。

盘古大模型5.5聚焦长序列、高准确、低幻觉、快慢思考融合与智能体（Agent）核心技术。其中，自适应快慢思考技术可根据问题复杂度动态切换思维节奏，简单问题快速反馈，复杂问题深度推理，整体推理效率提升8倍。深度研究模块DeepDiver已可在5分钟内完成超10跳复杂问答，支持生成上万字的专业调研报告，极大提升复杂任务执行效率。

除NLP外，盘古大模型5.5在视觉识别、科学预测、多模态融合、科学计算等领域同步升级，技术广泛落地农业、制造、工业控制、科研计算等行业场景，持续拓展行业AI应用深度。

“盘古不仅在通用AI能力上快速追赶，更在复杂行业场景中实现领先落地。”张平安在发布会现场表示，未来盘古大模型将持续定位为“行业AI先行者”，推动AI深入产业核心业务，成为各行各业的智能生产力引擎。（袁宁）

本文来自网易科技报道，更多资讯和深度内容，关注我们。

图片来源：互联网

相关文章