华为云盘古大模型5.5发布:全栈昇腾训练

发布时间:2025-06-20 20:02:21

本文作者:小古

6月20日消息,在今日举办的华为开发者大会HDC 2025上,华为常务董事、华为云计算CEO张平安正式发布盘古大模型5.5。

图片来源:互联网

据悉,此次升级覆盖自然语言理解(NLP)、计算机视觉(CV)、预测、多模态与科学计算五大基础模型,强化行业应用能力,全面提升训推效率与智能深度。

张平安强调,盘古大模型5.5完全基于华为自研昇腾全栈软硬件训练体系打造,标志着昇腾架构具备支撑世界一流大模型的完整能力。

在NLP方向,全新发布的718B深度思考模型采用256专家MoE架构,在知识推理、工具调用、数学计算等核心任务上能力跃升。盘古自研的通算掩盖、全局动态均衡、分组混合专家MoGE等关键算法,实现了高效训推,训练MFU与单卡推理吞吐均达业界领先水准。

盘古大模型5.5聚焦长序列、高准确、低幻觉、快慢思考融合与智能体(Agent)核心技术。其中,自适应快慢思考技术可根据问题复杂度动态切换思维节奏,简单问题快速反馈,复杂问题深度推理,整体推理效率提升8倍。深度研究模块DeepDiver已可在5分钟内完成超10跳复杂问答,支持生成上万字的专业调研报告,极大提升复杂任务执行效率。

除NLP外,盘古大模型5.5在视觉识别、科学预测、多模态融合、科学计算等领域同步升级,技术广泛落地农业、制造、工业控制、科研计算等行业场景,持续拓展行业AI应用深度。

“盘古不仅在通用AI能力上快速追赶,更在复杂行业场景中实现领先落地。”张平安在发布会现场表示,未来盘古大模型将持续定位为“行业AI先行者”,推动AI深入产业核心业务,成为各行各业的智能生产力引擎。(袁宁)

本文来自网易科技报道,更多资讯和深度内容,关注我们。

图片来源:互联网

本文转载自互联网,如有侵权,联系删除。

相关文章