6月23日消息,阿里云今日推出面向自动驾驶场景的全新训练与推理加速框架PAI-TurboX。该框架可提升感知、规划控制乃至世界模型的训推效率,实测显示,在多个行业模型的训练任务中,PAI-TurboX均可缩短50%的时间。

自动驾驶模型需融合图像、激光雷达、毫米波雷达、GPS等多模态数据,长期以来受限于大规模数据预处理效率与算子执行性能瓶颈,训推成本高昂。PAI-TurboX在多模态数据预处理、离线大规模模型训练以及实时智驾推理等环节提供了全面解决方案。
在系统层,PAI-TurboX通过优化CPU亲和性、动态编译、流水线并行等机制,提升硬件利用率;在数据层,PAI-TurboX自主研发高性能DataLoader引擎,并引入智能样本分组和预处理优化,有效缓解数据加载与预处理瓶颈。
同时,PAI-TurboX集成算子优化与量化能力,在降低访存延迟、压缩内存带宽需求的同时,保障推理精度,支持异构算力环境下的高性能部署。
实测结果显示,在自动驾驶的3D物体检测模型BEVFusion训练任务中,PAI-TurboX可以将训练时间缩短58.5%;在实时在线矢量化高精地图构建模型MapTR训练任务中,PAI-TurboX可以将训练时间缩短53%;在端到端自动驾驶模型SparseDrive训练任务中,PAI-TurboX 可以在感知模块训练和联合训练两个阶段获得明显的速度提升,相同训练步数下可分别缩短51.5%和48.5%。


阿里云研究员林伟表示:“ TurboX不仅可以提升自动驾驶模型的训推效率,还将进一步加速世界模型的开发进程,让所有终端和人一样具备感知、思考和决策能力。”(袁宁)
本文来自网易科技报道,更多资讯和深度内容,关注我们。
