(文/观察者网 吕栋)
“以往医生看病理切片,就像在森林中找一片异常的树叶。中国的病理医生每天要在显微镜下看300多张片子,而欧美的病理医生每天只需要看50张左右,所以我们三甲医院病理医生的工作量是美国医院的5-6倍,很容易产生漏诊和误诊。现在用AI大模型来看的话,一是能解决效率问题,二是能在一定程度上提高准确率。”在上海交通大学医学院附属瑞金医院(下称:瑞金医院),一位技术专家对观察者网说道。
近日,瑞金医院联合华为宣布开源RuiPath病理模型。该模型是由瑞金医院在华为团队支持下研发的临床级多模态病理大模型,涵盖泛癌种视觉特征提取、视觉-语言跨层表征对齐、长序列的深度思考模型训练机制等能力,用于全流程临床病理辅助诊断,目前已覆盖中国每年全癌种发病人数90%的19个常见癌种,涵盖上百个辅助诊断任务。
“原来每个诊断任务,病理医生需要通过显微镜一个个进行皮肤侵犯检测、乳头侵犯检测等,现在AI把每个步骤提前做完,医生只需要去确认,判断采纳还是不采纳,相当于一个Copilot模式,医生从原来大量看片子,变成最终确认AI的结果,这样就避免了在树林里找不正常的树叶,每个步骤都是AI提前把数据找到,医生去确认好还是不好。”技术专家表示。
此次开源的是RuiPath病理模型的核心“视觉基础模型”,依托瑞金医院百万张高质量数字病理切片数据,使用华为AI全流程工具链ModelEngine进行标注、训练和模型精调而成。

图源:观察者网
现场专家介绍,在业界12个主流公开数据集的14个辅助诊断任务测试中,RuiPath病理模型有7个达到业界领先水平(SOTA),而美国哈佛大学的病理视觉模型UNI2,只有6个达到了SOTA。并且,RuiPath已具备临床验证能力,本次开源配套提供测试数据集,覆盖了肺癌、结直肠癌、甲状腺癌、胃癌、乳腺癌、前列腺癌、胰腺癌等7个常见癌种。华为同步还开放了基于以上开源模型的工具及实践指南,加速推动人工智能在医疗行业的落地。
技术专家对观察者网坦言,中国的病理科医生只有不到2万,缺口高达14万,这是国内医院比较大的挑战。像瑞金这样的大型三甲医院把病理模型做出来并开源后,一是可以解决效率问题,原来病理科医生一天能看200-300张病理切片,现在能看400-500张甚至更多;二是能提高诊断准确率,通过AUC、ACC和F1 Score等指标确保模型能达到极致精准度。
“我们希望通过RuiPath病理模型的开源,来带动中国数字病理标准的规范。如果其他医院的跟瑞金的标准很接近,几乎不需要做任何训练就可以直接使用,瑞金怎么用,其他医院就怎么用,需要的是部署硬件。但如果标准不一样,就需要在数据上做增量训练,但训练成本相对会低很多,因为瑞金100多万张切片已经提取完特征了。”这位技术专家补充道。

华为数据存储产品线总裁周跃峰
研发一款病理大模型并不容易,即便像瑞金医院这样的国内顶级医院,已经积累了大量的数字切片,但在前期训练大模型的过程中,依然面临数据格式不统一和标注工作量大等难题。
2022年初,华为轮值董事长胡厚崑、华为数据存储产品线总裁周跃峰等一行曾到访瑞金医院。胡厚崑表示,在数字化病理等场景中,华为将为瑞金医院专家团队提供充分的技术支撑,发挥云、网、边、端的技术协同优势,在真正有刚需的场景中深度合作,联合创新。此后三年里,华为与瑞金医院病理模型的合作共经历了“数字化”和“智慧化”两个阶段。
第一阶段病理数字化,在瑞金医院采用统一数字病理格式(CSP)高效存放数据(空间节省45%),实现病理切片数据的标准化落地。从2023年联合业界发布《数字化智慧病理科建设白皮书》,到2025年共积累了百万规模高质量数字化病理数据,为后续的智慧化打下坚实基础。
第二阶段病理智慧化,华为天才少年团队入驻瑞金医院,进行数据工程、模型工程、应用工程的联合研发。基于高质量数据,通过“医生+AI工程师”进行模型蒸馏、知识蒸馏、模型精调。改变传统单癌种小模型开发模式,实现大模型从泛癌种精准识别、辅助诊断任务到上层应用的端到端落地,使得其贯穿医生诊断全流程。

图源:观察者网
“原来10-20分钟标注一张的工作量很大,现在一天能标注700张以上。”技术专家对观察者网介绍道,华为提供并开源的ModelEngine,让医生从逐条标注变为批量审核,效率翻数倍,并保证专业性和准确性。同时基于ModelEngine应用工程能力,实现应用系统接口的标准化对接和病理报告模板可视化编排,单病种AI诊断应用上线周期从10天降到2天。
以往谈起大模型的训练和推理,行业的普遍印象是高成本和高投入,尤其美国企业动不动就要用到海量的GPU卡进行训练,这种高成本国内多数企业和医院难以承受。但在瑞金,华为采用算存网协同、模型及算法优化技术,仅用16卡集群完成了RuiPath病理模型开发及部署。
“中国每家医院都有信息中心,但没有人工智能中心,缺乏人工智能人才,瑞金跟华为在做的事情,就是让医疗大模型落地过程简化,其他医院照着一步步就能用,而不是必须要有个大模型的专家,让大家能够更快速的去做整个行业模型的落地。”技术专家对观察者网说道。
技术只有服务于人才有价值。中国工程院院士、瑞金医院院长宁光表示,希望此次开源与成果共享,集聚上海力量、中国力量,让更多同道参与到病理辅助诊断模型的研究与应用中,加速RuiPath病理模型临床应用落地,共同提高医疗水平,让AI医疗能力持续惠及全社会。
本文系观察者网独家稿件,未经授权,不得转载。