清华大学智能产业研究院院长张亚勤近日在接受第一财经的电视节目采访时表示,AI医院用2天时间便可完成三甲医院2-3年的诊断量,而且目前来看诊断的准确率很高,超过了96%。
今年4月,清华大学宣布成立人工智能医院(Tsinghua AI Agent Hospital)。按照规划,初期将建设AI医院系统,依托北京清华长庚医院及北京清华长庚互联网医院试运行,以全科医学科和眼科、放射诊断科、呼吸科等专科为试点。
张亚勤在最新的采访中表示:“我们构建了全世界第一个AI医院,完全使用智能体,构建一个虚拟的医院,里面有些智能体是医生,有些智能体是护士,有些智能体是病人,模拟整个医院各个科室。”

“AI医生”加速进化
去年11月,清华团队研发的“紫荆AI医生”内测系统上线,基于“闭环式”医疗虚拟世界实现“AI医生”加速进化,为人工智能医院建设奠定了智能医疗领域智能体研究及应用基础。
“这些智能体的好处是可以在虚拟的空间里实现互动,就像下围棋,左右手可以互搏,它的进化速度很快,可以是真实世界的上百倍,甚至上千倍。”张亚勤表示。
人工智能在医疗领域的应用日益普及。一些智能体在患者问诊以及医生病历撰写方面已经体现出一定的优势。尽管如此,“AI医生”距离独立看病仍需要漫长的进化过程。
近日,一项来自澳大利亚的研发发现,包括ChatGPT、Claude在内的全球领先的人工智能大模型,在回答医疗相关的问题时,很容易提供看似权威的虚假健康咨询信息,这些信息甚至包含来自真实医学期刊的虚假引文。
研究人员在《内科医学年鉴》上呼吁:“如果没有更好的内部保障措施,广泛使用的人工智能工具很容易被部署,从而大量制造危险的健康错误信息。”
对此,大模型的开发者已经表示,他们正在采取行动完善针对虚假信息的防护机制。
在国内,各大三甲医院也正在积极部署AI智能体,以解决医疗资源分布不均的问题。但专家同样指出,AI智能体容易出现“幻觉”。
上海交通大学医学院附属新华医院院长孙锟教授对第一财经记者表示,通用大模型在医疗领域存在明显的局限性,包括专业知识不足和较为严重的“幻觉”问题。“这与模型训练数据的广泛性和非专业性有关。因此需要开发专用的医疗大模型,使用经过合规清洗以及人群的验证,具备临床级别推理能力的数据。”孙锟说道。
AI智能体如何应对数据挑战
近日,新华医院联合商汤医疗发布了“AI儿童全科医生”智能体,该AI智能体经过严格测试和验证,患儿家长可以直接向它提问,或者上传图像,通过人工智能的计算,AI医生可以给出建议。
专家医生的“数字分身”也是AI智能体发展的重要方向之一。上个月,复旦大学附属中山医院心内科就基于“观心”大模型(CardioMind)开发了心脏病专家葛均波院士的“数字分身”。这位“AI医生”的声音也与葛均波极其相似,普通话还带有山东口音,患者能够感受与真人医生互动的场景。
与其他行业一样,AI智能体在医疗行业应用落地的过程中,首先面对的是数据的挑战。专家指出,未公开发表数据是医疗大模型的核心竞争力,但这些数据通常存在于医院科室的封闭系统当中,获取和使用这些数据面临着复杂的挑战。
中国科学院院士、复旦大学附属中山医院樊嘉教授在谈及AI智能体在医疗行业的应用时,强调高质量数据对于人工智能模型的重要性。他表示:“模型的准确性和可靠性取决于训练数据,即语料的质量。此外,在临床应用中还需解决患者对数字医生的信任度、确保模型符合伦理和监管标准等。”
也有专家提到,由于大多数医疗文献、数据都是英文撰写,国内缺乏专业的中文语料用于训练大模型,且医学发展本身是动态性的,变化很快,包括一些专家的共识,这部分语料都是分散在医院的各个业务系统里,如何把它们形成高质量的语料去赋能大模型的应用是很大挑战。
“医院在落地AI智能体之前,首先要做的就是基础数据库的建设,做好数据治理,获取高质量的语料,用于训练垂类大模型和AI智能体。”一位三甲医院信息科相关人士告诉第一财经记者。
他还表示,AI智能体目前还不具备独立的医疗决策能力,医生仍需为医疗行为担责。“未来的一个发展方向是如何使AI智能体更好地与人的思维相连接,更能理解人的意图并执行,进而具备创新研究能力。”上述人士表示。