7月17日记者获悉,空军军医大学病理学团队联合清华大学团队、商汤医疗共同发布国内首个病理大模型“PathOrchestra”。该模型基于国内规模最大的数字病理图像数据集训练,并实现全球最广泛的临床任务赋能,完成了病理AI领域从“单模专病”到“一模多病”的跨越式突破,开启病理诊断“新纪元”。
病理诊断被誉为疾病诊断的“金标准”,但该领域长期以来面临病理人才培养周期长、优质病理诊断资源分布不均匀等问题。人工智能技术的应用让国内外病理科迎来数智化转型浪潮,不过由于数字病理切片分辨率高、涉及病种多,在“大数据+精标注”的传统AI模型训练范式下,想要对每一种疾病进行精标注训练几乎是“不可能完成的任务”。“病理图像具有非常大的多样性,借助人工智能技术开展诊断难度极大,因此病理图像处理也被称为图像处理中的‘皇冠上的明珠’。病理大模型正是突破数字病理瓶颈的关键。”大学基础医学院王哲教授表示。
此次发布的病理大模型PathOrchestra,将视觉模型和大语言模型结合,利用国内规模最大的近30万张全切片数字病理图像(近300TB数据)数据集训练,并融合了文本、视频等多模态训练数据。通过对海量数据的自监督学习,无需大量精标注数据,即可让模型“触类旁通”学会分析各类器官病理图像,已覆盖肺、乳腺、肝脏、食管等20余种器官,赋能包括泛癌分类、病灶识别和检测、多癌种亚型分类、生物标志物评估等在内的百余项临床任务,在多器官泛癌分类、淋巴瘤亚型诊断、膀胱癌筛查等近50项任务中准确率超过95%,这也是目前全球赋能临床任务最广的病理大模型。
在训练过程中,研发团队还针对性地增加了食管癌、乳腺癌等中国发病率较高的癌症数据,使模型能力更符合我国临床实际需求。王哲表示:“PathOrchestra是一首由视觉模型、大语言模型以及多模态数据共同奏响的‘协奏曲’,希望这首协奏曲能够奏出美好的曲调,为中国乃至世界的广大患者的病理诊断做出更好的服务。”
病理大模型PathOrchestra的发布,为数智化病理学科建设提供了强大的底层技术支撑。依托病理大模型的底层赋能,将AI的能力半径拓展至百余种病理临床任务,有效缓解了病理医生工作量超负荷的问题,显著提高阅片效率,帮助病理实现数字化、智慧化转型,为患者提供水平更高、效率更高的高质量医疗服务。
文/任娜 张静 张语桐
(西安晚报)
编辑/倪家宁