摘要 肺癌是发病率和死亡率最高的恶性肿瘤,严重要挟人类健康,因而进步肺癌的诊疗效率至关重要。人工智能技术为肺癌的诊治带来了新思绪,目前大量研讨集中于肺部肿瘤的早期筛查、诊断、治疗和病程管理,以及研发基于深度学习的计算机辅助诊断系统,并取得了显著效果。 本文系统论述了人工智能技术在肺部肿瘤早期筛查、病理诊断、预后评价、手术导航和免疫治疗等方面的研讨停顿,置信人工智能技术必将为肺癌的诊治带来新的机遇,并将有助于进步肺癌患者的总生存率和生活质量。 GO 全文选读 肺癌的发病率和死亡率在全球排名第一,是全球肿瘤相关死亡的主要缘由。随着人类癌症基因组的解码和针对驱动突变的疗法的呈现,目前治疗能更精确选择靶向特定基因中止治疗。与常规化学治疗相比,靶向药物具有更高的反响率和更少的毒性。此外,随着对肿瘤细胞与免疫系统相互作用的深化了解,目前还展开出新的针对立肿瘤免疫的治疗战略 [1]。 但是,固然研讨人员在诊断和治疗方面已取得显著停顿,但晚期非小细胞肺癌(non-small cell lung cancer,NSCLC)患者的 5 年总体生存率变更不显著,且肺癌的发病率未见明显降落 [2]。 关于肺癌只需做到「早期检测、正确诊断、精准治疗」,才干从基本上延长患者生存期,进步患者生活质量。人工智能为当前行业科技化展开的中心特征,得益于计算机技术的展开和硬件的提升,将人工智能用于医疗范畴大大加速了医学技术反动。鉴于肺癌的高发病率和高死亡率,人工智能在肺癌中的研讨和应用停顿极为疾速,本文就人工智能技术在肺癌中的应用现状作一综述。 1 人工智能技术用于肺结节筛查 1.1 计算机辅助诊断(computer-aided diagnosis,CAD)系统 目前,越来越多的肺结节在检查中被发现,固然大部分肺结节为良性病变,但仍有较高比例的早期肺癌。直径>3 cm 的肺结节恶变的可能性十分高,因而需高度注重肺结节的筛查。肺结节筛查工作量大,易漏诊,且医师在检出肺结节后需精确判别其良恶性,为下一步治疗提供倡议。 基于上述问题,科研人员和企业投入大量物力和财力研发辅助医师筛查肺结节的人工智能系统,以辅佐放射科医师疾速定位疑似结节,并提出诊断意见和治疗倡议,从而减少误诊和漏诊。基于此,各种 CAD 工具正不时开发,研讨表明 CAD 系统能辅佐医师辨认更多结节 [3];此外,其还可经过结节容积法评价结节恶性肿瘤的恶性水平和治疗反响,客观剖析结节形态,优化工作流程 [4]。 1.2 结节图像数据库 CAD 系统可辅佐放射科医师早期快速定位疑似结节。但是,其在中止肺结节检测、分类和定量评价时必须有一个完善、可重复的计算机断层扫描(computed tomography,CT)数据库,如肺图像数据库联盟(Lung Image Database Consortium,LIDC)和图像数据库资源计划(Image Database Resource Initiative,IDRI)分离树立的 LIDC/IDRI 数据库。 该数据库由国度癌症研讨所发起,国度卫生研讨院基金会推进,并由食品药品监视管理局、7 个学术中心和 8 个医学影像公司共同参与,包含 1 018 例病例,每例均包含临床胸部 CT 扫描图像和相关的 XML 文件,且该文件由 4 位阅历丰厚的放射科医师中止两阶段图像注释。 在初始阶段,每位放射科医师独立检查每次 CT 扫描图像,并标记属于 3 种类型的病变(结节 ≥ 3 mm、结节<3 mm 和非结节 ≥ 3 mm);在第 2 阶段,每位放射科医师检查自己的标记和其他 3 位放射科医师的匿名标记,给出最终意见。最终该数据库包含至少 1 位放射科医师标记为「结节」的 7 371 例病变,其中 2 669 例被至少 1 位放射科医师标记为「结节 ≥ 3 mm」,且有 928 例(34.7%)4 位放射科医师均中止了如此标记。 LIDC/IDRI 数据库为医学图像研讨社区提供了一个公开的参考,为推进 CAD 在临床理论中的展开、考证和传播提供重要的医学影像研讨资源 [5]。我国肺癌患者数量多,目前各大医院都有自己的肺结节 CT 数据集,但尚未见相似 LIDC/IDRI 数据库的中国版本。 1.3 人工智能技术在肺结节筛查中的应用 有学者研发了一种检测早期肺结节的新型 CAD 系统,该系统主要由肺实质分割、结节候选检测、特征提取(共 22 个特征)和结节分类 4 个部分组成,并运用 LIDC/IDRI 数据集中的公开数据集中止锻炼和测试。从 80 个 CT 扫描图像当选择 6 400 张图片,共包含 978 个结节,由 4 位放射学家标记。 该 CAD 系统经过快速分割法将肺结节分为 888 个真结节和 11 379 个假阳性结节,采用集成分类器随机森林(random forest,RF)诊断良恶性的精确率、灵活度、特异度和受试者工作特征(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC)分别为 93.2%、92.4%、94.8% 和 97.6%;与支持向量机(support vector machine,SVM)分类器相比,其运用的 RF 能降低假阳性率,取得更高的 AUC [6]。 另有研讨者应用 LIDC/IDRI 数据集的图像开发了肺结节筛查的 CAD 措施。该措施采用图像处置和方式辨认技术,还运用闵可夫斯基函数、距离度量、点度量向量表示、三角度量和羊齿直径,最后应用遗传算法选择最优模型和 SVM 中止分类;最终该措施诊断良恶性的精确率、灵活度、特异度分别为 93.19%、92.75%、93.33% [7]。随后的一项研讨也应用 LIDC/IDRI 数据集中的图像开发了一种用于肺结节分类的措施。该措施同样采用图像处置和方式辨认技术,并运用外形丈量,经过外形图、比例丈量和基于圆柱的剖析判别结节外形,随后将该措施应用于 LIDC/IDRI 数据库中的 833 幅图像,并中止 k 重交叉考证,最终其分类结节与非结节的平均精确率为 95.33% [8]。 CT 检测肺结节所得图像为多维度图像。三维卷积神经网络(convolutional neural network,CNN)能充沛应用肺结节的空间三维上下文信息,采用多视角战略,进步二维 CNN 对肺结节的分类和灵活度,减少假阳性率。有研讨对 CT 检测肺结节的自动三维技术中止了综述,其中有几项研讨被以为有助于医疗诊断辅助工具的构建,但仍需留意改善和优化算法,以进步对不同大小和外形的不同种类结节的检测才干、与电子病历系统和相关图像存档和通讯系统的整合才干 [9]。 一项研讨应用三维 CNN 从 CT 图像中自动检测肺结节,与二维 CNN 相比,三维 CNN 可对更丰厚的空间信息中止编码,经过火层提取更有代表性的特征 [10]。 另一项研讨应用三维多视点卷积神经网络(multiple view-convolution neural network,MV-CNN)对肺结节中止分类,该网络具有链结构和有向无环图结构,包含三维 Inception 和三维 Inception-ResNet;对 LIDC/IDRI 数据集中的 CT 图像中止二值分类(良性、恶性)和三元分类(良性、原发性恶性和转移性恶性),可发现三维 MV-CNN 的性能优于二维 MV-CNN,最终三维 Inception 网络在二值分类上的错误率为 4.59%,在三元分类的错误率为 7.70% [11]。 目前,基于人工智能技术的肺结节筛查大赛也在疾速展开,比较知名的有天池医疗人工智能大赛(TianCHi)、LUNA16 和 Kaggle 大赛。TianCHi 以「人工智能辅助医疗决策」为主题开发算法模型,检测 CT 图像中的肺结节区域;大赛数据集包含数千份高危患者的低剂量肺部 CT 图像(mhd 格式),每张图像包含一系列胸腔的多个轴向切片,层厚<2 mm,其原始图像为三维图像,由不同数量的二维图像组成(https://tianchi.aliyun.com/competition)。 LUNA16 运用公开可取得的 LIDC/IDRI 数据库,数据集中切片厚度均<2.5 mm,共有 888 份肺部 CT 样本,竞赛参考规范是 4 位放射科医师中有 3 位接受的>3 mm 的结节;参与者提出的算法模型灵活度均超越 95%。4 位放射科医师的最终察看表明,最好的人工智能系统能够检出那些最初注释 LIDC/IDRI 数据的专家漏诊的小结节 [12]。 Kaggle 数据集中有 1 000 张来自高危患者的低剂量肺部 CT 图像(dicom 格式),每张图像包含多个胸部的轴向切片;该竞赛的任务是树立一种自动化措施以肯定患者能否会在 1 年内被诊断出恶性肿瘤(https://www.kaggle.com/)。 2 人工智能技术用于肺癌病理诊断与分类 组织病理和细胞病理诊断是肺癌诊疗过程中不可或缺的一环。有研讨者拟经过人工智能技术对不同类型肺癌(腺癌、鳞状细胞癌、小细胞癌)中止分类,以进步病理诊断的精确性和稳定性。该研讨开发了一种应用深度卷积神经网络(deep convolution neural network,DCNN)的自动分类计划,由 3 个卷积层、3 个池化层和 2 个全衔接层组成,显微图像的分辨率为 256×256 像素;为避免过度拟合,经过旋转搜集图像增强、翻转、过滤,应用三重交叉考证对分类精度中止评价,结果约 71% 的图像可被正确分类 [13]。该技术在辨认肺癌细胞病理学过程中分类正确和错误的典型图例见图 1 [13]。 依据病理切片富含的信息可对肺癌患者预后中止精准的判别。一项研讨运用肿瘤基因组图谱(The Cancer Genome Atlas,TCGA)的 2 186 张肺腺癌和肺鳞状细胞癌的石蜡组织切片的全扫描图像以及 294 张组织微阵列(tissue microarray,TMA)数据库的图像,抽取了 9 879 张图像的定量特征并运用机器学习算法选取排名靠前的特征,结果显现这些特征能够很好地预测肺腺癌(P<0.003)和肺鳞状细胞癌(P<0.023)患者的生存时间。 此外,应用 TMA 数据库中的数据考证评价模型的精确性发现,其预测这 2 类肿瘤的精确性差别有统计学意义(P<0.036),结果充沛表明自动获取的病理图像特征可辅佐预测肺癌患者的预后 [14]。 3 人工智能技术预测肺癌患者的预后 Sesen 等 [14] 应用贝叶斯网络(Bayesian network,BN)分离肺癌临床数据为肺癌患者制定个性化的生存预测和治疗选择。该研讨基于英国肺癌数据库(lung cancer audit database,LUCADA)评价了 BN 中止生存预测和治疗选择的可行性,同时比较了各种因果发现措施的性能,从专家学问和数据中探寻最可行的网络结构,结果显现 BN 的 ROC AUC 仅为 0.75±0.03,而经 CAMML(causal minimum message length)混合因果结构发现算法学习后其 AUC 可达 0.81±0.03。 Lynch 等 [16] 将线性回归、决策树、梯度增强机(gradient boosting machine,GBM)、SVM 和自定义集成等大量监视学习技术用于 SEER(Surveillance,Epidemiology and End Results Program)数据库,经过对肿瘤分级、大小、阶段和数量,以及患者性别、年龄的初选,对肺癌患者的生存中止分类,最终比较不同措施的预测才干。 结果显现,预测性能最好的技术是自定义集成,其根均方差(RMSE)值为 15.05。在生成的 5 个单独模型中,最精确的模型为 GBM(RMSE 值为 15.32),固然 SVM 的 RMSE 值为 15.82,但统计剖析将其作为独终身成共同输出的模型。表明这些监视学习技术应用到肺癌 SEER 数据库中能够用来评价患者的生存时间,告知患者护理决策的最终目的。 4 导航辅助的计算机视觉系统与肺癌诊疗 随着早期肺癌检出率的进步,肺癌治疗理念也发作相应改动,目前以为不只需消弭肿瘤,还要最大水平保存肺功用。因而,介入消融、胸腔镜切除等微创手术治疗肺癌的方式进入了「段时期」。经过影像检查中止肿瘤及周边组织的三维重建能够对肺癌手术评价精准到肺支气管段、术前模仿手术导航、术中全程三维量化实时导航,最终完成全面、精确和直观助力肺癌的精准手术或微创治疗。 细致来说,手术前经过智能伎俩精准定位出病灶位置及病灶与周围血管、气管、支气管段的空间毗连关系,从而经过交互式三维模型实施虚拟手术。术中将影像实时交互定量化技术带入微创介入导航,机器人全程实时定位手术器械,临床医师依据需求恣意调整分割面的位置、角度、曲度,调整进针点、进针角度和深度、进针途径及消融范围等。 该方式对各类胸腹部肿瘤微创介入手术(如射频消融、微波消融、冷冻消融等)均能起到辅助作用,智能外科理念在手术治疗的各个环节都会得到表示。 在支气管镜检查中,导航辅助的计算机视觉系统是极具吸收力的低成本处置计划,其能够指导内窥镜医师对周围病变中止活组织检查和组织学剖析。有研讨提出一种解耦的深度学习体系结构,将输入帧投射到 CT 渲染的范畴,允许从特定患者的 CT 扫描数据中中止离线锻炼。 在图形处置单元(graphic processing unit,GPU)上完成了一个完好的卷积网络体系结构,并在一个包含 32 个视频序列和 60 000 帧的伪数据集上中止测试;研讨结果显现该体系的平均深度估量精度为 1.5 mm,比传统的输入帧直接深度估量高出 60%,计算时间为 30 ms,估量的深度与真实状况相似 [17]。 计算机辅助技术在肺癌切除中应用的研讨较多,一项研讨剖析了机器人辅助胸椎手术(robot-assisted thoracic surgery,RATS)与视频辅助胸椎手术(video-assisted thoracic surgery,VATS)对 NSCLC 患者肺叶切除的可行性战争安性;该研讨归入了 12 项队列研讨,共 60 959 例患者,结果显现 RATS 术后死亡率明显低于 VATS,但这与其中 6 项匹配研讨的结果不分歧,两种术式的发病率差别并无统计学意义 [18]。 另一项研讨开发了一套基于学问的治疗规划算法,并将该算法应用于行平面定向体放射治疗(stereotactic body radiotherapy,SBRT)的肺癌患者。该研讨归入了治疗肺癌患者的 105 个 SBRT 计划,包含 97 个调强放射治疗(intensity-modulated radiotherapy,IMRT)、6 个旋转调强放射治疗(volumetric-arcradiotherapy,VMAT)和 2 个三维适形放射治疗(conformal radiation therapy,CRT),分离上述技术中止基于学问的模型(knowledge-based model,KBM)锻炼,多次考证结果表明 KBM 可用于产生与临床计划相当的肺癌 SBRT 计划 [19]。 5 人工智能技术预测肺癌的免疫治疗疗效 肿瘤免疫治疗是近几年肿瘤治疗范畴最胜利的措施之一,免疫治疗措施很多,其中免疫检查点抑止剂是国际肿瘤免疫治疗的主要方向。T 淋巴细胞为人体免疫细胞,其名义表白程序性死亡蛋白 1(programmed cell death 1,PD-1),正常状况下能辨认感染细胞并予以破坏,而肿瘤细胞名义表白程序性死亡蛋白配体 1(programmed cell death ligand 1,PD-L1),其与 T 淋巴细胞名义的 PD-1 分离后使 T 淋巴细胞失去鉴别才干,从而无法辨认和杀死肿瘤细胞。PD-1 抑止剂可分离 PD-1,使 T 淋巴细胞重新辨认并摧毁肿瘤细胞。 该疗法的目的是调动人体自身的免疫系统,阻断 PD-1/PD-L1 信号通路,促使肿瘤细胞死亡,进步患者总生存率和生活质量。如 PD-L1 抑止剂 durvalumab 可延长部分晚期不可切除的Ⅲ期 NSCLC 患者的无疾病停顿时间(progression-freesurvival,PFS),durvalumab 组患者的中位 PFS 远高于安慰剂组(16.8 个月 vs 5.6 个月) [20]。 但是,针对免疫检查点的治疗并非对一切患者有效,目前主要是经过检测肿瘤细胞的 PD-L1 表白水平判别疗效。Keynote-042 研讨显现 PD-L1 的表白与疗效密切相关,PD-L1 表白水平越高,免疫治疗给 NSCLC 患者带来的获益越明显 [21]。 PD-L1 检测措施简单、方便、直接,对染色技术请求不高,但存在较多问题:(1)医疗资源的不均衡招致检测措施和流程统一性差;(2)医师判读客观性过强,主要依据形态学和阳性染色散布,存在肿瘤异质性、组织细胞染色、非特异性染色等多种干扰要素,为精确评价染色结果,病文科普通会布置 2 位合格医师对同一检测结果实行背靠背判读,不分歧时则请第 3 位医师或科内讨论,占用了医师正常工作时间;(3)发明性差,显微镜下病理医师只能判别能否染色和染色强度,难以给出定量数据,而阳性染色的定量以及与周围组织的空间距离可能有助于预测疗效和评价预后。 人工智能技术已胜利应用于肿瘤病理图片中肿瘤细胞的分割、辨认,也能准肯定量免疫组织化学染色结果。深度学习技术同样可用于辨认肺癌组织中 PD-L1 的表白,且其结果的客观性和重复性强,不存在人为误差;此外,其还能辨认切片中的淋巴细胞、肿瘤细胞和间质,经过三维重建显现各种细胞间的空间散布,而这种空间散布也是判别免疫治疗疗效的潜在要素之一 [22]。 综上所述,人工智能技术在肺癌早期筛查、病理诊断和分类、预后评价、手术导航和免疫治疗等方面都取得了一定停顿,证明了人工智能技术在肺癌诊疗中的可行性。但是,由于缺乏细致的临床应用场景、规范的数据库(特别是国内)、统一的规范或专家共识以及相应的国度政策法规,肺癌人工智能的落地还需较长一段时间,尚需科研工作者和企业踏实树立自己的数据库和行业规范,突破技术瓶颈,为肺癌人工智能的展开作贡献。 |