巨匠好,今天跟巨匠共享一篇题为Metabo lomic machine learning predictor for diagnosis and prognosis of gastric cancer(代谢组学机器学习展望癌症的会诊和预后)胃癌(GC)是全球癌症关联死一火率的一个紧要职责,这突显了要紧需要制定早期检测计策和精确的术后干扰步调。
缱绻布景
胃癌 (GC) 谢全国范围内组成了癌症关联死一火率的千里重职责,突显了制定早期检测计策和精确术后干扰的要紧需求。然而,用于早期会诊和患者风险分层的无创生物标识物的果决仍未获取充分探索。在这里,咱们对来自多中心参与者的 702 份血浆样本进行了有针对性的代谢组学分析,以发扬 GC 代谢重编程。
咱们的机器学习分析揭示了一个 10 代谢物 GC 会诊模子,该模子在外部测试归拢进行了考据,智谋度为 0.905,优于行使癌症卵白质标识物的传统重要(智谋度< 0.40)。此外,咱们机器学习生息的预后模子施展出优于行使临床参数的传统模子的性能,并灵验地将患者分层到不同的风险组以引导精确干扰。
总的来说,咱们的缱绻成果揭示了 GC 的代谢景不雅,并详情了两个不同的生物标识物组,分别或者进行早期检测和预后展望,从而促进 GC 的精确医疗。
张开剩余83%见图一
缱绻的默示图轮廓。
图一
缱绻假想轮廓。该插图是使用 BioRender.com 上的十足许可证创建的。该缱绻共纳入 702 东谈主,他们的血浆样本经受了靶向代谢组学分析。比较部队 1 (n = 426) 中胃癌 (GC) 患者和非 GC 对照 (NGC) 的代谢特征,以描画 GC 中的代谢重编程。使用来自部队 1 的代谢组学数据和机器学习时刻,创建并考据了 GC 会诊模子(10-DM 模子)。该模子在测试集 2 (部队 2,n = 95) 中获取了进一步考据。使用机器学习算法分析来自部队 3 (n = 181) 患者的代谢组学数据过头临床特征,以莳植预后模子 (28-PM 模子)。这两个模子的性能以临床使用的生物标识物/临床特征为基准。图中不同情怀的三角形代表用于模子构建、考据和比较过程的不同参与者组。源数据算作 源数据 文献提供。
见图二GC 患者与非 GC 对照比拟的重编程血浆代谢景不雅。
图二
a 部队 1 (n = 426) 血浆靶向代谢组学数据的主因素分析 (PCA),比较 GC 患者(紫色)和 NGC 对照(绿色)。
b 部队 1 血浆代谢组学中检测到的代谢物的火山图(GC 患者与 NGC 对照)。权贵各异代谢物呈紫色(上调)和绿色(下调);其他的则为灰色。双侧 Wilcoxon 秩和考研,然后是 Benjamini-Hochberg (BH) 多重比较考研,作假发现率 (FDR) < 0.05,倍数变化 (FC) > 1.25 或 < 0.8。
c 凭证代谢变化的雷同性,使用各异代谢物对 GC 进展过程中的代谢轨迹进行 Mfuzz 聚类。每个簇的代表性代谢物清晰在侧面。
d 京齐基因和基因组百科全书 (KEGG) 代谢路线在 GC 患者和 NGC 对照之间由昭彰各异代谢物富集。使用单侧 Fisher 精确考研,然后是 BH 多重比较考研,仅冷漠 FDR < 0.05 的通路。源数据算作 源数据 文献提供。
见图三基于血浆代谢组的机器学习生息展望模子用于 GC 会诊。
图三
a 建模做事进程的假想。经受 LASSO 总结和就地丛林算法进行特征遴荐和模子老师。10-DM 模子在测试集和外部测试归拢进行了考据。该插图是使用 BioRender.com 上的十足许可证创建的。
b 测试集 1 顶用于会诊 GC 患者的受试者做事特征 (ROC) 弧线。凭证 1000 次就地抽样测试的均值和协方差缱绻 95% 置信区间。
c 10 种代谢物对 10-DM 模子的孝敬。
d–g,10-DM 模子在测试集 1 (d) 和测试集 2 (e) 中分手 GC (紫色)和 NGC (绿色),以及分手 I 期 GC 患者 (IA 期黄色和 IB 期棕色) 在测试集 1 (f) 和测试集 2 中与 NGC 的展望性能 (g).虚线透露 0.50 的戒指值,用于将展望的 NGC(左侧)与 GC(右侧)分开。源数据算作 源数据 文献提供。
见图四
预后模子在展望 GC 患者预后方面优于临床参数。
图四
a 预后模子假想的默示图大纲。S 幸存下来,D 物化。
b 测试集的 ROC 弧线分析。95% CI 是凭证 1000 次就地抽样测试的平均值和协方差缱绻得出的。
c 通过单变量 Cox 总结分析详情的具有昭彰预后关联性的临床参数的丛林图。P < 0.05 的参数被以为具有统计学意旨,并由绿线透露。中间的点和线代表 HR 和 95% Cl,由 log 10 缩放。EGC,早期胃癌。TNM 分期、肉眼外不雅和血管肿瘤栓塞的 P 值分别凭证 n = 181 、 180 和 180 个零丁样本的数据缱绻。
d 测试归拢宏不雅外不雅、TNM 分期、血管肿瘤栓塞和 28-PM 模子的 C 指数值比较 (n = 60)。C 指数和 95% Cl 清晰在相对彩色条柱下。
e 使用 28-PM 模子对测试集患者 (n = 60) 进行预后展望。以 2.1 的临界值绘图的虚线将患者分为高危组和低危组。绿色圆圈和灰色圆圈透露测试归拢的 survived 和 deceased。箭头指向死于腹黑病发作的死者。
f Kaplan-Meier 弧线清晰测试集 GC 患者 (n = 60) 的总糊口期 (OS) 和无病糊口期 (DFS),按预后风险评分 (临界值 = 2.1) 分层。P 值经受双侧对数秩考研缱绻。g 高危组死一火和复发/调动比例较高。使用双侧 Fisher 精确考研缱绻 P 值。源数据算作 源数据 文献提供。
02
缱绻论断
总的来说,咱们的发现描画了 GC 中的代谢重编程,并趋附了机器学习算法来构建两个模子,分别识别 GC 患者并展望他们的预后。咱们的做事增强了对 GC 病理学的领略,促进了 GC 早期检测的发展,并发扬了 GC 的精确调养。更一般地说,该框架卓著了基于机器学习的组学数据讲明注解在肿瘤检测和决策引导方面的独到上风,而且不错现实到探索其他疾病。
好了开云(中国)Kaiyun·体育官方网站-登录入口,今天的文献解读就到这儿来,咱们下期相遇!若是你正在开展临床缱绻.需要决议假想.数据科罚. 数据分析等守旧.也随时不错磋议咱们。
发布于:广东省