当前位置:网站首页>11+的基于甲基化组和转录组综合分析识别葡萄膜黑色素瘤中新的预后 DNA 甲基化特征~
11+的基于甲基化组和转录组综合分析识别葡萄膜黑色素瘤中新的预后 DNA 甲基化特征~
2022-06-24 11:22:00 【作图丫】
导语
葡萄膜黑色素瘤(UVM)是最常见的原发性眼内人类恶性肿瘤,死亡率很高。异常 DNA 甲基化已迅速成为许多癌症的诊断和预后特征。
背景介绍
基因甲基化在肿瘤发生发展中的起至关重要的作用,今天小编为大家带来的这篇文章,对甲基化组和转录组进行了全基因组整合分析,提出了一种基于机器学习的策略来识别由 10 个 甲基化驱动的预后基因(MDPG)组成的 DNA 甲基化驱动标志 (10MeSig) 。文章发表在《Briefings in Bioinformatics》上,影响因子为11.622,文章题目为:Machine learning-based integrative analysis of methylome and transcriptome identifies novel prognostic DNA methylation signature in uveal melanoma。
数据介绍
本研究所用数据:从UCSC Xena中下载了TCGA中的 80 个 UVM 病例的临床信息、甲基化和转录组数据;从GSE44295中获得了的其他独立 57 个 UVM 病例数据。
结果解析
01
MDPGs的鉴定
本研究的工作流程如图1所示。第 1 步:通过对顶部实线框内的甲基化组和转录组进行综合分析来鉴定 MDPG。第 2 步:使用机器学习方法建立甲基化驱动的预后特征。第 3 步:在独立队列中验证甲基化驱动的预后特征。
图 1
本研究首先对早期和晚期患者进行了差异甲基化分析,并确定了总共3982个与阶段相关的CpG位点。其中,发现 2187 个候选预后 CpG 与总生存期显著相关(图 2A)。曼哈顿图显示,这些相关位点在人类常染色体中分布不均匀(图 2B)。接下来本研究对 2187 个候选预后 CpG 位点的无监督层次聚类分析产生了两个不同的患者聚类,它们与临床分期显著相关(图 2C)。接着将2187 个候选预后 CpG 位点映射到基因组区室时,本研究发现其中大多数富含启动子和基因体区域,涉及 304 个高甲基化基因和 619 个低甲基化基因(图 2D 和 E),大多数属于基因组的海岸和公海区域(图 2F)。
为了识别进展相关基因,本研究还对早期和晚期患者以及转移性和非转移性患者之间的差异表达分析。结果共鉴定出219个阶段相关基因和1013个转移相关基因(图2G和H)。最后,本研究将 40 个与分期或转移显著相关的高甲基化和低甲基化基因定义为 MDPG(图 2I)。
图 2
02
MDPGs的功能表征
为了探索 40 个 MDPG 的功能作用,本研究对 MDPG 进行了 GO 和 KEGG 通路功能富集分析。GO分析结果如图3A所示,40个MDPGs富集在7个GO BP中,KEGG分析结果如图 3B所示,40个MDPG参与蛋白质消化吸收和轴突引导。
图 3
为了进一步研究 MDPGs 与 UVM 临床特征之间的关系,本研究基于 40 个基因的表达模式对 TCGA 数据集中的 80 名 UVM 患者进行了一致性聚类分析,根据 CDF 区域的变化得到了三个不同的患者聚类(图 3C 和 D),三个患者集群之间的总生存率存在显著差异(图 3E)。
03
MeSig的开发与验证
本研究使用增强机器学习算法从 40 个 MDPG 中选择签名并确定了一个 MeSig,包括 10 个 MDPG(10MeSig)。然后,将 10MeSig 通过 10MeSig 表达式的线性组合转化为风险评分模型,并通过多元 Cox 回归中的相对系数进行加权。10MeSig 的最佳风险临界值将 80 名患者分为具有不同总生存期的高风险组 (n = 30) 和低风险组 (n = 50)。如图 4A 所示,高风险组患者的总体生存率明显低于低风险组患者。时间依赖性 ROC 分析显示,10MeSig 预测 3 年和 5 年总生存期的 AUC 分别为 0.95 和 1.0(图 4B)。
图 4
为了进一步研究 DNA 甲基化对 UVM 基因调控的影响,首先研究了 10MeSig 在按 10MeSig 分层的高风险组和低风险组中的表达和 DNA 甲基化模式。如图 5A 所示,基于 DNA 甲基化和基因表达之间的交叉点,观察到 10MeSig 中涉及的四种表达和 DNA 甲基化模式。接下来本研究通过Spearman相关性分析进一步检验了DNA甲基化对基因表达的影响,发现7个CpG-基因对表现出显著的负相关,4个CpG-基因对表现出显著的正相关(图5B)。
图 5
04
10MeSig的独立验证
为了进一步验证 MDPGs 与 UVM 临床特征之间的关系,本研究在独立的GEO数据中绘制了 35 个 MDPGs 基因。然后,对GEO队列中的 57 名 UVM 患者进行了一致性聚类分析,从 35 个基因的表达模式中揭示了两个不同的患者集群(图 6A 和 6B)。如图 6C 所示,两个患者集群之间的总生存率存在显著差异;如图 6D 所示,高风险组患者的总生存时间明显短于低风险组患者。此外,9 个 MDPG 的表达模式与在发现队列中观察到的一致(图 6E)。
图 6
05
10MesSig与临床和病理特征无关
为了进一步检查 10MeSig 是否独立于其他临床和病理因素,本研究进行了多因素 Cox 回归分析。如图 7A 所示,在 TCGA-UVM 队列中,10MeSig , IV 期和年龄在多变量分析中与 OS 显著相关。在独立的 GEO的队列中,只有 10MeSig 与 OS 保持显著关联(图 7B)。这些结果表明,10MeSig 是 UVM 患者生存的独立预测因素。
图 7
小编总结
在这项研究中,作者对甲基化组和转录组进行了全基因组整合分析,确定了 40 个甲基化驱动基因,而为了进一步研究这 40 个甲基化驱动基因的临床应用,作者进行了基于机器学习的特征选择,确定了一个由 10 个 MDPG组成的 MeSig (10MeSig),它将 TCGA 队列的 UVM 患者分层为两个风险组,总生存期显著不同。 本文的研究方法值得我们在研究中学习借鉴。
边栏推荐
- Realization of alarm clock with AHK
- ArrayList#subList这四个坑,一不小心就中招
- 美团基于 Flink 的实时数仓平台建设新进展
- About the unsupported instruction set SSE 4.2 of CPU in virtualization
- I just did it! Visualization of character relationships in Douluo continent
- “一次编写,运行各端”,高通重磅发布 AI 软件栈!
- Concise tutorial | making cartoon heat map with PPT - EFP graph?!
- 《opencv学习笔记》-- 矩阵归一化 normalize()函数
- Install Kali on the U disk and persist it
- A fault record of misoperation dhclient script
猜你喜欢

Any and typevar make the automatic completion of IDE better

AXI低功耗接口

@Requestbody annotation

链接器 --- Linker

Programmers spend most of their time not writing code, but...

Group counting_ Structure and workflow of CPU

"Meng Hua Lu" is about to have a grand finale. It's better to learn it first than to look ahead!

电商红包雨是如何实现的?拿去面试用(典型高并发)

Visual presentation of pictures effectively enhances the attraction of large screen

math_等比数列求和推导&等幂和差推导/两个n次方数之差/
随机推荐
Déplacer Tencent sur le cloud a guéri leur anxiété technologique
Shell脚本(.sh文件)如何执行完毕之后不自动关闭、闪退?
Istio best practice: graceful termination
Database migration tool flyway vs liquibase (II)
"One good programmer is worth five ordinary programmers!"
Adobe Photoshop using the box selection tool for selection tutorial
Understanding of homogeneous coordinates
可变参数模板实现max(接受多个参数,两种实现方式)
PF_ Ring ZC | high speed traffic processing dpdk alternative
Introduction to C language circular statements (foe, while, do... While)
ArrayList#subList这四个坑,一不小心就中招
math_ Summation and derivation of proportional series & derivation of sum and difference of equal powers / difference between two nth power numbers/
Internship experience sharing in ByteDance 𞓜 ten thousand word job guide
[Old Wei makes machines] issue 090: keyboard? host? Full function keyboard host!
《opencv学习笔记》-- CV::Mat类
电商红包雨是如何实现的?拿去面试用(典型高并发)
The record of 1300+ times of listing and the pursuit of ultimate happiness
[深度学习][pytorch][原创]crnn在高版本pytorch上训练loss为nan解决办法
“一次编写,运行各端”,高通重磅发布 AI 软件栈!
What is the bin file for? How to open the file correctly