关于基因组、转录组及蛋白质组学的网络分析

rainoffallingstar 于 2022-12-01 发布

学习报告:关于基因组、转录组及蛋白质组学的网络分析

在本课程(#基因组、转录组和蛋白质组学)的学习中,认识到贯穿在课程中起脉络作用的中心法则(复制-转录-翻译)下的基因结构,RNA功能和结果,蛋白质组的方法等内容,结合个人对于网络分析(network analysis)的兴趣,因此,本学习报告主要报告我在基因组、转录组等多组学下网络分析的心得体会。

围绕中心法则的基因—mRNA—蛋白质上下游是一个复杂庞大的互相作用网络,如在基因表达的调控网络中,有相应的修饰蛋白组学,如组蛋白甲基化、泛素化等,而在mRNA的亚群中,也有miRNA(基因沉默)和endo-siRNA(介导假基因转录,特异性基因沉默),在DNA层次中,也存在着启动子、增强子等特殊底层机制,因此在基因组、转录组甚至蛋白组的观察可能只是对这一复杂而且庞大的相互作用网络的某一个角度的观察,当然,我们对于多组学网络的构建因为生物体的复杂程度可能还存在很多空白而需要补充的地方。

这些提法可能跟系统生物学的概念有相似的地方,系统生物学(代谢组学课提及)是把孤立的在基因水平、蛋白水平的各种相互作用、各种代谢途径调控途径等融合起来,用以说明生物整体,高通量的组学实验平台构成了系统生物学的大科学工程。但是,对于一个整体的大网络,我们可能更多取其一部分,比如空间转录组学,将空间信息和转录信息相结合下出现的新组学模式。同时,在某个单层次水平,如在mRNA水平,在bioinformatic杂志上,使用图表示学习理论(Graph theory)进行mRNA分子间的互作作用的讨论已经成为热点。超越多个层次下,基因通路、蛋白通路的联合对表型的讨论也是目前经久不息的话题。

在疾病的诊断和治疗从宏观进入微观,由病理、影像进入小分子的今天,研究与文章更多地致力于发现和揭示各种某个有生物标志物意义(对于诊断、对于患者预后)的小分子,临床诊断指南也为我们提供各种对疾病进行危险分层的突变基因信息(如白血病的欧洲共识)。我们的RNA-seq、Chep-seq、PCR、二代测序等手段可以为我们提供高通量的信息,在这些基因组的分析中,我们可以寻找突变的基因、启动子的位置,可以分析到基因表达的上调与下调,可以分析到具有表达差异的基因(Padj < 0.05, 这代表着在1000个差异表达基因里面,我们观察到的结果可能有50个是错误分析的),此外我们可以得到基因注释,进行基因本体论研究(GO)和富集分析(enrichment),这些分析有助于我们发现表型间有差异性的标志物,也是进一步构建多组学网络的基石。

在蛋白质结构上,网络分析是预测蛋白质结构的有力工具,同时也是探究蛋白质互作网络(如信号传导通路)的有效途径。目前蛋白质组的方法(类似于代谢组学)目前主要依赖于质谱仪及更高级的二联质谱(如LC-MS/MS)进行,然而样本分子在进入质谱的过程中,伴随着使分子破碎的轰击,而质谱仪观测到的峰值是基于基团水平的观察,甚至,在不同时间,不同地点,不同批次样本甚至不同仪器(同型号)的改变中,都有可能产生不同的结果。然而最主要的是,在靶向质谱中对于物质的结构鉴定是一个较难的过程,因为分子结构可能存在潜在的相似性(更有所谓同分异构体)可能导致裂解后相似基团的峰值富集,这使得从质谱向蛋白质求索的过程是一个充满挑战的过程。

综上,如果从宏观的角度观察的话,可能我们需要寻找的生物标志物也许不是某个小分子,而是某个疾病的特征小分子网络。人体是一个很复杂的集合系统,某个通路节点的改变可能导致上下游的反馈、侧枝的增强补偿等可能性,怀着对网络分析的兴趣和如何从基因组、转录组和代谢组的基础上去构建网络的疑惑下学习了本课程,进一步了解了DNA测序、DNA结构、RNA的亚群和功能、蛋白组和代谢组的方法等内容,进一步将这些作为网络分析的稳定基石的话,所有之前的疑惑都有所解答。