能区分癌症基因表达轮廓的一个小调节核心指出基因体网络的"梅杜莎" 构造

过去数十年来,研究人员一直在找寻能了解造成各种疾病,尤其是癌症的分子机制,他们使用DNA微阵列一次查看病人组织切片数千个基因的表达,基因体每一个基因以不同的转录量共同组成基因表达的轮廓。因为数万个基因中每一个基因都可以启动或关掉,一个基因表达轮廓包含复杂的信息,类似条码系统含有数万个字元分别代表每个物品,当微阵列数据初次被基因找寻者用来鉴定新颖基因,比如只在某些癌症组织表达时,研究人员己学到使用复杂的电脑计算工具将这些条码分类成不同的次族群,每个次族群有特殊的记号。在癌症研究这些基因表达型式的统计分析可以鉴定新的癌症次族群,更准确的将病人分类。但此种粗暴计算类型的分辨效果也只有这样,生物学家希望知道:这些特殊的基因表达型式源自何处?一个细胞如何知道 "写" 这些长的条码,在数万个基因中让一个基因接着一个基因表达,而且以可靠的方式编码成不同的细胞及癌症细胞型态?虽然以统计分析取得信息的计算生物学家不常问这问题,它确是一个重要且基本的生物问题。

哈佛医学院儿童医院Sui Huang (现在任职于卡加利大学)领导的团队以此问题在心中分析基因表达轮廓,在2011年五月份《实验生物及医学》(Experimental Biology and Medicine) 期刊刊登的文章,Huang博士和他的学生Guo、Feng、及Trivedi 第一次探讨基因表达轮廓能稳定表达的来源,是否和这些基因表达的轮廓由一个基因调节网络控制着,有一个"梅杜莎" 的头控制着被支配的周边,如理论家所建议的。

Huang博士说明" 我们都将基因表达轮廓视为理所当然,正如法医学家看待指纹一样,不去问它们如何在演化中发展出来" 。一个基因的表达是由一群特殊的蛋白质称作转录因子(TFs) 控制,人类基因体大约有2000个TFs,很显然地,整个基因表达轮廓或数万个字元条码是由这些转录因子活性共同决定,因为它们的表达也是互相影响,TFs基因的次族群便形成一个互相调节的"核心网络"。 此外它们也控制细胞内非转录因子的正常工作蛋白质,如骨架蛋白质或代谢酵素,它们如同所有的基因也受TFs的调节,但不调节其他基因的表达。在这种原始结构上,基因表达条码的造型基本上便由核心网络决定,是梅杜莎的头控制着周边被调节的基因,即梅杜莎的肢体。

如果整个基因表达轮廓就像条码代表细胞型态的表现型是由几千个基因核心,而不是数万个基因控制,Huang博士说明" 这样除了理论生物学外会有实质的作用,通过更有效率在调节核心上的计算可以加速了解疾病特性的基因表达型式及做诊断" 。

Huang的研究团队利用肺癌病人组织的基因表达轮廓显示它们基因的表达和梅杜莎网络是一致的,他们以各种统计测试,发现少于数千个的转录因子基因,而不是整个几乎一万个DNA微阵列,已足够根据所患的肿瘤型态将病人肺癌检体做分类,这数百个TFs的诊断比将近一万个基因代表整个基因体的效果更好,经校正基因数目及表达量后也有同样的结果。相反地,代谢基因代表梅杜莎下属的肢体,对基因表达轮廓也没什么影响,在相同的比较下也表现不佳没有作用。有趣的是,Huang及他的研究群也发现微小RNA,一群调节的转录本不编码蛋白质,但含有核苷酸排序和编码蛋白质的转录本互补,因此可以特异的干扰它们转译成蛋白质,甚至比转录因子更具效果,因为miRNA也是调节核心的一部份,这结果不惊讶,但为什么它们的表现比转录因子更好?Huang解释说,类似于计算基因表达造型的分子调节,miRNA作用像网络" 布林函数运河化" --这是1970年代Stuart Kauffman第一次提出的想法,miRNA通过作用在后转录阶段可以否决之前的其他调节者,它们的出现抑制了网络理论所称的混乱动态,可以让网络产生多重稳定的基因表达型式也能自我组合,形成所谓吸引子状态。很多此种稳定吸引子状态同时存在是多重细胞以及肿瘤细胞的基础,因为这些型态的细胞含有不同的稳定基因表达轮廓。也许这不是巧合,在多细胞生物出现之前,miRNA出现在演化同时于基因调节网络的高度复杂化。

《实验生物及医学》期刊主编Steven R. Goodman说:「Huang及同事的工作支持梅杜莎网络的组织角色,也建议基因表达轮廓的解读可以在我们多了解表达轮廓和其相关网络的相互作用下进行」。


EurekAlert!





上一篇 下一篇 TAG: 癌症 基因