寻找癌症的环境因素

环境因素与人类癌症发生发展密切相关。早在1775年就观察在职业扫烟囱的人中阴囊鳞癌非常普遍,主要因为暴露于煤烟所致,这是第一个与职业和环境暴露相关的肿瘤。

20世纪将啮齿类动物暴露于各种致癌因素,试验提供如下证据:紫外光和烟草化合物有效促进肿瘤形成。人类暴露于这些因素时,间接证据表明至少部分类型的人类癌症是由于环境因素所致。然而更明确的证据直到DNA测序用于鉴定人类肿瘤基因和基因组以追踪环境因素印迹时才最终获得。

美国Gerd P. Pfeifer教授在Curr Opin Oncol.杂志上发表了一篇综述,文中讨论了高通量测序癌症基因组的进展,这些进展进一步确认了环境暴露与癌症突变模式的相关性,同时也揭示了以往没有认识到的突变特征,这意味着人类还暴露于一些性质不明的致癌因素。

根据TP53推测人类癌症突变模式

采用Sanger测序方法筛选原癌基因和肿瘤抑制基因,结果显示编码肿瘤抑制蛋白P53的TP53基因在许多类型肿瘤中都有突变。即便在今天许多肿瘤基因组或外显子组都已经测序的情况下,TP53基因仍然在人类癌症中突变发生频度最高。

两个TP53的突变数据库包含成百上千报道的突变类型。非黑色素瘤皮肤癌与白皮肤人群的阳光暴露密切相关,序列分析非黑色素瘤皮肤癌中TP53基因,结果显示此类肿瘤中发现的突变由阳光中的紫外线导致。

皮肤癌有关的TP53突变很大程度上都是在二嘧啶位点的C到T的转化,而且经常包括CC到TT的串联突变。根据以往的实验室研究结果,紫外线的确能够诱导这些类型的突变。CC到TT的串联突变在其他致癌物诱导的突变中非常少见,身体内部位置的肿瘤几乎从未发现这种类型突变。这就提供了可靠证据,人类癌症中的确存在环境诱导突变。

分析肝癌中TP53基因发现了一个独特的突变类型,发生在密码子249,AGG转化为AGT。该突变在一些特定地理位置的肝脏肿瘤中特别常见,这些地区通常食物中黄曲霉素污染是非常严重的问题。已知在实验中黄曲霉素可以诱导G到T的转化。以往认为肝癌中突变过程的诱发因素就是黄曲霉素暴露所致。

然而黄曲霉素如何特异的靶向密码子249位置的鸟嘌呤仍不清楚,可能是与其它机制相互作用所致,包括乙型肝炎病毒等。如果密码子249突变从TP53突变数据库中移除,那么突变的异质性会更明显,包括频繁的A:T碱基对突变,与结肠癌的突变模式非常不同。

肺癌中TP53的突变主要是G到T传化,这种突变类型在吸烟者比非吸烟者中更常见,这表明烟草中致癌物参与这种突变形成。烟草中的焦油包含很多致癌物并含有多环芳烃(PAHs),苯并芘是这组化合物中研究最多的。

当它进入细胞或组织时,这些复合物被解毒过程代谢活化,导致形成苯并芘衍生物,这种代谢过程的中间物能够与DNA强烈结合,形成共价DNA加合物,具有突变作用,使G到T转化。

TP53基因内G到T转化在六个热点突变位置是很常见的。将人类气道细胞暴露于苯并芘衍生物导致形成DNA突变热点,与吸烟者肺癌中常见的突变类型位置非常一致,该数据为肺癌与吸烟之间提供了特异的分子连接。

全癌基因组测序研究

因为高通量DNA测序技术的出现,已经使分析全癌症基因组成为可能。外显子组测序也受到关注,因为改变编码序列的驱动突变基因需要被鉴定。此种水平的分析很快就清楚地显示,在肿瘤中发现的大多数突变不可能对启动癌症和癌症进展有任何影响。

例如,影响密码子第三个碱基的突变经常是沉默的,在癌症中出现的频度与随机出现的频度几乎是一样的。大量特异类型突变为理解癌症突变模式提供了丰富的信息。

全癌症基因组测序显示只有小部分突变与癌症发生相关。大范围癌症基因组测序分析已经揭示了许多人类肿瘤中的突变特征。有关TP53的突变数据与过去的数据很相似,但是也有几个新发现。除了黑色素瘤和某些尿道上皮癌以外,极少有癌症基因组只是以单一的特异突变构成。

在病人的一生中和在肿瘤本身的发生发展过程中,存在许多潜在的突变过程,包括遗传性DNA多聚酶错误、自然降解的DNA、内源性氧化DNA损害诱导的歧义多聚酶旁路、DNA复制中外源性暴露诱导DNA损害导致的突变等。采用计算方法切除各种可能导致癌症的基因组突变,此研究揭示了肿瘤特异性的突变特征,大多数类型肿瘤有两个或以上特征性突变。

有几个特征最可能是由内源性突变机制所致。其中之一是CpG岛位点的C到T的转化突变。哺乳动物基因组中大部分CpG是甲基化的,突变机制可能包括5甲基胞嘧啶碱基自然发生去氨化形成胸腺嘧啶,且误配修复无效。

然而其它机制也是可能的,包括研究甚少的途径如5甲基胞嘧啶酶氧化产物5-羟甲基胞嘧啶、5-胞嘧啶甲酰和5-胞嘧啶羧基,最近研究认为这些产物是表观遗传学密码。

另一个内源性途径似乎在几种癌症中产生一种特征突变,包括诱导活化酶促多肽样家族,胞苷脱氨酶-胞嘧啶脱氨酶-脂蛋白B mRNA编辑酶。这个途径可能与胞嘧啶的频繁突变有关,胞嘧啶经常转化为胸腺嘧啶。这些内源性过程尽管重要,但并不是本文的重点。接下来将讨论几个有趣的特征突变例子,有可能由于环境暴露引起。

黑色素瘤基因组突变与紫外线B暴露有关

黑色素瘤是致死性皮肤癌,发生率在世界范围内不断增高。尽管其它因素暴露也与黑色素细胞转化为黑色素瘤有关,但暴露于阳光紫外线却是最重要的原因,特别是黑色素瘤发生在阳光暴露的体表位置时。不同波长的紫外光谱到达地球表面并有可能参与肿瘤形成,既可以是黑色素瘤也可以是非黑色素瘤的皮肤癌。

然而小鼠实验中紫外线B的波长诱导肿瘤的有效性远远强于紫外线A。第一个完整黑色素瘤基因组的序列揭示了紫外线B特异性突变的倾向。突变包括大量双嘧啶位点的C到T的转化和CC到TT的转化,这种模式在黑色素瘤序列研究中也能观察到。这些数据确立了阳光中紫外线B在黑色素瘤形成中是一种强烈的突变驱动因素。

肺癌基因组中的突变与烟草暴露有关

每年肺癌导致的死亡有100万。大多数肺癌是由烟草中的化学物质引起。与紫外线相关黑色素瘤相似的是,肺癌基因组突变频率是所有癌症中最高的。肺癌中最常见的突变是G到T的转化,其发生具有链偏倚性,趋向发生在非转录DNA链。重要的是吸烟者肺癌基因组同非吸烟者相比包含10倍以上的突变,证实了烟草暴露的巨大致突变能力。

G到T突变优势同以往获得的TP53基因数据很相似,强化了PAHs可能也参与肺癌突变。在邻近碱基序列分析水平上,G到T转化经常发生在甲基化的CpG双核苷酸上,与TP53很相似。同样的特异性突变在实验性苯并芘致DNA损害中也观察到,强烈支持烟草作为肺癌致癌物的作用。

食管腺癌:不明确的致癌过程作用于序列5,AA端

最近几十年食管腺癌的发生率明显增高。胃肠道反流性疾病、Barrett食管、吸烟和肥胖都是主要原因。最近EACs外显子组序列揭示A到C的转化特征,这在食管鳞癌中不存在。共有149名EACs病人的标本进行外显子组检测,15个标本检测了全基因组,上述特征在大量病例中都能见到。

在全基因组序列库A到C突变约占所有突变的34%,远超其它肿瘤类型。碱基对分析显示,84%A到C突变发生在5,端的腺嘌呤侧面,也就是说突变的靶点序列是5,AA端。

更高水平的基因表达与更低水平的AA到AC突变频率有关,而且小的链偏倚明显朝向非转录链。这些表明转录有关的DNA修复过程减少AA序列A到C突变。

虽然在这个非常独特的突变中相关分子途径并不清楚,双核苷酸靶的本质和朝向非转录链基因组区的偏倚都揭示或许一个大的或是交联的DNA损害可能与这个过程有关。进一步的机制研究将致力于发现EAC的驱动因素或是途径。

尿道上皮癌和马兜玲酸

包括马兜玲植物在内的中药可能与肾毒性和上尿路上皮癌有关。这些植物的提取物马兜玲酸,代谢后能在腺嘌呤位置形成DNA加合物。在上尿路上皮癌中TP53突变研究显示A/T碱基对突变较多,主要是A到T转化。实验中此突变是马兜玲酸特征性突变。

最近2项研究分析了上尿道上皮癌基因组,病人来自台湾,疑有马兜玲酸暴露。在2项研究中突变频率极高,具有相似的突变特征,同早期TP53数据相关。A到T突变约占所有突变的70%,这些突变频繁的发生在一个序列位点(T/CAG),主要发生在非转录链DNA。

有意思的是作者在肝细胞癌基因组中鉴定了一个相似的A到T转化为主的突变模式,这意味着暴露于马兜玲酸可能与肝癌也相关。

肝癌基因组中的复杂突变

几项序列研究报告了肝癌基因组突变,主要是肝细胞癌。在肝细胞癌突变数据库,鉴定了二个主要特征:G到T转化和A/T碱基对突变。G到T转化,倾向非转录链偏倚,吸烟肺癌中频繁发生,可能起源于曝露能够形成大块DNA加合物的致癌物,这种情况只有在转录DNA链才能得到有效修复。

目前为止,黄曲霉素暴露人群的肝癌基因组序列库尚未建立。稀少的A/T碱基对突变起源仍不清楚。一些以A到T转化为主的例子可能是由于使用了中药制剂,其中可能包含马兜玲酸。

只有几个已知突变原能选择性地产生腺嘌呤突变,例如PAH复合物和氯乙烯。职业性人造氯乙烯暴露可能诱导更多的血管肉瘤,甚至超过肝细胞癌。肝癌中A到G转化突变的分子起源仍不清楚,需要更多研究明确肝细胞癌中复杂突变模式的分子起源。

总结

最近的基因组序列数据揭示了几个癌症基因组中难以解释的独特的突变特征,其中包括肝癌和食管癌。越来越多的肿瘤基因组测序,期望可以进一步明确突变特征,这有助于理解与特别环境因素相关的少见类型的癌症,或是世界各地独特的暴露发挥的作用。

在识别特异性突变特征和实际鉴定诱发因素之间存在很大距离,为了缩短这个距离,应进一步发展实验系统,筛选侯选致癌物或是突变原,用以阐明它们特异的突变特征以便最终在肿瘤基因组中发现与之相匹配的特征。在中高通量水平,这可以通过shotgun测序方法实验实现,或许结合超敏感NDA测序技术新方法可能会达到更佳效果。