“林奇综合症”背后的科学故事
发布时间: 2020-12-29
作者:贾小彦
责编:兮
这个故事每字每句都真实,而且很有传奇色彩。
有一位美国医生叫Clement Richard Boland 【1】,他的聪明才智足够让他进入耶鲁大学医学院,本应前途光明,然而他却有一个挥之不去的心理负担:他时刻觉得自己可能活不过30岁。之所以那么认为,因为他的父亲,26岁就患了肠癌,49岁时就不幸去世。他父亲有个妹妹,27岁时就因病去世。Boland医生同样了解到,他的祖父,曾祖父,都因肠癌去世。
带着这样的负担,他访遍当时(1970年左右)认识的所有医生、教授,告诉他们自己家族有一种“家族式”肠癌。但是没有人能帮到他,甚至没有人相信他。当时的顶级专家们都不知道“家族性癌症”这回事。他的教授们只能告诉他,他的家人只是“运气不好”(bad luck)而已。
直到1972年,Boland医生认识了Dr. Henry Lynch (图1)。Lynch(林奇)医生是第一个发文章正式描述“家族性癌症”的科学家【2】。在当时很少有人相信他,以致在此后的20年里,他写的基金申请大部分都没拿到钱。但真正的科学发现终不会被埋没!随着生命科学技术的飞速发展,越来越多的证据表明“家族性癌症”的存在,以及其最基本的原因—基因突变。上世纪90年代中期(不过25年前),Boland医生也在自己的实验室,让家族的“病魔”显了原形。他的家族DNA里, 一个抑制癌症的基因(MSH2),大段缺失,让他们得大肠癌的概率,高达80%。
再后来,经Boland医生的建议,这种类型的“家族性大肠癌症”被正式命名为Lynch Syndrome(林奇综合症)。2019年,Lynch医生以“遗传性癌症之父”的尊称去世,享年91岁。Boland医生虽已年逾70岁高龄,依然活跃于医学和科研的第一线,时有署名文章发表。

图1:Boland 和Lynch医
Lynch Syndrome (林奇综合症)
时至今日,林奇综合症的发病机理已经研究得非常清楚。林奇综合症通常由人体的DNA修复错配基因(DNA mismatch repair : MSH2, MLH1, MSH6, PMS2)的致病突变造成【3】。这四个基因负责修复DNA复制过程产生的“错误”(突变)。人体的DNA聚合酶(DNA polymerase)其实非常精确,犯错的概率大概只有一亿分之一(10e-8)。但人的DNA有30亿对碱基,所以每次细胞分裂还是要造成大概30处突变的。如果任由聚合酶这样犯错,人类这个物种根本不可能稳定地传宗接代。好在细胞还有DNA错配修复系统在DNA链上“巡逻”,检查并修复这些错误。
普通人的细胞都有两套染色体,一套来自母亲,另一套来自父亲,这保证在大多数情况下,支撑生命的重要基因都在细胞里有备份。然而有一些人,生来是带有基因突变的。如果不幸从父母一方遗传了DNA错配修复系统里,四个基因(MSH2, MLH1, MSH6, PMS2)中任何一个基因的功能丧失突变 (loss-of-function mutation),就会导致林奇综合症。林奇综合症的遗传模式是常染色体显性遗传(autosomal dominant inheritance),也就是说:只要一套染色体内有这几个基因的突变,就是林奇综合症患者。
有人可能会问:不是还有另一套染色体正常行使功能吗?的确是。但人生是个漫长过程,随着人出生、长大、成年、变老,人体DNA会不可避免遭受辐射、毒素、酒精、压力等侵害,以致造成基因突变。普通人有两套DNA修复基因,偶尔损失了一副,细胞也能承受。但如果生来就带有一半的突变,因另一半受破坏以致全部功能缺失的概率就大大增加。林奇综合症患者在70岁前得大肠癌或子宫癌的概率高达80%。因为漫长的人生岁月里,说不定哪天就失去了DNA修复功能,聚合酶的错误突变飞速累积,最后发展成癌症。
全球无论国家种族,大概每300个人里就有一个林奇综合症患者。这个患病率其实非常高了。试想这篇文章如果有3万人读到,读者中就有100个林奇综合症患者,他们40岁50岁时就有非常高的几率得肠癌。中国人也不例外,这里有一篇国内关于Lynch Syndrome的新闻报道:一家五代人竟有10人先后患癌!
怎么诊断林奇综合症?
一个人如何知道是否是林奇综合症的患者呢?最简单的办法是:看家族史。也就是看父母、祖父母、叔叔姨妈、唐兄妹表兄妹有没有得癌症的。如果父母(必须是亲生的)都有幸高龄(>80岁),且没有得过癌症,那么遗传林奇综合症的概率很低。当然不是说不会得癌症,只是说得遗传性的癌症的可能很小 。没有遗传因素,由一生的环境因素(比如吸烟)导致癌症的可能也很大。
然而家族病史不是绝对的,因为人这个生命是很复杂的。如果要非常确定地诊断是否有林奇综合症,就需要医学级基因检测。高质量的基因检测能几乎100%知道一个人DNA里有没有导致林奇综合症的突变。需要强调一下,免得误解,上句的核心是“100%知道有没有突变”,不等于100%得癌症!这里有至少两层意思:1,有的突变,是中性的,无害的,DNA里有也能正常过一辈子。2, 很多的突变是有害的,但有害的也未必100%得癌症。因为林奇综合症的“外显率”(penetrance)并不是100%。
林奇综合症方面的基因检测,跟乳腺癌相关的BRCA1/2的基因检测很相似。虽然DNA错位修复系统基因的筛查,在普通大众中不如乳腺癌BRCA基因筛查出名,但在人群里的发病率很相似,在学术界也有重要意义 。林奇综合症一旦确诊,有非常成熟的干预、预防和癌症早筛手段 。正因为如此,在发达国家,林奇综合症的相关基因检测已经慢慢成为医院的常规筛查。比如美国医生会推荐所有的肠癌患者进行基因检测。一旦确定是林奇综合症,同样会让可能受影响的子女,亲属进行基因检测。精准诊断,精准预防和干预,也是精准医疗的精髓所在。
基因检测的VUS问题
随着测序技术的发展进步和测序价格的持续下降,越来越多的人通过医生或者自掏腰包进行基因检测。病人测序数据的获得已经变得越来越便宜,但对大量的数据进行分析解读却依然是很大的挑战。正如前文所说,基因检测只能告诉病人有没有DNA突变,很多时候却不能准确预知病人会不会因此得癌症。因为就算在重要的基因上,很多突变可能是中性无害的。对很多的突变来说,医生和科学家都没有办法判断这些突变是致病还是中性无害。如果是致病突变而医生不做什么,那么病人会得癌症;但如果是中性无害突变而医生进行了不恰当的干预,比如切除子宫,这样的结果也很难让人接受。
这些在基因检测里发现的,但没有确定是否是有害的突变,在医学上称为“不确定变体”(Variant of Uncertain Significance),或者VUS。VUS因为不确定性,通常会给医生和病人双方都造成极大焦虑。对林奇综合症来说,ClinVar【4】里错义突变的VUS的占比高达九成(图2)。我们正是为了系统性地解决林奇综合症基因检测的VUS问题,而开展了这项研究【5】。

图2: ClinVar数据库里,Lynch Syndrome VUS占比大约90%
系统性测量林奇综合症MSH2基因的所有突变

图3: 12月23号online的文章标题
传统上对不确定变体(VUS)进行判断的标准做法是:从病人身上提取突变样本à实验室进行克隆à把病人的突变放进人的细胞或酵母细胞里进行功能性分析à确定VUS是否致病。这样的工作虽然卓有成效,解决了小部分VUS的判定问题,但实在太费时费力,已经无法满足不断增长的病人数据分析需要。
我们实验组决定一次性,系统性地解决林奇综合症错意突变的VUS判定问题。运用最新的DNA合成和高通量测序技术,结合分子生物学手段,建立了一个高通量的系统,能测定林奇综合症基因所有可能的错义突变。所有的错义突变是多少呢?拿此次刚刚发表的MSH2基因举例。MSH2有934个氨基酸,每个氨基酸对应MSH2基因的一个密码子。每个碱基有四种可能,所以每个密码子(codon)三个碱基就有64种组合。如果每次突变一个密码子,那突变整个基因的所有可能组合是934x63=58,842个。
这正是我们所做的。我们合成并克隆了MSH2基因突变的所有58,842种cDNA突变可能,并对每一个可能进行了严格的实验测量。当然测量是通过高通量并行测序完成的。最后通过数据分析,把DNA测量的结果翻译到氨基酸水平上,报告每一种突变是否是致病突变。基因突变的整体画卷可以通过热图的方式呈现(图4)。红色代表有害突变,蓝色代表中性突变。

图4: MSH2所有突变对蛋白功能影响的高通量测量
大的热图太密集,看不清细节。图5选取了其中的一段放大,重新做图,展示细节。X轴上标示氨基酸的位置,Y轴上标示突变后的氨基酸。一次整个蛋白只突变一个位置,红色方块表示该突变有害,蓝色表示中性。A636P是犹太人里非常常见的一个致病突变,在我们的测量里没有意外,非常明显的有害突变。

图5: MSH2 突变-功能关系热图节选
当我们做完实验,处理完数据后首先问自己的一个问题是:这种批量测量得到的数据准确吗?为此我们查阅了MSH2突变功能性测量的大量文献 – 其实是能找到的所有历史文献。即便如此,因为之前一个个做实验太费时费钱,我们总共也就找到了165个,其中158个跟我们的测量结果吻合,95.8%。这是非常高的吻合度,考虑到之前的数据由很多实验室,在不同时间,用不同方法独立完成。即便其中7例不同的情况,我们也怀疑之前的研究可能因为采用的实验系统不理想,做错了。总之,图6A的比较给我们吃了定心丸。

图6: 本研究结果跟“黄金标准”结果比较
这项研究的目的是为了最终在临床上给病人身上的突变做指导。所以,我们同样也跟ClinVar(现在最常用的基因检测数据解读数据库)上专家审核后的“黄金标准”判定进行了比较(图6B)。总共65个突变,62个专家判断跟我们的结果吻合。敏感性达95.3%,特异性达到95.5%。这就表明我们的测量结果用于临床上的诊断会非常准确。事实上ClinVar数据库里,专家能解读的突变数量非常有限(65个),而因证据不足不能解读只能标示为VUS的数量则高达1374个。这些都是在以往的基因检测报告里出现在病人身上的突变!而我们的数据可以马上为这些病人提供非常可靠的答案。
ClinVar数据库里的突变,只是之前做过林奇综合症基因检测的人。世界上绝大多数到现在都没有做过基因检测。该研究对未来的价值在于:我们已经测量了数学意义上MSH2这个基因的所有突变,就算未来有人走进诊所,发现了一个ClinVar数据库里不存在的新突变,也同样可以使用我们的结果,作为非常准确的参考。
用这种穷举的方法来对基因的突变进行功能性研究在目前还只处在起步阶段。本项研究建立起的方法体系的价值,远远大于MSH2所有突变的测量结果本身。可以确定是,这个实验系统可以直接应用于林奇综合症的其他3个基因(MLH1, MSH6, PMS2)。而加以调整,同样可以适用于人类疾病相关的大多数基因。
当然这个方法也有不完美的地方:首先,就是工作量比较大,一次只能用于研究一个基因。所以科研产能暂时来说是线性增长,也许未来能通过系统优化和机器人运用实现指数增长。其次,因为这个系统选择cDNA为模版突变,所以没有办法识别通过影响基因剪接而致病的突变。不过影响剪接的突变在大多数情况下,所占比例非常非常低。
对蛋白结构-功能关系分析的价值
以上描述了该项研究在临床上的应用价值,但该研究,对基础研究,特别是蛋白质结构和功能关系的研究也有非常大的价值(图7)。比如可以把我们得到的数据跟已经解析出来的MSH2蛋白结构有机结合,来看单氨基酸突变对功能影响在结构上的解释。比如MSH2蛋白有个很重要的ATPase结构域【6】,这个区域的几乎所有对原氨基酸的改变都会让蛋白失去DNA修复功能。而另一些区域,功能则不那么重要,几乎所有的突变都不会对功能产生影响。

图7: 蛋白结构-突变-功能三方结合的综合性分析
还有一些其他比较有趣也符合预期的观察。Proline(脯氨酸)总体来说,是蛋白质“最不能忍”的突变,由于脯氨酸在旋转自由度的限制,很多变成脯氨酸的突变都是有害突变。而一般疏水氨基酸变成另一个疏水氨基酸则对蛋白功能不会有太大影响。MSH2在第二个功能域有一处疏水核心,该疏水核心的突变就会破坏蛋白的功能。比较有意思的是,疏水核心的周围有很多 Alpha螺旋结构,Alpha螺旋靠近核心一侧的氨基酸,基本不能容忍突变,但远离核心那一侧的氨基酸,几乎不在乎是否有突变。这里有很多不错的线索可以在未来进一步追踪研究。实验室暂时人力资源有限,也许未来可以跟结构生物学的专家合作来进行更多的分析。
用基因检测来精准确诊的意义
最后想利用这个机会表达一个观点。因为经常有人问这个问题:现在癌症又不能保证治愈,我检测了,知道了自己带有癌症基因突变,除了增加烦恼外,有什么用?这代表了很多人的想法。不过我想至少有三方面的原因,知道了比不知道好。
凡事预则立,不预则废。知道信息本身就是一种力量。有了信息你才知道自己面对的是什么。风险几何?多少岁可能病发?平时饮食需要注意的?最新的科研进展是什么?人类文明的进步就是不断地掌握更多更准确的信息,指导行动。
预防。癌症发现得早和发现得晚,治疗效果是有极大不同的。如果一个人知道自己有高发肠癌的基因突变,就可以每年去做一次肠镜检查。肠镜检查虽然不舒服,但除了心理不适,对人体健康没有侵害。一旦发现了癌症的早期症状,就能早早治疗,存活率能极大提高。有些预防手段虽然有些极端,比如因为携带BRCA基因突变而做双乳切除手术,普通人可能下不了决心。但如果像安吉丽娜·朱莉那样看到自己母亲因癌症去世,可能会有另一层的体会。
下一代。最新的体外受精技术,已经能让父母选择自己的后代基因。如果你不幸携带有致癌突变,通过体外受精(IVF)的办法,能避免传给下一代。因为遗传的概率是50%,你在科学指导下选出那个不受影响的受精卵,就能让后代不再承受这一辈生而就有的风险。
原文链接:
#
1. Boland, C. R., Jr. Clement Richard Boland, Jr., MD: a conversation with the editor. Interview by William Clifford Roberts. Proc. 17, 444–461 (2004).
2. Lynch, H. T. & Krush, A. J. Cancer family ‘G’ revisited: 1895-1970. Cancer 27, 1505–1511 (1971).
3. Lynch, H. T., Snyder, C. L., Shaw, T. G., Heinen, C. D. & Hitchins, M. P. Milestones of Lynch syndrome: 1895-2015. Nat. Rev. Cancer 15, 181–194 (2015).
4. Landrum, M. J. et al. ClinVar: public archive of relationships among sequence variation and human phenotype. Nucleic Acids Res. 42, D980–5 (2014).
5. Jia, X. et al. Massively parallel functional testing of MSH2 missense variants conferring Lynch Syndrome risk. Cold Spring Harbor Laboratory 2020.06.03.133017 (2020) doi:10.1101/2020.06.03.133017.
6. Warren, J. J. et al. Structure of the Human MutSα DNA Lesion Recognition Complex. Mol. Cell 26, 579–592 (2007).