主题:【原创】新冠病毒起源小议 -- 澹泊敬诚

2020-04-20 22:29:31澹泊敬诚
新冠小议(三)制造与改造

两个月过去,开头提到的Andersen的文章已经发在了《自然 医药》(Nature Medicine)上面,总结起来,他说了两个方面的原因:新冠既和我们能想到的改造方式不同,也没有人工制造的痕迹。

先说后者,我的观点有所不同:现在的分子生物学技术,是能够制造出“不着痕迹”的人工冠状病毒的。

制造冠状病毒的关键步骤就是造出其基因组,那条30 kb长的单正链RNA。在宿主细胞中有效表达的单正链RNA,就能够自我完成RNA复制、蛋白质合成、病毒组装和释放的所有过程。

造RNA链的难度比DNA链的难度大很多,因为RNA本身不稳定,而且无法有效进行分子克隆等操作,但我们如果有了长DNA链作为模版,扔进宿主细胞,就可以转录成长RNA,进而制造出病毒。所以问题就转化成了如何获得一个长的双链DNA链模版,这就相对简单多了。选择双链DNA是因为单链DNA不稳定,而且不好做克隆。

直接化学合成长链DNA是不靠谱的。现在的DNA固相合成的上限是几百个核苷酸长,随着长度的增加,产率快速下降,错误率急升,到不了1000 nt就剩不下什么了。

但我们能够做一系列的短DNA片段(60-500 nt),然后想办法短片段拼成长片段。传统的方法是先通过聚合酶链式反应(PCR)扩增一系列冠状病毒基因组DNA片段,并且在这些片段添加特定的限制性内切酶识别位点,通过限制性内切酶酶切,让片段的末端成为两条链一长一短的粘性末端,不同片段的粘性末端互补配对,再通过连接酶把这些配对起来的片段连起来形成长链。比如2015年那篇引起争议的改造SARS病毒文章,用的就是这个思路,具体方法发表在2003年的美国科学院院刊。这个方法的效率比较低,而且会留下使用的限制性内切酶识别位点,成为人工操作的痕迹。当然,精细选择合适的内切酶可以让这些位点在克隆操作中被抹去,但这个办法比较看运气,如果基因组中正好有这个识别位点,就不能用该内切酶了。

2009年Gibson克隆技术把分子克隆变得“简单粗放”,不再依赖于限制性内切酶的切割,而是通过核酸外切酶造成更长的粘性末端,不同片段粘性末端互补配对,再通过DNA聚合酶补齐+DNA连接酶连接,来形成没有克隆痕迹的长链DNA。这个技术对于合成长链,尤其是基因组级别的DNA非常有帮助,成名作就是2010年由Craig Venter领导的合成生命:Gibson克隆结合酵母同源重组相,从核苷酸开始合成了1百万个碱基对的环状基因组,并成功在细菌内实现了生理功能和自我复制。

今年2月,瑞士的一个组也用类似的方法快速合成了MERS和COVID19的基因组

所以合成冠状病毒的基因组并且抹去人工操作的痕迹从理论上是可行的,但是科研面对的难点不是怎么做,而是做什么,即怎么改造病毒。

改造基因和蛋白质的科研工作者一般是“既怂又懒”的,能够抄一段已知的功能明确的的片段就不做改动,能够改一个氨基酸残基就不改两个,能够修改就不做删除或插入,能够局部改动就不做几个不同来源片段的拼合,能够拼拼补补就不从头全新设计。究其原因是我们对蛋白质序列与结构功能的关系所知太少,改造中不得不采用保守的策略,尽量减少对天然蛋白结构改变来达到我们的改造目的,以避免出现我们无法预期的变化。无中生有地造出一个全新的蛋白序列,且满足独特的结构和功能对于现在的我们是非常难的。因此当草台班主James Lyons-Weiler 在电视上说新冠S蛋白找不到已知相近的核酸序列,所以是人造病毒的时候,他的生物学博士真的是白念了。

从1962年Anfinsen核酸酶折叠实验表明蛋白序列决定其三维结构开始,半个多世纪的时间我们研究了很多蛋白的序列、结构和功能。基于这些积累的信息,现在我们已经能够用算法来“猜”一下新蛋白的结构和功能,但也只限于猜的水平,准与不准还是得通过结构生化细胞的方法去实地验证。近10年来,以David Baker为代表的一批科学家开始尝试蛋白从头(de novo)设计,对于小蛋白有了较好的结果。需要强调的是,我们现在掌握的算法还是基于对已有蛋白信息的学习和分析,自然界中存在着太多的蛋白结构和功能是我们不知道的,每一个新蛋白结构的出现,都拓展并且颠覆了一些已有认识,让我们对蛋白的理解更加深入和多样。这也是Andersen所说的,新冠Spike与和我们现有预测方式得到的结果完全不同。打个比方,我们围棋开局刚下了个星位,对面的AlphaGo不管什么入界宜缓,直接点三三进来,这不是我们已有的棋理能预测的。

通宝推:桥上,陈王奋起挥黄钺,
帖:4508992 复 4477327
帖内引用