西西河

主题:【转载】写在基因中的历史 -- 毘沙门

共:💬19 🌺92 🌵24 新:
全看分页树展 · 主题
家园 【转载】写在基因中的历史

本文是复旦大学分子人类学家金力教授作的一篇报告,此人在国内分子人类学算是个权威人物,有兴趣的朋友自己百度。

转载到河里,并非表示同意或支持文中观点,只是觉得与河里相关的新进文章相比,该文起码在系统性和逻辑性方面,还算严谨一些。

读后个人体会如下,仅供参考:

第一,分子人类学研究的是人群间的关系和个体间的关系,它并不能代替史书和考古,而是一种交叉研究的方法。

第二,研究的基础是必须要有足够的样本,即使用于研究历史人物的民族特性,也必须对古代民族的DNA有足够的学术积累。

如果没有足够多的样本量,仅仅依靠出土的个别尸骨来搞基因研究,然后又把个体结果扩展到全体,结论差不多就是扯蛋。

原文如下:

《写在基因中的历史》

一、研究人类历史的窗口

如果说史籍上记载的是一个一个点,考古也是研究一个一个的点,通过史籍记载,我们可以把这一个一个点连在一起,那么,基因研究对于历史研究的贡献,也在于它能把人给关联起来。这使我们看到了历史学、考古学和基因研究相互融合、相互交叉的可能。

有关曹操墓真伪的学术争论出现,使得生命科学的研究者与历史学者有了深入交流。今天,我试图从历史学的视角,讨论遗传学与历史学如何能够走到一起来。

研究人类历史,最主要的窗口当然是史籍。史籍记载的是曾经发生过的事件。同历史学相关的还有考古学。考古学研究什么呢?考古现场会有一个墓或一个遗址,是人类活动留下的痕迹。这些痕迹是发生过的事件及其时间、地点、人物所留下的实物证据。通过史籍记载下来的历史事件是我们所看不到的,而考古则让我们回到过去,看到一些过去发生过的事情。

现在,我们再增加一个考察坐标,那就是基因。实际上,基因虽然不能告诉我们历史事件中的时间、地点和人物,但它可以告诉我们人群间或者人物间的关系。比如,任何两个人之间的生物学关系究竟如何,借助遗传学分析就可以做一个推测;又比如,现在的汉族和藏族两群人之间的关系如何,也可以通过遗传学做分析和推测。所以,基因研究可以把人们关联在一起。如果说史籍上记载的是一个一个点,考古也是研究一个一个的点,通过史籍记载,我们可以把这一个一个点连在一起,那么,基因研究对于历史研究的贡献,也在于它能把人给关联起来。这使我们看到了历史学、考古学和基因研究相互融合、相互交叉的可能。

如果我们试图推测历史上曾经发生过什么,我们主要依靠的是寻找历史的痕迹。这些痕迹可以从多个学科去分析,比如历史学、历史语言学、考古学甚至古生物学,还有人类学、气象学、进化遗传学等等。但是这些学科所告诉我们的时间纵深度是不一样的。比如,历史学可以使我们上溯到四千年前,这四千年已经上溯推衍得很远了,像甲骨文就是上溯推衍到三千年之前。历史语言学则通过语言的比较,去发现语言是如何进化、怎样分化的,最多的年限可上推到六千年前,如果要推到一万年前,则要借助一些猜测了。考古学因为有实物保存,从现在的学科发展来看,至少可以追溯到两百五十万年之前。而古生物学、古人类学和进化遗传学可以推得很远,因为人类和黑猩猩作为两个物种在进化上分开是在距今五百万年到七百万年之间。历史可以通过史籍研究去推测、了解,但史前史一直是遗传学和考古学的强项,尤其是遗传学,因为它基本上在推测史籍上没有的东西。

所以,当历史学和遗传学交汇的时候,遗传学增加了时间上的深度。当然,遗传学和历史学最大的差别在于,遗传学是真实的。你可以到处说你是某位历史名人的后代。而遗传学只要获得了关于那位名人的DNA准确信息,就可以准确无误地告诉你:你究竟是不是他的后代。

遗传学或者分子人类学可以做什么?在我看来,它是连接史籍、考古、家谱等的桥梁,其中家谱实际上也是一种历史记载。

从遗传学角度如何看人类历史?非常简单,只有两件事情:人类是如何起源的,然后又是如何迁徙分化的?也可以用两个字来概括,即源和流。遗传学相比考古学、历史学有个很大的优势,它的研究对象主要是现在活着的人。通过研究现代人群的遗传结构去分析、推测人群的进化史。如果结果能同历史事件联系在一起,就可以不叫进化史,而叫人类史。

今天,我会把分子人类学和遗传学两个名词交互使用,因为当遗传学应用到人类历史研究时,我们把它叫做分子人类学。

遗传学家眼中的人类迁徙史是怎样的呢?很简单,他会告诉我们,人类起源于非洲,然后迁徙到世界各地。最近,美国《科学》杂志发表了两篇文章,作者通过对现代人和尼安德特人的比较,认为人类的祖先和尼安德特人的祖先在基因上有一些交流,但是尼安德特人对于现代人类的基因贡献是微乎其微的。而现代人类的祖先起源于东非,然后跑到了世界各地。基本上,人类祖先有两条路线,第一步部分人走出了非洲,到了中东;然后一支沿着印度洋沿岸往东,另一支往北往西迁徙。往东迁徙的成为了现代亚洲人的祖先,往西迁徙的成了现代欧洲人的祖先。于是,我们现在可以看到世界上有黄种人、白种人的差别。

人群是迁徙的,迁徙以后会发生什么?史前的人类是很少的,迁徙出去的人群因为缺乏现代的通讯技术,所以与原来的人群就失去了联系。于是他们在信息上没法沟通,在遗传上也没法交流,因为遗传上要有交流的话,必须两个人群在一起。这就造成了人群的遗传隔离。隔离时间一长,人群就开始分化,不一样了。这种不一样包括人群特有的生物学以及非生物学特征,有人把非生物学特征叫做文化特征。

人群的生物学特征是什么呢?我举两个例子,比如遗传学的特征,可以通过基因分析得到;体质形态的特征,即两个人长得不一样,至少黑人和白人一眼看上去长得就不一样;疾病的特征,即不同的人群常患的病都不一样。一些非生物学特征则包括文化特征、语言特征,后来还多了一种东西,民族特征。

这些特征为我们提供了一些分析的途径。人群分开的时间短,相似性就大,分开的时间长,相似性就小。当然这里面有一个隐含的假设,就是人群分开后不作交流。我们可以因此去度量人群之间的关系,包括他们的生物学特征关系,以及非生物学特征关系。因为分隔时间的长短,导致他们分化特征的相似性不一样。为了更好地寻找这种特征,我们最好能把握一种可以直接度量的特征,并且可以很精确地加以度量。这就是遗传上的相似性。

所以,我们尝试通过度量人群间的遗传关系去度量人群间的关系。这样,我们就等于找到了一把尺子。如果说遗传学和人文学科有交融的机会,无非就是说,我们可以把遗传学作为一个很好的测量工具,用来度量人群间的关系。

  二、为什么可以借助遗传学

通过分析现代人群,可以把原来那些特征性的东西挖掘出来。所以,用遗传学去研究人类历史,很重要的一点就是去提取人群的特征,当然,这些特征最终是用遗传标记表现出来的。

人的细胞里面有细胞核,细胞核里面有23对染色体,把染色体拉长之后,就能看到DNA,它是一个双螺旋结构。而DNA上面有基因,基因能对蛋白质进行编码,表明蛋白质是怎么合成的,蛋白质合成之后就执行某种功能,这些功能的组合就是我们的生物体。整个生物学就这么简单。

我们仔细看一下DNA的双螺旋结构,有很多单位,这些单位叫做碱基对,碱基一共有四种,A、T、G、C。把DNA“缠绕”起来,压缩之后就成了染色体。在整个细胞中,除了一个细胞核,还有其他的东西,也就是细胞器,最重要的细胞器就是线粒体。线粒体的功能是什么呢?人做任何事情都需要能量,线粒体就是产生能量的地方,它自己也有DNA,叫线粒体DNA。所以,我们谈到基因组的时候,不仅是指核基因组,还包括线粒体DNA。而线粒体DNA对研究人类迁徙也是一个很好的工具。

在核基因组里面有30亿个碱基,包装成23对染色体,所以一个人有46条染色体。因为每一对染色体都有两套,一套来自父亲,一套来自母亲,所以染色体有一个重组的问题,父本和母本的染色体相同位置会发生交换而把遗传特征重新组合。但是在基因组里还有不重组的部分。有一种Y染色体,跟其他染色体不一样,Y染色体不会重组。Y染色体最大的特点是只有男性有,即只有父亲能给下一代儿子,再由儿子传给下一代儿子。至于线粒体DNA,到下一代的时候,父亲的线粒体DNA就没有贡献了,下一代儿子或者女儿只接受母亲的线粒体DNA,所以,尽管男性有线粒体DNA,但只是从母亲那里拿来用一用,然后不往下传。故而线粒体DNA只是母系遗传。

分别研究Y染色体和线粒体DNA,我们可以推测人类的父系历史和母系历史。但是这个DNA序列不安分,它会发生突变。DNA是ATGC四种碱基组成的序列。有时原来的G会变成T,这是一个随机现象,主要因为在DNA复制的时候,自然会发生错误。很多人以为在生物进化中,很多东西是很完美的,其实不然。正是这种复制错误,使得我们在不断进化中会产生新东西。原来的G突变成T,这种突变在不断进行中。当然,有些突变不好,比如体细胞突变会让人得癌症,癌症的主要原因就是在某些关键的地方,基因组发生了突变。突变以后就出现了一件事,你突变之后,别人跟你没关系,他不突变,这造成什么结果?就是人跟人的基因组不一样了。人跟人的差异,或者说人群跟人群的差异,正好可以被我们拿来作为一个标记,让我们去研究人类。这个概念很重要,它就是遗传标记。

如果在人群当中任意拿来两个人的基因组,这两个基因组的差别是多少?平均是千分之一。人有30亿个基因组,任意拿两个基因组过来,平均有300万个不同碱基。所以,如果我们能在整个基因组的水平上进行分析,就会知道,人与人的差别是非常大的,几乎没有一个人是相同的。正因为这种差别,可以让我们回过头来,去分析这种差别的历史。比方说,我们最早的祖先是一个基因组,突变以后发生分化,形成了不同版本;然后再进一步积累突变后又进一步分化;到现在,可以看到各种各样不同版本。这些突变发生在不同位置上,把这一个一个突变点串起来看,就形成个人的特征,成组的突变特征叫做单倍型。

从全世界单倍型的分布,可以看到全世界人的单倍型确实不一样。既然不一样,就可以拿来分析。这里,我强调的是人群间的关系。人的基因不一样,有些会表现在形态上:比如,有些人的耳垂要长一些;有些人的手指能够弯过来;还有,人的精神状态,容不容易得精神病,到了高原需不需要氧气瓶等等,这些都跟基因有关。

我们之所以能做遗传学分析,还有一点很重要。尽管人身上有很多细胞,但是,每个细胞里的基因组都一模一样。所以,我们并不需要去分析身体各部位来了解你的基因组,我们只要抽一些血,或者搜集一下口腔脱落细胞,或者随着技术越来越先进,只要拔一根头发。这些东西搜集后,指向的都是一个人,他或她跟其他人都不一样。

通过分析现代人群,可以把原来那些特征性的东西挖掘出来。所以,用遗传学去研究人类历史,很重要的一点就是去提取人群的特征,当然,这些特征最终是用遗传标记表现出来的。

如何提取人群特征。举个例子,你到了黄海,黄海海纳百川,它的水一部分来自黄河,一部分来自长江。你到黄海搜集一小瓶水,如何告诉人们里面有多少水从黄河流过来,有多少水从长江流过来?要知道,这瓶水就相当于现代人的基因组,它是混合的。有人说,这个很简单,买一缸红墨水,一缸蓝墨水,到黄河源头把红墨水倒进去,到长江源头把蓝墨水倒进去。过段时间,到黄河取一份水样,如果红墨水的分子有特征,蓝墨水也有特征,那么只要看一下红墨水的分子占多少,蓝墨水的分子占多少,就知道了。这有很重要的道理,因为我们有了特征性的标记在那里。在人群中如何做呢?那就是把不同人群的源流用遗传标记涂成颜色。所以我说,这个世界应该是一个色彩斑斓的地图。

三、遗传标记隐含人类历史痕迹

通过提取有群体特征的遗传标记,然后推测出东亚人群的迁徙方向。

我们实验室在过去十几年中,通过提取有群体特征的遗传标记,推测出东亚人群的迁徙方向。可以举几个范例。

第一个范例。先不论东亚人是不是从非洲来的,我们要问的是:他们是怎么来到东亚的?如果从西方来的话,地理上存在着很明显的障碍———喜马拉雅山脉和喀喇昆仑山脉,要翻过这两个山脉过来几乎不可能,所以,只有两条路可走:一条沿着南亚,通过东南亚往上走;另一条,通过中亚大草原,从中东那里过来。

我们就从父系遗传的Y染色体角度来看。从全世界各类Y染色体上单倍型的关系图中发现,亚洲的单倍型是多态的,是含信息的。我们在某些位点上对东亚人群进行研究,同时用一种颜色代表一种单倍型,就会看到,亚洲北方人群看上去颜色比较素,南方人群看上去比较多彩,也就是说单倍型比较多。而且,北方人群的单倍型在南方人群那里都有。这是第一个观察结果,显示出有特征性的东西出来了。

然后,我们拿一种单倍型,不管它是什么,来对比南方人群和北方人群。我们可以加上另外一些标志,从突变中看同一个单倍型的古老程度。我们发现,对同一个单倍型来说,南方的比较古老,北方的比较晚近。

最后,把这些群体的遗传关系通过一种“主成分”分析方法,我们发现,在相似性上,南方人群变异差别很大,北方人群变异很小。

根据以上三个观察结果,我们在1999年提出一个假设,东亚人是从南边进来的,因为南方类型比较古老,比较多,也比较分散,差异大。我们又对东亚人从东南亚进入的时间做了一个估计:距今三到四万年,由南向北迁徙,进入中国和东亚其它地区。当然,对于现代的东亚人群来说,我们不排除其中有北方过来的人群,但是这些人群进入东亚的时间要晚得多,现代考古学和遗传学证据表明,大概最多距今三四千年。

跟遗传学最相似的是语言。我们的母语也是从父母那里传下来的。如果说人的基因一半传自父亲,一半传自母亲,所以还比较稳定的话,那么,人的语言本身变化则比较快、不稳定。比如上海城的历史没有多少年,居然会出现了上海话。

从语言分类上看,整个东亚可以大致分成六个语系。东亚北边是阿尔泰语系、汉藏语系、苗瑶语系。阿尔泰语系有三个代表人群,满族、蒙古族、维吾尔族;汉藏语系,有汉族、藏族等;苗瑶语系就是苗族、瑶族和畲族。往南是侗傣语系,包括傣族、壮族等。再往南的南亚语系则包括柬埔寨人、越南人。最南边是南岛语系,包括马来人、印度尼西亚人、菲律宾人以及太平洋大部分岛国人群。我们通过研究发现,人类的语言分布同遗传的分布也有高度的对应关系。

我们估计了一下南来和北来人群对东亚人群的贡献,结论是,南来人群对东亚人群的贡献大于北来人群。原来人们都相信东亚人群是从北方过来的。我们复旦大学唱了个反调,认为东亚人群是从南方过来的。现在国际上都接受了这一结论。

第二个范例就是北方汉族人群的扩张。我们知道,五千年前形成了几个文明的萌芽:西北的仰韶文化、东南的河姆渡文化,山东则有龙山文化,华中地区则有大溪文化,也可能是苗瑶族群的祖先。农业主要在仰韶文化和河姆渡文化两块地方,小米的种植同仰韶文化相关,而大米的种植则同河姆渡文化紧密联系在一起。所以说,现在的中国人基本上是这两个文化的后代。这样的话,北方的人占据了北方,南方的人占据了南方。北方的人显然是汉族的祖先了。那么,最初南方人讲的是不是汉语呢?为什么现在南方人的方言特别多呢?遗传学能不能研究出,尽管现在南方这么多人都自称汉族,他们究竟是不是遗传意义上的汉族?换句话说,当汉文化向南扩展的时候,它究竟是一种单纯的文化传递或者说“同化”,还是人群带着文化一起往下走的?这项工作不难做,实际上,北方汉族的样本很容易采集;尽管南方的现代人群基因库变了,我们还是可以拿现在南方各原住少数民族来同北方的汉族做比较;通过比较,我们来分析:究竟是北方的汉族对南方汉族的贡献大,还是南方的少数民族对南方汉族的贡献大。

通过DNA分析,我们发现,南方汉族的父系和母系结构不太一样;就父系而言,南方汉族的主体基本上是从北方汉族而来的,而就母系而言,现在的南方少数民族的母体对南方汉族的贡献更大。有意思的是,这些贡献还同地理纬度有很大的相关性。这些发现正是借助遗传学得来的。

北方的汉族为什么要来南方?历史学家的研究表明,这同历史上的政局变化相关。在中国历史上有三次大的移民期,即西晋灭亡、唐朝安史之乱之际以及辽金时期。我们在遗传学上也看到了这样的证据。所以,汉文化的传播主要是由人口迁徙所驱动的,这种迁徙表现出一种强烈的性别偏向性。

四、历史研究如何用好遗传学工具

遗传学主要研究人群间的关系和个体间的关系,借助遗传学,我们在研读史籍的时候,就可以忽略时间、地点,去重点研究那些历史人物。

遗传学主要研究人群间的关系和个体间的关系,借助遗传学,我们在研读史籍的时候,就可以忽略时间、地点,去重点研究那些历史人物。绝大部分的重大历史人物都是有后代的,所谓族谱,基本上就是后人对祖先的一种记忆。要研究著名的历史人物,借助遗传学,就可以对他们的后代加以分析,做多个相对独立的个体分析。比如说,曹操的后代有很多支,每一支都取一些样本,分析他们的Y染色体,因为Y染色体是跟着父系遗传的,曹操后代的一个共同特征,就是有同样的单倍型。如果能准确找到这种共同的单倍型,就可以知道曹操的Y染色体是什么样的,而根本无需去检测曹操墓中的骨头了。这种工具是有法医学意义的,因为遗传学分析可以作为法庭证据支持分析结果。

遗传学分析还可以用来证实或者证伪历史人物或人群之间的遗传关系。这些历史人物之间的关系,历史书说了不全算数,如果DNA有条件判断,那么DNA说的是算数的。借助遗传学的基因技术,我们还可以对不同地点关联人群的样本进行分析,找出他们的分化路径,来判断历史人物后代或人群的迁徙路线。

遗传学可以用来分析历史人物的民族归属。我们知道,每个民族都有它自己的人群特征,我们可以借助DNA技术去分析历史人物的民族特征。当然,前提是我们要对古代民族的DNA有足够的学术积累。

遗传学还可以用来分析古代人群的迁徙(比如说,回鹘人群是从哪里开始,又是什么时候通过哪条路线跑到新疆的),用来研究古代人群的人种特征(比如说,匈奴人究竟是黄种人还是白种人?)以及古代民族人群间的交流。

遗传学是一门自然科学,它同人文科学研究有一定差别,因为自然科学的研究方法是假设驱动。一开始,研究者根据相关背景资料作出一个假设,然后相应地设计出一个实验,通过实验产生出数据,对这些数据做出分析以后来回答和检验原先的假设。这是自然科学的思维方式。遗传学实验作为一个工具,在研究过程中所作的假设,是从人文科学特别是历史学那里找来的根据,但一旦假设提出,后面的研究过程实际上不受其他学科的影响,而是遵循遗传学研究自身的路径和规律。得出结果之后,又必须回到原来的相关学科框架下去检验。所以,遗传学仅仅只是一个工具。这样一个工具对于历史研究有很大的作用。至今,我们的研究团队已经获得了两百多个民族、近二十万个样本可供专业研究。获得这些样本,是需要以长期艰苦的田野工作为基础的。

通宝推:老顽童,桥上,
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河