东亚人的遗传系统初识
李辉
在西方人眼里,远东永远是个神奇的地方,这里不仅有多变的气候、复杂的地形,还有多姿多彩的民族风情。在我们这块东亚大地上,从青藏高原的万仞雪域,到琉球列岛的千顷碧波,从塔克拉玛干的漫漫黄沙,到婆罗洲的莽莽森林,生活着千百个形形色色的民族和部落。千万年的生息和繁衍,他们创造了一个个灿烂的文明,成为人类历史上不可抹灭的炫色。
惊叹之余,人们一直在追问,这些人群之间究竟有什么样的关系。迄今为止的任何理论都承认,人类都有一个共同的远祖,在漫长的历史中渐渐分化成不同的族群。这种分化的起因,当然是人口增长之后的群体扩散造成的地理分离。而群体分化的内在表现为遗传差异,外在表现则为文化特化。自然,两种表现出除了决定于群体的系统发生关系外,也都会受到群体闲交流的影响,使我们看到血统的混杂和文化的融合。科学调查已经证实,自然状态下遗传交流比文化交流要慢得多。所以长期以来,民族学和考古学要从文化特征来研究人群种族之间的亲缘关系,总会遇到不可逾越的障碍。更为致命的是,与遗传特征不同,文化特征还会受到地理环境等各种因素的影响,使得文化人类学家们的探索之路坎坷异常。所以要认识人群的系统发生关系,直接研究其遗传特征,不啻是条捷径。
壹、遗传基因能区分民族系统吗?
长期以来,人们一直不了解遗传现象的本质,更不知道遗传的物质基础——DNA 。所以最早对人群遗传特征的研究,都停留在外在形态的观察。体质人类学因此发展起来,科学家们测量了一个个人群的眼、耳、口、鼻、四肢和身躯,用大量的数据来比较人群间的差异程度。然而,我们都知道,许多体态特征会收营养状况的影响,譬如身高、体重等等。还有一些又会受制于特殊生活方式,或气候环境的影响,譬如肤色等。所以体制形态的分析结果,离人群真实的系统发生关系还是很远,至今都没能解决各种指标的成分区分,虽然体质人类学家还在努力着。
自从十九世纪中期孟德尔(Mendel)发现了遗传法则,人体上的一些简单的遗传特征相继被找到。比如血型、色盲、体味、舌运动、耵聍(耳垢)等。早期的人类遗传学家通过观察和化验,了解了大量真正不受外在影响的人类遗传特性,也发现了东亚大陆从东向西和从南向北的几种梯度遗传差异。但是,这些特征项目的类型较为贫乏,不足以体现人群如此复杂的关系。
分子生物学技术的发展,使对DNA 分子的直接研究成为可能。起先,一些有具体功能的基因的多态性(即人与人有差异)得到了关注。研究得最多的是人类特异性免疫蛋白基因(HLA)。他的确有相当多的类型,可以观察到大量群体间的差异。但由于与重要的人体功能有关,所以它的变异受到相当程度的限制,无法与人群的分化完全同步。其实,『人类基因组计划书』的完成使人们发现,在人类冗长的DNA 分子中,有具体表达功能的基因只有三万个左右,而大部分的区段都只是填充基因组或维持分子结构的无意序列。这些序列的变异往往不会影响正常的人体功能,所以可以自由的与人群分化同步。然而,不管有无功能,位于常染色体(Auomosome)上的序列都会碰到混血的难题。人类基因组主要分成二十三段,每一段构成一种染色体,其中二十二种是常染色体。每种常染色体在每个人体内都有一对, 其一来自母亲,另一来自父亲,但在继续传给后代时,父母双方的染色体会打断而后重新拼接,即重组(recombination)。所以不同位置的突变之间毫无关系,其组合顺序完全不同于父母(参见图一)。
于是,人们自然开始关注没有重组现象的染色体区段,其一是线粒体的DNA(mitochodria DNA),其二是Y 染色体非重组区的DNA(NRY DNA),线粒体是男女都有的,但不管男女都来自其母亲,男性的线粒体无法传给后代,所以人类的线粒体都来自其女祖先,自然不存在重组。NRY 则只有男性体内存在,男传男,更无法重组。这种不重组的区段,最大的优点是其上的突变是紧密相关的,每一个突变都代表着整个区段的特性。先后发生的突变,也会有上下游关系。这样,不仅突变的谱系清晰,不同性质的突变,在研究时也可以相得益彰。相关联的突变构成的组合结构叫做单倍型(Haplotye)。就如图二中所示单倍型1 最古老,2 和3 产生于1 的后代中,4 产生与3 的后代中,5 产生于2 的后代中。而每种单倍型的发生年代可从其相关的(时钟)标记计算得到。这样,只要民族群体有特征单倍型,其发生渊源和年代就可推断。
但是这种构成单倍型的突变,必须保证每代只变一次而且不会变回祖先的形态,不然各种单倍型就不能保证其发生的独特性,再有,如果同一种单倍型有不同的来源,便不能据以分析群体发生的关系,有一种突变 「SNP」 就符合这种要求。各SNP 构成的某种单倍型都是单一来历的,NRY 上的SNP 单倍型就是在世界各地各民族中体现出极丰富的特异性和多样性。
另一种突变标记 「STR」 与SNP 单倍型相粘连时,就成了天然的『时钟』标记。在一个固定的基因位置上,有一种特定的短序列重复了几遍,有如火车车厢,每次突变都会增加或减少一节。因为突变的速度是可知的,所以我们只要寻找到重复数,再加上其他一些参数,就可以推算出他们共同祖先的生活年代。
不同位置上的STR,也可以构成单倍型。当几个STR 同时增减时,奇妙的效果产生了。从最古老的单倍型开始,向不同方向产生差异越来越大的单倍型。(就如图三所示,三个STR 的相连变化)。
在特定群体中观察到的中央单倍型总是最古老的,这就象一点墨水在清水中静静的扩散,色迹的中心必然是墨滴的最初位置。而根据扩散的半径,也可以计算扩散持续的时间。现实的群体中的单倍型关系网比圆三复杂得多,所以更象扩散现象。在同一种SNP 单倍型的个体中分析STR 的网络关系,就可以计算SNP 的发生年代。这样,我们就掌握了民族遗传分析的两大利器。
贰、夏娃和亚当,人类的非洲起源
由于技术难度较低,最早研究的非重组区是线粒体。在分析了遍及全世界的几千个人的线粒体之后,一九八七年,卡恩(Rebecca Cann)发现线粒体的系统发源于非洲,由于线粒体是母系遗传的,所以这一学说被称为『非洲夏娃说』,这项研究揭开了遗传学方法探索人类史前历史的序幕。从现代人的线粒体发现现代人类起源于十万年前的非洲,那么其他大陆上更早时期的古人类必然已经灭绝。这与古人类学界原有的普遍观点不合,因此引发了很多争论。但是,对欧洲尼安德特人(Homo Neanderthalensis)骨骸DNA 的分析,证实了他们的确与现代人没有传承关系,两个学界的认识也渐统一。
但是,由于线粒体的特殊性质,它突变过快而且长度太短。这使得它提供的信息量很有限,而且在群体间的分布格局较乱,于是这一切只好靠在NYR 上捕捉。NYR 上不断产生新的SNP,到二00 一年,斯坦福大学的昂德希尔(Peter A. Underhill)等在全世界人群中发现了二一八个SNP 位点,构成了一三一种单倍型。这些NYR单倍型构成的谱系与线粒体谱系所揭示的共同之处,就是现代人十万年前发源于非洲。
图四是这种谱系结构的示意图。首先通过与黑猩猩等人类近亲的相关区段的比较,我们找到了人类谱系的『根』的方向,因为SNP 的特异性,人类的SNP 位点,在黑猩猩的对应位置上必然未突变。所以与黑猩猩单倍型最接近的人类SNP 单倍型,必然是人类最古老的形态。而后随着时间的推移,不断有新的人类的单倍型演化出来。结果发现所有最早演化出来的形态都保存在非洲,而非洲之外的人类的单倍型形态只是较晚(约十二万年前)发生的一小支。这说明现代人最早(约十五万年前)的演化过程发生在非洲,直到大约十二万年前,才有一小部分人走出非洲,向全世界扩散。而美洲和澳洲的土著,则是稍晚的时候从亚洲人群中分化形成的。
这种结构在NRY 的谱系中表现得比线立体清晰和稳定得多。由于NRY 是纯粹父系遗传的,所以这种非洲起源假说被称为『非洲亚当说』。人们往往对非洲人的黝黑肤色难以认同,其实大多数现代非洲人并不是世界上其他人种的直系亲属。只是在大约一千年前,西非洲的黑人掌握了农业技术,人口增长而后扩张,才把东非洲等地的浅肤色的我们的远祖近亲取代了。而南非洲的这种取代,由于欧洲人开始殖民,就被打乱而至今未能完成,所以南非的土著(祖鲁人)肤色不太黑。
叄、东亚:现代人的到来
东亚的古人类学界至今还有人不相信。北京猿人其实不是我们的祖先。但是在这里,的确没有找到十万年到四万年前的人类化石,看起来这里的古人种,在约十万年前就灭亡了。在之后的几万年冰河时期,东亚大地寒冷而寂寞,直到四万多年前,来自非洲的现代人重新发现了这块大地。从一九九九年宿兵等人研究了几千分亚太地区的样品的NRY,到二000 年柯越海等人研究近一万二千分东亚各族样品,涉及到的所有个体的NRY 单倍型都在非洲起源的谱系树上,没有一个人是可能来自北京猿人或其他东亚的古人种。
既然东亚人群也是来自非洲,他们又是从哪个方向进入东亚大地的呢?有两个可能的地方,中亚或中南半岛。由于前一地区考古研究的深入,大量现代人的早期遗址被发现,所以很多人开始相信东亚人是由西北方向进入,而后由北向南散布开来的。但实际上东南亚发现的现代人遗址的年代也不晚。宿兵等对亚太人群的NRY 分析证实了后一种可能。他们的研究对象包括南亚人群和西伯利亚人群,由于每个部分包含相当数量的群体,所以保证了大区域结构的可靠性。结果发现,这四个区域中的NRY 的SNP 单倍型种数由南向北梯度下降,而且南部区域包含了所有北部区域的种类。因为SNP 单倍型的主要种类早在人类在东亚分化前就形成了,所以随着长时间的扩散迁徙,人群的单倍型在途中可能丢失,造成单倍型种类沿迁徙方向从丰富变为单调.故而只有可能是现代东亚人始祖由东南亚进入东亚大陆。随者冰川渐渐消融, 人群开始向北扩散,遍及各地。还有部分群体通过亚洲和北美之间的白令陆桥进入美洲。
除此之外,在北方还发现了很少量的单倍型,在人群中占的比例很小,这个比例在新 疆大概是17%,蒙古大概占6%-8%之间,东北维持于4%上下,而到日本就骤升为约30%,而这些类型显然与约十万年前由非洲迁移到中亚的群体有关。所以,迁移的主线虽是由南向北,但还有少量人口由西北进入。
[ 本帖最後由 使君子 於 2009-9-12 13:56 編輯 ] |