王传超教授以第一作者或通讯作者在包括Nature、Science、National Science Review、Nature Communications、Current Biology、Science Bulletin等在内的国内外期刊上发表SCI、SSCI或A&HCI论文百余篇,以参与作者在Cell、Nature Ecology & Evolution、Nature Communications上发表论文6篇,精细解析了东亚人群遗传结构,系统性地重构了东亚人群形成史,为汉藏同源、南岛与壮侗同源提供古基因组学证据,反驳了现代语言起源非洲说以及泛欧亚语的农业传播假说,发展了印欧语的起源和扩散假说,推动了人类基因组学大数据在法医学中的应用。论文累计被引用5000余次,h指数为33,i10指数为100,连续三年入选爱思唯尔(Elsevier)中国高被引学者榜单,主持国家杰出青年科学基金项目、国家社科基金重大项目并获滚动资助、国家重点研发计划课题等,获教育部青年长江学者、中国青年五四奖章、福建省社科优秀成果奖一等奖和二等奖、福建青年五四奖章等荣誉奖励。
【新石器时代黄河流域农业人群的迁徙扩张与中华民族的形成】
1. 黄河流域新石器时代农业人群是汉藏人群的共同祖先,对中华民族的形成有着主要的遗传贡献
王传超联合全球43个单位的85位团队成员广泛搜集东亚地区重要遗址的人骨,使用1240K和外显子捕获测序方法,成功提取并测序了中国陕西新石器时代五庄果墚遗址、中国台湾新石器到铁器时代汉本和公馆遗址、蒙古国50余个考古遗址、俄罗斯远东地区Boisman、Yankovsky和黑水靺鞨等遗址、日本绳文人遗址等距今8000到1000年前诸多重要遗址的近200个古人的基因组,还发表了中国和尼泊尔46个现代族群的383个样本的Human Origin基因芯片分型数据以及108个碳十四测年数据,精细解析东亚人群形成和迁徙历史,论文发表在Nature上(Wang et al., Nature, 2021, 第一作者和共同通讯作者)。研究发现包括5000年前陕北五庄果墚遗址的古人在内的黄河流域新石器时代农业人群从遗传学上看是藏缅人群和汉族人群的共同祖先,Y染色体Oα-F5是汉藏人群所共有的高频单倍群类型。随着人口的扩张带动人群迁徙流动,汉藏祖先人群在中国北方传播农耕、汉藏语言和相关技术;南北方汉族的祖先人群主要是由新石器时代南北方农业人群混合形成的,由北向南呈现梯度混合模式。3000-2000年前中国台湾的古人与大陆侗台语人群有紧密的遗传关系,南岛语人群形成过程中还受到来自北方农业人群的基因混合影响,南岛和侗台语人群的祖先人群向南扩张,传播南岛语和侗台语。日本、中国台湾、东南亚等地的新石器到铁器时代的古人群有遗传上的联系,表明他们的一部分祖先人群可能来自共同的早期沿海迁徙路线,这与早期分子人类学上所观察到的旧石器时代Y染色体单倍群D的分布相吻合。
王传超团队与河南考古院合作提取和测序了仰韶村遗址的古人DNA,发表了仰韶村遗址8个属于新石器时代仰韶文化和龙山文化的个体的古基因组数据(Li et al., Science Bulletin, 2024,共同通讯作者)。研究人员发现仰韶文化与龙山文化相关人群之间具有高度的遗传连续性,还在黄河中游龙山文化农业人群中发现了一个以前从未被发现的群体遗传亚结构。仰韶村遗址古人对中华民族的形成有着重要的遗传贡献,比如,各地汉族人群有57%-92%的遗传成分可被模拟为来自于仰韶村遗址古人及其相近人群,西藏藏族人群有70%-80%的遗传成分来自仰韶村古人,华南地区的苗瑶和壮侗语人群也有大量血统来自仰韶村古人。之前的研究表明,新石器时代的瓦店、郝家台和平粮台遗址的古代人群遗传同质,并且相比于仰韶文化人群,瓦店、郝家台和平凉台遗址的古代人群受到来自东亚南方的遗传影响,这与黄河流域龙山时期水稻种植的增加相吻合。然而,研究人员发现这一南方基因流并没有影响到邻近的、同时期的仰韶村遗址。最后,研究发现一些来自仰韶村遗址的龙山文化个体受到了古东北亚相关的基因流影响。仰韶村龙山遗址人群既可以被模拟为仰韶文化相关血统和古东北亚血统的混合,又与陕北石峁遗址人群相对遗传同质。古东北亚相关成分在黄河中游地区的出现可能与龙山中后期河套地区对黄河流域的文化影响相关。
王传超团队与郑州大学考古与文化遗产学院等单位成功提取和测序了从西周、春秋、唐代到明清时期的中原地区38个古人的基因组,并将新测序的中原古人样本与之前已发表的中原新石器时代古人和现代河南汉族基因组数据合并在一起,进行了跨时间尺度下的群体遗传学分析。研究发现,自新石器时代晚期以来,中原地区没有看到明显的人群遗传结构的改变,并没有受到印欧人群、匈奴和鲜卑等北方游牧人群的显著影响,这与欧洲动荡的人口历史形成鲜明对比。唯一的遗传离群值是一个可以追溯到明清时期的个体,该个体与一些现代中国南方少数民族人群相对遗传同质,都可以被模拟为中原古人和东亚南方古人的混合。鉴于所有古代中原样本和今天生活在中原的汉族人群都没有表现出如此高比例的东亚南方相关血统,研究人员认为该离群个体不太可能代表明清时期中原地区的主要遗传谱系,而更可能是来自华南的移民,比如清政府曾派遣大批被称为“闽营”的福建军民到中原进行开垦等。该研究填补了中原人群距今3000年来的古基因组数据的部分空白,扩展了人们对中原人群历史的理解(Ma et al., Science Bulletin, 2024,最后通讯作者)。
2. 黄河流域新石器时代农业人群南下藏彝走廊
新石器时代晚期仰韶文化庙底沟类型西向传播形成马家窑文化。马家窑文化在青藏高原影响深远,其典型文化因素-彩陶-和粟作农业经济模式普遍见于川西高原的新石器时代中晚期遗址,其特有的双孔石刀和风格类似的陶器最远已到达云南西北部,该时期云南多处考古遗址的生业经济模式以粟黍和稻混作农业为主。西南地区是研究史前农业传播和人群迁徙的焦点区域,近年来有诸多进展,但有诸多问题仍待解决,比如粟黍农业伴随马家窑文化南下藏彝走廊,最早何时到达位于西南地区的四川云南等地,西南地区人群史前生存策略从狩猎采集向农业的转型是如何发生的,粟黍和稻混作农业模式如何产生,是单纯的文化技术传播还是人群迁徙混合导致,生计转型过程中人群在生物学上有怎样的适应性策略等?
王传超团队与四川大学、成都文物考古研究院、云南省文物考古研究所等单位合作在Current Biology上发表论文(Tao et al., Current Biology,2023,最后通讯作者),通过对新石器时代四川宝墩文化高山古城与青铜时代云南剑川海门口遗址人骨样本进行古DNA的提取、测序和群体遗传分析,发现两支古代人群主要由黄河流域的古代粟黍农业人群(约90%)与和平文化的采集狩猎人群(约10%)混合形成的,但没有发现与华南地区古代稻作农业人群相关的基因流。中国西南地区新石器及青铜时代粟稻混合的生业模式很可能是由黄河流域以粟黍种植为主的农业人群南下驱动促成的,水稻的种植很可能是粟黍人群南迁过程中学习了稻作技术,但并没有发生人群融合。现代西南的藏缅人群中,比如羌族、纳西族、彝族、白族和普米族等,也保留着大量高山城与海门口古人相关的遗传成分。当然,也有部分现代藏缅人群受到了华南及东南亚地区壮侗人群的遗传影响,总体呈现出南北混合的特征,这说明稻作人群的遗传成分对现代的部分藏缅人群还有较大影响,目前还不清楚这一基因流影响是何时开始,如后续对西南地区有更详尽的调查取样或能更好厘清南北人群融合的时间框架。
王传超团队与兰州大学、云南省文物考古研究所和西湖大学等研究机构的科研人员在Science Bulletin上发表论文(Ma et al., Science Bulletin,2023,共同通讯作者),该研究通过对云南兴义遗址人类和动植物遗存进行碳十四测年,植物大遗存、牙结石微体植物遗存、稳定同位素和古蛋白质组分析,发现云南地区从狩猎采集到农业模式的转变早在距今约4900年就已经开始。那么在生计方式转变过程中古人是如何适应环境的?研究团队使用PCT-SWATH高通量蛋白组学技术一次性鉴定几百到数千种蛋白质,发现古人骨骼的蛋白质组图谱与稳定同位素鉴别的食谱所反映的人群分类模式一致,古代人群在农业出现前后代谢和免疫方面的蛋白质表达存在显著差异,一些免疫相关蛋白在农业人群中被上调,例如补体成分 3 (C3)、凝血因子 II (F2)、激肽原-1 (KNG1)和桥粒芯糖蛋白-1 (DSG1)等。关于古蛋白研究,早在上世纪50年代就有研究在化石中发现氨基酸,但直到近20年来,学界才开始利用质谱法对古蛋白质进行分析研究。古蛋白质研究被广泛应用于人类饮食和生存模式的重建以及过去人类疾病的特征分析等,但大都属于微生物或器物残留的古蛋白研究,并不涉及古人自身的古蛋白,应用于人类自身的系统发育重建和健康状况的古蛋白质研究案例非常稀少。兴义遗址的古蛋白研究揭示了古代人群在农业出现前后代谢和免疫方面的蛋白质表达存在显著差异,为新石器化过程中的人类适应提供了直接的生物学证据。
3. 黄河流域中原地区农业人群向东迁徙进入山东
王传超团队与复旦大学科技考古研究院文少卿团队、生命科学学院金力团队、中国社会科学院考古所王明辉团队、山东省考古研究院孙波团队及烟台市博物馆等13家单位合作发表了山东18个遗址的69例古人基因组数据,通过古基因组比较分析,结合考古学和历史学的材料、方法,重建了近六千年以来山东的人群遗传历史。研究团队对8个大汶口文化遗址(包括刘林、岸堤二村、傅家、五村、大汶口、西夏侯、三里河和午台遗址)的29例个体进行测序及分析,结果显示,大汶口时期的人群主要是由黄河中游农业人群(58.6-100%)和部分山东本地采集狩猎人群、中国南方古代人群三种祖先成分混合形成。研究人员对3个龙山文化遗址(包括午台、三里河和呈子遗址)的13例个体进行测序及分析,发现山东龙山文化人群在遗传上基本(85.2-100%)继承自大汶口文化人群。研究人员对商周时期5个遗址(呈子、五村、两醇、西三甲和东康留)的11例个体进行测序及遗传学分析,发现中原人群在商周时期进入山东并与本地人群发生了混合。研究人员对秦汉及以后历史时期的7个遗址(封山、西三甲、徐家营、洗砚池、东小宫、煎药庙和东关东南)的16例个体进行测序及遗传学分析,发现秦汉之后的古代山东人群与现代山东人群遗传组成一致,论文发表在Current Biology上(Du et al., Current Biology, 2024, 共同通讯作者)。
王传超团队与山东大学考古学院王芬教授团队合作对山东章丘大汶口文化焦家遗址出土人骨的古基因组研究,发现山东地区的新石器化过程伴随了黄河中游中原地区粟黍农业人群的遗传影响。研究人员测序并分析了焦家遗址出土的21个古人的基因组。焦家遗址主要遗存属大汶口文化中晚期阶段,年代为距今5000年左右,出土了目前海岱地区年代最早的城址,入选“2017年度全国十大考古新发现”。通过古DNA分析,研究人员发现焦家遗址古人带有大量的来自中原地区仰韶文化相关人群的遗传成分,大约有60%左右来自于黄河中游仰韶文化粟黍农业人群,而40%左右来自于山东本地的狩猎采集人群,这说明仰韶文化农业人群从黄河中游向东迁徙参与了黄河下游大汶口文化的新石器化过程。而相比于黄河中游粟黍农业人群和山东采集狩猎人群,焦家遗址古人并未受到东亚南方相关遗传成分的影响,这表明焦家遗址古代人群可能没有受到稻作农业人群的遗传影响。该研究填补了新石器时代山东人群古基因组数据的部分空白,对理解新石器时代山东大汶口时期新石器化过程的人群历史和中华文明的起源和传播有着重要作用,论文发表在Science Bulletin上(Wang et al., Science Bulletin, 2024, 最后通讯作者)。
王传超团队与山东省文物考古研究院、武汉大学历史学院合作发表了山东临淄地区自战国至魏晋南北朝时期的21个古人基因组,通过群体遗传分析,发现山东地区在新石器时代到历史时期这一时间段里曾发生大规模的人群变迁。山东历史时期人群与山东新石器时代早期人群之间存在明显的遗传异质性,历史时期人群主要受到黄河流域中游中原地区农业人群的遗传影响,与新石器晚期龙山文化人群之后的黄河中游人群存在遗传同质性。而从战国时期以来,山东地区人群保持着长达2000年多的遗传连续性,以山东历史时期人群为代表的古汉族祖先成分与南方人群融合形成了现代汉族。此外,尽管考古学研究显示,毗邻中国北方的欧亚大陆东部草原牧民、东亚东北部的辽东地区人群与山东地区长久保持文化交流与往来,但该研究揭示,在目前山东地区历史时期古代人群中并未发现欧亚大陆东部游牧人群及辽东地区人群遗传成分的影响。(Shen et al., 2024, Journal of Genetics and Genomics, 最后通讯作者)。
4. 黄河流域农业人群向西北迁徙进入河西走廊
王传超团队联合复旦大学、甘肃省文物考古研究所等在Science Bulletin上发表论文(Xiong et al., Science Bulletin,2023,共同通讯作者),该研究通过对河西走廊中部的黑水国汉代墓地和河西走廊西端敦煌佛爷庙湾曹魏-唐代墓地的25例古人进行DNA提取和测序,重建了近两千年以来河西走廊的人群遗传历史。研究团队对汉代以前、汉代至唐代、现代等三个时间段的基因组数据进行分析,结果显示,在新石器时代晚期至汉代,河西走廊人群至少发生了一次明显的遗传成分转变,即以齐家文化为代表的黄河上游新石器晚期祖先成分转变为黄河中下游新石器时代晚期/青铜晚期铁器时代早期的祖先成分,这种转变的影响甚至新疆东部。该研究中,研究团队在敦煌佛爷庙湾墓地曹魏时期和唐代的个体中各发现1例欧亚大陆东西部的混血个体,其欧亚西部祖先成分分别高达~30%和~50%,这两例个体都显示出当地男性和欧亚西部女性的性别偏向混合。
5. 黄河流域农业人群向东北迁徙进入西辽河
前期研究表明,在东北地区,自红山文化时期开始,西辽河流域农业人群已能够检测到仰韶文化相关人群的遗传成分。到新石器时代晚期,夏家店下层文化的二道井子遗址人群与仰韶文化人群在遗传组成上已无显著差别,而夏家店上层文化时期,人群生业模式由农业转向农业与畜牧业并存,北方草原游牧人群南下与夏家店下层文化人群混合形成夏家店上层文化的古人群。王传超团队联合南京师范大学等单位在Journal of Systematics and Evolution上发表论文(Zhu et al., Journal of Systematics and Evolution,2023,最后通讯作者),该研究通过对夏家店上层文化大山前遗址的一个样本进行DNA提取和测序,发现该样本虽然与此前报道的夏家店上层文化的古人的地理位置非常接近,但遗传成分差别很大,该样本并不带有草原游牧人群成分,而是可模拟为100%黄河流域农业人群成分,这表明青铜时代西辽河流域的古代人群存在着较大的遗传多样性,后续对东北地区更多考古遗址更多样本进行DNA分析或能更好地厘清由农业转向农业与畜牧业并存过程中的人群混合历程。
6. 黄河流域农业人群登上青藏高原
前期研究发现新石器时代黄河流域的农业人群是汉藏人群遗传学上的主要祖先人群,实证了原始汉藏人群的北方起源假说,而且青藏高原上的藏缅人群有着较强的遗传连续性,青藏高原东缘的南北向通道藏彝走廊在藏缅语人群的形成与分化过程中起到重要作用,但历史时期青藏高原人群的古基因组却鲜有研究报道。吐蕃王朝是中国西藏历史上第一个有明确史料记载的政权,以往对吐蕃的研究都集中于文献史料、宗教艺术、石像板画及出土文物等,而对于吐蕃人群来源、文化传播模式等科学问题却鲜有涉及。申请人与复旦大学等单位合作,从热水墓群哇沿水库遗址中成功提取和测序了10例古代个体全基因组,并进行了群体遗传分析。研究发现,样本中的9个古代个体拥有与现代核心藏族人群相似的遗传成分,这也是目前为止发现带有相似遗传成分的古代青藏高原人群古基因组中最东北缘的个体,反映了核心藏族人群向青藏高原东北缘的迁徙和扩张。吐蕃古人中的上述核心藏族遗传成分主要来自于新石器时代黄河流域的农业人群,实证了吐蕃古人属于汉藏人群,反驳了吐蕃来源中的“鲜卑说”和“印度南来说”。此外,研究还发现一例出自竖穴土坑墓的样本与同期的欧亚大陆草原游牧人群拥有相似的遗传成分,表明了都兰区域与中亚地区可能存在人群交流互动。综合已有的考古学证据,该研究认为吐蕃政权的扩张属于人群和文化共扩张的现象,吐蕃政权在与吐谷浑长期争夺都兰地区控制权的过程中,伴随着大量的人群迁徙。同时,都兰地区本土文化也逐渐受到吐蕃文化的影响,并最终被吐蕃文化所取代(Zhu et al, iScience, 2022, 共同通讯作者)。
7. 黄河流域农业人群与北方游牧民族的融合发展
鲜卑是继匈奴之后在蒙古高原崛起的古代游牧民族,兴起于大兴安岭,是魏晋南北朝对中国影响最大的游牧民族。鲜卑可能分支自原始蒙古语人群,然而,由于缺乏文字记载,鲜卑人的起源及其与周边民族的关系仍然是个谜。申请人与复旦大学等单位合作对鲜卑皇帝——北周武帝宇文邕进行了古DNA提取和全基因组测序,并应用3D扫描技术复原了他的头像,发现北周武帝祖源主要来自东北亚地区但也带有与黄河流域农业人群相关的遗传混合,这与当时的民族融合背景相符,论文发表在Current Biology上(Du et al., Current Biology,2024,共同通讯作者)。
8. 东亚人群精细遗传结构分析
王传超带领团队搜集包括南亚、苗瑶、印欧、蒙古、突厥、通古斯、藏缅、壮侗等语系的300多个人群的数千例样本,已完成全部样本60多万位点的基因芯片分型和部分样本的全基因组测序,建立了高覆盖度、强代表性的区域性基因组水平的参考数据库,精细描绘了东亚人群遗传结构,最大程度完善东亚地区遗传多样性。研究发现新石器时代黄河流域的农业人群是现代汉藏人群的共同祖先,汉藏人群在迁徙过程中不断与周边族群融合,奠定了中华民族的遗传基础。论文发表在European Journal of Human Genetics、Journal of Systematics and Evolution、American Journal of Physical Anthropology、BMC Genomics、Molecular Genetics and Genomics、Annals of Human Biology等SCI和SSCI期刊上。
以上研究成果的代表性论文如下(#共同第一作者,*通讯作者):
(1) Chuan-Chao Wang*,#, et al. (2021) The Genomic Formation of Human Populations in East Asia. Nature, 591: 413–419.(中科院一区,JCR Q1区,共同第一作者排第一和共同通讯作者)
(2) Le Tao, … Chuan-Chao Wang*. (2023). Ancient genomes reveal millet farming-related demic diffusion from the Yellow River into southwest China. Current Biology, 33(22), 4995–5002.(中科院一区,JCR Q1区,最后通讯作者)
(3) Minmin Ma, …, Chuan-Chao Wang*, Guanghui Dong*. (2024). Forager-farmer transition at the crossroads of East and Southeast Asia 4900 years ago. Science Bulletin, 69(1), 103–113.(中科院一区,JCR Q1区,共同通讯作者)
(4) Jianxue Xiong, …, Chuan-Chao Wang*, Shaoqing Wen*. (2024). Inferring the demographic history of Hexi Corridor over the past two millennia from ancient genomes. Science Bulletin, 69(5), 606–611.(中科院一区,JCR Q1区,共同通讯作者)
(5) Panxin Du#, Kongyang Zhu#, …, Chuan-Chao Wang*, Shaoqing Wen*. (2024). Ancient genome of the Chinese Emperor Wu of Northern Zhou. Current Biology, 34: 1–9. (中科院一区,JCR Q1区,共同通讯作者)
(6) Du P, Zhu K, Wang M, Sun Z, Tan J, ..., Jin L*, Chen G*, Li H*, Wang CC*, Wen S*. Genomic dynamics of the Lower Yellow River Valley since the Early Neolithic. Current Biology. 2024 Aug 7:S0960-9822(24)01002-9.(中科院一区,JCR Q1区,共同通讯作者)
(7) Ma H, Zhou Y, Wang R, ..., Wang CC*. Ancient genomes shed light on the long-term genetic stability in the Central Plain of China. Science Bulletin, 2024 Jul 15:S2095-9273(24)00504-8.(中科院一区,JCR Q1区,最后通讯作者)
(8) Wang F, ..., Wang CC*. Neolithization of Dawenkou culture in the lower Yellow River involved the demic diffusion from the Central Plain. Science Bulletin, 2024. (中科院一区,JCR Q1区,最后通讯作者)
(9) Li S, ..., Wang CC*, Wei XT. Ancient genomic time transect unravels the population dynamics of Neolithic middle Yellow River farmers. Science Bulletin, 2024. (中科院一区,JCR Q1区,共同通讯作者)
(10) Shen Q, Wu Z, Zan J, Yang X, ..., Zhang Q*, Wang CC*. Ancient genomes illuminate the demographic history of Shandong over the past two millennia. J Genet Genomics. 2024 Jul 13:S1673-8527(24)00185-1. (中科院二区,JCR Q1区,最后通讯作者)
(11) Kongyang Zhu, …, Chuan-Chao Wang*. (2024). The genetic diversity in the ancient human population of Upper Xiajiadian culture. Journal of Systematics and Evolution, doi: 10.1111/jse.13029.(中科院一区,JCR Q1区,最后通讯作者)
(12) Kongyang Zhu#, Panxin Du#, …, Chuan-Chao Wang*, Shaoqing Wen*. (2022). Cultural and demic co-diffusion of Tubo Empire on Tibetan Plateau. iScience, 25(12), 105636. (中科院二区,JCR Q1区,共同通讯作者)
(13) Guanglin He#, Yingxiang Li#, …, Chuan-Chao Wang* (2021) Fine-scale genetic structure of Tujia and central Han Chinese revealing massive genetic admixture under language borrowing. Journal of Systematics and Evolution, 59(1):1-20. (中科院一区,JCR Q1区,最后通讯作者)
(14) Guanglin He#, Mengge Wang#, Yingxiang Li#, ..., Chuan-Chao Wang* (2020) Fine-scale north-to-south genetic admixture profile in Shaanxi Han Chinese revealed by genome-wide demographic history reconstruction. Journal of Systematics and Evolution, https://doi.org/10.1111/jse.12715IF: 3.4 Q1 . (中科院一区,JCR Q1区,最后通讯作者)
(15) Mengge Wang, …, Chuan-Chao Wang* (2022) Reconstructing the genetic admixture history of Tai-Kadai and Sinitic people: Insights from genome-wide SNP data from South China. Journal of Systematics and Evolution, doi: 10.1111/jse.12825IF: 3.4 Q1 . (中科院一区,JCR Q1区,最后通讯作者)
(16) Guanglin He, …, Chuan-Chao Wang* (2022) The northern gene flow into southeastern East Asians inferred from genome-wide array genotyping. Journal of Systematics and Evolution, doi: 10.1111/jse.12826IF: 3.4 Q1 . (中科院一区,JCR Q1区,最后通讯作者)
(17) Guanglin He, …, Chuan-Chao Wang* (2022) Extensive ethnolinguistic diversity at the crossroads of North China and South Siberia reflects multiple sources of genetic diversity. Journal of Systematics and Evolution, doi: 10.1111/jse.12827IF: 3.4 Q1 . (中科院一区,JCR Q1区,最后通讯作者)
(18) Xiufeng Huang#,*, Qinghui Zhou#, …, Chuan-Chao Wang* (2018) The genetic assimilation in language borrowing inferred from Jing people. American Journal of Physical Anthropology, 2018, 166(3):638-648. (中科院二区,JCR Q1区,最后通讯作者)
(19) Hongbing Yao, …, Chuan-Chao Wang* (2017) The Genetic Admixture in Tibetan-Yi Corridor. American Journal of Physical Anthropology, 164(3):522-532. (中科院二区,JCR Q1区,最后通讯作者)
(20) Jianxin Guo, …, Chuan-Chao Wang* (2021) Genomic insights into Neolithic farming-related migrations in the junction of east and southeast Asia. American Journal of Biological Anthropology, 2021, 177(2): 328-342. (中科院二区,JCR Q1区,最后通讯作者)
(21) Guanglin He, …, Chuan-Chao Wang*, Yiping Hou* (2020) Inferring the Population History of Tai-Kadai-speaking People and Southernmost Han Chinese on Hainan Island by Genome-Wide Array Genotyping. European Journal of Human Genetics, 28: 1111–1123. (中科院二区,JCR Q2区,共同通讯作者)
(2)王传超课题组也在《学术月刊》《复旦学报(社会科学版)》《北方民族大学学报》《人类学学报》等中文CSSCI(扩)期刊上发表多篇论文,系统讨论了语言学与考古学、遗传学交叉在解析南岛语、侗台语、汉藏语和泛欧亚语源流上的实践应用:
① 范志泉,邓晓华,王传超* (2018) 语言与基因:论南岛语族的起源与扩散. 学术月刊. 50(10):175-184.
② 孙娜,王传超.语言学和分子人类学视野下日语的起源与日本人群的混合历史[J].复旦学报(社会科学版),2020,62(01):75-86.
③ 赵静,王传超*.古DNA提取技术对比及概述[J].人类学学报,2020,39(04):706-716.
④ 范志泉,邓晓华,王传超.语言学与分子人类学视角下三亚回族及其语言的演化历史[J].回族研究,2019,29(01):44-52.
⑤ 禄佳妮,王传超*.分子人类学视域中畲族族源新探[J].北方民族大学学报(哲学社会科学版),2019(01):98-107.
⑥ 杨文姣, 王传超. 侗台语族起源与扩散的跨学科探索. 中国社会科学报. 2022年01月04日.
⑦ 郭健新, 王传超. 跨学科研究揭示汉藏语起源与演变. 中国社会科学报. 2021年05月11日.
⑧ 孙娜,王传超. 从三维视域看语言的扩散——以泛欧亚语为例. 中国社会科学报. 2020年12月15日.
【印欧语人群的安纳托利亚起源和随草原游牧人群迁徙扩散历史、东西方人群的基因交流和演化历史】
(一)研究背景及科学问题来源
印欧语的起源与扩散研究从首次提出至今已走过了近百年的历程,对印欧语起源的研究最早来自于语言学的探索,旨在为印欧语系确定系属,以及为其他各语言确定语支。随着研究不断深入,印欧语起源的谜团受到了神话、语言学、体质人类学、遗传学和考古学等领域的关注,也是各个学科较有争议的一个重大而复杂的课题。对于印欧语的起源及扩散路径,目前学术界并未达成共识,现主要集中于库尔干假说和安纳托利亚假说,库尔干假说认为印欧人起源于“坟冢文化”,即东欧大草原上的颜那亚文化(Yamnaya culture),颜那亚文化是一个从铜石并用时代晚期到青铜时代早中期的考古学文化,时间可追溯到公元前3300-2600年;安纳托利亚假说则认为印欧语系的扩散与公元前6500年开始的安纳托利亚的农业经济扩张有关,随着语言传播者的人口增长而扩散至欧洲,替换了沿途的狩猎采集者语言。
高加索地区在地理上是联结库尔干假说和安纳托利亚假说的关键区域,中国新疆塔里木盆地发现的吐火罗语是印欧语系下的一个已经消亡的早期分支语言,对高加索和中国新疆的古代人群进行古基因组学取样调查和分析对于理解印欧语人群的早期起源和分化有着重要的意义。
中国西北是欧亚大陆东西方人群的融汇之地,也是古“丝绸之路”的必经之地,在欧亚大陆人群迁徙和演化史上扮演着重要的角色,同时也造就了西北地区突厥语、蒙古语和通古斯语人群极高的多样性。居住在西北地区的人群历史和来源复杂,大多数人群都在文化、语言、面貌和遗传上等多方面表现出不同程度的混合特征。但除维吾尔族之外,中国西北的大部分人群都没有基因组水平上的大数据精细研究。解析中国西北各族群的遗传背景和祖源构成,探究印欧语人群对中国西北、南西伯利亚的影响,对于重构了东西方人群的基因交流和演化历史、厘清语言的接触交流和演变历史有重要意义。
(二)创新性研究工作及科学意义
王传超课题组近年来通过对高加索地区和中国新疆的古人DNA研究为厘清印欧语的起源和扩散提供了关键证据,为全面解析东西方人群的基因交流和演化历史提供重要参考,主要有如下三方面工作:
(1)青铜时代早中期欧亚草原游牧人群中带有欧洲早期农业人群的遗传贡献:近年来的古DNA研究发现以颜那亚文化为代表的欧亚草原人群是由东部和高加索狩猎采集人群混合而成的。然而,目前尚不清楚该欧亚草原人群的祖先群体是在何时何地出现,以及是否与公元前四千年一系列的文化和技术创新、印欧语系的扩散等有关。为了探索这一问题,王传超等从铜石并用草原文化、迈科普文化、颜那亚文化、北高加索、科班文化、萝拉文化、地下墓穴文化等16个考古遗址出土遗骸中取得107个个体的颞骨和牙齿样本,从中成功做出了北高加索地区自6500年前到3200年前跨越3000多年的45个古代遗骸的高质量全基因组水平的数据,发现高加索以北山前地带的史前人群在遗传上与邻近的草原人群有较大的差异,而与高加索以南地区的古今人群在遗传上相似,说明高加索山并不是史前人群迁徙不可逾越的障碍。与该地区6300年前铜石并用时代的古人群相比较,颜那亚文化人群和所有后来的游牧草原人群都带有先前未被发现的与周边农业人群相关的祖源成分,早期印欧语可能由此传入欧亚草原。
(2)青铜时代早中期欧亚草原游牧人群向东扩散传播印欧语:吐火罗语是印欧语系下的一个已经消亡的早期分支语言,在公元6~8世纪流行于新疆塔里木河流域,目前学界对于该人群来源仍不清楚。石人子沟遗址(又称东黑沟遗址)位于中国新疆哈密地区巴里坤县的东天山北麓,该遗址是集墓葬、居址和岩画于一体的超大型聚落。遗址范围内包涵青铜时代至清代的多种遗存,其中以早期游牧文化遗存为主,有着密度高、数量多和属性复杂等特点,罕见于欧亚草原东部,荣获中国“2007年度全国十大考古新发现”称号,引起国内外欧亚考古学界的广泛关注。王传超与吉林大学生命科学学院、西北大学文化遗产学院合作,成功做出了2200年前铁器时代新疆石人子沟遗址的10例古人的全基因组数据,发现石人子沟古人是典型的混合人群,其一部分祖源成分主要来自于东北亚地区,而另一部分主要是来自阿凡纳谢沃(Afanasievo)、颜那亚等青铜时代早期欧亚草原游牧人群。这对理解吐火罗语人群的起源和迁徙有着重要意义。由石人子沟的古DNA证据来看,吐火罗语人群也有可能是随着青铜时代早期欧亚草原游牧人群的东扩来到中国新疆地区的。
综合上述两部分研究工作中的语言、考古和古基因组学多学科的证据,王传超等推断印欧语起源于高加索山南部地区到安纳托利亚一带,因为安纳托利亚语是印欧语系的最早期分支;尔后,随着农业文化的扩张,安纳托利亚农业人群开始向西扩散进入欧洲东部,形成欧洲早期的农业人群;欧洲东部早期的农业人群带着原始印欧语随即向东进入东欧大草原,与那里的早期游牧人群融合而形成了青铜时代早中期以颜那亚文化为代表的草原游牧人群;以颜那亚文化为代表的草原游牧人群向西涌入欧洲,向东直达阿尔泰山区,并深入塔里木盆地遗留下了吐火罗语,向东南进入南亚,不断地传播印欧语。
(3)东西方人群的基因交流和演化历史:为解析中国西北各族群的遗传背景和祖源构成,探究印欧语人群对中国西北、南西伯利亚的影响,王传超课题组对保安、东乡、东西裕固、哈萨克、柯尔克孜、撒拉、蒙古、满族、回族等族群进行了详尽的取样调查和全基因组水平基因芯片分型,观察到这些族群的祖源构成是以东亚本土人群为主,但也受到了来自西方印欧语人群的一定比例的遗传混血(5-30%),发生的时间平均在5-70代之前(约150-2100年前),语言的扩散、传播和流变过程中也受到的人群基因交流的影响,研究结果对了解欧亚人群的迁徙历史和理解欧亚人群的遗传多样性有重要意义。
(三)主要研究工作成果
以上研究内容发表在Nature Communications、Current Biology、Forensic Science International: Genetics、Frontiers in Genetics、American Journal of Physical Anthropology、Molecular Genetics and Genomics、Annals of Human Biology等,最有代表性的论文如下(#共同第一作者,*通讯作者):
(1) Chuan-Chao Wang*, et al. (2019) Ancient human genome-wide data from a 3000-year interval in the Caucasus corresponds with eco-geographic regions. Nature Communications, 10:590.(中科院一区,JCR Q1区)
(2) Chao Ning#, Chuan-Chao Wang#, et al. (2019) Ancient genomes reveal Yamnaya-related ancestry and a potential source of Indo-European speakers in Iron Age Tianshan. Current Biology, 29(15):2526-2532.(中科院一区,JCR Q1区)
(3) Chuan-Chao Wang*, et al. (2019) The massive assimilation of indigenous East Asian populations in the origin of Muslim Hui people inferred from paternal Y chromosome. American Journal of Physical Anthropology, 169(2):341-347.(中科院二区,JCR Q1区)
(4) 杨文姣,孙瑾,郭健新,王传超*. 语言、考古和遗传学多学科视角下的印欧语系起源与扩散. 学术月刊. 2021, 53(05): 175-185.
【分子人类学的技术方法创新及其在法医学中的跨学科应用】
王传超课题组近年来专注于多种遗传标记的法医学特征的研究,开展了大量的基于法医学检测体系的群体遗传学研究及法医学检测体系的开发、验证(灵敏度、特异性、重复性、族属特异性等)等工作。对中国各地汉族、藏缅语和侗台语人群中10366个样本的常染色体、X染色体或Y染色体法医STR、InDel等检测体系进行了法医遗传学及群体遗传学调查、验证工作,系统验证了各类遗传标记的法医学效能,多角度、多层面完善了东亚地区法医数据库。
王传超与合作者改进和应用父系Y染色体测序和分型技术、流程,通过Y染色体捕获测序,发现并命名了4000余个新的SNP位点可用于精细法医识别(https://isogg.org/上以F开头命名的位点),推动法医遗传系谱学发展。把分子人类学分析与地方志和族谱的研究结合起来,文理交叉,探寻中华姓氏的源流,更精细地构建出中华民族的姓氏父系遗传结构图谱。
王传超等通过把高通量基因组测序和芯片分型技术方法全面地引入法医人类学研究中,研究过程中产生的古今人群的基因组数据为法医学用于个体识别或亲缘鉴定提供更多获得证据的手段,对于人群源流精细的分析还将在流行病研究的样本设计、数据对照分析等多方面起到推动作用。
王传超课题组对法医学遗传标记、检测平台及法医学任务等相关的科学问题有较为丰富的科研积累及经验,为后续开展关于中国人群的法医遗传系谱和生物地理祖源共推断体系开发的研究奠定了基础,提供了技术保障。
主要研究工作成果
以上研究内容发表在Forensic Science International: Genetics、Frontiers in Genetics、Molecular Genetics and Genomics、International Journal of Legal Medicine、Legal Medicine、Annals of Human Biology等期刊上,最有代表性的论文如下(#共同第一作者,*通讯作者):
(1) Mengge Wang#, Weian Du#, …, Haibing Yuan*, Hui-Yuan Yeh*, Chuan-Chao Wang*, Chao Liu*, Guanglin He* (2022) Genomic history and forensic characteristics of Sherpa highlanders on the Tibetan Plateau inferred from high-resolution InDel panel and genome-wide SNPs. Forensic Science International: Genetics, 56:102633.(中科院一区,JCR Q1区)
(2) Guanglin He#,*, Atif Adnan#, …, Pengyu Chen*, Chuan-Chao Wang* (2019) A comprehensive exploration of the genetic legacy and forensic features of Afghanistan and Pakistan Mongolian-descent Hazara. Forensic Science International: Genetics, 42: e1-e12.(中科院一区,JCR Q1区)
(3) Chi-Zao Wang, …, Mei-Sen Shi*, Chuan-Chao Wang* (2020) Haplotype analysis of 36 Y-STR loci in a Chinese Han population from Anhui Province, Eastern China. International Journal of Legal Medicine, 134:2063-2065.(中科院一区,JCR Q1区)
(4) Atif Adnan, …, Chuan-Chao Wang*, Jin-Feng Xuan* (2020) Phylogenetic relationship and genetic history of Central Asian Kazakhs inferred from Y-chromosome and autosomal variations. Molecular Genetics and Genomics, 295: 221–231.(中科院三区,JCR Q2区)
(5) Yang Liu, …, Mei-Sen Shi*, Chuan-Chao Wang* (2020) 27 Y-chromosomal STR haplotypic structure for the Chinese Han population from Changchun, Northeastern China. Legal Medicine, 48:101813.(中科院四区,JCR Q3区)
(6) Han Zhang#, Guanglin He#, …, Chuan-Chao Wang*, Jiang Huang* (2019) Genetic diversity, structure and forensic characteristics of Hmong-Mien-speaking Miao revealed by autosomal insertion/deletion markers. Molecular Genetics and Genomics, 294:1487-1498.(中科院三区,JCR Q2区)
(7) Guanglin He#, Zheng Ren#, …, Jiang Huang*, Chuan‑Chao Wang* (2019) Population genetics, diversity and forensic characteristics of Tai–Kadai-speaking Bouyei revealed by insertion/deletions markers. Molecular Genetics and Genomics, 294:1343-1357.(中科院三区,JCR Q2区)
(8) Hongbin Yao*,#, Chuan-Chao Wang*,#, …, Hui Li* (2017) Genetic structure of Tibetan populations in Gansu revealed by forensic STR loci. Scientific Reports, 7: 41195.(中科院三区,JCR Q1区)
(9) Xiaotian Yao#, Senwei Tang#, …, Gang Chen*, Chuan-Chao Wang* (2017) Improved phylogenetic resolution for Y-chromosome Haplogroup O2a1c-002611. Scientific Reports, 7: 1146.(中科院三区,JCR Q1区)
(10) Chuan-Chao Wang, …, Hui Li* (2016) Agriculture driving male expansion in Neolithic Time. Science China Life sciences, 59(6), 643–646. (中科院一区,JCR Q1区)
(11) Chuan-Chao Wang, …, Hui Li* (2015) Convergence of Y Chromosome STR Haplotypes from Different SNP Haplogroups Compromises Accuracy of Haplogroup Prediction. Journal of Genetics and Genomics, 42(7), 403–407.(中科院二区,JCR Q2区)
(12) Chuan-Chao Wang, …, Hui Li* (2013) Late Neolithic expansion of ancient Chinese revealed by Y chromosome haplogroup O3a1c-002611. Journal of Systematics and Evolution, 51: 280-286.(中科院一区,JCR Q1区)
(13) Shi Yan*, Chuan-Chao Wang, …, Li Jin* (2014) Y chromosomes of 40% Chinese descend from three Neolithic super-grandfathers. PloS One, 9(8), e105691.(中科院三区,JCR Q2区)
(14)Shi Yan*, Chuan-Chao Wang, …, Li Jin* (2011) An updated tree of Y-chromosome Haplogroup O and revised phylogenetic positions of mutations P164 and PK4. European Journal of Human Genetics, 19(9), 1013–1015. (中科院二区,JCR Q2区)
【反驳现代语言非洲起源论】
语言人类学研究的关键科学问题是人类的语言是否有一个共同的起源,其形态的演化是否有规律,最极端的进化形态会怎样。王传超课题组有着丰富的语言学大数据搜集、整理和分析的经验。于2012年在Science上发表世界范围内579种语言的语音多样性论文,反驳现代语言的非洲起源理论,提出早期人类及语言“亚洲扩张”的新假说。通过对579种世界范围内语言的元音、辅音和声调进行大数据分析,发现人类语言的语音多样性分布是有一定规律可循的,欧亚大陆的语言语音比较复杂,而非洲的略简单,美洲与澳洲更简单,语音最复杂的前几种语言都出现在中国,全世界的语音分布可能指向语言的最近扩散中心在里海南岸。
Wang, Chuan-Chao et al. “Comment on "Phonemic diversity supports a serial founder effect model of language expansion from Africa".” Science, 335, 6069 (2012): 657, doi:10.1126/science.1207846IF: 44.7 Q1 .
全部论文及引用情况,请查看:
https://scholar.google.com/citations?user=lr_OGo0AAAAJ&hl=zh-CN
https://www.researchgate.net/profile/Chuan-Chao-Wang