之前我们讲解了Y-SNP命名前缀对应的机构,还是有很多朋友表示看不懂Y染色体字母所代表的含义,这篇文章带大家了解一点点Y染色体单倍群命名的来龙去脉。

Y染色体在遗传的过程中,每经历一定的世代就会出现一个随机的SNP突变,父系关系更近的男性共享更多的SNP突变,通过这个方法我们可以判断不同男性之间的父系家族关系。将所有男性的Y染色体进行对比,我们就能得到人类父系家族的谱系树。

Y染色体联合会(YCC)在2002年根据已发现的SNP突变位点制定了一套命名规则,将Y染色体的谱系树划分为若干个大的Y染色体单倍群(父系家族),并使用大写字母从A到T进行命名,用数字和小写字母对各大单倍群的下游SNP进行分类。

单倍群后面所加的由字母打头的一串数字则是SNP突变的名称编号。如O2a2b1a2-F114中,O2a2b1a2是单倍群名称,F114是该单倍群代表性突变位点的名称,F是命名机构的代码(F代表复旦大学),114是编号。

由于是早期人为做出的划分,所以这个命名系统现在看存在着一些比较难以理解的地方。比如A群为旁系群而非单倍群,包含了单倍群BT之外的所有支系。单倍群BT实际上相当于A1b2。

单倍群的字母并不是严格按照支系的远近关系划分的。比如由于早期发现的SNP较少,认为C、D、E、F是并列的四个支系,后来发现C和F具有更近的共同祖先,D和E具有更近的共同祖先。L、M、N、O、P、Q、R、S、T也是类似的情况。即字母顺序并不能完全反映分化次序和远近关系。

随着样本的丰富和测试精度的增加,原有的树形不断发生着变化,下游分支的命名也不断随之变化。比如原来O-M175下游分为O1-M119、O2-M268、O3-M122三支,由于后来发现O1和O2共享有更近的共同祖先,所以原O1和O2重新命名为O1a和O1b,原O3重新命名为O2。

Y染色体命名规则 单倍群之间存在辈分差异吗? 染色体 snp 基因传 第1张

(截取自源基因谱系树)

Y染色体单倍群只是父系家族的标记,并不能作为种族或者民族划分的依据,事实上以字母命名的大单倍群都有超过三万年的共祖时间,下游家族支系可能早已分散到了不同的民族之中。