“为何我是满族人却没有测出满族血统?”

这是一个高频的问题,答案是我们可检测的民族中并不包含满族。

23魔方可检测民族[文]血统:

23魔方等基因检测机构为啥测不出满族血统? 23魔方 血统 基因 满族 第1张

那么大个民族居然测不出来?

其实这是市面上所有基因检测都在头疼的问题,但为了解决这个问题我们曾多次征集满人样本,希望有所突破。可是按照目前的算法我们还是没能测出来满族。

那么我们是根据什么检测民族血统的呢?

想知道个体的基因祖[章]源,就需要把基因组[来]与一个已知明确种群[自]分类的样品集合做比[历]对通过其相似度来进[史]行推断,得出检测者[大]基因组民族祖源成分[全]

有很多方法可以估算[网]基因组的种族民族成[文]分但都要依赖一个成[章]型参考集合数据库。[来]它的质量对祖源民族[自]成分准确度起到了关[历]键作用所以我们在集[史]合数据库的时候十分[大]谨慎。

23魔方祖源民族数据库一共会经历四个步骤:

参考样品选取

亲缘关系过滤

PCA过滤

panel参考集性能测试

参考样品选取

以每个民族始祖的D[全]NA定义民族样本是[网]再合适不过,然而现[文]实让人无奈不是每个[章]民族都有古DNA样[来]本的,加上近百年来[自]迁徙频率加快,让我[历]们去进行民族样本的[史]划分更是难上加难。[大]为了确保参考集的客[全]观,我们选取参考集[网]的标准是:

三代同宗

(即从自己往上推三[文]代祖先中都必须同一[章]个民族,同一个省份[来])最大限度地保证参[自]考集的特异性。

亲缘关系过滤

有亲缘关系的样品因[历]为在基因组上格外相[史]似会引起频率计算的[大]偏向,如果一个参考[全]祖源中的亲缘关系样[网]品比较多,在某些S[文]NP上的频率就会额[章]外偏高。所以对于参[来]考集合第一步质控就[自]是过滤有亲缘关系的[历]样品。

PCA过滤

PCA(主成分分析[史])是在群体遗传学上[大]一个常用的基因组聚[全]类方式23魔方的芯[网]片有70万个位点,[文]相当于从70万个维[章]度定义一个样本PC[来]A就是把70万维降[自]维到2维平面(如下[历]图)

23魔方等基因检测机构为啥测不出满族血统? 23魔方 血统 基因 满族 第2张

一般情况下同一个地[史]区的人群样本往往会[大]如图中一样聚集在一[全]起,通过这种方式可[网]以快速排除离群的样[文]本,使得参考集更纯[章]

Panel参考集合性能测试

过滤后的还需要对参[来]考集合做进一步的训[自]练测试,通过Lea[历]ve-One-Ou[史]t(留一法)来对参[大]考集合进一步筛查,[全]对异常或者“不纯”[网]的参考样品删减,从[文]而使我们祖源参考集[章]合性能达到最优。

我们统计了23魔方[来]数据库里的资料,把[自]用户填写满族的民族[历]血统分布作成民族成[史]分分布的箱线图。

23魔方等基因检测机构为啥测不出满族血统? 23魔方 血统 基因 满族 第3张

可以看出绝大部分的满族成员,主要成分分布在北方汉族范围,没有存在特别的的民族血统分布。

我们还专门征集了2[大]0个样本(拥有家谱[全]记载的三代同宗的满[网]族人)

23魔方等基因检测机构为啥测不出满族血统? 23魔方 血统 基因 满族 第4张

并结合公开的民族数据库进行PCA分析,分析如下图。23魔方等基因检测机构为啥测不出满族血统? 23魔方 血统 基因 满族 第5张红色点为我们征集的满族样品,可以看出几乎全部都落在北方汉的集群位置中。

结合我们23魔方已[文]有的数据库以及征集[章]的有家谱记载的满族[来]样品并结合算法模型[自]对满族进行预测。在[历]已有的数据和模型下[史]根据现有技术我们无[大]法构建一个满族训练[全]集合。

本着对用户负责的态[网]度,为了追求结果的[文]严谨和准确度所以我[章]们暂时不支持满族的[来]民族血统预测。

目前有很多民族血统跟满族一样,我们无法构建出参考集,但在探索的过程中我们也找到了更多样的血统参考集。新版民族血统正在测试中,如果您有独特的血统或者好的建议可在社区留言,欢迎您加入一起探索。

历史大全 历史上的今天