【更新日志】WeGene父系祖源优化

大家好,在深圳迎来今年第一场暴雨的今天,我们又更新啦~ 更新菌今天冒着大雨踩着拖鞋,为大家邀请了我司祖源分析专家汤教授 (@yaoxt) 为大家带来本次的父系祖源算法优化说明。下面有请汤教授讲课——
 
人类的Y染色体是非常特殊的一条性染色体。由于Y染色体只在男性个体中出现,同时其大部分区域不参与同源重组,这使得Y染色体成为研究人类演化迁徙历史的良好素材。然而,Y染色体是单倍体且部分区域与X染色体同源,这给高通量检测Y染色体的SNP位点的准确性和稳定性带来了很大的挑战。这也是23andme、Ancestry等国外基因检测公司对Y染色体SNP检测很少的重要原因。
 
为了更好地解读父系祖源,尤其是为了能更加深入地探索东亚人群的演化历程,WeGene以ISOGG国际Y单倍群参考树上所涉及的SNP位点为基础,加上复旦大学等国内外科研机构在东亚人群中的研究成果,设计了WeGene基因芯片所检测的Y染色体位点。
 
自2015年底推出WeGene检测服务以来,我们已经完成了上万份的WeGene基因芯片检测和数据分析。基于大规模的基因组数据,以及用户的积极反馈,我们对东亚人群父系祖源有了更加深入的理解,部分成果已经在Nature出版集团旗下的Scientific Reports上发表[1]。在进行这些研究工作时,我们通过与全基因组测序等数据进行比较,发现Y染色体上的部分位点检测结果存在系统误差。同时,我们也从客户服务、WeGene社区以及分子人类学论坛等处收到用户反馈Y染色体上若干位点的检测结果存疑。
 
因此,我们在过去的几个月里对Y染色体上所有SNP位点的SNP Calling算法和流程进行了优化,以修正我们发现的系统性误差。截至今天(2017/5/15),我们已经修复了我们在Y染色体上业已发现的问题位点,并根据更新后的基因组数据重新计算了老用户的父系祖源结果。
 
根据我们的统计结果,大约18.8%的用户的父系祖源结果将会受到影响,最常见的几种变化如下表所示:

Picture1.png


如上表所示,绝大部分受影响用户的Y单倍群结果的分支没有变化,只是精度有所降低。这主要是因为东亚人群常见Y单倍群的下游分支稳定性较差,比较容易受到影响。
 
在此感谢所有用户对WeGene的建议和帮助,我们将会继续对数据的质量和解读的准确性进行优化,为大家带来更可靠的结果。
好了,汤教授今天的讲座就到这里,欢迎同学们踊跃提问~ (装作我都听懂了的样子!)
 
参考文献:
1. Yao, X., Tang, S., Bian, B., Wu, X., Chen, G., & Wang, C.-C. (2017). Improved phylogenetic resolution for Y-chromosome Haplogroup O2a1c-002611. Scientific Reports, 1–5. http://doi.org/10.1038/s41598-017-01340-z
2017-05-15 • IP属地香港
按热门排序    按默认排序

11 个回复

lingsan - 我是生物 我是活物
不应该叫“优化” 应该叫改错,文字游戏呢。。
技术不扎实 差评
natsumi - 999用户
母系祖源还有更新的前景吗?
bunnyfz - O1a1b
倒数第二,洋大人变土鳖,哭晕在厕所里。
我的父系单倍群被定为C2e1a1,但在这一分支的6个位点中,我只测到F3739是阳性的,其它5个位点CTS8579、F3883、F4040、F3737和F3836均为阴性。请问是不是还在继续研究者6个位点的可靠性?
我的上游为--(未检测到)的位点判定为阳性的问题还没有被修复。
O2a2b1a1a6的所有位点还是阴性,6b的改了,而下游的6b1就没问题?
如果有假阴性位点怎么办?
tokyo9pm - “Jawatsau” toipu kunino tsatuma-paritsau no khoh'ei. Pukhei to mbokhei tsotsen pa ndottimo Namutohkhei.
Bilibili......
顶一下。

要回复问题请先登录注册