xraywu
综合讨论组
【更新日志】WeGene父系祖源优化
大家好,在深圳迎来今年第一场暴雨的今天,我们又更新啦~ 更新菌今天冒着大雨踩着拖鞋,为大家邀请了我司祖源分析专家汤教授 (@yaoxt) 为大家带来本次的父系祖源算法优化说明。下面有请汤教授讲课——
参考文献:
1. Yao, X., Tang, S., Bian, B., Wu, X., Chen, G., & Wang, C.-C. (2017). Improved phylogenetic resolution for Y-chromosome Haplogroup O2a1c-002611. Scientific Reports, 1–5. http://doi.org/10.1038/s41598-017-01340-z
好了,汤教授今天的讲座就到这里,欢迎同学们踊跃提问~ (装作我都听懂了的样子!)人类的Y染色体是非常特殊的一条性染色体。由于Y染色体只在男性个体中出现,同时其大部分区域不参与同源重组,这使得Y染色体成为研究人类演化迁徙历史的良好素材。然而,Y染色体是单倍体且部分区域与X染色体同源,这给高通量检测Y染色体的SNP位点的准确性和稳定性带来了很大的挑战。这也是23andme、Ancestry等国外基因检测公司对Y染色体SNP检测很少的重要原因。
为了更好地解读父系祖源,尤其是为了能更加深入地探索东亚人群的演化历程,WeGene以ISOGG国际Y单倍群参考树上所涉及的SNP位点为基础,加上复旦大学等国内外科研机构在东亚人群中的研究成果,设计了WeGene基因芯片所检测的Y染色体位点。
自2015年底推出WeGene检测服务以来,我们已经完成了上万份的WeGene基因芯片检测和数据分析。基于大规模的基因组数据,以及用户的积极反馈,我们对东亚人群父系祖源有了更加深入的理解,部分成果已经在Nature出版集团旗下的Scientific Reports上发表[1]。在进行这些研究工作时,我们通过与全基因组测序等数据进行比较,发现Y染色体上的部分位点检测结果存在系统误差。同时,我们也从客户服务、WeGene社区以及分子人类学论坛等处收到用户反馈Y染色体上若干位点的检测结果存疑。
因此,我们在过去的几个月里对Y染色体上所有SNP位点的SNP Calling算法和流程进行了优化,以修正我们发现的系统性误差。截至今天(2017/5/15),我们已经修复了我们在Y染色体上业已发现的问题位点,并根据更新后的基因组数据重新计算了老用户的父系祖源结果。
根据我们的统计结果,大约18.8%的用户的父系祖源结果将会受到影响,最常见的几种变化如下表所示:
如上表所示,绝大部分受影响用户的Y单倍群结果的分支没有变化,只是精度有所降低。这主要是因为东亚人群常见Y单倍群的下游分支稳定性较差,比较容易受到影响。
在此感谢所有用户对WeGene的建议和帮助,我们将会继续对数据的质量和解读的准确性进行优化,为大家带来更可靠的结果。
参考文献:
1. Yao, X., Tang, S., Bian, B., Wu, X., Chen, G., & Wang, C.-C. (2017). Improved phylogenetic resolution for Y-chromosome Haplogroup O2a1c-002611. Scientific Reports, 1–5. http://doi.org/10.1038/s41598-017-01340-z
11 个回复
赞同来自:
赞同来自:
赞同来自:
赞同来自:
赞同来自:
赞同来自: vkrx
赞同来自:
赞同来自:
赞同来自: 鸬鹚 、蓝星旗 、蓝
赞同来自: 鸬鹚
要回复问题请先登录或注册