![Mehmet](https://uploads-cdn.wegene.com/avatar/000/08/47/92_avatar_mid.jpg?v=12066)
【基因助手】2021年1月更新,微基因用户的祖源PCA主成分分析
基因助手
https://geneu.xyz
祖源关系一直是基友们津津乐道的,探索自己的基因祖源是科学,也是一种对历史文化的态度。祖源分析的准确性虽然受制于DNA芯片检测的偶然误差、不同基因公司的芯片SNP点位不同、以及各种祖源计算器的参考样本标杆的局限性,但微基因的祖源样本标杆丰富,并针对中国人群进行了细分,并且拥有几十万的用户量可以不断修正祖源计算参数,所以微基因的官方祖源报告任然具备较高的参考价值。
基因助手此次新增祖源PCA分析,基于微基因官方的用户祖源大数据,分别对全国425个城市的微基因全网用户、以及近6000个抽样用户这两个样本集的42种祖源维度进行PCA主成分分析,对这两个样本集进行线性变换,降低特征维度,从42种祖源维度不断降维到3种特征,最终得到城市祖源PCA和用户民族祖源PCA,两种PCA图都支持二维和三维显示,也就是二种和三种主成分。由于基因助手与微基因保持实时同步关联,随着微基因用户的增长,祖源PCA图也会实时变化更新。
如果你有微基因账号,登录后可以看到你所有的样本在PCA祖源图上和其他城市、其他民族用户的祖源距离。PCA图中样本点很多,推荐使用PC电脑看更清晰,特别是3D图,可看出空间里任意两个样本点之间的距离。快来看看你到底是和哪个城市、哪个民族的祖源接近吧!
1,基于中国省份城市的祖源PCA,展现了中国425个地级市的祖源主成分距离,每个点代表一个城市,点击城市可看到具体祖源详情,右上角的放大镜可以局部放大查看,或切换两维和三维显示。南方与北方,东部与西部的城市都能看到明显的祖源距离差距,在第一主成分上差距最大的城市分别是天津西青区和广东云浮市,在第二主成分上差距最大的城市是上海嘉定区和新疆和田市,这几个城市分别代表了中国最典型的北方人、南方人、东部人和西部人,分析结果与实际情况相符。可看到东部地区,如上海,山东,福建的祖源分布都比较聚集,而中部地区如河南,湖南湖北,由于是九省通衢之地,历史上人群迁徙必经之地,所以中部地区人群的祖源比较离散。云南虽然临近两广,但祖源却接近北方,甚至接近新疆,这和云南历史上有来自北方的军人移民有关。新疆的南疆四地州(喀什、和田、阿克苏、克孜勒苏)则是祖源距离其他城市最远的。
2,基于用户民族的祖源PCA,抽样展示近6000个微基因用户的祖源主成分距离,每个点代表一个微基因用户,以民族分类,并在两维和三维空间展现这些用户之间的祖源距离,由于汉族人数很多,关闭汉族选项可以更清晰的看到少数民族之间的祖源距离。在三维空间中,需要发挥你的空间想象力才能更好的感受人群之间的祖源距离哦,鼠标滚动可以放大缩小,调整三维空间位置。
说明:由于个别少数民族用户的祖源比较特别,有些还是导入的23andMe或其他基因公司数据,而不同公司所用的SNP点位大不相同,导致祖源报告偶尔会给出95%以上的单一祖源,比如全是北汉南汉。这些误差样本在PCA图上会聚集在一起很难区分,在二维平面图可以用右上角的放大镜工具放大图形,在三维图中可以直接滚动鼠标放大缩小。
https://geneu.xyz
祖源关系一直是基友们津津乐道的,探索自己的基因祖源是科学,也是一种对历史文化的态度。祖源分析的准确性虽然受制于DNA芯片检测的偶然误差、不同基因公司的芯片SNP点位不同、以及各种祖源计算器的参考样本标杆的局限性,但微基因的祖源样本标杆丰富,并针对中国人群进行了细分,并且拥有几十万的用户量可以不断修正祖源计算参数,所以微基因的官方祖源报告任然具备较高的参考价值。
基因助手此次新增祖源PCA分析,基于微基因官方的用户祖源大数据,分别对全国425个城市的微基因全网用户、以及近6000个抽样用户这两个样本集的42种祖源维度进行PCA主成分分析,对这两个样本集进行线性变换,降低特征维度,从42种祖源维度不断降维到3种特征,最终得到城市祖源PCA和用户民族祖源PCA,两种PCA图都支持二维和三维显示,也就是二种和三种主成分。由于基因助手与微基因保持实时同步关联,随着微基因用户的增长,祖源PCA图也会实时变化更新。
如果你有微基因账号,登录后可以看到你所有的样本在PCA祖源图上和其他城市、其他民族用户的祖源距离。PCA图中样本点很多,推荐使用PC电脑看更清晰,特别是3D图,可看出空间里任意两个样本点之间的距离。快来看看你到底是和哪个城市、哪个民族的祖源接近吧!
1,基于中国省份城市的祖源PCA,展现了中国425个地级市的祖源主成分距离,每个点代表一个城市,点击城市可看到具体祖源详情,右上角的放大镜可以局部放大查看,或切换两维和三维显示。南方与北方,东部与西部的城市都能看到明显的祖源距离差距,在第一主成分上差距最大的城市分别是天津西青区和广东云浮市,在第二主成分上差距最大的城市是上海嘉定区和新疆和田市,这几个城市分别代表了中国最典型的北方人、南方人、东部人和西部人,分析结果与实际情况相符。可看到东部地区,如上海,山东,福建的祖源分布都比较聚集,而中部地区如河南,湖南湖北,由于是九省通衢之地,历史上人群迁徙必经之地,所以中部地区人群的祖源比较离散。云南虽然临近两广,但祖源却接近北方,甚至接近新疆,这和云南历史上有来自北方的军人移民有关。新疆的南疆四地州(喀什、和田、阿克苏、克孜勒苏)则是祖源距离其他城市最远的。
2,基于用户民族的祖源PCA,抽样展示近6000个微基因用户的祖源主成分距离,每个点代表一个微基因用户,以民族分类,并在两维和三维空间展现这些用户之间的祖源距离,由于汉族人数很多,关闭汉族选项可以更清晰的看到少数民族之间的祖源距离。在三维空间中,需要发挥你的空间想象力才能更好的感受人群之间的祖源距离哦,鼠标滚动可以放大缩小,调整三维空间位置。
说明:由于个别少数民族用户的祖源比较特别,有些还是导入的23andMe或其他基因公司数据,而不同公司所用的SNP点位大不相同,导致祖源报告偶尔会给出95%以上的单一祖源,比如全是北汉南汉。这些误差样本在PCA图上会聚集在一起很难区分,在二维平面图可以用右上角的放大镜工具放大图形,在三维图中可以直接滚动鼠标放大缩小。
7 个回复
赞同来自: Alborz 、Mehmet
赞同来自: 为什么小姐 、Mehmet
赞同来自: Mehmet
赞同来自: Mehmet
赞同来自: Mehmet
赞同来自:
赞同来自:
要回复问题请先登录或注册