大航宝 大航宝 - 一句话介绍 综合讨论组

一直对wegene的基因库很感兴趣 是如何建立的呢?

一直对wegene的基因库很感兴趣 是如何建立的呢?还是与哪些厂商进行的合作,毕竟分析时基于数据库的基础上,并且基因检测商业化也没有多长时间!!谁能帮忙解释一下呢?
2016-01-06 • IP属地中国
按热门排序    按默认排序

1 个回复

费力科思 - WeGene勤杂工
题主的表述不是特别具体,我先假设楼主说的『基因库』指的是WeGene在分析和解读时用于构建模型的训练数据集。
 
首先,大部分关于运动、营养、疾病、药物等内容的解读规则是来自ClinVar,dbSNP,DrugBank等等数据库的,并不是来自任何原始数据的分析。现在诸如个人的风险跟平均风险的关系,相同人数的百分比,以及祖源等分析和解读的模型是用到了大量的原始数据来构建。接下来说说WeGene用到的数据和大概的应用。
 
现在WeGene用到的数据一部分来自公共数据集,例如千人基因组、HGDP等等,另一部分是WeGene自己的数据。
 
千人基因组、HGDP等数据是用在了祖源成分分析的模型构建中。@wang 通过一些人类学的规则,筛选出了500多个有可能能代表各个族群的样本,然后@  通过使用一些分析方法再筛掉了一些异常的样本,最终得到我们的祖源成分的训练数据集。
 
另外,WeGene自己的数据主要是用在诸如有多少人给你有一样的基因型,以及类似运动基因中各项内容的分数分布的计算上,做一些中国人的群体统计的分析。
 
各种具体的算法我们会整理之后逐步开源的,相关技术的白皮书也会发布出来,数据的使用会有官方的伦理委员会来审查,请大家指点和监督:)

要回复问题请先登录注册