大航宝 -
一句话介绍
综合讨论组
一直对wegene的基因库很感兴趣 是如何建立的呢?
一直对wegene的基因库很感兴趣 是如何建立的呢?还是与哪些厂商进行的合作,毕竟分析时基于数据库的基础上,并且基因检测商业化也没有多长时间!!谁能帮忙解释一下呢?
1 个回复
首先,大部分关于运动、营养、疾病、药物等内容的解读规则是来自ClinVar,dbSNP,DrugBank等等数据库的,并不是来自任何原始数据的分析。现在诸如个人的风险跟平均风险的关系,相同人数的百分比,以及祖源等分析和解读的模型是用到了大量的原始数据来构建。接下来说说WeGene用到的数据和大概的应用。
现在WeGene用到的数据一部分来自公共数据集,例如千人基因组、HGDP等等,另一部分是WeGene自己的数据。
千人基因组、HGDP等数据是用在了祖源成分分析的模型构建中。@wang 通过一些人类学的规则,筛选出了500多个有可能能代表各个族群的样本,然后@ 通过使用一些分析方法再筛掉了一些异常的样本,最终得到我们的祖源成分的训练数据集。
另外,WeGene自己的数据主要是用在诸如有多少人给你有一样的基因型,以及类似运动基因中各项内容的分数分布的计算上,做一些中国人的群体统计的分析。
各种具体的算法我们会整理之后逐步开源的,相关技术的白皮书也会发布出来,数据的使用会有官方的伦理委员会来审查,请大家指点和监督:)
赞同来自: wang 、cqnyfz 、flyboyleo 、Guy_KAI 、yysky723 、元月十号更多 »
要回复问题请先登录或注册