一直对wegene的基因库很感兴趣是如何建立的呢？

一直对wegene的基因库很感兴趣是如何建立的呢？还是与哪些厂商进行的合作，毕竟分析时基于数据库的基础上，并且基因检测商业化也没有多长时间！！谁能帮忙解释一下呢？

2016-01-06 • IP属地中国

按热门排序按默认排序

1 个回复

费力科思 - WeGene勤杂工

题主的表述不是特别具体，我先假设楼主说的『基因库』指的是WeGene在分析和解读时用于构建模型的训练数据集。

首先，大部分关于运动、营养、疾病、药物等内容的解读规则是来自ClinVar，dbSNP，DrugBank等等数据库的，并不是来自任何原始数据的分析。现在诸如个人的风险跟平均风险的关系，相同人数的百分比，以及祖源等分析和解读的模型是用到了大量的原始数据来构建。接下来说说WeGene用到的数据和大概的应用。

现在WeGene用到的数据一部分来自公共数据集，例如千人基因组、HGDP等等，另一部分是WeGene自己的数据。

千人基因组、HGDP等数据是用在了祖源成分分析的模型构建中。@wang 通过一些人类学的规则，筛选出了500多个有可能能代表各个族群的样本，然后@ 通过使用一些分析方法再筛掉了一些异常的样本，最终得到我们的祖源成分的训练数据集。

另外，WeGene自己的数据主要是用在诸如有多少人给你有一样的基因型，以及类似运动基因中各项内容的分数分布的计算上，做一些中国人的群体统计的分析。

各种具体的算法我们会整理之后逐步开源的，相关技术的白皮书也会发布出来，数据的使用会有官方的伦理委员会来审查，请大家指点和监督：）

赞同来自: wang 、cqnyfz 、flyboyleo 、Guy_KAI 、yysky723 、元月十号更多 »

(6)

2016-01-06 • IP属地中国 • 评论 (0)

要回复问题请先登录或注册

大航宝

一句话介绍

综合讨论组

8181 个讨论

进入小组

一直对wegene的基因库很感兴趣 是如何建立的呢？

与内容相关的链接

1 个回复

一直对wegene的基因库很感兴趣是如何建立的呢？