使用本网站需要启用 JavaScript, 请启用后刷新页面获得更好的体验
登录
注册
首页
个人基因检测
临床应用研究
科研合作项目
合作与服务
社区
纯合片段分析
姓氏祖源
祖源平均脸
基因关系
基因保险助手
原始数据
使用 WeGene 需要启用 Cookies, 请启用后刷新页面获得更好的体验
社区首页
综合讨论区
讨论详情
大航宝 - 一句话介绍
综合讨论组
一直对wegene的基因库很感兴趣 是如何建立的呢?
一直对wegene的基因库很感兴趣 是如何建立的呢?还是与哪些厂商进行的合作,毕竟分析时基于数据库的基础上,并且基因检测商业化也没有多长时间!!谁能帮忙解释一下呢?
2016-01-06 • IP属地中国
与内容相关的链接
提交
按热门排序
按默认排序
1 个回复
费力科思
-
WeGene勤杂工
题主的表述不是特别具体,我先假设楼主说的『基因库』指的是WeGene在分析和解读时用于构建模型的训练数据集。
首先,大部分关于运动、营养、疾病、药物等内容的解读规则是来自ClinVar,dbSNP,DrugBank等等数据库的,并不是来自任何原始数据的分析。现在诸如个人的风险跟平均风险的关系,相同人数的百分比,以及祖源等分析和解读的模型是用到了大量的原始数据来构建。接下来说说WeGene用到的数据和大概的应用。
现在WeGene用到的数据一部分来自公共数据集,例如千人基因组、HGDP等等,另一部分是WeGene自己的数据。
千人基因组、HGDP等数据是用在了祖源成分分析的模型构建中。
@wang
通过一些人类学的规则,筛选出了500多个有可能能代表各个族群的样本,然后@ 通过使用一些分析方法再筛掉了一些异常的样本,最终得到我们的祖源成分的训练数据集。
另外,WeGene自己的数据主要是用在诸如有多少人给你有一样的基因型,以及类似运动基因中各项内容的分数分布的计算上,做一些中国人的群体统计的分析。
各种具体的算法我们会整理之后逐步开源的,相关技术的白皮书也会发布出来,数据的使用会有官方的伦理委员会来审查,请大家指点和监督:)
要回复问题请先
登录
或
注册
发起讨论
大航宝
一句话介绍
综合讨论组
8181 个讨论
1 个回复
首先,大部分关于运动、营养、疾病、药物等内容的解读规则是来自ClinVar,dbSNP,DrugBank等等数据库的,并不是来自任何原始数据的分析。现在诸如个人的风险跟平均风险的关系,相同人数的百分比,以及祖源等分析和解读的模型是用到了大量的原始数据来构建。接下来说说WeGene用到的数据和大概的应用。
现在WeGene用到的数据一部分来自公共数据集,例如千人基因组、HGDP等等,另一部分是WeGene自己的数据。
千人基因组、HGDP等数据是用在了祖源成分分析的模型构建中。@wang 通过一些人类学的规则,筛选出了500多个有可能能代表各个族群的样本,然后@ 通过使用一些分析方法再筛掉了一些异常的样本,最终得到我们的祖源成分的训练数据集。
另外,WeGene自己的数据主要是用在诸如有多少人给你有一样的基因型,以及类似运动基因中各项内容的分数分布的计算上,做一些中国人的群体统计的分析。
各种具体的算法我们会整理之后逐步开源的,相关技术的白皮书也会发布出来,数据的使用会有官方的伦理委员会来审查,请大家指点和监督:)
赞同来自: wang 、cqnyfz 、flyboyleo 、Guy_KAI 、yysky723 、元月十号更多 »
要回复问题请先登录或注册