DNAnexus完成世界上最大的泛癌症数据的重分析(附数据下载)

DNAnexus完成世界上最大的泛癌症数据的重分析(附数据下载)

关键词:Pan Cancer 10487患者 33种癌症 突变检测 TCGA DNAnexus
阅读用时:1843字,约需4.5分钟
内容简介:DNAnexus 在12月9日宣布它已完成在世界上最大的泛癌症数据集上的统一重分析和突变检测,数据来自TCGA(癌症基因组图谱)的10,487个患者,涵盖33种癌症类。
 
2016 年12 月 9 日 | DNAnexus 今天宣布它已完成在世界上最大的泛癌症数据集上的标准化的重分析和突变检测,数据来自TCGA(癌症基因组图谱)的10,487个患者,涵盖33种癌症类型。突变数据经过了额外的质量控制和过滤,现作为开放阅读数据集可在 NCI Genomic Data Commons 和Synapse下载。也可以通过 DNAnexus或 GitHub库重现这个TCGA 突变结果。
eicZhoGYCfyZWXc4V7CwJIsNicqicPCVrPbBcmCXaJXRr82lP846arib2rSxjQ2g9CfmOZMcXI173Im57ibKnkyVBLg
TCGA 图片来自:ocg.cancer.gov
“在过去,TCGA 样品的突变检测主要是对于个体的肿瘤类型,项目使用不同的变异检测工具或不同版本的变异检测工具,这意味着数据不统一”,项目主任Carolyn Hutter博士在NHGRI的基因组医学部门的声明中说,“我们现在认为最好的(癌症数据)分析对象通过多个变异检测工具分析,然后经过质量控制和过滤,涵盖多种癌症类型得到的数据。这就是为什么 TCGA 团队决定回过头重新分析TCGA中10,000 多个外显子,并且分析得到这种多个变异检测工具得到的体细胞突变(somatic mutation)数据集。”
TCGA成员机构不具备跨越多种癌症类型的突变分析所需的计算资源。突变检测包括病人信息的安全、可以处理数以万计的外显子,可扩展的环境,和可重复的结果,这里采用了DNAnexus 平台。
eicZhoGYCfyZWXc4V7CwJIsNicqicPCVrPbRSIZFUticacBeVldU3vCQABTCNXTbia5nkI5ZX9sgiaMeHNjqTlZfgdCA
DNAnexus工作原理 图片来源:smartplanet.com
“这是一个巨大的挑战,也是DNAnexus平台的优势体现的一个典型例子,”DNAnexus 的首席执行官Richard Daly说到,“在四个星期内大约 180 万单位CPU(core-hours)的计算时间用于处理400 TB 的数据,以产生可重复的结果。目前得到的一致性的数据可让全球的研究人员用来解释多种类型癌症共享的基因组特征、致癌标志物和潜在治疗目标”。
“用一种单一的方法在新的标准突变检测上重新修正 TCGA 数据将使肿瘤数据更加方便研究人员使用。DNAnexus 通过版本控制的分析及工具创建统一的,敏感度高的分析处理,这对在一定的时间范围内在单一的设施上重复很具有挑战性,”贝勒医学院的分子和人类遗传学部门的教授David Wheeler博士说,“有这套通过几个变异检测工具获得的标准化突变检测集,我们将能够识别非组织来源多种肿瘤之间共享的癌症的遗传变异因素。我们乐观地认为,获得这些信息将推动精密医学的进步。”
现在研究人员除了 GitHub库也可以通过DNAnexus 平台途径访问 TCGA。DNAnexus 工作以确保数据访问请求的机制,和当请求者符合云端 dbGaP和TCGA数据的安全标准时批准出售数据。
 
数据下载地址(需要先免费注册synase)
https://www.synapse.org/#!Synapse:syn7214402/files/
数据集(syn5917256)WiKi网址:
https://www.synapse.org/#!Synapse:syn7214402/wiki/405297
参考文献:
http://www.bio-itworld.com/2016/12/9/dnanexus-reanalyzes-cancer-genome-atlas-data.aspx
 
邀请 & 预告
《温故2016》系列节目在未来一个月内将计划推出肿瘤基因检测、微生物组、个人基因组、生物云平台等专题的三人访谈节目《基因三人行》。敬请关注,欢迎提出您宝贵的建议。
基因慧团队将秉持“使连接产生价值,让知识获得尊重”的初心,连接行业,服务大家(010-56527551,info@genonet.cn)。
精华文章
点击下列链接,可见更多推荐文章:
eicZhoGYCfya8d9amvCQUkI0swluE5cc4aG2icPmTGzUl3kEO47YOwcHWGRriboGhvLRFUXUYYOOicTBUNibHD5ialoQ
更多干货,欢迎进入基因慧知识铺
eicZhoGYCfyYA27eSceibibXTibxiaeuRAfCnd76p08wYk4ibYr98uPpPPnH9w9ibClibBpopw4Equib1UQ4IRCf5IMkkgA
声明
1. 以上内容是基因慧集合行业经验,资源进行编撰或梳理而成,版权属于基因慧(北京基因界科技信息咨询有限公司)。欢迎转发、转载。转载请联系微信后台,获得授权后在正文首行显要位置注明来源:基因慧。欢迎交流合作。 2.我们秉持客观、严谨、中立的态度,从多方渠道收集病发布信息,供行业参考。但受收集当时信息公开的时效性,不同渠道存在不同见解,不能完全保证信息的完整性和准确性,如有错漏之处,欢迎指正。
调研、培训、会议报道、品宣等服务:
电话:010-56527551 / 400-088-7466
地址:北京市海淀区中关村大街1号
官网:www.geneclub.net.cn
邮箱:info@genonet.cn
基因慧
精准医疗
行业连接器
长按关注
eicZhoGYCfyam0tGtPa9Wtk53hnvwRbYHjq4TJkMuoiawANaKoXTXuuD5PebLcHg0IYb0Hn88Kx6lu0QmK5zGN4Q