基因、大数据和新基建


【导语】“数据正成为新世纪的矿产与石油”——田溯宁(亚信科技董事长、前中国网通CEO)


首发丨基因慧 作者|布三少 
关键词丨基因大数据 新基建

一、大数据是数字经济的石油、新基建的核心


在“大数据中心”与5G、人工智能、工业互联网列为新基建[1]的同月,中共中央国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》[2],其中把数据和土地、劳动力、资本、技术等并列为要素市场,随之而来是“数字经济”,再次引起高度重视。


2015年,我国乃至全球第一家大数据交易所贵阳大数据交易所(GBDEx)正式挂牌运营;2019年,中国与23个国家和地区签署《数字经济大阪宣言》。同年,我国三类国家试验区联动发展,促进数字中国建设[3]


中国互联网络信息中心(CNNIC)在2020年4月发布的第45次《中国互联网络发展状况统计报告》显示[3],截至2020年3月,我国网民规模为9.04亿,我国数字经济规模已达31.3万亿元,占GDP的比重达到34.8%。


在数字经济的高定位、低落地的发展格局中,正如我国互联网产业首批推动者之一、亚信科技联合创始人田溯宁谈道[4]:“数据正成为巨大的经济资产,成为新世纪的矿产与石油,将带来全新的创业方向、商业模式和投资机会”。


因为,数字经济以数据为关键要素,大数据是数字经济的“石油和矿产”。


特别地,在新基建的三大类中,“数据中心”被赋予算力基础设施的战略地位。为何?5G、物联网、卫星互联等围绕政企民服务时,依赖工业互联网业态和应用场景化,而5G以及工业互联网等的基础设施除了初始化的硬件搭建和软件投入外,数据流通和获取是关键,包括人工智能以数据、算法、算力为三大要素,其中核心的输入是数据,过程即是将数据转化为价值,所以,大数据是新基建的核心。数据要素有序高效流通也成为三类国家试验区的建设重点


在“大数据”作为新基建时,大数据的概念虽不能但必将掀起新泡沫。真正可用的大数据,惠及航天、气候、能源、金融、公卫和医健等领域,但大部分在初级阶段。


在备受关注的公卫及医健领域,普惠千万级人群、结构化、因果关系属性等,基因组学大数据首当其冲,列为亚马逊云、阿里云等医健行业解决方案首位。


二、没有大数据,从精准医疗到生命健康管理是空中楼阁


类似“精准医疗”扩展为全生命周期健康管理,“智慧城市”扩展为数字经济,不再是政治家和学者的一句口号的改变,而是理念及基础设施的升级。其中的核心是数据规模的积累、数据分析和数据挖掘平台的建设、转化应用的业态初备。


以精准医疗来说,在2015年奥巴马政府提出时,强调“在合适时间给合适的人用合适的药”,主要基于早期GWAS、后期的NGS队列研究进行疾病分子分型和用药指导等。发展至今,已扩展至全生命周期管理,例如:新生儿耳聋及代谢病等筛查、千万级新冠核酸筛查、孕前及产前诊断、基于DEL的药物研发、伴随诊断、预后监测等。仅无创产前产前一项,国内总样本数超过1000万例。


除了基因数据规模的积累,数据分析和应用方面,FDA从2015年开始批准一款靶向药和PD-1/L1时,基本同时批准一款基于基因检测等技术的伴随诊断产品,从而指导患者合理用药。2017年开始,不限癌种的“泛癌种”基因检测大Panel开始被FDA批准上市。2018年开始,我国创新企业针对非小细胞肺癌研发的肿瘤基因检测小Panel被连续获批6款。

△图:生命多组学 (来源/遗传, 2015; 37(7): 655-663)


由中科院目前方向东教授主持负责的课题《精准医学大数据处理和利用的标准化技术体系建设》 作为2016年国家启动的”精准医学研究”重点专项正在开展,,另外两个项目:《精准医学大数据管理和共享技术平台建设》、《疾病研究精准医学知识库构建》分别由军事医学科学院和复旦大学牵头,共同推进我国精准医学大数据行业建设。


而在大数据转化应用的业态初备上,在部分板块发展快速,大部分板块我国稍落后于全球水平。

《基因大数据智能生产及分析》

 行研报告  启动合作


三、基因大数据产业业态的痛点


从技术来看,大数据的要素包括数据、算法、算力(从比特币领域“借”来的概念),通俗地理解,即采集数据形成的数据中心、分析数据的算法软件等工具、数据计算及数据挖掘能力。


从产品来看,借用云计算的架构,大数据平台需广义的IaaS、SaaS和PaaS。即包括CPU、存储、网络等在内的硬件基础设施服务(IaaS),以软件为主的软件基础设施服务(SaaS)和结合硬件、硬件和数据用于应用的平台服务(PaaS)。


从技术和产品架构映射到产业上,大数据产业业态,即以英特尔、英伟达、三星、希捷、东芝为代表的硬件供应商;以Oracle、微软为代表的软件及数据库供应商;平台层面以亚马逊云、谷歌云、阿里云为代表的云平台服务。可以看到,在核心供应商列表中,我国仅有阿里云占一席之位,而同时阿里云也依赖于芯片、内存、存储硬件及数据库等软件供应商。


从基因大数据产业业态看,在广义大数据业态的肩膀上,目前初具产业链业态。


在基因大数据硬件和基础软件环境层面,以亚马逊云、阿里云、华为云为主的云平台,京东云、腾讯云等在跟进,在绝大资源集中在阿里云。而开发环境上较好的亚马逊云因为数据管理等敏感问题可能影响客观市场,华为云目前因涉及自营医疗健康业务及自身品牌有一定波动。


在基因大数据软件分析层面,主要以免费开源软件为主,少数部分海外商用软件及数据库(例如GATK、IPA、HGMD等)主要以海外公司为主。同时,头部企业通过产业战略投资和收购正集成资源,例如华大投资英国生物信息公司康剑尼科(Congenica)、QIAGN投资Ingenuity等。


平台层面,Galaxy作为研发爱好者的开源平台[5]之外,华大的BGI Online、Illumina的BaseSpace云平台用于自身系统及客户交付外,几乎没有公开、通用的云平台。谷歌投资的DNAnexus具有强大的技术背景及产品架构,但迟迟未进入中国,而国内的类似专注此赛道的烈冰云、聚道科技均拓展了其他业务,里程碑产品仍在路上。


参考链接:

1. http://www.mofcom.gov.cn/article/i/jyjl/e/202004/20200402957398.shtml

2. http://www.gov.cn/zhengce/2020-04/09/content_5500622.htm

3. 贵阳大数据交易所(GBDEX)

4. 《大数据时代》推荐序一:拥抱“大数据时代”

5. https://galaxyproject.org/


【声明】我们秉持专业、专注、赋能的理念收集、分析或发布信息,但由于时效性及行业特殊性,所刊登内容仅供研究参考,不作为决策依据;以上信息不代表基因慧的观点;“基因慧”刊登的原创内容的知识产权为“基因慧”商标拥有者及相关权利人所有;欢迎转载,转载请申请并注明来源。欢迎个人及机构投稿及合作。


 关于基因慧 

基因慧是一家数字生命健康创新服务平台,专注基因及数字生命健康领域,创立于2016年,基于10+年产业实践、创立了产业数据库YourMap® 和资讯平台基因慧,提供基因等产业咨询、品牌及策划服务,帮助合作伙伴洞察市场,致力于建设基因及数字生命健康产业大数据平台,服务生命健康创新创业。

☆ 国发改《战略性新兴产业发展展望》编委

☆ 中国遗传学会生物产业促进委员会委员

☆ 发布基因产业信息平台优脉通YourMap®️

☆ 参与组织发布行业共识、流程共识和团体标准

☆ 发布数十份基因及相关行研报告

☆ 组织基因检测联盟(筹)及首届第二届会议

☆ 主办数字健康私董会大湾区生命健康创新论坛

☆ 受邀为华西Illumina华大上海交大等报告

☆ 广东省精准医疗应用学会政策研究应用分会常务委员

☆ 深圳市健康产业发展促进会理事

▼  点击“阅读原文”,查看精选产业分析

版权所有,未经允许不得转载。基因慧:数字生命健康创新服务 » 基因、大数据和新基建

相关推荐

抢沙发