首页

位置导航: 首页 > 学术前沿 > 正文

深度解析“基因+大数据”的颠覆应用:从癌症基因测序到辅助生殖

来源:菠菜担保网

访问:

2015-06-13 22:41

【导读】医疗健康行业将被重新定义,未来个性化诊断将成为新常态未来的医疗发展之路,会从原来粗矿的、单一的、依赖于单个医生,以治疗疾病为目的走向变成更加个性化的、有针对性的、依赖大数据分析的以预防疾病为宗旨的新型模式,所有的变革和颠覆都离不开革命性的技术:二代基因测序。

二代基因测序行业是目前增长最快的基因学研究板块,五年后接近百亿美金市场

根据Markets&Markets的一项研究报告显示,2014年二代基因测序的全球市场为25亿美金,预计2020年将达到87亿美金,复合增长率23%,二代基因测序是基因学领域中增长最快的子行业,超过基因芯片和PCR技术。

基因测序仪增速已放缓,大数据处理成为难点和瓶颈,癌症治疗占最大下游份额(超过35%)基因测序仪已被欧美企业垄断,增速放缓,根据Markets&Markets的预测,2014-2020年,测序仪的复合增长率是15.4%;基因测序生物信息学全球市场(目前测序行业最大的难点和瓶颈),2012-2018复合增长率23%。下游应用市场以科学研究为主,肿瘤检测占下游最大的市场份额(超过35%)。

测序服务业将成为测序市场增长最迅速的子版块,2011-2016复合增长率达29%。根据BCC的预测,测序服务是测序市场增长最快的子板块,从2011年不超过10亿美金到2016年达到35亿美金,复合增长率29%;到2016年,测序服务的市场容量将超过测序仪器。

我国的基因测序行业:政策已破冰,扬帆起航正当时

我国基因测序行业还处于起步阶段,政策方面经历了灰色地带,全面叫停,从2014年下半年开始,逐渐破冰。目前,仅华大基因和达安基因两家企业有产品获得CFDA认证。

今年医药行业最火的一个词莫过于“精准医学”四个字。

何为精准医学?

就是利用现代化的遗传技术、分子影像技术、生物信息技术,结合患者的生活环境和临床数据,实现精准的疾病分类以及诊断,制定具有个性化的治疗方案。为什么现在大力推动精准医学?背后的大逻辑就是因为人类基因组学技术的革新和大数据分析工具的出现。

一、癌症基因测序领头羊企业:Foundation MedicineNASQFMI

癌症是二代基因测序最大的下游应用领域(>35%),也是大家最关心的细分领域,那我们就先从全球癌症基因测序的领头羊企业Foundation Medicine谈起。

1Foundation Medicine两大主打产品:FoundationOneFoundationOne Heme

Foundation Medicine(NASQ:FMI)是一家以二代基因测序技术为基础,根据癌症基因测序结果给肿瘤患者提供用药指南的公司,2013年纽交所上市,代码FMI。Foundation Medicine目前提供两种产品:FoundationOne和FoundationOne Heme,两种产品均是以二代基因测序为基础,使用的测序仪包括Illumina HiSeq 2000 system和Life Technologies' Ion Torrent。

FoundationOne检测315个癌症相关基因的编码区域以及28个基因的内含子重排,适用于所有固体瘤的检测,费用为$5800。FoundationOne Heme检测405个基因的编码区序列和31个基因的内含子重排,以及265个基因的RNA序列来检测基因融合,费用为$7200。

2Foundation Medicine能为癌症患者提供怎么样的服务

Foundation Medicine的服务需要医生订购,从提取肿瘤细胞的DNA到最终的报告,持续时间14-21天。下面两张图显示了Foundation Medicine的服务流程图以及一份其出示的最终检验报告,其中包含了检测出来的癌症基因突变情况,以及针对每一种突变基因给出的用药指导建议。

3、我国癌症基因检测的治疗领域市场(百亿级市场规模)

《2012中国肿瘤登记年报》表明,我国每年新发肿瘤病例约312万例,市场上癌症基因测序价格1万-5万,据2015年4月21美国癌症研究协会年(AACR)调查显示59%癌症患者愿意接受“肿瘤基因检测”,假设其中有1/2患者最终可以选择基因检测,假设平均每次花费2.5万元,因此每年中国肿瘤基因测序的治疗市场约为400亿人民币。

二、癌症基因测序(预防领域):市场更大(千亿级别),也更具争议性

Foundation Medicine给肿瘤患者提供用药指南,那对于健康人群和癌症易感人群呢?我们先从癌症的特点说起。

1、癌症的两大特点:潜伏期长以及机理复杂

潜伏期长:癌症不是一朝一夕形成的,一个癌细胞经过1-5年成倍增殖20次之后,可以形成一万个不正常的细胞团,这时瘤体只有针尖大小。当癌细胞成倍增殖30次之后,瘤体形状可如豌豆大小。正常细胞通常历经十年以上的诱导、刺激才可能转化成癌细胞。例如结肠癌,有10-20年的病情发展期(下图所示)。

2、易感人群和健康人群的癌症基因检测:早监测早防范早治疗

肿瘤医院的病人中有60%至80%刚到医院时就已经进入中晚期,癌症早期的筛查可以帮助患者有针对性的改善生活习惯或者采取个体化的辅助治疗,有益于身体健康;同时将癌症扼杀在摇篮里,从而降低日后巨大的医药开支和生活困扰。例如,随着美国进行前列腺癌的筛查,被检出的患者增多了,但整体死亡率却显著下降(下图所示)。

再看一组数据:来自American Cancer Society的数据表明(下图所示):宫颈癌早期诊断的五年生存率的概率是93%,而晚期诊断这个概率只有15%,乳腺癌、肠癌和皮肤癌也都如此,早期诊断的五年生存率远高于晚期诊断。

所以对于易感人群和健康人群,预防比治疗更重要:癌症有1/3可预防,1/3可治愈,1/3可缓解。前瞻性的预防疾病可以提高远离疾病诱发因素,提高患者生存率,降低医疗费用。

3、健康人群和易感人群的癌症基因测序:更大的市场(千亿级别),也面临更多的争议比治疗更大的市场

如果未来某一天,癌症基因测序可以像今天的常规体检一样普及,那么就不仅仅是百亿市场,会有千亿级别的市场(假设我国每年1亿人进行癌症基因检测,每次1000元)。

更大的争议:但目前阶段,对于健康人群和易感人群的癌症基因测序也存在着非常大的争议,例如,我们是不是应该提前知道未来的健康状况并且进行提取干预;预测结果是一个概率,如何对阵下药;医疗手段还不能跟上检测的步伐,对于一些目前医学界还不能解决的疾病,并不能解决患者的问题,只能徒增心理负担。

三、基因测序的另一个前景广阔的应用领域:辅助生殖

1PGS/PGD:人工辅助生殖过程中对胚胎的遗传学筛查和基因诊断

PGS是胚胎植入前遗传学筛查(Preimplantation Genetic Screening),用于在胚胎植入着床之前对早期胚胎进行染色体数目和结构异常的检测,主要通过检测胚胎的23对染色体结构、数目,通过比对来分析胚胎是否有遗传物质异常。PGD(preimplantation genetic diagnosis),即种植前基因诊断,主要用于检查胚胎是否携带有遗传缺陷的基因。

2、高龄、高危家庭需要PGS/PGD:降低自发性流产,提高怀孕率

美国南加州生殖医学中心的研究数据表明,40岁以上的妇女的成功受孕率还不到比40岁以下妇女的一半。35岁的妇女流产率约为25%,40岁妇女流产率为33%,45岁妇女流产率上升到了50%。而且,用羊膜穿刺的方法检测年龄为35岁的产妇,其胎儿存在染色体异常的概率为1/132,40岁的为1/38,45岁的为1/12。如下图所示,试管婴儿20周后使用PGS比不使用PGS的受孕成功率高。胚胎遗传筛查的优势在于显著提升试管婴儿的胚胎移植成功率;降低自发性流产;提高怀孕率;确保单个胚胎的转运从而降低多胚胎的风险。

3、二代基因测序作为PGS/PGD的检测手段:准确+高效

PGS/PGD的通用检测手段包括PCR、荧光原位杂交(FISH),比较基因组杂交(array CGH)以及单核苷酸多态性(SNP)、二代测序(NGS)检测。其中CGH、SNP关联分析以及二代测序方法使得检测更为准确、高效。例如,仅仅使用一次切片检查,Illumina的24sure微阵列芯片可以在12小时之内完成24条染色体的筛查。最新的测序技术可以达到同时检测单基因病和染色体非整倍性的诊断目的,其准确率已经超过了99%(来自Carolina Conceptions)。

下图,分别是比较基因组杂交和二代测序的方法在PGD中的应用。随着测序技术成本大幅度降低、遗传学机制研究的推进以及生物信息数据分析的深入,相信二代测序技术对试管婴儿的开展更具临床价值和更大市场空间。

4、我国二代基因测序用于PGS/PGD的市场:接近百亿元

据估计,试管婴儿有千亿美元的市场。国内每年出生的婴儿数量约为1600万,按12.5%~15%的不孕不育发病率计算,理论上每年应该还有200万-240万的婴儿因为不孕不育无法生育。

假设这部分婴儿的父母中的60%选择试管婴儿手术,则每年进行试管婴儿手术的夫妇为120万-144万对。由于国内试管婴儿平均成功率不足30%,假设每对夫妇平均采用2.4次试管婴儿手术,按平均每周期PGS/PGD收费2500元计算,则潜在市场规模达80亿元的市场。

四、基因大数据:助力个性化医疗

生命科学已经进入“Omics”时代,生物大数据的特点:高速度、大容量、多样性。生物大数据的形式:百花齐放。建立人群特有基因库、理解基础生物学机制和转化研究成果,都迫切需要大数据分析工具和技术的提升。

1、大数据给生命科学领域带来的颠覆性效应

A)为公共卫生提供健康趋势的预测

谷歌通过收集的大数据预测禽流感散布,反应速度超越美国疾病控制中心。谷歌公司利用5000万条词条以及美国疾控中心在2003年至2008年间季节性流感传播时期的数据,建立了共4.5亿个不同的数字模型,对流感疫情做出了精准的预测(如下图)。

B)对疾病进行人群及区域的特异性分析

遗传病的易感基因具有人种特异性,即在一种人群中发现的风险基因在另外一个人群中未必也是风险因素。即使同是BRCA1和BRCA2基因,汉族人群在这两个基因上的常见突变位置和变异形式也与欧美人不同。

因此,中国人群遗传病的诊断和治疗是不可以依赖和照搬国外的研究成果的。而根据中国人群的基因型进行特异性、个体化的疾病风险预测、影响评估以及紧急医疗计划都离不开中国人群特有基因库的建立和完善。这正是大数据可以整合各地区、各民族、各类生物数据来长袖善舞的地方。

请看下图,测序价格降低后,各国争相建立自己的基因组资源库。

C)加快生物医药研究成果的转化

遗传病的诊断和预测以及药靶的筛选需要大数据的支撑。复杂疾病诸如糖尿病、心血管病、精神疾病等往往是多基因的“微效”作用和环境因素共同作用的结果。例如,科研人员已经发现2000多种可能导致多发性硬化(multiple sclerosis)的遗传、环境和传染因子;美国的研究者会从美国国立卫生研究院(NIH)的数据库或者其它资源整合患者的各种数据包括遗传记录、患者调查、地理区域以及生活条件等。

对于开篇提到的Foundation Medicine(NASQ:FMI),他们的数据分析结果(基因变异和癌症的机理的关系)是基于一系列的科研报告(peer-reviewed paper),随着科研数据的进一步积累,Foundation Medicine的分析结果也会更加精确。

2、基因大数据行业:风起云涌,群雄混战(GoolgeDNAnexusSeven Bridges Genomics以及BGI

在基因测序的产业链中,数据的分析处理是整个测序产业链中的难点和壁垒,但是和测序仪行业不同(已经形成寡头垄断),目前全球涉及基因大数据的公司成百上千,行业欣欣向荣,但竞争格局激烈,目前正处于群雄混战的阶段。

例如下面提到的Google,DNAnexus,Seven Bridges Genomics以及华大基因,争先加入基因大数据的行业,抢占市场份额。

A) Google基因组:开启基因组云存储服务

下图是Google Cloud提供的服务,包括基因组数据的运算、存储和APP服务。单个人的基因组数据月为100GB,经过谷歌特殊算法的处理后,原本100GB的数据可压缩至1GB,费用从25美元降至25美分,对打开人类基因组存储市场大有裨益。

B) DNAnexus:DNA数据库公司,基因数据管理

DNAnexus致力于打造从原始测序文件导入到结果解读的一步式分析平台。从Google获得1500万美元的C轮融资后,DNAnexus在2015年4月22日又从药名康德获D轮融资1500万美元,将与药名联盟推出全球首个一体化精准医学平台。

C) Seven Bridges Genomics(SBG)提供免费的工具并帮助设计数据分析流程

SBG去年拿下了美国国家癌症中心580万美元的癌症基因组云计算项目。SBG的平台上多采用开源的免费软件,如下图SBG提供的数据分析服务,包括外显子组、全基因组、转录组分析。

D)华大基因BGI Oline:发布基因组数据分析云平台服务

BGI Oline同样为新一代测序项目的管理提供一站式解决方案,让用户可以轻松创建和运行复杂的数据分析流程。BGI的平台上兼容了开源软件之外也融入了华大自己研发的软件。

3、基因大数据的变现问题

基因数据有着非常大的价值,这点已经毋庸置疑,但如何变现一直是基因测序公司需要考虑的问题。23andMe和世界顶级药企Genetech的合作,给很多基因测序公司指明了一条道路。

2015年1月7日,23andMe宣布其获得了世界级药企Genentech的6000万美元投资,用来获得3000名帕金森氏病患者或者他们的一级亲属的全基因组序列信息,Genentech此举是为了挖掘新的药物靶点。下图正反映了结合生物大数据,挖掘疾病分子机制最终可以做到更好的筛查,更好的临床指导以及更好用药的过程。

五、投资策略与建议

本篇行业深度报告重点分析了基因测序行业在癌症和辅助生殖领域的应用,以及基因大数据给生命科学带来的颠覆性效应。

为什么今年基因测序行业,以及精准医疗这个领域会特别火,解释有如下三个:

1基因测序的价格以超摩尔定律下降

2大数据分析工具的出现和进步

3传统医学需要突破

分析师表示:2015年将成为我国精准医疗的元年,基因测序行业是精准医疗的前端,未来该行业一定出现爆发性的增长,按照三个维度推荐测序行业的标的:

1)肿瘤基因测序的先行者:我们首推北陆药业、迪安诊断和达安基因,其中北陆药业可以详见我们四月初的行业深度报告。

2)基因大数据的唯一标的:荣之联。在A股中唯一看准基因大数据的爆发性增长趋势,已经开始布局。

3)其他涉及基因测序的公司:首推丽珠集团,双鹭药业,新开源和中源协和。

其他重点关注的品种还包括:昌红科技,东富龙,仟源医药,紫鑫药业和千山药机。

备注:本文内容来自民生证券分析师所写的行业深度研究报告,不代表生物探索观点。