《癌症早筛KOL100》系列专访
第28期
受访嘉宾:李蔚教授
主要研究方向:设计和应用生物信息学算法来评估肿瘤等疾病发生发展过程中的全局调控机制,在大规模基因组数据及表观遗传学数据分析方面有着坚实的基础。参与完成人类基因组计划,主导完成了中国第一个微生物基因组计划等重大项目。所开发的BSMAP、RSeqQC等算法,目前已成为Bisulfite-seq、RNA-seq数据分析等多个生信领域的标准算法。现已在高影响因子期刊上发表超过180篇论文,其中23篇作为通讯作者发表在Nature、Science、Cell系列刊物(包括子刊),H-index 高达79(发表的论文中有79篇引用超过79次)。
专注肿瘤精准医疗领域的国家高新技术企业——求臻医学,早在创业之前,首席科学家李蔚教授就于2008年开始深耕甲基化领域,做了大量的甲基化大数据研发。并于2014年,在全球首次提出了“甲基化峡谷(canyon)”的概念。在癌症的早期筛查领域,用基础科研驱动癌症早筛技术创新,李蔚教授可谓是十四年磨一剑!
请介绍一下您联合创立求臻医学的初衷和定位?
李蔚教授:参与联合创立求臻医学说起来也是机缘,我跟孙大伟(求臻医学董事长)是中科院校友,跟周启明(求臻医学总裁兼首席技术官)是研究生隔壁宿舍同学。
2004年,我在华大基因和中科院生物物理研究所完成博士学位以后出国,此后一直在国外做基础科学研究。作为科学家,我主要关注基础科研的创新研究。同时我也觉得,如果能够跟一些志同道合的朋友们一起为现在的病人做些事情,也是非常有意思、有意义的。我一直以来都有做企业的想法,但作为科学家,我不大擅长企业运营,刚好大伟和启明邀请我一起创办企业,所以求臻医学的创立是水到渠成的事情。
2017年底,我们共同创立了求臻医学,主要是希望为中国的癌症检测做出一定贡献。大伟、启明、牛北方(求臻医学首席信息官)是行业老兵,在企业运营、实验室管理、生信分析方面有多年的经验,所以从求臻医学创立之初就不用担心业务问题。
而作为首席科学家,我的愿景是能通过基础科学研究,为求臻在未来5-10年开发具有独特创新性的、有自主知识产权的产品或技术解决方案,而不是仅限于研发市面现有的产品,因为现阶段的产品同质化比较严重,不能很好地形成很高的技术壁垒。
求臻医学的产品和服务体系,主要在哪些方向布局?
李蔚教授:求臻医学聚焦中国的实体肿瘤、血液系统肿瘤及早期筛查的NGS市场,产品包括:ChosenOne 599®泛癌种、ChosenOneTM500泛癌种、ChosenLungTM肺癌27基因检测以及结直肠癌、乳腺癌、血液系统肿瘤等九大系统肿瘤的20余项肿瘤检测产品。
在夯实基础后,我们也开始布局产业上游,包括推进IVD产品的开发及III类医疗器械的注册,除了肺癌、肠癌产品即将完成注册申报外,我们还有肿瘤大Panel、甲基化早筛产品准备临床报批。未来我们每年都将有至少一款IVD产品进入临床试验。
求臻医学很早就在肿瘤早筛市场内开始布局,您从什么时候开始关注癌症早筛?
李蔚教授:“癌症早筛”是一个商业用语,是基于市场需求的一种表述方式。十年前没有人提癌症早筛,因为那时可能还没有这个市场或者概念。刚提到我主要专注于基础科学研究,之所以跟癌症早筛产生关系,是因为早在2008年,我在贝勒实验室就申请到了美国NIH的表观基因组学路线图计划(Roadmap Epigenomics Project)。
作为该计划的生物信息分析团队重要成员,从那时开始,我就做了大量的甲基化大数据研发。当然,在那时候我并没有想到甲基化会对癌症早筛有帮助,而是完全基于对基础研究的兴趣去做甲基化大数据研发。
在这里我也想强调一下基础科学研究的重要性,如果只是根据市场需求来做研究的话,就很难出现突破性的技术。在基因编辑和免疫治疗兴起之后,美国的科学界更加大力提倡要花钱做基础科研。这是因为基因编辑和免疫治疗这两个对人类健康产生重要影响的技术是过去15-20年科学家基于基础研究得到的结果。所以,如果没有基础研究,再过5-10年也没有新的突破性技术来造福病人。
我们实验室涉足早筛也正是反映了这一点,我们从2008年开始做技术储备,那时候跟早筛市场是没有多大关系的。希望我们多年的技术储备能够应用于今天的早筛市场。众所周知,癌症早筛市场的潜力非常大,但是国内外市场上都还没有出现非常完善的产品,各公司都有自己的机会,因为市场足够大。我觉得未来在中国或者美国,都会出现一些癌症早筛市场的巨头。
您觉得目前癌症早筛存在哪些挑战?有哪些技术路线?一款好的癌症早筛产品应该具备哪些特征?
李蔚教授:技术上需要突破的地方还有很多,比如,如何将cfDNA更加精准地转化为可提取的数据。虽然现在有各种各样的技术方案,但是并没有一个完美的、能够“秒杀”同行的方案,每个公司的方案都有自己的特点。目前市面上的早筛产品,对早期癌症的检测的精度还远远不够。另外,得到病人的大数据以后,如何能够把其中的信息提取出来,这也是非常重要的一环,也是我们实验室十四年来潜心做技术储备时想要得到的答案。
我们现在主要专注于将甲基化技术应用于癌症早筛,这几乎是所有大企业形成的一个关于技术路线的共识。比如GRAIL在几年前花费大量资金去尝试somatic mutation、甲基化、CNV等不同的技术路线,最终还是决定选择all-in甲基化的技术路线。他们泛癌种的产品也完全是从甲基化技术路线出发。目前美国唯一获批的产品Cologuard,也是通过检测粪便DNA甲基化来实现结直肠癌的早期发现。除了甲基化以外,还有外泌体、突变、copy number、免疫细胞异常变化等不同技术路线,但个人更看好甲基化。
关于早筛产品应该具备什么特征有着不同的考量标准。美国特别看重产品的阳性预测值(PPV),这是FDA批准或保险公司纳入报销时考虑的重要指标。中国的早筛产品主要是患者自费,但是美国的早筛产品费用主要由保险公司报销,所以一款好的早筛产品需要满足保险公司对投入产出比的期望值。同时,产品的其他指标如灵敏度和特异性也很重要。
您在Nature、Cell等期刊发表文章180余篇,并基于大数据分析在全球首次提出了“甲基化峡谷(canyon)”概念并用于肿瘤早筛,成为生物信息学推动生物学发展的典范,请您简单介绍下相关成果。
李蔚教授:我们实验室早在2014年就发表了一篇《自然·遗传学》(Nature Genetics)文章,提出了“甲基化峡谷(canyon)”这个概念。“甲基化峡谷(canyon)”跟传统的启动子或增强子基因都没有关系,它在正常细胞的甲基化水平特别低,低于10%。“甲基化峡谷(canyon)”在人的各种正常组织中都是高度保守的,跟组织生理没有太大关联。很多保守基因特别是与发育相关的基因都存在甲基化峡谷修饰。
后来,我们发表在《基因组生物学》(Genome Biology)的文章发现,在癌症里面一些大峡谷区域通常都变得高度甲基化(hypermethylation),而且这种变化是pan-cancer的,跟癌症类型没有多大关系。
有意思的是,虽然大家普遍认为甲基化水平与基因表达相关,但是没有直接证据可以证明甲基化能调控基因的表达。我们设计了一套巧妙的系统,人为的定点改变甲基化峡谷修饰模式,发现受甲基化峡谷修饰的原癌基因表达显著上调,而之前传统的启动子区CpG岛的甲基化水平改变并未影响该基因的表达。这是首个直接的证据,能证明甲基化峡谷模式改变能直接上调原癌基因表达。
最近又有领域内的同仁进一步丰富了甲基化峡谷修饰的精细机制,并且把这个重要成果发表在《科学》(Science)上,这些都说明甲基化峡谷修饰是一种理想的肿瘤早期检测靶标。
在癌症早筛方面,为何求臻医学选择从泛癌早筛产品切入,而非单癌?
李蔚教授:这个跟我们的基础研究直接相关,刚才也提到,在癌症里面这些大峡谷区域通常都变得高度甲基化(hypermethylation),而且这种变化是pan-cancer的,跟癌症类型没有多大关系。所以,从这个角度出发,我们觉得适合做一个pan-cancer的产品。而且,现在把癌症按照分子分型来进行分类而非按组织分类是个流行的趋势,同时,泛癌种早筛产品更符合未来市场需求。
基于“甲基化峡谷”检测去做泛癌早筛产品,相比传统的以CpG岛作为特定的检测靶点的甲基化检测方法有什么优势?
李蔚教授:CpG岛相对较短,只有大峡谷的十分之一左右。不同于cpG岛甲基化,甲基化峡谷修饰是一段通常大于3.5 kb,个别甚至大于20 kb的低甲基化区域。检测的片段长度越长、信号越强,结果就会更加稳定可靠。大峡谷甲基化水平在正常组织都非常低,但是在癌症组织中却非常高,这个巨大的变化会让癌症信号的发现变得更加容易。
总而言之,大峡谷有三个优势:1.在正常组织中很低,在癌症组织中很高,因此容易检测得到;2.检测的目标范围宽,信号更强,检测结果更加准确;3.是一种泛癌种检测指标,非常cost-effective。我们此前发的文章是基于美国病人的组织样本数据做的分析,求臻医学正在实现基于中国人群的由组织活检向液体活检技术平台的转化。
液体活检的应用热点除了癌症早筛,还有复发早检,如MRD领域发展迅速,早于影像学提示复发风险,求臻医学在这方面有何布局?
李蔚教授:实体瘤患者在根治性治疗后体内若残存微小病灶,即molecular minimal residual disease(MRD),可能会导致肿瘤的复发,从而产生不良预后。现在通过ctDNA检测MRD已经成为当前的热点。
求臻医学的MRD检测产品ChosenOne—MRD,采用全基因组测序与超高深度靶向测序双引擎开发模式。全基因组测序的优势是建库的复杂度低,减少了引入人为突变的概率;并且增加了测序的广度,联合检测微小结构变异,可以极大提升检出概率从而降低检测下限。
而超高深度靶向测序结合了自主UMI分子标签、链间矫正及AI主动降噪技术等黑科技,抑制了PCR随机错误及测序系统错误的发生概率,提升了信噪比,使微小残留无处遁形。我们可以稳定检出MAF低至2‱的突变,符合共识要求,相关产品将在不久的将来与大家见面。
您曾参与人类基因组计划,在求臻医学也主导了《中国肿瘤基因图谱计划》(简称“CGAC计划”),见证并引领了行业的发展。能否分享一下,您所看到的行业发展的趋势和您对行业未来的展望?
李蔚教授:当我还是学生身份,以及后来我在华大基因任职的时候(1999-2003年期间),华大基因的定位还是科研服务,公司的客户数量和经济效益都很有限。但后来基因检测直接面向消费市场时,整个行业就发生了翻天覆地的变化。未来,消费基因组学(consumer genomics)将是一个拥有巨大潜力的产业,相当于20年前的google所在的IT行业。
在美国,有大量的初创企业的创始人都是来自于基因组学、疾病诊断等领域。目前大家普遍认为,基因组学的数据就是具有巨大价值的财富。像美国的23andme和Ancestry.com积累了大量的人类基因数据,这些数据本身就是非常大的财富,他们可以跟药企合作进行药物研发,这也是我们研究小组重点研究的方向之一。
未来我们将基于大人群的基因组、表观基因组、转录组大数据找到更多与疾病相关的致病基因和biomarker,然后与传统实验室合作,在动物模型上验证新的基因与疾病的作用关系。基因组学对生命科学研究是具有开创性和颠覆性的,因为传统生物学的研究模式是先在酵母、小鼠、细胞系等模型上进行,然后在病人身上进行临床试验;而传统的转化医学研究是discovery in animal, test in patient;有了基因组学的研究方法以后,研究模式转变为“reverse-translational research”,即先通过基因组学在大人群上找致病位点和biomarker,找到以后再回到动物上做test,经过动物验证以后再回归到病人,以此实现一个研究的大闭环。
在商业的角度看,基因组学数据就是财富,将来会有很多公司基于这些数据实现可观的营收。对于消费者来讲,疾病的早筛早查早诊,都得益于基因组学研究取得的进展。从基础研究、商业发展和消费者健康获益三方面,基因组学都起到了巨大的推动作用。
当市场的热情被技术和前景点燃之后,整个行业需要考虑如何培育适当的商业生态。例如,中国拥有更多的人口和临床资源,我们应该和中国医院合作进行大样本的研究和应用,加快肿瘤基因检测领域标准及规范的制定。
《中国肿瘤基因图谱计划》是由国家人类遗传资源中心牵头的,求臻医学作为唯一企业单位参与其中的前瞻性项目,项目以合作研究的形式,在全国约70家医院开展,相信随着CGAC项目的实施,项目中前瞻性的数据可以帮助临床专家及行业人士制定行业标准、指导临床实践,发表高水平文章,抢占肿瘤基因大数据学术制高点,切实帮助解决尚未满足的临床需求,最终推动中国肿瘤基因检测领域相关行业标准及规范的制定!
自成立以来,求臻医学始终将创新驱动放于首要位置,基于多年的的基础研究和实践积累,目前已在甲基化检测技术方面拥有深厚根基,我们将利用求臻医学国际领先技术优势不断开发出更优质的、具有差异化的肿瘤早期筛查与诊断产品和服务,提供肿瘤精准诊断的全流程解决方案,为更多肿瘤患者带来福音。
求臻医学是专注肿瘤精准医疗领域的国家高新技术企业,以新一代基因测序和先进信息挖掘技术为基础,依托《中国肿瘤基因图谱计划》和《肿瘤精准医学大数据平台》项目,深度融合基因检测和人工智能,致力于肿瘤液态活检领域诊断产品的开发及智能迭代升级,业务涵盖肿瘤早筛、伴随诊断、动态监测、预后评估等多场景应用领域;同时不断探索发现中国人肿瘤基线及特异的生物标志物,助力抗肿瘤药物的研发。求臻医学成立伊始,便快速布局产业链上下游,积极引入海内外顶尖科学家团队,持续加大在研发科研领域的投入,目前已拥有55项专利、62项基于大Panel的生信软件著作权等科技成果。
关于《癌症早筛KOL100》
《癌症早筛 KOL 100》访谈栏目由早筛网、基因谷、医世象联合出品、全网发布,本栏目旨在邀请国内外肿瘤领域的专家和企业领军人物从“产、学、研、医”的不同角度,分析癌症早筛的技术路径、临床转化和产业发展面临的机遇和挑战,为行业前行和百姓福祉指明方向。如果您(个人/机构)希望在《癌症早筛 KOL 100》访谈栏目分享精彩内容,请与我们联系:
早筛网 陈老师 13425578893
基因谷 张老师 15821074273
医世象 王老师 18701871600