基于cfDNA的癌症早检大家已经喊了好几年了,性能上大家基本心里有了一杆尺子,毕竟都是在地球上做技术,前沿的水准心中多少有点数。而且大家似乎有了一个共识,cfDNA甲基化是癌症早检第一标志物。
所以当G司自爆要在WCLC上展示其I期肺癌早检灵敏度100%的cfDNA片段化分析技术时,有个朋友的评论就很有代表性了:
MIA(微浸润)外部验证集敏感性100%,这是Grail看了要沉默Thrive看了要流泪
本着“公众号宣传都是王婆卖瓜”的底层逻辑,我特地去找了原文(WCLC,MA07.07的附件),欢迎收看本期走近科学。
这是cfDNA片段化的封神之战吗?
cfDNA片段化的前辈们
片段化、甲基化、突变,究竟怎么理解?
免责声明:本文基于作者高中生物学知识完成,如有不满,请直接到倒数第二段去看段子
01
cfDNA片段化一战封神?
首先,这个结果真的挺不错,甚至可以说相当不错:MIA验证集敏感性100%,IB期验证集敏感性100%,<1cm的验证集敏感性也有近93%,同时这么高的敏感性下还有90%的特异性,真的很难不让人“哇塞,牛逼”一下。
但在看的过程中我是有疑问的,这么好看的数据,怎么不公布各个亚组的人数呢?难道这里面隐藏了什么惊天秘密?毕竟如果某个亚组只有1人,就算抛硬币也有50%的概率实现100%敏感性
所以我简单的推算了下各组的人数,下面这张图看着是不是清晰多了?(这并不难做到,只需要在一点点数学知识、医学知识和足够的耐心)
果然,在外部验证集上100%敏感性的两个亚组(MIA和IB期)的入组人数都挺少的,考虑到在内部验证集中MIA的灵敏度,运气这一次站在了算法这边。
但,这不能掩盖这个结果的亮眼,能在I期肺癌做出92.5%/90%的敏感性/特异性,无论如何都值得称赞。
所以,cfDNA片段化一战封神?
我倒更愿意称DECIPHER-Lung(我也不知道这名字是什么的缩写,玩早检的都是起名鬼才)为“成功的复现”,因为cfDNA片段化并不是新东西,这样的优异表现也不是第一次出现。
DECIPHER-Lung的前面,站着DELFI——cfDNA片段化癌症早检的先驱。
02
cfDNA片段化的早检之路
把时钟拨回2019年,Nature发表了来自约翰·霍普金斯大学基梅尔癌症中心的一篇重要研究《Genome-wide cell-free DNA fragmentation in patients with cancer》,第一次把cfDNA片段化在癌症早检中的应用带到世人眼前。感受下当时的数据,肺癌敏感性是100%。
但当时这个研究更多的是我们发现了“癌症患者cfDNA片段化和正常人不一样”,但这个规律是真的存在,抑或仅仅是个巧合?
时间前进到2020年2月,AJHG在线发表了香港中文大学卢煜明教授团队的研究《The Biology of Cell-free DNA Fragmentation and the Roles of DNASE1,DNASE1L3, and DFFB》,第一次定义了完整的细胞DNA如何被剪切成血液中的循环小片段的机制。
同年5月,卢煜明教授团队进一步在Cancer Discovery上发表研究《Plasma DNA End-MotifProfiling as a Fragmentomic Marker in Cancer, Pregnancy, and Transplantation》,提示在癌症患者中cfDNA片段化确实存在“某种特点”并具备组织溯源能力。
而就在一个月前的2021年8月,约翰·霍普金斯大学基梅尔癌症中心在Nature Communications上发表重要研究《Detection andcharacterization of lung cancer using cell-free DNA fragmentomes》,将2019年的DELFI进行了升级,并就肺癌单病种的早检性能进行了评估。
单看这次结果,如果同样放在肺腺癌这个病种,DELFI的I期敏感性依然保持了100%,当然样本量也不大:8个。
如果跟这次的DECIPHER-Lung相比,DELFI在更低的测序深度(同样是WGS,DELFI平均1-2x,而DECIPHER-Lung是5x)下,做到了更好的敏感性,但特异性差一些(DELFI约为80%,而DECIPHER-Lung为90%),基本可以认为二者应该处在同一水平梯队。
虽然很可惜G司这一次的研究不是“史无前例”的,但却也抛出了一个新问题:
如果隔着太平洋都能复现如此优异的性能,是不是意味着cfDNA片段化即将取代cfDNA甲基化成为新的当红炸子鸡?
在回答这个问题之前,我们先讲个段子。
03
法外狂徒张三的甲基化、片段化和突变
8个中国人,1个英国人,1个美国人在聚会,要求找出中间哪一个是美国人,哪一个是英国人。有两种方法:1. 一个一个询问,先找出美国人,再找出英国人。2. 先找出两个外国人,再从他们中间区分英美。
现在的泛癌种早检本质上都是第二种逻辑:第一层算法用来识别是不是癌症。第二层算法用来识别来源于哪个器官,这两个算法是相对独立的。
最近老是刷到罗翔老师的陈年视频,今天的故事就和法外狂徒张三有关
张三越狱了,走之前他对室友说:我要去干一票大的。
他去买了一套开锁工具,一个口罩,一件套头衫,大摇大摆的来到了115号小区3号楼小美家,在打开门后,张三进去一顿翻找,最后从衣柜的最里层找到了一个小的保险箱,虽然暂时打不开但是能装在保险箱里的应该是个值钱物件,于是张三抱着保险箱离开了。
问:小美怎么知道家里失窃了?
1. 小美在办公室查看电子猫眼时,发现曾经有一个穿着套头衫戴着口罩的人长时间停留在自己门口——这是甲基化
2. 小美下班回到家,一推开门,发现家里被翻的乱七八糟的——这是片段化
3. 小美赶紧跑进卧室打开衣柜,发现保险箱不见了——这是突变
“110吗?我家里进贼了!”
警察的效率很高,1天之后张三就被抓住了,人赃俱获。
问:警察蜀黍怎么知道是张三?
1. 张三啊张三,你咋每次犯事儿都是这副打扮呢?口罩上印个玛卡巴卡是怕别人不知道你吗?——这是甲基化溯源
2. 张三啊张三,你咋每次盗窃翻东西都是这个样子呢?你看,袜子扔在厨房门把手上,除了你还有谁这么天才?——这是片段化溯源
3. 他娘的有几百人都喜欢偷保险箱啊,是谁干的?——这是突变,无法溯源
如果把小美的房子理解为人体,张三理解为发生癌变的器官,这个例子就更容易理解了。
甲基化更像是因:因为甲基化异常,导致了细胞变成了癌细胞
片段化更像是果:因为细胞变成了癌细胞,导致核酸酶异常,从而使片段化出现异常。
但,因果真的能做取舍吗?
04
只能选择一个吗?
从张三的例子中可以看到,片段化、甲基化、突变是发生在不同时间的不同表现,三者性能优劣先不谈,但所以为什么要做单选题呢?
关于这一点,约翰·霍普金斯大学基梅尔癌症中心的那两篇文章也给了我们一些提示,比如在2019年的Nature中,如果把片段化加上突变,可以将灵敏度提升到91%(7癌种、98%特异性)
而在2020年的NatureCommunications中,如果把片段化加上CEA、年龄、吸烟史等升级为DELFI-multi,可大幅弥补DELFI在II期的拉胯。
听说DECIPHER-Lung这个队列其实也不止cfDNA片段化,还包括了甲基化水平、CNA等(真妙啊,1篇文章变4篇,我要是也学会了这招,就不用天天鸽了)。
未来的竞争可能会更多的考验各位玩家能否在多组学的情况下充分实现组学间的取长补短并控制成本,毕竟随着《深化医疗服务价格改革试点方案》的发布和可以预见的未来全面铺开,竞争那10%市场调节价的项目名额就要靠“谁覆盖的癌种多”(比别人需要更少的名额)和“谁成本控制的更好了”(2年后转为通用/复杂医疗服务项目,降价势在必行)。
早检,终究绕不开一个size driven呐