在癌症早期,来自于肿瘤细胞的DNA占血液中细胞游离DNA(cfDNA)的比例很低,在位点平均甲基化率指标中很容易被噪音所淹没。
借助大型预训练深度神经网络,DeepTrace从单分子分辨率识别来自肿瘤的ctDNA,精准判断每个DNA分子来源于癌细胞的可能性。
在采用同一数据集进行训练的结果中,DeepTrace大型预训练神经网络表现出优异的性能,不仅远超传统机器学习模型,还表现出优于GRU、LSTM等神经网络的预测表现。
此外,得益于预训练神经网络架构的优越性,在进行新癌种、泛癌种项目开发时,只需使用具体应用数据对预训练模型进行Fine-tune训练,而无需对完整大模型进行重复训练,可节省超过90%的算力开销。
为此,竹石生物DeepTrace从模型设计之初就考虑到未来精简Marker体系的需求,在架构的各个环节设置了可视化节点。随着实验数据的增加,模型可以将所学习到的不同Marker间权重大小、相互关联等信息通过可视化指标进行反馈,竹石生物正在以此为依据精简Marker,进行IVD产品的开发。
关于竹石生物 /Profile/
竹石生物科技(苏州)有限公司是一家由生物计算驱动,专注疾病诊断与治疗的生物科技企业。当前正致力将领先组学技术与先进AI技术相结合,聚焦于肿瘤早期检测技术的研发和临床应用。