新的计算工具可靠地从单细胞rna测序数据区分癌症和正常细胞

CopyKAT使研究人员在分析实乐动体育LDsports中国体肿瘤样本时获得新的见解

德克萨斯大学的研究人员在分析大型单细胞rna测序数据集时,试图解决一个重大挑战乐动体育LDsports中国MD安德森癌症中心开发了一种新的计算技术,以准确区分来自癌细胞的数据和在肿瘤样本中发现的各种正常细胞。这本书今天出版于自然生物技术

这种被称为CopyKAT(非整倍体肿瘤拷贝数核型)的新工具,使研究人员能够更容易地检查从大型单细胞rna测序实验中获得的复杂数据,该实验提供了数千个单个细胞的基因表达乐动体育LDsports中国数据。

CopyKAT利用基因表达数据来寻找非整倍体,或染色体数目异常的存在,这在大多数癌症中是常见的,该研究的资深作者说尼古拉斯·纳文博士。,副教授遗传学生物信息学与计算生物学.该工具还有助于识别癌细胞内不同的亚群或克隆。

“我们开发了CopyKAT作为从转录组数据中推断遗传信息的工具。通过将该工具应用于多个数据集,我们表明,我们可以以约99%的准确率明确识别混合肿瘤样本中的肿瘤细胞与其他免疫或间质细胞。”“然后,我们可以进一步发现亚克隆的存在,并了解它们的基因差异。”

历史上,肿瘤被研究为所有细胞的混合物,其中许多不是癌变的。近年来,单细胞RNA测序技术的出现使研究人员能够以更大的分辨率分析肿瘤,通过检查每个单个细胞的基因表达,绘制出包括周围微环境在内的肿瘤景观乐动体育LDsports中国图像。

然而,如果没有可靠的计算方法,很难区分癌细胞和正常细胞,Navin解释说。前博士后Ruli高博士。,现任休斯顿卫理公会研究所的心血管科学乐动体育LDsports中国,开发了CopyKAT算法,该算法通过提高准确性和调整最新一代单细胞rna测序数据来改进旧技术。

该团队首先通过将结果与全基因组测序数据进行比较来对其工具进行基准测试,结果显示在预测拷贝数变化方面具有很高的准确性。在三个额外的数据集胰腺癌,三阴乳腺癌和未分化甲状腺癌,研究人员发乐动体育LDsports中国现,在混合样本中,CopyKAT可以准确地区分肿瘤细胞和正常细胞。

这些分析是通过与赖耀光,医学博士,博士教授头颈外科,以及史黛西腐朽。教授乳房肿瘤内科,乳腺癌月球照片®他是MD安德森公司的一部分载人登月计划®这项合作旨在将科学发现迅速发展为有意义的临床进步,挽救患者的生命。在分析这些样本时,研究人员还表明,该工具可以根据拷贝数差异有效地乐动体育LDsports中国识别肿瘤内的癌细胞亚群,三阴性乳腺癌实验证实了这一点。

“通过使用CopyKAT,我们能够识别三阴性乳腺癌中罕见的亚群,这些亚群具有独特的、没有被广泛报道的基因改变,包括那些具有潜在治疗意义的基因改变,”Gao说。“我们希望这个工具将有助于研究界充分利用他们的单细胞rna测序数据,并推动癌症方面乐动体育LDsports中国的新发现。”

研究人员可以免费使用该工具乐动体育LDsports中国在这里.作者指出,该工具并不适用于所有癌症类型的研究。例如,非整倍体在小儿癌症和血液癌中相对罕见。

该研究得到了美国癌症协会、美国国立卫生研究院/美国国立癌症研究所(RO1CA240526, RO1CA236864, CA016672)、德克萨斯州癌症预防与研究所(CPRIT)单细胞基因组学核心设施资助(RP180684)、乐动体育LDsports中国美国科学促进会(AAAS) Martin and Rose Wachtel癌症研究奖、Andrew Sabin家庭奖学金、Jack and Beverly Randall癌症研究卓越奖、S乐动体育LDsports中国usan G. Komen、间变性甲状腺癌Petrick研究基金和MD Anderson研究计划赠款。

MD安德森的其他合作者包括:遗传和泌尿生殖医学肿瘤学的白珊珊;Ying C. Henderson, m.d., Ph.D, Jennifer Rui Wang, m.d., Head and Neck Surgery;Yiyun Lin, Aislyn Schalck, Yun Yan, Tapsi Kumar和Alexander Davis博士,所有遗传学和uthehealth生物医学科学研究生院;胡敏和Emi Sei博士,都是遗传学博士;王芳博士和陈肯博士(生物信息学和计算生物学);Simona F. Shaitelman,放射肿瘤学医学博士。作者声明没有相互竞争的利益。