Next-Gen BioInformatics工具可以在没有编程专业知识的情况下实现大数据分析
Drbioright使用自然语言界面来促进更广泛的研究界的直观数据分析乐动体育LDsports中国
MD安德森新闻发布于2020年9月24日
研究人员开发的新数据分析工具乐动体育LDsports中国德克萨斯州大学安德森癌症中心包含一个用户友好的自然语言界面,允许生物医学研究人员在没有生物信息学或编程语言中的专业知识,以对大型数据集进行直观分析。乐动体育LDsports中国
开放访问,人工智能(AI)-Drivend程序,称为Drbioright,为所有研究人员提供了较低的障碍,以充分利用现代研究方法中越来越大量的数据。乐动体育LDsports中国本平台的一份报告今天发布癌细胞。
“我们觉得我们可以通过创建任何研究人员可以使用的工具来改善进行常规生物信息学分析的当前模型,并大大加快周转时间,”乐动体育LDsports中国汉亮,博士。,教授生物信息学与计算生物学。“我们的Drbioright的长期目标是每个研究人员都是一个聪明的合作者。”乐动体育LDsports中国
现代生物医学研究中使用的高通量技术产生了大型复杂的数据集,提供有关患者,动物模型或正在研究的细胞系的全面信息。乐动体育LDsports中国这些可以包括,例如,研究整个遗传信息(基因组学),基因表达(转录组织)或蛋白质表达(蛋白质组学)。
因为这些“omics”数据集是如此复杂,所以在没有专门的分析方法的情况下回答特定的生物学问题可能具有挑战性。这些分析通常使用以各种编程语言编写的计算机脚本来完成,这需要一些了解编程和生物信息学。
生物信息管理员可以帮助导航和处理这些复杂的数据集,但工作可能是耗时的。因此,研究小组开发了DRBio乐动体育LDsports中国right,使研究人员能够通过具有自然语言交互的用户友好的聊天界面更轻松地进行他们自己的数据的例行分析。
以自然语言为导向的计划允许用户提出该计划的问题,仿佛自然地讲,而不是复杂的编程语言,解释了。
Drbioright自由地向学术研究人员提供。乐动体育LDsports中国最初,该程序有许多模块现成的制备,以处理最常见的生物信息学问题,包括可用的一些最常用的公共癌症数据集,例如癌症基因组地图集和癌细胞系百科全书。
作为对方法的确认,研究人员使用DRBioright复制了经典癌症基因组学纸的分乐动体育LDsports中国析,并发现它可以准确地再现先前公布的结果。
由于该程序由AI驱动,因此它还能够从每个查询和改进分析中学习,随着时间的推移成为一个更有用的工具。前进,研究人员希望能够提高DRBior乐动体育LDsports中国ight,使用户能够分析自己的数据集,并允许新模块开发开发。
“随着我们努力改进计划,我们还希望能够使其他生物信息管理员能够贡献他们的算法并教导DRBioright,”梁说。“从整个研究界的参与将有助于创建一个有助于回答复杂的研究问乐动体育LDsports中国题的工具更有效。”
该研究得到乐动体育LDsports中国了国家卫生研究院(U24CA209851,U01CA217842,P50CA221703和P30CA016672)的支持,MD Anderson教师学者奖梁和洛林戴尔生物信息学用于个性化癌症医学计划。
额外的合作者包括:Jun Li,Ph.D.,Hu Chen,Yumeng Wang,Ph.D.和梅菊可能陈,博士,所有生物信息学和计算生物学。H.陈和Y.王也是贝勒医学院的定量和计算生物学院成员,ZX。全文可以找到作者披露的完整列表这里。