当美国总统巴拉克·奥巴马(Barack Obama)呼吁一项10亿美元的国家登月计划(National Moon Shot Initiative),以加快癌症研究,“让美国成为一个彻底治愈癌症的国家”时,他乐动体育LDsports中国指望副总统乔·拜登(Joe Biden)来领导这项努力。
拜登的领导能力——毫无疑问是受到他儿子博2015年死于脑癌的鼓舞——包括参加重要的专业癌症研究会议,并成立了副总统的癌症研究特别机会基金。乐动体育LDsports中国该基金鼓励科学家、医生、倡导者、慈善组织以及生物技术和制药行业的代表共同工作,共享数据,以产生新想法和新突破。
这种合作是一个很多美国人都不知道的项目的重要组成部分:癌症基因组图谱(TCGA)。于2005年推出,由美国国家癌症研究所和国家人类基因组研究所乐动体育LDsports中国在美国,TCGA使癌症研究数据公开给研究乐动体育LDsports中国社区,以加速理解这种疾病的分子基础,并提供潜在的新疗法的途径。尽管该计划已进入其存在的最后一年,但它已经成为对癌症科学做出宝贵贡献的关键,并为通过新的合作计划进一步探索奠定了基础。MD Anderson通过领导和参与TCGA相关研究,从TCGA的形成到现在,在TCGA中发挥了不可或缺的作用。
Data from the Cancer Genome Atlas and other studies “has clarified that cancer is a disease of the genome,” wrote Douglas Lowy, M.D., acting director of the National Cancer Institute (NCI), and Francis Collins, M.D., Ph.D., director of the美国国立卫生研究院(NIH)在新英格兰医学杂志的2016年5月19日,发行。“它已成为越来越明显的是,知道什么是驱动突变存在于特定肿瘤常常比知道它产生了能够器官系统更重要。基因组技术也表明,虽然每个肿瘤分子独特的,某些途径反复受到影响 - 这已经通知设计和使用的新一代药物靶向这些途径的调查结果“。
“什么,每天激励我是认为在这些数据集中的地方回答如何改善患者的预后可能被埋没,” Roeland Verhaak博士说:‘这是什么它是所有关于到底。’
数据海啸
TCGA的起源,在某种程度上,可以追溯到约翰·韦恩斯坦,医学博士,美国医学博士生物信息学和计算生物学MD安德森。但这几乎没有发生。
它于1991年开始回来时,温斯坦,谁当时在NCI工作,正打算休一天假。这时他想起他的老板在大查房当天讲话。上班是一个偶然的决定,这将导致温斯坦的追求,最终将影响TCGA创建重要数据相关的项目的发展。
温斯坦说:“在他的演讲中,我有了一个想法,促使我的实验室小组率先对NCI-60进行了全面的分子图谱分析。NCI使用60种人类癌细胞系来筛选超过100,000种化合物以及天然产物的抗癌活性。”
他把由这些早期的努力产生的数据超新星爆炸称为“数据海啸”,并把TCGA比作“由病人样本组成的12000平方棋盘”。
“它为我们提供了在其中一个方面制定出基因组游戏规则,并生成有用的,潜在的显著成果,造福癌症患者和他们的家庭,”他说。
这些结果可以为研究人员提供一个新的视角来观察肿瘤是如乐动体育LDsports中国何发展的,并指出新的治疗方法。韦恩斯坦经常被称为“后基因组生物学的先驱”,部分原因是他的另一项发明:密集热图。这些地图让研究人员能够将海量数据中乐动体育LDsports中国的模式可视化,并更快地利用它们。集群热图出现在成千上万的出版物中,而韦恩斯坦的小组现在已经开发出“下一代集群热图(NG-CHMs)”,它可以像谷歌地图一样被放大和导航。NG-CHMs通常用于TCGA中许多不同类型癌症的数据。
如今,TCGA正在研究30多种不同癌症的基因组变化,根据生物信息学和计算生物学助理教授Rehan Akbani博士的说法,MD Anderson是“TCGA每一个疾病工作组的重量级成员和令人自豪的参与者”。
“在MD安德森基因组数据分析中心(GDAC)已成为反相蛋白质阵列的首映提供商(RPPA)为基础的TCGA蛋白质组学数据和分析,以及一批影响分析和数据质量控制,” Akbani说。
批量效果与不同的计算机系统,实验室程序和数据收集方法聚合来自多个机构的数据时发生的由于技术文物的发现和成果。MD安德森与评估批次特效工作,帮助确保全球范围内通过TCGA正在研究的研究机构的数据是准确的,一致的。乐动体育LDsports中国RPPAs涉及同时在数千个样品进行蛋白测定法,允许蛋白表达的测量,以及蛋白质修饰如磷酸化,这开启蛋白酶和关闭。
“TCGA的真正价值可能要到几年以后才能被认识到,”Rehan Akbani博士说,“就像John Weinstein雄辩地说的那样,‘挖掘所有这些信息是一代人的工作,尽管这个项目已经结束,但它真的只是一个开始。’”
找到了宝藏
通过大量的数据筛选经常被称为“挖掘”,而科学家们是寻宝者在寻找有价值的掘金,这将导致更好地了解癌症的分子运作的。
MD安德森调查人员在挖掘TCGA数据,并与多个合作伙伴在癌症研究机构的全球合作有显著的成功,作出了关于癌细胞的分子细微差别的重要发现。乐动体育LDsports中国
“MD安德森的研究人员不仅乐动体育LDsports中国已经在领导水平的癌症基因组图谱贡献,帮助确保它的成功,但我们也有参与,并担任已开辟了癌症诊断和新的可能性铅研究者基于TCGA-研究治疗,”说安德森博士的主席罗纳德·德平厚博士“我为这个开创性项目所付出的努力感到骄傲,我知道在未来的许多年里,我们将继续从这些数据中获益。”
大约两个侵袭性癌症启示
生物信息学和计算生物学副教授Roeland Verhaak博士领导了基于TCGA数据的研究调查,揭示了两种侵袭性癌症的惊人发现。乐动体育LDsports中国
今年早些时候,Verhaak公布的一项研究由圣保罗里贝朗普雷图医学院及哥伦比亚大学大学共同领导,暴露了弥散性神经胶质瘤,这是在一些成人脑癌患者中发现新信息的发现。
通过分析TCGA数据,该团队从患者样本中定义了一套完整的神经胶质瘤相关基因,并使用分子图谱来改进疾病分类。他们能够识别分子相关性,并为疾病从低级到高级的进展提供见解。
另一项由密歇根大学的Verhaak和他的同事领导的研究,揭示了关于肾上腺皮质癌(ACC)的重要新发现,这是一种罕见的癌症,通常与不良预后有关。
研究人员乐动体育LDsports中国 - 包括来自39个国际机构 - 来自四大洲91检查ACC肿瘤标本和观察到的“大规模” DNA损失,随后通过全基因组倍增(WGD)。WGD当肿瘤细胞获得他们的整个基因组的额外副本时。研究人员乐动体育LDsports中国发现,WGD与侵略性临床过程相关,这表明它可能是疾病进展的一个标志。他们推测肿瘤的生长速度可以减慢,如果他们能在今后的临床前研究禁止WGD。
在TCGA于2017年初结束后,通过NCI癌症基因组学中心(CCG)运行的新的NCI基因组计划将继续在TCGA的成功基础上,使用相同的合作模式进行大规模基因组分析,并将基因组学数据公开。
RNA编辑和性别对癌症的影响
生物信息学与计算生物学副教授韩亮博士也利用TCGA数据进行研究。乐动体育LDsports中国
一项研究,其中评估6226克的样品从患者的17种不同癌症类型,揭示了有关RNA编辑的事件在肿瘤与正常组织的新信息,并提供了证据,
RNA编辑可能选择性地影响药物的敏感性。
这项研究发现为理解为什么有些人活得更久或对治疗反应更好的生物学原因开辟了另一条途径。
梁领导的另一项与tcga相关的研究指出了之前未知的性别和癌症之间的差异。梁回顾了13种癌症类型,并提供了一个关于一个人的性别如何影响各种癌症的新的分子理解。研究揭示乐动体育LDsports中国了两个问题
癌症类型与癌症发病率和死亡率有关,这表明“迫切需要”为某些癌症制定针对性别的治疗策略。
梁说:“这是一个至关重要的发现,因为患有多种癌症的男性和女性患者通常以相似的方式接受治疗,而没有明确考虑他们的性别。”
为未来的发现奠定了基础
比如TCGA和新的国家探月计划,MD安德森的登月计划强调合作。
“MD Anderson的GDAC和TCGA社区作为一个整体,是MD Anderson探月计划丰富的数据、分析工具和专业知识的来源,”Weinstein说。
“MD安德森调查谁是GDAC的成员也参与研究的几乎所有的MD安德森的登月计划。”乐动体育LDsports中国
梁认为直接的联系,在他调查的登月,这是产生新的洞察意想不到的类型是癌症形成新的驱动程序。
他解释说:“有了这些知识,月球拍摄可以集中在这些驾驶事件上,并评估它们如何在临床环境中用于造福更大的患者群体。”
梁认为,TCGA还“为国家探月计划奠定了坚实的基础”,而国家探月计划仍处于形成阶段。
“从某种意义上说,TCGA将不同类型癌症的分子驱动因素进行了分类,”他说。但是,使用这些司机指导病人护理的最佳方式仍不清楚。各机构需要通力合作
通过整合TCGA确定进入临床试验的关键因素“。
癌症基因组图谱词汇
基因组生物体内的完整的DNA(遗传物质)。
几乎人体的每个细胞都包含一个完整的基因组副本。基因组包含了一个人发展和成长所需要的所有信息。研究基因组可以帮助研究人员了解不同类型的癌症是如何形成的乐动体育LDsports中国
应对处理。这可能会导致新的方法来诊断,治疗和预防癌症。
癌症基因组图谱已经生成了33种癌症关键基因组变化的全面多维地图。
TCGA的数据集是描述从超过11,000患者的肿瘤组织和匹配的正常组织数据的2.5 PB的。这是提供给公众,并已被研究界广泛使用。乐动体育LDsports中国
petabyte有多大?一个pb等于9000亿页纯文本。根据《纽约时报》一篇关于科学和数据的报道,这大约相当于7.99亿份《白鲸》。
基因组数据分析中心(GDACS)
阵列和第二代测序技术的大量数据必须整合到数千个样本中。
这些中心向整个研究界提供新的信息学工具,促进TCGA数据的更广泛使用。乐动体育LDsports中国MD Anderson有两个gdac。
基因组鉴定中心(GCC)负责所有特征的研究作为TCGA计划的一部分肿瘤中发现的基因组变化。GCC的在用国家的最先进的技术来分析与癌症有关的基因变化以及这些数据提供给癌症研究机构。乐动体育LDsports中国
MD安德森在癌症的作用基因组阿特拉年代
MD安德森建立TCGA的基因组鉴定中心方面发挥了主导作用。走rdon Mills, M.D., Ph.D., chair of Systems Biology, heads up the Proteomics GCC, which is aimed at improved analysis of cancer cell proteins with the goal of identifying proteins that could be used as drug targets or biomarkers for screening and diagnosis.
MD安德森也导致2 TCGA七个基因组数据分析中心,开发工具,工作与GCC的是帮助研究人员处理和集成大量数据的分析,从的乐动体育LDsports中国
在整个基因组。
MD Anderson的主要研究人员和两个GDACs的共同pis是Weinstein, Akbani, Mills和Al Yung, M.D,教授Neuro-Oncology。