一个国际团队完成了迄今为止最全面的癌症全基因组研究,极大地提高了我们对癌症的基本认识,并为癌症的诊断和治疗指明了新的方向。巴塞罗那超级计算中心从该项目的初始阶段就参与其中,并为数据分析、癌症基因组学特定计算解决方案的设计以及与肿瘤生物学相关的特定问题的回答做出了贡献。
由来自37个国家的1300多名科学家和临床医生参与的“泛癌症项目”(Pan-Cancer Project)分析了38种不同肿瘤类型的2600多个基因组,创造了一个巨大的初级癌症基因组资源。这是16个工作组研究癌症发展、因果关系、进展和分类的起点。
此前的研究主要关注1%的蛋白质编码基因组,类似于绘制大陆海岸地图。这个泛癌症项目更详细地探索了剩余99%的基因组,包括控制基因开关的关键区域——类似于绘制大陆内部与海岸线的地图。
泛癌症项目为癌症基因组研究提供了全面的资源,包括原始基因组测序数据,癌症基因组分析软件,以及探索泛癌症项目数据各个方面的多个交互式网站
 
高性能计算的作用
BSC是世界上为数不多的管理和分析PanCancer数据的数据分析中心,也是欧洲最活跃的超级计算中心。BSC已经参与了这个项目的早期阶段,对项目做出了广泛的贡献,包括基因组的初步分析,包括突变的检测;相关计算资源的生成;以及对肿瘤的转移和进展有直接影响的非功能性基因拷贝的鉴定。
每个供体的两个基因组序列(一个来自健康细胞,另一个来自肿瘤细胞)已经用不同的方法进行了分析。利用BWA方法,每个供体的两个基因组与参考人类基因组进行比对。随后,使用Sanger、DKFZ / EMBL、Broad / MUSE方法分析了这种比对的结果,以比较同一患者的健康基因组和肿瘤基因组,并检测肿瘤中可能存在的突变。在平衡记分卡中,14%的分析被执行。由于算法中的知识产权问题,四种分析方法(Broad / MUSE)中的一种仅在美国使用。
 
癌症新知识
泛癌症项目扩展了包括云计算在内的癌症基因组分析的先进方法,并将这些方法应用于其大型数据集,发现了关于癌症生物学的新知识,证实了以前研究的重要发现。今天在《自然》及其附属期刊上发表的23篇论文中,泛癌症项目报告说:
癌症的基因组是有限的,也是可知的,但极其复杂。通过将整个癌症基因组的排序与一套分析工具相结合,我们可以描述在癌症中发现的每一个基因变化,所有产生这些突变的过程,甚至是癌症生命历史中关键事件的顺序。
研究人员即将对所有与癌症有关的生物途径进行编目,并对它们在基因组中的作用有一个更全面的了解。在几乎所有被分析的癌症中都发现了至少一种因果突变,并且发现产生突变的过程非常多样化——从单个DNA字母的变化到整个染色体的重组。基因组中控制基因开关的多个新区域被确定为致癌突变的目标。
通过一种新的“碳年代测定法”,泛癌症研究人员发现,在肿瘤出现前数年,有时甚至数十年,有可能鉴别出突变。从理论上讲,这为早期癌症检测打开了机会之窗。
根据在整个基因组中观察到的遗传变化模式,可以准确地识别肿瘤类型,这可能有助于诊断病人的癌症,而传统的临床试验无法识别其类型。确切的肿瘤类型的知识也可以帮助定制治疗。