澳洲昆士兰州坐拥充足的阳光、海水,以及绵延无尽的金色海滩,这里却也是全球黑色素瘤患者人数最多的地方之一。黑色素瘤是一种相对罕见却极为严重的皮肤癌。

总公司位于布里斯本的新创公司,同时也是 NVIDIA Inception 计划成员的 Max Kelsen,企图利用人工智能提高透过免疫疗法成功治疗黑色素瘤患者的机会,而免疫疗法是一种配合人体免疫系统,增强身体对疾病之反应能力的治疗方法。

免疫疗法创造出的结果足以扭转患者的生活,只是效果不一。一名癌症患者可能会进入缓解期,身上没有出现任何疾病的症状,另一名患者的免疫系统则可能会攻击健康的器官和细胞。

在许多情况下,费用高昂且治疗反应率通常不高的免疫疗法,只限用于治疗末期癌症。Max Kelsen 的研究团队使用人工智能和基因体来找出可靠的标记及开发一种测试方法,来更好地预测哪些患者在正式治疗前,可以透过免疫疗法来缓解症状。

建立一项测试方法,以更佳预测治疗结果

在澳大利亚联邦政府的资助下,Max Kelsen 与 genomiQa、BGI Australia、Metro North Health and Hospital Service 及 QIMR Berghofer Medical Research Institute 合作。

各方将自己的专长用于这个案子上,Max Kelsen 使用人工智能来挖掘大数据和探索新的见解、genomiQa 的专长为分析基因体资料、BGI 为大型基因体定序服务供应商,QIMR Berghofer 则是免疫学和癌症基因体研究的领导业者。

「这个案子要做的是基因体定序,而非单一标记,将在未来的精准医学领域里确立人工智能和全基因体分析的角色。」Max Kelsen 执行长 Nicholas Therkelsen-Terry 说。

有着相关健康结果的优质资料并不多,又需要庞大的运算能力,使得推广将人工智能用在基因组学方面的脚步一直很缓慢。

约三千人的32亿个基因体硷基对完整序列,经压缩后产生出相当于 30PB 的庞大资料量。另一个作法则是查看经过处理后,称为 variant call format(VCF)的档案,其中储存每个人约 50MB 的资料量,同样的三千人产生出共 150GB 的资料量。

Max Kelsen 使用两套 IBM Power9 系统来计算这些资料,每套系统搭载六个 NVIDIA Tesla V100 Tensor Core GPU。Therkelsen-Terry 说:「在 NVIDIA 的协助下,我们处理出的资料量,足以为当前治疗癌症的方式进行革新。」

Max Kelsen 使用复杂的人工智能技术,打算整合基因体、转录体及患者临床信息,以找出分类器和开发治疗反应测试法。Max Kelsen 将使用多个黑素瘤研究案的基因体资料来开发分类器,再使用于澳洲卫生体系内透过操作规程收集到的第二群四百名肺癌患者资料进行验证和调校。

一开始的作法是半监督式学习,建立通用模型来解读基因组的特征。将基因体信息构建成一种语言,便能将基因组的整个结构比拟成章节、段落、长句和短语的结构式语料库。

Therkelsen-Terry 表示:「我们投入不少心力来开发一项技术,透过它以料想新的情境和朝着梦想前进。它学习如何在梦境里表现现实世界,或是综合虚假相似的情境,便能建立较现有训练资料所提供更庞大的搜寻基础。」

降低发病率和死亡率

Max Kelsen 及其合作伙伴花了三年的时间来解决这些问题,目标为在2019年7月前提出首篇关于 VCF 建模与黑色素瘤的报告。

他们最终着眼于确保临床医生能切实掌握患者治疗办法,以及最适合接受免疫治疗的患者等信息,降低黑色素瘤和肺癌的发病率和死亡率,再将这些资料用于产生出用于它类癌症的分类器。

「我们的研究范围不只是单一肿瘤是否会对免疫疗法有所反应,而是想把深度学习当成未来医学领域的一项重要工具,让医疗领域的专业人员使用深度学习来解决当前遇到的多项重大问题。」Therkelsen-Terry 说。