研究人员利用 GPU 人工智能技术,解开这面用以观测宇宙之「哈哈镜」的奥秘。

重力透镜一直都是萦绕在天文学研究人员心头的事物之一,让那些致力于寻找与研究它的人百思不得其解。

然而科学家将深度学习与计算机视觉用于当前强大望远镜所产生的大量资料之际,便能逐步运用数十万个重力透镜来扩大我们对宇宙的理解程度。

当一个或一群星系挡住,而看不到「后面」的另一个星系时,便会出现重力透镜;第一个星系的重力会使得第二个星系发出的光线形成弯曲状,让第一个星系变成放大镜,可以仔细观察第二个星系。

科学家先确认出重力透镜(科学界证明这是一大难题),再分析望远镜产生出的资料,不仅能更深入观察那些更遥远的星系,还可以了解暗物质的性质。暗物质是似乎一种遍及我们的宇宙各处的未知物质形态。

「我们从重力透镜学到很多科学知识,可以利用这些资料来研究暗物质的分布情况,还有恒星及星系的形成。」史丹佛大学卡弗里粒子天文物理与宇宙学研究所的 NASA 哈伯望远镜博士后研究员 Yashar Hezaveh 说。

钻研深度学习

科学家一直要到最近,才使用大量精密的计算机程序码来分析影像,而这得在超级计算机集群上进行极为庞大的运算作业与大量的人为干预。但是当 Hezaveh 及其研究团队决定要使用计算机视觉与神经网络,情况就改观了。

史丹佛大学博士后研究员,也是此一主题报告的共同作者 Laurence Perreault Levasseur 表示:「我们没有想到它会变得多美好,或者是它到底能不能派上用场。」

也可以把重力透镜想成哈哈镜,难处在于消除镜子扭曲的效果,还有找到镜子前面物体的真实影像。过去是将观察结果跟在不同变形透镜中看到的同一物体大量模拟影像资料进行比较,以找出哪一个与资料更接近。

不过神经网络可以直接处理影像并找出答案,不用使用大量模拟资料进行比较。原则上,这可以加快计算速度,只是训练一个能明白各种波动如何影响着物质表现的深度学习模型(更不用说我们看到的画面),还是得用到庞大的运算能力。

Hezaveh 及其团队采用 GPU 来分析资料,便掌握更深入了解宇宙所需的速度和准确性。研究团队使用史丹佛大学的 Sherlock 高效能运算集群(在 NVIDIA Tesla 与 TITAN X GPU 的组合上运行),便能将训练模型的速度提高到较使用 CPU 的程度快上100倍。

对于重力透镜的理解,可望为那些想要更深入认识宇宙的人提供不少素材。

Perreault Levasseur 说:「透过这项工具可以解答很多科学问题。」

征求:重力透镜

当然得先找到重力透镜上的资料,才能加以分析,而这正是欧洲三所大学的科学家正在进行的补充研究活动。

格罗宁根大学、那不勒斯大学与波恩大学的研究团队在 Kilo-Degree Survey(KiDS)计划里,使用深度学习方法来找出新的重力透镜。Kilo-Degree Survey(KiDS)是一项旨于更深入认识宇宙暗物质与质量分布的天文学调查活动。

在一篇与他人合著详细介绍深度学习之报告的 Carlo Enrico Petrillo 表示,就算该调查只是仅观察一小片(大约 4%)的天空,使用人工智能搭配 KiDS 也能发现多达2,500个重力透镜。

可是想要实现这个目标,有着一大难题:缺少深度学习应用程序通常要使用的重要训练资料。Petrillo 说他的团队模拟重力透镜四周的弧线和环,并将它们搭配真实星系的影像,以克服这个问题。

「我们用这种方式来模拟调查影像里重力透镜的所有特征,象是分辨率、波长和噪点。」Petrillo 说。

也就是说研究团队将这个视为二元分类的问题:符合模拟内容,且被弧和环包围的星系被标示为透镜,不符合模拟内容的即被标示为非透镜。随着神经网络从每个模拟中汲取知识,研究团队可以缩小候选对象的范围。研究团队的报告指出他们一开始使用这项方法。便将761个可疑重力透镜缩减到56个。

NVIDIA GPU 缩短了将一批影像与模拟内容进行比对的时间,有助于落实这个目标。使用 CPU 的话,每批要25秒的时间,GeForce GTX 1080 GPU 则是将速度加快了50倍 (在报告里是使用前一代 GeForce GPU 的结果,Petrillo 最近升级使用了新版本的 GPU)。

「使用 CPU 的话,我就达不到这些成果了。」他说。

将诞生出海量资料

随着望远镜与深度学习技术不断进步与创新,将会产生出海量的重力透镜资料,象是 Petrillo 说欧洲太空总署的欧几里得(Euclid)太空望远镜预计会产生数十 PB 级的资料量,而位于智利的大型综合巡天望远镜(LSST)每晚将产生 30TB 的资料量。

这代表得消化大量资料、发现许多重力透镜,还有掌握新的空间边界 – 只要科学家的脚步能够跟上。

Petrillo 说:「拥有众多重力透镜,代表能精确描绘星系的形成和演化、深入认识暗物质的性质,还有时空连续体本身的结构。我们需要高效率又快速的算法来分析这些资料,当然,天文学家会很常使用机器学习这项工具。」