准确的天气预报,总的来说,完全处于高性能计算领域——就在本周,英国宣布了一项近16亿美元的投资,用于世界上最大的天气和气候超级计算机。现在,约翰内斯古腾堡大学美因茨分校和意大利斯维扎拉大学的研究人员正致力于用一种新的算法来挑战这种现状,这种算法允许个人电脑运行以前需要超级计算机才能完成的任务。
 
该算法基于一个叫做可伸缩概率逼近(scalable probabilistic approximation,SPA)的概念,经过多年的开发。SPA算法能够提取一个系统的几十个组件,并分析这些元素来预测未来的行为,具有很强的准确性。“例如,使用SPA算法,我们可以对欧洲未来一天的地表温度进行基于数据的预测,预测误差仅为0.75摄氏度,”该研究的合著者、美因茨约翰内斯古登堡大学(Johannes Gutenberg University Mainz)的生物信息学专家苏珊娜·戈贝尔(Susanne Gerber)说。
 
与现有的机器学习方法相比,研究人员特别设计了可解释的算法。“许多机器学习方法,如非常流行的深度学习,都非常成功,但工作起来就像一个黑匣子,这意味着我们不知道到底发生了什么,”戈贝尔说。“我们想了解人工智能是如何工作的,并更好地理解其中的联系。”
 
当然,该算法的真正优势在于它的性能要求。另一位合著者、意大利斯维泽拉大学(Universita della Svizzera italiana)的计算机专家伊利亚?例如,在Gerber的天气预报示例中,该算法产生的结果的错误率比许多气象服务使用的计算机系统高出40%——而所有这些都是在传统的PC上运行的,成本要低5到6个数量级。
 
该算法的应用范围很广,从天气到乳腺癌诊断,再到神经科学。对于生物应用,该算法在需要对大量细胞进行排序的情况下非常有用。Gerber说:“这个结果特别有用的地方是,我们可以了解用来对细胞进行分类的特征。”
 
该算法在多个领域的应用。图片由作者提供。
 
“SPA算法可以应用于许多领域,从洛伦茨模型到氨基酸在水中的分子动力学,”Horenko说。“与目前最先进的超级计算机相比,这个过程更简单、更便宜,而且结果也更好。”
 
关于研究
本文讨论的研究在2020年1月的《科学进展》上发表为“复杂系统的低成本可伸缩离散化,预测和特征选择”。 它由Susanne Gerber,L。Pospisil,M。Navandar和Illia Horenko撰写,可以在此链接上进行访问。