随着全球商业运作模式的丕变,大数据(Big Data)的分析也成为企业IT的显学,而GPU的当家本事──图形加速,在虚拟化当道的现在也有了新的用法

在企业环境中,很多人对绘图处理器(GPU)的第一印象,通常会认为它是高阶图形设计工作站的必要配备,或是应用在气象预测、科学研究等特殊专业领域的高效能运算(HPC)环境中。如今,随着全球商业运作模式的丕变,巨量资料(Big Data)的分析也成为企业IT的显学,而除了掌握像Hadoop这类的关键技术或因应储存容量的成长之外,也开始有一些业者投入研究,想找到如何从硬件处理器运算技术的层面下手,获得提升巨量资料的分析能力,其中,具有大量运算核心、可支援平行处理的GPU正是首选之一。

除了将强大的运算力转化为处理巨量资料的新动力,GPU的当家本事──图形加速,在虚拟化当道的现在也有新的用法,那就是让GPU也能更真正地配合相关应用,而不像以往只能透过虚拟化软件平台与CPU来模拟,让这项硬件资源能够专属指定的虚拟机器,或透过软硬件的支援,充分让多台虚拟机器得以共享。

因应资料量暴增的趋势,云端服务与网站开始用GPU协助分析
以当前的GPU运算技术应用来说,经过多年来的发展,已经遍布了许多科学领域,象是高能物理、材质模拟、3D基因体、10亿像素阵列相机、离心机分析,以及阿兹海默症等领域的研究,也涵盖资料探勘、金融计算、医疗影像,但是现在对于云端运算与行动应用兴起之后,所产生的巨量资料处理需求,GPU在这里的实际应用,最近终于有了很大的进展。

在今年举办的GPU技术大会(GTC 2013)上,Nvidia共同创办人暨执行长黄仁勋在主题演讲当中,一口气宣布了3个在商用环境下的应用案例,分别是以CRM云端软件服务闻名的Salesforce,为众多智能型手机与平板计算机提供歌曲搜寻App服务的Shazam,以及提供智能型图形辨识技术的Cortexica,这几家厂商所做的资料处理,也各自针对文字、声音与图片等不同性质的巨量资料,提出解法。

之后,在GTC2013的其他分场议程中,Salesforce继续分享他们在即时纯文字搜寻过程中,用GPU来加速关键字比对(Keyword Matching)与条件陈述的评估(Expression Evaluation),此外,还有团购网站Groupon、提供金融讯息处理系统服务的Hitachi也发表他们对GPU的运用。

相较于过去,上述这些例子的出现,其实对GPU运算应用方向的扩大,有很重大的意义,因为一般人也逐渐透过这些服务的使用,能够真正感受到GPU运算通用化(General-purpose computing on graphics processing units,GPGPU)的好处。 

云端服务业者Salesforce

每天帮客户实时分析5亿笔Twitter推文以提供客户关系管理云端服务所著称的Salesforce,藉由GPU的加速处理,让他们得以为Cisco、Dell、Gatorade(开特力)等知名国际大厂,提供社交网站的监控、分析服务,每天所要处理的这些推文的数量,已经超过5亿笔以上。

App开发商Shazam
针对2,700万首歌,每月应付3亿用户查歌
Shazam为了加速2,700万首歌曲的搜寻与辨识,而采用GPU加速。目前该公司使用者有3亿人以上,每天平均搜寻1千万首以上的歌曲,每周新进使用者则有2百万人,而他们维护的歌曲数据库,在短短一年内也成长了一倍。

影像辨识技术平台供应商Cortexica
实时以图找图,查询1百万款以上的商品项目
有了GPU的加速处理,Cortexica可执行复杂的视觉物件辨识算法。他们开发的行动App,可以让消费者结合手机、平板计算机的拍照功能,将商品照片上传至在线款式数据库,以便快速搜寻到符合类似外观特征的商品,进而在在线下单采购。

电视台The Weather Channel
可负荷3倍以上的在线视讯实时转播需求
美国气象频道的Live视讯系统,采用了GPU技术,可实时针对不同尺寸与分辨率的荧幕,来调整对应的视讯画面,因此能同时适用于智能型手机、平板计算机、桌上型计算机与一般电视。在桑迪飓风肆虐期间,总计有1千2百万人观看,最高同时上线人数曾达到16.7万。

IT系统服务商Hitachi
金融XML讯息处理系统速度提升100倍
操作商业应用系统时,执行速度经常会卡在服务器端资料与传输处理过程,若架设更多台服务器的丛集环境来解决,并不划算,于是Hitachi想将这些处理卸载到GPU执行,处理负担分散至GPU的500多颗核心,速度较CPU架构提升了100倍。