最爱地球的超级运算平台

利用ASUS ESC4000 G2搭配两片AMDFirePro S10000在2U空间中创造出每瓦特2.351 GFLOPS double(倍精度浮点数)运算能量的德国超级计算机SANAM,荣获超级计算机排名Green 500亚军殊荣,这让ASUS这个国产品牌在国际视野中有了亮丽的成绩,而评分也与第一名的每秒2.499GFLOPS double只差了一点点,但是ESC4000 G2这个平台的实力绝对不仅止于此,若是搭配4片目前最新NVIDIA K20XGPU运算加速卡,每瓦特能创造出超过4GFLOPS double的惊人数据,所以想要在空间运用、能源消耗与运算能量取得最佳效果绝对不能不使用ASUS ESC4000 G2这款超效能表现的GPU运算服务器。

专为大量GPU 运算量身打造

早在三年前GPU运算刚刚开始萌芽阶段,ASUS就着手研发这款最高可以支持四片16x或八片8x GPU集成式2U高度的运算服务器平台ESC4000,但是当时GPU运算效能上虽然可达到CPU运算三到四倍效能,却因为没有好的软件支持让这成果仅仅使用在科学界成果研发上,随着GPU运算效能每年都以倍数成长的惊人速度而受到各家软件厂商高度重视,加上云端运算也因网络普及与带宽提升而日渐成形,云端GPU运算俨然已经发展成势不可挡的必然趋势,而因应新GPU规格提升ESC4000也推出G2版本来支持新款PCI-e GEN.3硬件规格以达到更高效能要求。

时势造英雄、ESC4000 G2 造时势

 这次编辑部特别与ASUS借测的这台ESC4000 G2除了规格比起前一代的明显提升,很荣幸的也是全台湾第一家评测搭配Nvidia GRID K2顶级GPU加速卡在软件应用与效能表现的媒体,最主要就是想了解透过优异硬件规格与新技术支持下能够对影像工作者在作品制作与图像表现上有着怎样帮助,因为就像小编三年前所提到的HD时代来临,Render Farm势必成为算图不可或缺之工具,如今各家电视台、广告制作与后制公司都已将画质提升到HD以上规格,Render Farm也渐渐普及在影像工作环境中,但是未来Full HD规格绝对不会拖延太久,GPU势必会成为运算主流,根据NVIDIA研究结果发现,增加GPU数量与缩短的算图处理时间是以一种接近线性方式在变化(能有效且明显缩短时间),按照这样的结果推论能够安装越多的GPU就能越快,但是基于CUDA架构必须采用CPU+GPU方式才能有好的效能,所以匹配的CPU规格也不能太差。

 本次评测很庆幸也得到NVIDIA原厂的支持,所以这次ESC4000 G2搭配NVIDIAGRID K2主要测试方向是针对构筑在虚拟主机的环境上,因为单机多GPU已证实的确能够带来明显运算效能提升,而透过NVIDIA先进的虚拟桌面VGX Hypervisor技术可以让原本无法在虚拟主机上分享到的GPU资源也能有效运用,但到底实际有何作用就让小编为读者们一探究竟。

颠覆绘图工作站型态

针对企业用户在绘图工作站的解决方案上ESC4000 G2可以轻松达成支持多人共享单机GPU效能,假设原本每个使用者都必须在个人工作站上安装专业绘图卡来工作,10位使用者就必须购置10部绘图工作站,成本的支出上非常庞大,但使用NVIDIA GRID K2搭配NVIDIA VGXHypervisor技术则可以将GPU资源共享给多部虚拟主机,让虚拟主机摆脱只能做文书工作的刻板印象,以GRID K2内含两颗GPU并可以安装四片的数量来计算,一台ESC4000 G2最少可以分配给8位专业工程绘图人员来使用,若是搭配像是CITRIXXenDesktopXenServer分享的数量将可以超越16台以上,这样的解决方案对于有大量绘图需求的企业不但成本更加节省且管理上方便许多,另外操作的平台也可以扩展到其他行动装置上,因为透过虚拟主机操作的方式只要在能够接受画面与输入指令平台就能作业,平板计算机或是其他装置都能变成绘图工作站。

架构说明与体验

要建立一个多人操作绘图服务器环境需要五个部分,分别为Windows Server 架设AD、授权Server、DCC Server、绘图虚拟主机与用户端联机用的计算机,当然这些服务器都可以在同一台ESC4000 G2架设,服务器都架设好后使用者就可以透过远程虚拟化桌面联机开始使用,而这次环境是采用ESC4000 G2安装XenServer 6.0.2建立虚拟主机环境,透过XenCenter联机对服务器做虚拟主机规划与控制,账号管理是透过AD的机制来控管,使用者透过网页浏览器连接上Desktop Delivery Controller(DDC)Server使用XenDesktop接口在登入账号后与虚拟主机建立联机并取得虚拟主机画面就可以使用了,而XenDesktop支持NVIDIA GRID K2虚拟化分配驱动程序,让虚拟主机可以正确地取得显示适配器信息让绘图软件可以使用GPU资源,过去虚拟主机是没有所谓的GPU可以使用的,所有显示的效能都是利用CPU模拟出来,而VGX HypervisorGPU能够被虚拟主机使用到的技术确实是一大突破,在使用上除了窗口移动时会有些许的延迟以外,软件操作时若不说这是在远程虚拟主机上作业应该也不会有人发现,因为影像数据有透过H.264编码技术压缩再传送到使用端,对于NVIDIA在影像数据传输的技术果然大有独到之处。

效能极限挑战

 这次测试将着重在多人同时使用3D绘图或影像软件时的效能表现,使用的软件有Autodesk 3ds Max 2013内建的Nvidia iRay与Adobe After Efficets CS6,并会使用单机工作站来做效能的比对,看看多人共享一台服务器GPU资源与单机的工作站在显示与运算上差异性为何?

进化空间

 以ESC4000 G2这样高集成GPU运算仅需要2U空间的服务器来说,在功耗效能比上同级产品确实无人能敌,不论是要用在单一系统当作个人超级计算机来使用或是成为多人使用的绘图计算中心兼具算图农场功能都可以灵活搭配应用在各个领域上,但很可惜受限于目前CPU核心技术还不能有所突破,虚拟主机方案在数量上会受到核心数不足的限制导致无法再向上提升,若是能够在有限空间中(例如3U)塞进六颗CPU与六张NVIDIAGRID K2这样的规格,而NVIDIA VGX Hypervisor发展出多GPU支持一台虚拟主机的技术,对于企业来说绝对是一大利多,因为绘图工作站的规格变成可以自由分配资源,CPU核心数与GPU运算能量可以发挥在需要的使用者身上,工作站资源也不会因为人员离职后无人使用造成浪费,随时都可以动态调整工作站数量与效能真的会是一款梦幻服务器,不论是管理或使用上都绝对是无可挑剔的绝佳工具。

 

测试1:Viewport 显示速率

首先是3ds Max 实时显示测试,使用面数为5百多万面的场景,贴图占显示适配器内存1736MB,在View Port上使用Realistic+ Edged faces时,虚拟主机每秒可以达到26fp以上,对照组的DIY工作站配备i7-920 + Quadro 4000每秒约7fps,可见NVIDIA Kepler架构确实让显示效能有非常大的跃进,但ESC4000 G2在同时四台虚拟机都开启同一个档案操作时依然能够有相同的效能表现令小编非常惊讶,有了NVIDIA GRID K2与VGX Hypervisor技术加持让ESC4000 G2变身成为绘图工作站中的叶问,”一个打十个”这经典画面在CG界真实上演。

测试2:虚拟主机vs 实体工作站

 接着测试iRay这款全物理运算并使用CUDA技术的彩现引擎,因为CPU资源分配的关系所以仅使用两部虚拟主机,虚拟工作站各分配了四核心的CPU资源与一颗NVIDIA GRID K2拥有1536个CUDA核心与4G GDDR5显示内存,图文件大小为Full HD规格1920*1080,两部虚拟主机同时算图计算1024次所耗费的时间分别为46m59s与47m05s,而对照组的工作站因为仅有2G GDDR5的显示内存,不足场景所需而跳出了警告讯息,整体算图过程系统崩溃了好几次,最后成功计算出来的时间为4h30m36s,足足是虚拟工作站的六倍之多。

 

测试3:网络算图测试

接着测试网络算图的功能,因为每部虚拟主机都可以视为单独的工作站,这对想要制作动画的使用者来说是非常有利的,因为组Render Farm通常需要多部主机与大空间才能达成,现在只需要少量的主机就能达到多部主机效率的话,那真的是一大福音,小编使用了Backburner控制算图工作,测试1920*1080与电影规格的4096*2304并分隔为10个计算单位,假设单台单张1920*1080花费46分钟来计算,那理论上两台同时计算应该会低于这个时间才是,但结果出乎意料的反而是花费了55分钟17秒,可是成像的质量却大大的提升了,原因可能是在做Ray Tracer受影像大小的影响不大,仍旧需要要花那么多时间去计算光影的数值,但由于影像大小变小反而提高了成像的质量,基于这样的结论测试4K图档的算图结果应该不需要花四倍的时间才是(因为影像是四倍大),结果花费2小时47分钟41秒,成像质量也与前一次的差不多,所以证明使用GPU算图利用iRay彩现会比传统CPU算图在影像大小日益膨胀的未来更具有竞争优势。

测试4: After Effects 加速

接着是Adobe After Effects的加速测试,Adobe CS6版本有多项软件都已经是64位的版本了,并且提供水星引擎在图像处理上有硬件加速功能,而图像处理最耗时的不外乎是加入特效之后的预览与最后输出影片时编码所需要的时间,而强大的NVIDIA GRID K2提供了最佳的解决之道,比起单纯使用CPU编码的速度提升了约8倍的时间(H.264编码),在测试的过程中都是同时使用两部虚拟主机在做运算,强悍的效能表现一点都不受到影响真的很令人印象深刻。

测试5:硬件压力测试

 最后还是要做一下压力测试才能知道这样的虚拟主机方案能不能真的使用在工作上而不流于研究阶段,还是一样使用iRay来做测试,把算图质量设定为Unlimeti就能够永无休止的算下去,经过了36个小时连续测试下来ESC4000 G2依然平顺且正常的工作着,GPU温度也都保持在摄氏50度的稳定状态,散热效率与稳定性都非常值得信赖。