近日,金山云正式推出GPU云服务器实例P3I实例,目前已在金山云官网上线。P3I实例是业内首款采用英伟达高性能计算卡Tesla P4的云服务器产品,单实例负载能力是传统CPU的30倍以上,具有访存性能高、联网增强、配备新一代网卡三大特点,性价比更高,为包括语音识别、语义识别、语音合成、人脸识别、图像识别、场景识别、广告推荐、智能游戏和无人驾驶等在内的多种人工智能应用场景提供基础设施支撑,满足企业级客户对于计算的高标准需求。

P3I实例的推出,将加速人工智能技术应用的普及,通过优质的产品和体验,让人工智能的潜力得以全面释放。

率先采用Tesla P4计算卡

当下,人工智能可谓热度空前,上至科技巨擘,下至创业新秀,纷纷将人工智能技术当作开掘市场金矿的利器,例如智能音箱、智能电视、刷脸支付、无人超市、智能推荐、无人驾驶等等,大量的商业应用场景被一一建构,这对计算量、数据量、深度学习等能力提出了更高的要求。如何为人工智能提供充沛动力,加速相关应用的开发,降低计算成本压力,成为摆在很多企业面前的现实问题。

在金山云看来,作为深度学习的重要支撑,近年来GPU在很大程度上提高了服务器的运算能力,大幅度提升训练速度,由此产生的云端计算集群,已成为人工智能的重要引擎。此次推出的P3I实例,是业内首款采用英伟达高性能计算卡Tesla P4的云服务器实例产品,将为人工智能的应用提供澎湃动力。

Tesla P4专为处理深度学习工作负载,可提升服务器的工作效率,在任意超大规模神经网络上的推理延迟,较CPU降低15倍以上,推理吞吐效率较CPU提高60倍以上,相比英伟达上一代计算卡M4有更低的延迟和更大的吞吐。因此,P3I实例有着更好的性价比和效率,单实例负载能力是配备传统CPU服务器的30倍以上,适用于深度神经网络模型的推理预测等场景。

P3I实例提供两种配置,第一种配置一颗Tesla P4 GPU搭载8GB DDR5显存、14核vCPU、120GB内存和500GB SSD硬盘,计算能力5.5TFlops;第二种配置两颗Tesla P4 GPU搭载16GB DDR显存、28核vCPU、240GB内存和1000GB SSD硬盘,计算能力11TFlops。客户在使用该产品建设深度学习平台时,可根据业务负载选择不同配置,从而满足客户的定制化需要。

三大特点配合Tesla P4,助人工智能多点开花

为更好地发挥Tesla P4的作用,P3I实例具有三大特点。首先,P3I实例提高了Tesla P4的访存性能,进行了延时优化,性能提升22%,接近物理机水平。通过优化云服务器Hypervisor层性能,降低Tesla P4访问内存开销,优化了GPU DMA访存性能,加快HOST内存到数据交换速率,将充分发挥Tesla P4的运算能力。

第二,全线支持联网增强。P3I实例的联网增强大幅提高实例发包速率,能够降低60%以上的网络延迟。在刷脸认证、刷脸支付、刷脸门禁、语音识别等应用场景中,客户对时间延迟的敏感度最高,联网增强可大幅降低预测请求到预测系统(运行于P3I实例上)的时间延迟,加上Tesla P4低延迟的特点,P3I实例能为客户带来更优质的体验。

第三,P3I实例配备新一代智能网络适配器,带宽得到进一步提升。在人工智能的推理预测应用中,客户除了对时间延迟敏感,对于系统吞吐也有较高要求,P3I实例配备的新一代网络适配器,可帮助客户提升网络吞吐一倍以上,能够更好适配Tesla P4的吞吐能力。

人工智能需要找到应用场景,发展才有意义。P3I实例的推出,将帮助人工智能应用在各个行业不断落地,让客户更好发挥自身的优势和资源。目前,P3I实例已开放购买(https://kec.console.ksyun.com/pub/gpu.html),已有多家知名人工智能厂商的数十个应用正在适配。在人工智能产业从技术变革行进到应用落地的重要阶段时,P3I实例将成为金山云推动产业发展进步的新引擎。