NVIDIA cuDNN是用于深度神经网络的GPU加速库。它强调性能、易用性和低内存开销。NVIDIA cuDNN可以集成到更高级别的机器学习框架中,如加州大学伯克利分校的流行CAFFE软件。简单的,插入式设计可以让开发人员专注于设计和实现神经网络模型,而不是调整性能,同时还可以在GPU上实现高性能现代并行计算。

点击这里了解更多关于加快机器学习与GPU的信息。

主要特点

  • -专为NVIDIA GPU特调的,用于卷积神经网络向前和向后的卷积程序。
  • -专为最新的NVIDIA GPU架构优化
  • -针对4纬张量的任意维度排序,striding和次区域可以很容易集成到任何神经网络的执行中
  • -对于许多其他常见布局类型(ReLU, Sigmoid, Tanh, pooling, softmax )向前和向后的路径
  • -基于上下文的API,可以很容易地多线程

开始使用cuDNN

cuDNN提供了不少特调过的用于常见深度神经网络的的例程 包括:

  • -前后卷积,包括互相关
  • -向前和向后pooling(最大值和平均值)
  • -向前和向后SOFTMAX
  • -向前和向后神经元激活(Rectified Linear, Sigmoid, Hyperbolic Tangent )
  • -张量转换功能

 cuDNN支持加州大学伯克利分校的CAFFE ,正集成了其他流行的机器学习框架。

cuNDD性能比较

Baseline Caffe与用K40加速cuDNN的Caffe做比较

Baseline Caffe与用Titan Z加速cuDNN的Caffe做比较

Baseline Caffe 与用cuDNN加速的Caffe 做比较

下载

cuDNN 对于 CUDA Registered Developers 免费,可以在这里 

共有评论:0
查看/发表评论
0.0分 | 0次评分