由于谷歌官方并未提供启用 AVX/FMA 指令的 TensorFlow 代码包。所以我根据 TensorFlow 源代码编译启用了 AVX/FMA 指令和 cuda\cuDNN 的代码包,供大家下载:
(注意!仅适用于支持 AVX2 指令集的英特尔处理器)
我会根据后续版本更新持续提供对应编译版本,敬请关注!
TensorFlow 1.8.0
1.未启用 cuda 和 cuDNN:(截至2018年5月21日)
Python | Windows | Linux |
Python 2.7 | x64 | x64 |
Python 3.6 | x64 | x64 |
2.启用 cuda-9.2 和 cuDNN-7.1,其中 cuda 位于 /usr/local/cuda-9.2,NCCL 1.3,未启用 TensorRT,compute capability: 6.1,未加–cxxopt=”-D_GLIBCXX_USE_CXX11_ABI=0″ 选项:(截至2018年5月21日)
Python | Windows | Linux |
Python 2.7 | 暂无 | x64 |
Python 3.5 | 暂无 | x64 |
3.启用 cuda-9.0 和 cuDNN-7.1,其中 cuda 位于 /usr/local/cuda(指向 /usr/local/cuda-9.0),NCCL 2.2、TensorRT 3,compute capability: 6.1:(截至2018年6月1日)
Python | Windows | Linux |
Python 2.7 | 暂无 | x64 |
Python 3.5 | 暂无 | x64 |
Python 3.6 | 暂无 | x64 |
4.启用 cuda-9.0 和 cuDNN-7.1,其中 cuda 位于 /usr/local/cuda(指向 /usr/local/cuda-9.0),NCCL 1.3、TensorRT 3,compute capability:6.1:(截至2018年6月1日)
Python | Windows | Linux |
Python 2.7 | 暂无 | x64 |
Python 3.5 | 暂无 | x64 |
Python 3.6 | 暂无 | x64 |
TensorFlow 1.9.0
1.未启用 cuda 和 cuDNN:(截至2018年6月16日)
Python | Windows | Linux |
Python 2.7 | 暂无 | rc1 | rc2 | Release |
Python 3.6 | 暂无 | rc1 | rc2 | Release |
2.启用 cuda 9.2\cuDNN 7.1\nccl2.2\TensorRT4.0:(截至2018年7月4日)
Python | Windows | Linux |
Python 2.7 | 暂无 | rc2 | Release |
Python 3.6 | 暂无 | rc2 | Release |
TensorFlow 1.10.0
从此版本开始,支持 GPU 的预编译版基于 NCCL 2.2,且不附带 NCCL。因此多 GPU 支持需要升级到 NCCL 2.2。
1.未启用 cuda 和 cuDNN:(截至2018年8月11日)
Python | Windows | Linux |
Python 2.7 | x64 | x64 |
Python 3.6 | x64 | x64 |
2.启用 cuda 9.2\cuDNN 7.1\nccl 2.2\TensorRT 4.0:(截至2018年8月11日)
Python | Windows | Linux |
Python 2.7 | 暂无 | x64 |
Python 3.6 | 暂无 | x64 |
3.启用 cuda 9.2\cuDNN 7.2\nccl 2.2\TensorRT 4.0:(截至2018年8月11日)
Python | Windows | Linux |
Python 2.7 | 暂无 | x64 |
Python 3.6 | 暂无 | x64 |
TensorFlow 1.10.1
1.启用 cuda 10.0\cuDNN 7.3\nccl 2.3\TensorRT 5.0 RC:(截至2018年9月25日)
Python | Linux |
Python 2.7 | x64 |
Python 3.6 | x64 |
TensorFlow 1.11.0
预告:从此版本开始,Windows 版仅支持使用 bazel 编译。
1.启用 cuda 10.0\cuDNN 7.2\nccl 2.3\TensorRT 5.0 RC:(截至2018年9月28日)
Python | Linux |
Python 2.7 | x64 |
Python 3.6 | x64 |
由于受众有限,不提供 OS X 版。
如果您需要自行编译,可以参照以下文章:
关于 “启用 AVX/FMA 指令的 TensorFlow 代码包(whl)” 的 1 个意见
您必须登录才能发表评论。