上回说到编译CPU版的MXNet:
http://cherishlc.iteye.com/blog/2299864
最近攒了个带GPU的本本,,终于可以整GPU版的啦~
过程和编译CPU版的差不多,但是却花了3天时间填坑,,具体过程本文不再详述,请先编译CPU版。
与编译CPU版不同之处在于:
具体流程参加CPU版的,,本文只是对编译GPU版本踩过的坑进行记录
1、Cuda、cuDNN的安装
Cuda:
https://developer.nvidia.com/cuda-toolkit
一路狂点即可,注意下载Cuda8RC版,,否则可能有兼容问题
cuDNN:
https://developer.nvidia.com/cudnn
要用v3版本的(MXNet官网这么说的,不知道现在是否支持v4、v5)。
记得把cuDNN的DLL所在目录加到PATH里!(和CPU版的openBLAS类似)
2、OpenCV的编译
由于换了全新的本本,OpenCV我也重新编译了一下,结果栽了跟头!
- 注意把VS的工程里的编译模式debug改为release!!!
- DLL所在路径添加到PATH,,上次没有这一步,这次就栽了跟头。。。表现为运行时找不到模块,而且不会提示找不到什么模块。。。
- 编译GPU版时间老长了,,没必要。。。
3、MXNet工程的生成
上次说到直接用CMake的CMake-gui工具配置,这次出了问题,,没生成x64平台的,只有win32平台。。。还是编译时发现一堆明明存在的lib却找不到时才发现的!!!
再次安利CMake编译x64平台代码的博文:
http://cherishlc.iteye.com/blog/2302987
即使一切配置正确,,编译还是不通过,提示找不到
opencv_dep_cudart.lib,当时真是想重新编译一个CPU版的OpenCV!但是,当我将该lib从MXNet工程的输入中剔除后,编译通过了!!
只是运行时提示找不到库(还没告诉我找不到什么库。。。),后来才想起来OpenCV的DLL路径没添加到PATH
再遇到这种情况可以使用depends工具查看DLL依赖关系:
http://www.dependencywalker.com/
其中,windows相关的组件找不到貌似没啥关系,,因为我添加了OpenCV路径后依然会说windows相关的组件找不到
4、安装python版的MXNet
和CPU版完全相同,,不再赘述
5、运行示例
安装好了就可以参照PHunter的博文跑一下
Neural art了:
http://phunter.farbox.com/post/mxnet-tutorial2
只是需要注意,由于windows无法运行.sh文件,我们需要手动下载模型
windows下
nvidia-smi程序在:
C:\Program Files\NVIDIA Corporation\NVSMI 下
官方文档:
https://developer.nvidia.com/nvidia-system-management-interface
拿左图同时作为输入和style image的输出居然和他自己不一样。。。
- 大小: 207.6 KB
分享到:
相关推荐
它可能包含了设置环境变量、路径以及安装依赖的步骤,确保MXNet能在Windows 10环境下正确运行。 **许可证** `LICENSE` 文件包含了软件的许可协议,对于MXNet而言,可能是Apache 2.0许可证,这意味着该软件是开放源...
标题“20170304_mxnet_x64_vc14_gpu”指的是一个特定版本的MXNet库,发布日期为2017年3月4日,该版本是针对64位(x64)Windows操作系统编译的,并且支持Visual Studio 2015(vc14)编译器,还集成了GPU(图形处理器...
基于Windows 10原生的GPU加速深度学习,支持Keras/Tensorflow/CNTK/MXNet and PyTorch五大框架,其中CNTK, Tensorflow, or MXNet提供GPU支持
综上所述,MXNet-1.1.0.post0-cp36-cp36m-macosx_10_10_x86_64.whl是一个专为Python 3.6环境下的Mac OS X Yosemite系统设计的MXNet库的安装文件,用户可以通过pip轻松安装,利用其功能进行深度学习和机器学习相关的...
### 《动手学深度学习》安装GPU版Pytorch #### 一、准备工作 在开始安装GPU版Pytorch之前,我们先来明确一下整个流程的主要步骤: 1. **安装Miniconda**:首先需要安装Miniconda环境管理工具,用于创建虚拟环境。...
在win x64环境下,MXNet C++ API与CUDA 8.0的结合,使得开发者能够在Windows操作系统64位版本上利用GPU进行深度学习模型的训练和推理。 在"MXNet C++ (CUDA 8.0, win x64 , without cudnn)"这个特定的版本中,值得...
3. **内存优化**:MXNet采用了内存规划算法,能够在有限的内存资源下有效地管理数据,从而减少内存占用,提高运行效率。 4. **模块化设计**:MXNet的模块化设计使得开发者可以轻松地构建、共享和复用预训练模型,...
4. **跨平台**:MXNet可在多个操作系统(如Linux、Windows、MacOS)和硬件平台(如CPU、GPU、Ascend)上运行,具有高度的可移植性。 5. **库集成**:MXNet集成了各种数学库,如BLAS(基础线性代数子程序库)和CuDNN...
3. **跨平台**:MXNet可在多个操作系统和硬件平台上运行,包括Windows、Linux、macOS,以及各种GPU和CPU架构。 4. **易用性**:MXNet提供Gluon接口,使得模型构建和训练变得更加直观,类似Keras的API,降低了深度...
1. **跨平台**:MXnet可以在多个平台上运行,如Linux、Windows、Mac OS以及移动设备,支持多种编程语言,包括Python、R、Julia、Scala和C++,这使得开发者可以根据自己的喜好选择合适的环境和语言进行开发。...
**cuDNN v7.1.3:深度学习加速库** `cuDNN`,全称为`CUDA ...通过集成cuDNN,开发者可以在Windows 10环境下利用CUDA 9.0的GPU加速能力,显著提升深度学习应用的性能,缩短训练时间,从而更快地实现模型迭代和创新。
2. **广泛支持**:cuDNN与多个深度学习框架如TensorFlow、PyTorch、Caffe、MxNet等兼容,使得开发人员可以在这些框架下轻松集成和使用cuDNN。 3. **内存管理**:cuDNN提供了一套内存管理策略,以有效地分配和重用...
ONNX支持的框架包括TensorFlow、PyTorch、Caffe2、MXNet等,这样用户可以在一个框架下训练模型,然后在另一个框架下进行推理或优化。 ONNX的运作方式是将深度学习模型转化为一种统一的中间表示(Intermediate ...
3. **多平台兼容**:除了本文提到的Linux ARMv7,ONNX Runtime还支持其他操作系统和硬件架构,包括Windows、macOS、x86/x64、ARM64以及GPU加速。 4. **持续更新**:随着版本的更新,ONNX Runtime不断引入新特性、...
- 对于 Windows 用户,建议使用最新的 Windows 10 并保持系统更新。对于较旧版本如 Windows 7 或 8,同样需要64位版本并确保所有更新已安装。 - 安装 Visual Studio 2017,以获得 Python 3.6 和开发支持。如果有旧...
9. **扩展性**:MXNet设计为跨平台,可以在多个操作系统(如Linux、Windows、MacOS)和硬件(CPU、GPU、FPGA)上运行。 10. **深度学习应用**:MXNet广泛应用于计算机视觉、自然语言处理、推荐系统等多个领域,如...
例如,`cudnn-windows-x86_64-8.9.1.23_cuda11-archive` 包含了 Windows 平台上的 x86_64 架构的 CUDNN 库文件,是为 CUDA 11 设计的归档文件。 总结,CUDNN for CUDA 11 是深度学习开发者的重要工具,它提供了高效...
3. **Windows 7兼容**:尽管Windows 7操作系统相对较老,但cuDNN v7.1.3仍然提供了对其的支持,让使用旧版操作系统的开发者也能享受到现代深度学习技术的便利。 4. **新功能**:v7.1.3版本引入了新的功能和优化,...
提到的一些关键词和术语,例如TensorFlow、Apache MXNet、GPU、ICT、Windows 10、C++等,都是与云计算和大数据处理密切相关的技术和工具。TensorFlow是一个由Google开发的开源机器学习框架,它支持大量深度学习模型...