人工智能无疑是计算机世界的前沿领域,而深度学习无疑又是人工智能的研究热点,那么现在都有哪些开源的深度学习工具,他们各自的优缺点又是什么呢?最近zer0n和bamos在GitHub上发表了一篇文章,对Caffe、CNTK、TensorFlow、Theano和Torch等深度学习工具从网络、模型能力、接口、部署、性能、架构、生态系统、跨平台等方面做了比较。
网络和模型能力
Caffe可能是第一个主流的工业级深度学习工具,它开始于2013年底,具有出色的卷积神经网络实现。在计算机视觉领域Caffe依然是最流行的工具包,它有很多扩展,但是由于一些遗留的架构问题,它对递归网络和语言建模的支持很差。此外,在Caffe中图层需要使用C++定义,而网络则使用Protobuf定义。
CNTK由深度学习热潮的发起演讲人创建,目前已经发展成一个通用的、平台独立的深度学习系统。在CNTK中,网络会被指定为向量运算的符号图,运算的组合会形成层。CNTK通过细粒度的构件块让用户不需要使用低层次的语言就能创建新的、复杂的层类型。
TensorFlow是一个理想的RNN(递归神经网络) API和实现,TensorFlow使用了向量运算的符号图方法,使得新网络的指定变得相当容易,但TensorFlow并不支持双向RNN和3D卷积,同时公共版本的图定义也不支持循环和条件控制,这使得RNN的实现并不理想,因为必须要使用Python循环且无法进行图编译优化。
Theano支持大部分先进的网络,现在的很多研究想法都来源于Theano,它引领了符号图在编程网络中使用的趋势。Theano的符号API支持循环控制,让RNN的实现更加容易且高效。
Torch对卷积网络的支持非常好。在TensorFlow和Theano中时域卷积可以通过conv2d来实现,但这样做有点取巧;Torch通过时域卷积的本地接口使得它的使用非常直观。Torch通过很多非官方的扩展支持大量的RNN,同时网络的定义方法也有很多种。但Torch本质上是以图层的方式定义网络的,这种粗粒度的方式使得它对新图层类型的扩展缺乏足够的支持。与Caffe相比,在Torch中定义新图层非常容易,不需要使用C++编程,图层和网络定义方式之间的区别最小。
接口
Caffe支持pycaffe
接口,但这仅仅是用来辅助命令行接口的,而即便是使用pycaffe
也必须使用protobuf定义模型。
CNTK的使用方式与Caffe相似,也是通过指定配置文件并运行命令行,但CNTK没有Python或者任何其他高级语言的接口。
TensorFlow支持Python和C++两种类型的接口。用户可以在一个相对丰富的高层环境中做实验并在需要本地代码或低延迟的环境中部署模型。
Theano支持Python接口。
Torch运行在LuaJIT上,与C++、C#以及Java等工业语言相比速度非常快,用户能够编写任意类型的计算,不需要担心性能,唯一的问题就是Lua并不是主流的语言。
模型部署
Caffe是基于C++的,因此可以在多种设备上编译,具有跨平台性,在部署方面是最佳选择。
CNTK与Caffe一样也是基于C++并且跨平台的,大部分情况下部署非常简单。但是它不支持ARM架构,这限制了它在移动设备上的能力。
TensorFlow支持C++接口,同时由于它使用了Eigen而不是BLAS类库,所以能够基于ARM架构编译和优化。TensorFlow的用户能够将训练好的模型部署到多种设备上,不需要实现单独的模型解码器或者加载Python/LuaJIT解释器。但是TensorFlow并不支持Windows,因此其模型无法部署到Windows设备上。
Theano缺少底层的接口,并且其Python解释器也很低效,对工业用户而言缺少吸引力。虽然对大的模型其Python开销并不大,但它的限制摆在那,唯一的亮点就是它跨平台,模型能够部署到Windows环境上。
Torch的模型运行需要LuaJIT的支持,虽然这样做对性能的影响并不大,但却对集成造成了很大的障碍,使得它的吸引力不如Caffe/CNTK/TensorFlow等直接支持C++的框架。
性能
在单GPU的场景下,所有这些工具集都调用了cuDNN,因此只要外层的计算或者内存分配差异不大其表现都差不多。本文的性能测试是基于Soumith@FB的ConvNets基准测试来做的。
Caffe 简单快速。
CNTK 简单快速。
TensorFlow仅使用了cuDNN v2,但即使如此它的性能依然要比同样使用cuDNN v2的Torch要慢1.5倍,并且在批大小为128时训练GoogleNet还出现了内存溢出的问题。
Theano在大型网络上的性能与Torch7不相上下。但它的主要问题是启动时间特别长,因为它需要将C/CUDA代码编译成二进制,而TensorFlow并没有这个问题。此外,Theano的导入也会消耗时间,并且在导入之后无法摆脱预配置的设备(例如GPU0
)。
Torch非常好,没有TensorFlow和Theano的问题。
另外,在多GPU方面,CNTK相较于其他的深度学习工具包表现更好,它实现了1-bit SGD和自适应的minibatching。
架构
Caffe的架构在现在看来算是平均水准,它的主要痛点是图层需要使用C++定义,而模型需要使用protobuf定义。另外,如果想要支持CPU和GPU,用户还必须实现额外的函数,例如Forward_gpu
和Backward_gpu
;对于自定义的层类型,还必须为其分配一个int类型的id,并将其添加到proto文件中。
TensorFlow的架构清晰,采用了模块化设计,支持多种前端和执行平台。
Theano 的架构比较变态,它的整个代码库都是Python的,就连C/CUDA代码也要被打包为Python字符串,这使得它难以导航、调试、重构和维护。
Torch7和nn类库拥有清晰的设计和模块化的接口。
跨平台
Caffe、CNTK和Theano都能在所有的系统上运行,而TensorFlow和Torch则不支持Windows。
原文地址: http://www.infoq.com/cn/news/2016/01/evaluation-comparison-deep-learn
相关推荐
《Tensorflow实战Google深度学习框架源码》是一个深入学习资源,包含了从第3章到第10章的源代码,旨在帮助用户理解并熟练运用Tensorflow这一强大的深度学习框架。Tensorflow是由Google开发的开源库,它允许研究人员...
在过去的几年里,深度学习框架的出现极大地推动了这一技术的发展和应用。以下是关于"10个经典深度学习框架"的详细解释: 1. **TensorFlow**:由谷歌开发的开源库,支持数据流图模型,适用于各种机器学习任务,包括...
《人工智能深度学习算法评估规范》是中国人工智能开源软件发展联盟(AIOSS)发布的一项标准,旨在为深度学习算法的评估提供一套系统化、规范化的框架。该标准在2018年7月1日发布并实施,对于推动我国人工智能领域的...
深度学习框架Tensorflow是Google开发的一种强大的开源库,专门用于构建和执行计算图,这些计算图可以处理复杂的数学和统计运算,尤其适用于机器学习和深度学习任务。Tensorflow以其灵活性、高效性和广泛的社区支持而...
PyTorch是Facebook开源的一个强大而灵活的深度学习框架,以其动态计算图模式和易于使用的特性受到了广大开发者和研究者的青睐。本篇将深入探讨PyTorch的核心概念、关键功能以及在实际项目中的应用。 一、PyTorch...
**TensorFlow实战Google深度学习框架** 本书《TensorFlow 实战Google深度学习框架》是一本针对初学者和进阶者设计的教程,旨在帮助读者全面掌握TensorFlow这一强大的深度学习库。TensorFlow是由Google Brain团队...
7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于...
通过阅读《TensorFlow 实战Google深度学习框架》这本书,你可以逐步学习如何构建和训练深度学习模型,包括数据预处理、模型构建、训练过程以及模型评估和部署。 本书涵盖了从基础到高级的各种主题,适合深度学习...
【深度学习框架对比】 在深度学习领域,有多个框架供研究者和开发者选择,其中TensorFlow、Caffe和Theano是最具代表性的。这些框架各自具有独特的特点和优势,适用于不同的应用场景。 首先,TensorFlow是由Google...
《Tensorflow实战Google深度学习框架》是一本深入探讨Tensorflow这一强大开源库的书籍,旨在帮助读者理解并掌握Google开发的深度学习平台。Tensorflow在机器学习和人工智能领域扮演着重要角色,它提供了灵活的环境,...
深度学习框架是现代人工智能发展的重要基石,它为开发者提供了构建、训练和部署大规模神经网络模型的工具。在“深度学习框架学习.zip”这个压缩包中,我们很可能会找到一系列关于深度学习框架的学习资料,比如教程、...
深度学习框架是现代人工智能发展的重要基石,它为开发者提供了构建、训练和部署深度学习模型的工具和环境。这篇市场简报将深入探讨深度学习框架的本质,并分析为什么中国的AI企业正在积极开发自己的开源深度学习框架...
为满足船舶腐蚀检测与评估自动化、智能化的需求,本项目依托PaddlePaddle深度学习框架,选择检测效果较好的模型检测船舶腐蚀,利用腐蚀率对船舶腐蚀进行评估,并开发了船舶腐蚀检测与评估系统。 gui文件夹为船舶腐蚀...
4. 并行与分布式训练:深度学习框架支持GPU并行计算和分布式训练,加速模型收敛。 5. 预训练模型集成:许多框架提供了丰富的预训练模型库,可以直接用于迁移学习或微调。 二、主流深度学习框架对比: 1. TensorFlow...
"人工智能深度学习算法评估规范完整版"提供了一套全面的准则,帮助研究者和开发者系统地衡量其算法的效率与效果。 首先,我们要理解深度学习算法评估的基本概念。评估主要关注以下几个方面: 1. **准确性...
《TensorFlow实战Google深度学习框架(第2版)》是一本深入探讨TensorFlow这一强大开源深度学习库的书籍。本书的源代码提供了丰富的实例和练习,帮助读者掌握TensorFlow的核心概念和技术,从而在实际项目中应用深度...
**Paddlex深度学习框架详解** Paddlex是由百度开源的一款深度学习开发工具,它旨在降低深度学习模型的开发难度,让开发者能够更加便捷地进行模型训练、验证、优化以及部署。Paddlex支持多种任务类型,包括图像分类...
近年来,图计算在搜索、推荐和风控等场景中获得显著的效果,但也面临超大规模异构图训练,与现有的深度学习框架Tensorflow和PyTorch结合等难题。 Galileo(伽利略)是一个图深度学习框架,具备超大规模、易使用、易...