阅读更多

0顶
0踩

编程语言

转载新闻 Python正在取代R,成为数据科学界新宠

2013-12-04 10:28 by 见习编辑 tuhaihe 评论(2) 有13767人浏览
R语言不是真正的语言

人们学习R很困难的一部分原因是,它并不是一种真正的编程语言。John Cook是一位R专家,他曾说:“R是一个做统计的交互环境,不是一种真正的编程语言。把R看做包含有编程语言的交互环境会更有帮助。



但正如Bob Muenchen强调的,R甚至对于那些精通SAS和SPSS数据统计工具的人来说都是困难的。关于R为分析师降低了复杂性的问题,还有待争议,虽然R包含宏和矩阵语言,此外,你还需要掌握像SPSS等工具。但是对于那些期待R去实现类似Stata的功能的人,他们注定要失望。

综合考虑,R的与众不同使它较难学习。

Python降低数据科学技术壁垒

然而,Python更加平易近人。一方面,各种各样的开发人员都熟悉Python并在广泛的应用领域使用它。不像R几乎只用于数据分析,一个开发人员在第一次编写他的网站脚本或其他应用程序时,就可以体验到Python。



随着企业竭尽所能地使用数据,他们也正在努力寻找合格的数据科学家。然而,正如Gartner的Svetlana Sicular所假设的,在本公司内对员工培训一些简单的大数据技术,比培训新雇佣的数据科学家复杂的商业知识更有效率。

Python“所向披靡”

但是,除了可以利用现成的Python开发者资源,用Python语言做数据科学的最大好处之一是:在不同的应用程序中使用一种编程语言所增加的效率。德克萨斯大学奥斯汀分校研究助理Tal Yarkoni解释说:“事实证明,使用一种语言来做所有的开发和分析的好处是相当可观的。一方面,当你可以用同一种语言做所有的事情的时候,你就不必一直提醒自己:Ruby使用blocks而不是comprehensions,在Python中得到数组的大小应当调用len(array),而不是array.length……

另外,你不需要再担心项目的不同模块采用不同语言的接口问题。没有什么比在Python中解析一些文本数据,然后将它转换成内部使用所需要的格式,最后才发现必须将它以另一种格式写到磁盘上,以便R或者MATLAB去做分析更烦人的了。只要使用单一的语言,所有这些开销都将消失。”

我们可以夸赞某个技术完美地解决了一个问题,但往往胜出的技术是解决一系列问题的通用工具。正如AppNexus优化和分析主管David Himrod指出:“AppNexus面临的最大挑战之一是如何让不同的员工使用相同的技术来工作。Python为具有不同背景的员工(尤其是工程师,数学家和分析师)提供了一种常见的、容易理解的语言,可用于公司将新功能进行标准化。”

使用Python的主流数据科学

相比R丰富的数据分析能力,Python尚有很多不足,但是它正在迅速的缩小差距。请记住:Python成功的关键并不是它比R或其他分析工具能够处理更神秘的功能,而在于它的平易近人和通用的性质。数据科学正在走出头号怪胎的领域,上个月在纽约举行的O'Reilly's Strata会议这一点尤为明显:过去的与会者多是学术领域的博士,现在则是关键的业务分析师和其他被企业要求去弄清楚大数据业务的人。

相比R,这种新的,早期的“数据科学家”,将更多地使用Python。Python使用起来相对简单,而且他们可能已经将其用于一个项目中了。至于在其他市场,相比于那些功能强大但复杂的工具,熟悉或者容易学习的工具更容易取胜。(文:任云)
  • 大小: 3.1 KB
  • 大小: 2.5 KB
来自: CSDN
0
0
评论 共 2 条 请登录后发表评论
2 楼 remyzane 2013-12-04 16:30
人生苦短,我用Python
1 楼 eisenwolf 2013-12-04 10:46
linux貌似都默认安装python库

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 理解cocoon

     cocoon是一个基于XML的Web发布框架,提供了一套机制真正实现了内容,逻辑,和表现形式的分离 cocoon具有高效的可配置性和复杂的缓存机制. 1.cocoon的安装 cocoon本身是一个web application,需要在有servlet engine的服务器中运行。 解开cocoon的安装包(现在稳定的版本是2.0.3),会有一个名为cocoon.war的WAR包, 这是安装唯一用

  • python是不是真正的有用_Python正在取代R,成为数据科学界新宠

    Python正在取代R 成为数据科学界新宠摘要:R是数据科学家历来选择的编程语言,但它正在迅速地让位给Python。最大原因是:Python更通用且相对容易学习,而R需要掌握复杂的编程环境。R:不是真正的语言人们学习R很困难...

  • Python正在取代R 成为数据科学界新宠

    摘要:R是数据科学家历来选择的编程语言,但它正在迅速地让位给Python。最大原因是:Python更通用且相对容易学习,而R需要掌握复杂的编程环境。 R:不是真正的语言 人们学习R很困难的一部分原因是,它并不是一种...

  • Python正在取代R,成为数据科学界新宠(转)

    R:不是真正的语言 人们学习R很困难的一部分原因是,它并不是一种真正的编程语言。John Cook是一位R专家,他曾说:“R是一个做统计的交互环境,不是一种真正的编程语言。把R看做包含有编程语言的交互环境会更有...

  • python回归分析五部曲_干货丨8种用Python实现线性回归的方法

    未必“宝刀不老”的线性回归时至今日,深度学习早已成为数据科学的新宠。即便往前推10年,SVM、boosting等算法也能在准确率上完爆线性回归。为什么我们还需要线性回归呢?一方面,线性回归所能够模拟的关系其实远不止...

  • python中如何对一个属性或方法进行封装_python中的方法

    大数据文摘作品作者:TirthajyotiSarkar编译:丁慧、katherine Hou、钱天培说到如何用Python执行线性回归,大...没错,作为数据科学界元老级的模型,线性回归几乎是所有数据科学家的入门必修课。抛开涉及大量数统...

  • python 线性回归函数_8种用Python实现线性回归的方法,究竟哪个方法最高效?

    大数据文摘作品作者:TirthajyotiSarkar编译:丁慧、katherine Hou、钱天培说到如何用Python执行线性回归,大...没错,作为数据科学界元老级的模型,线性回归几乎是所有数据科学家的入门必修课。抛开涉及大量数统...

  • 运用python的方式_8种用Python实现线性回归的方法

    “宝刀不老”的线性回归时至今日,深度学习早已成为数据科学的新宠。即便往前推10年,SVM、boosting等算法也能在准确率上完爆线性回归。为什么我们还需要线性回归呢?一方面,线性回归所能够模拟...

  • 害(haì)!Python不香了?Julia大法好?

    配图来自pexels近几年,由MIT CSAIL 实验室开发的编程语言Julia已然成为编程界的新宠,尤其是在学科计算领域。最近一篇标题为Bye-bye Python. Hello Ju...

  • python 线性回归 技术方案亮点_8种用Python实现线性回归的方法,究竟哪个方法最高效?-阿里云开发者社区...

    没错,作为数据科学界元老级的模型,线性回归几乎是所有数据科学家的入门必修课。抛开涉及大量数统的模型分析和检验不说,你真的就能熟练应用线性回归了么?未必!在这篇文章中,文摘菌将介绍8种用Pyth...

  • 【Python、C++、R 三合一效果好】Julia 重磅发布,全球热度上升最快

    IT派助力深广创业,免费代发招聘信息,了解一下? 近年来,Julia 语言已然成为编程界的...

  • 8种方法用Python实现线性回归,为你解析最高效选择

    来源:大数据文摘编译:丁慧、katherine ...说到如何用Python执行线性回归,大部分人会立刻想到用sklearn的linear_model,但事实是,Python至少有8种执行线性回归的方法,sklearn并不是最高效的。今天,让我们来谈谈线

  • COBOL语言简介

    COBOL语言 COBOL的全称是Common Business Oriented Language,意即:通用商业语言。 在企业管理中,数值计算并不复杂,但数据处理信息量却很大。为专门解决经企管理问题,于1959年,由美国的一些计算机用户组织设计了专用于商务处理的计算机语言COBOL,并于1961年美国数据系统语言协会公布。经不断修改、丰富完善和标准化,已发展为多种版本。 COBOL语言使用了3

  • SAX和DOM

    SAX是用于处理 XML 的基于事件的 API,SAX 是对“文档对象模型”或者 DOM 的补充 DOM 是用于由 W3C 发布的 XML 语法分析器的基于对象的 API SAX: 是基于事件的 API。 在一个比 DOM 低的级别上操作。 为您提供比 DOM 更多的控制。 几乎总是比 DOM 更有效率。 但不幸的是,需要比 DOM 更多的工作。 作为基于对象的接口,DOM 通过在内存中显示地构

  • StrutsCS

    StrutsCS是一个开源项目,它是基于Struts的一个Web应用开发框架。StrutsCS项目使我们可以使用XML、XSLT、Xpath等技术和Struts框架开发Web应用,而不是采用Struts中使用的JSP技术。而且StrutsCS中可以经过简单的配置开发工作后将输出格式变为WML、PDF等,所以扩展性更好。 简单地说,StrutsCS就是使用XSLT而不是JSP作为表示层的Struts

  • JSF

    目前Java Community Process(JCP)正在进行最终草稿审核的Java Specification Requests(JSR) 127 - Java Server Faces(JSF)(http://www.jcp.org/en/jsr/detail?id=127)就是一个基于JAVA技术的Web应用框架标准,同时也是对于J2EE标准的一个重大补充。JSF使得您能够轻松而方便地设

  • 今天看到sharepoint

    今天在网络上闲逛时偶然发现这个东西,特别浏览了一下 先摘抄一部分: SharePoint Portal Server 2003是一种连接到整个业务流程中所有个人、团队和知识的可伸缩门户服务器。 通过单点登录和企业应用程序集成功能,SharePoint Portal Server 2003将来自不同系统的信息集成到一个安全的解决方案中。它提供了灵活的部署和管理工具,使得通过数据整合、组织和搜索的端到

  • 好消息:SqlServer2005

    兩項最Cool的特性! 1、CLR集成。可以與VS2005開發環境完美的集成,現在,我們可以用我們自己喜歡的語言(C#/VB?NET)來寫StoredProcedure和Function了! 2、XCopy部署數據庫!是的,當要移動數據庫時,我們只需要將數據庫像文件那樣拷貝到另一臺電腦上,然後,修改數據庫連接字符串中的“AttachDBFilename”參數的值為數據庫文件所在的路徑,其他一切就不

Global site tag (gtag.js) - Google Analytics