原文地址:http://www.iteye.com/news/30029
摘要:有报告称,数据科学家的平均年薪为11.9万美元,而程序员的平均年薪为6.5万美元,差距由此可见。数据科学家在美国非常火,不仅谷歌、亚马逊等高科技公司需要数据科学家,那些非高科技公司沃尔玛等也需要。
你擅长数学,会用Python编程,而且还对某个行业了如指掌?
如果你拥有这样的技能集,那你就有可能当上数据科学家。而如果你当上了数据科学家,那你的日子就可以过得风风光光了——LinkedIn的最新投票结果显示,“统计分析和数据挖掘” 是2014年最大的求职法宝。
美国招聘网站Glassdoor的报告称,数据科学家的平均年薪为118709美元(约合人民币737550元),而程序员的平均年薪为64537美元(约合人民币400974元)。麦肯锡公司的一份研究预测称,到2018年,在“具有深入分析能力的人才”方面,美国可能面临着14万到19万的缺口,而“可以利用大数据分析来做出有效决策的经理和分析师” 缺口则会达到150万。
该领域目前异常火爆,纽约大学数据科学中心课程的负责人罗伊-洛伦斯(Roy Lowrance)表示,现在可能已经到了巅峰期。“也许存在着泡沫,” 他说。 “无论什么事情,一旦变得这样火爆,之后就肯定就会冷下来。”不过,纽约大学希望在未来几年里扩大数据科学课程的招生规模,把学生人数从40名增加到60名。本学年还有五个月才会结束,但50%到75%的学生已经找到了比较理想的工作。
为什么该领域会变得如此火爆?琳达-博奇(Linda Burtch)是芝加哥的猎头公司博奇工程的董事总经理,她表示,尽管像谷歌、亚马逊、Netflix和Uber这样的高科技公司都有自己的数据科学团队,但那些非高科技公司,比如Neiman Marcus、沃尔玛、Clorox和Gap,它们现在也需要使用这方面的人才,“很多公司都在物色数据科学家,”她说。
这些公司希望,数据科学专业人才可以挖掘新的信息,来帮助公司开源节流。IBM负责大数据业务的副总裁Anjul Bhambhri表示,航空航天制造商Pratt & Whitney现在可以预测出飞机发动机何时需要进行维护,准确率达到97%,这可以帮助它更加有效地开展业务。
虽然IBM在本月刚刚推出了基于云计算的Watson Analytics免费增值工具,但是,为了分析非结构化数据,数据科学家常常不得不亲自动手编写专门的软件程序,这正是数据科学家必须掌握编程技巧的一个原因。
学校教育
洛伦斯说,数据科学家需要具备三项基本技能:数学/统计、计算机能力、在特定业务领域的知识。纽约大学数据科学中心希望招收至少具备其中一种技能的学生,然后培养他们掌握其他技能,让学生到毕业的时候,可以独当一面负责处理数据工作。 “在学习过程中,他们要做一些数据科学项目,这些项目需要他们用到这三种技能,”他说。
但是,如果你想成为一名数据科学,也不一定非得去大学读书才行。从今年9月开始,一家名为梅蒂斯(Metis)的公司开始在纽约举办为期十二周的数据科学训练营,费用为1.4万美元。报名的人非常之多,入学竞争相当激烈。梅蒂斯公司的联合创始人杰森-莫斯(Jason Moss)说,大约有一半的学生都拥有硕士或博士学位。
第一期训练营在12月初结束。莫斯说,不过几周, 15名学生中就有6名拿到了聘用通知。
“我不认为训练营可以替代大学教育,”莫斯说。“训练营可以提供一条捷径,让你以最快的速度找到一份工作,但大学的目的不在于此。但我也不认为你必须上大学才能成为一名数据科学家,”他说。“有一种人,他们天生具有好奇心,有勇气,有决心,总想把事情理出头绪,他们在这一行可以干得很好。”
Anmol Rajpurohit是一名独立的数据科学家兼顾问,他说,做这一行工作最重要的素质就是能够快速学习东西。“与专长于任何特定编程语言相比,泛型编程技巧远远更加重要,”他说。 “在如今这个时代,技术的发展突飞猛进,语言会很快过时,新的语言则将迅速普及。因此,学东西很快的人,会比单独领域的专家更有前途。”
洛伦斯说,他认为,在某些技能方面,训练营和网上课程可以为学习者提供很大的帮助。但在另外一些方面,它们的作用就就相对有限了。纽约大学的数据科学课程有一个优势,就是可以按照正确的先后顺序来培养你的技能。“我们的教学顺序可以让你循序渐进、融会贯通地掌握技能。”他说。
数据科学家要做哪些事?
游戏公司Playstudios的数据科学家乔恩-格林伯格(Jon Greenberg)说:“在日常工作中,我需要管理一系列控制面板,它们提供的信息可以让公司知道,我们的生意到底做得怎么样? 用户在做什么事情?”格林伯格现在是一名经理了,所以他编程的时候没有以往那么多,但是他有时候仍然需要编程。通常来说,他把数据从Apache Hadoop的存储器里调取出来,在分析平台Revolution R上运行它,并对它进行一些可视化处理。 “比如说,我们可以从中得知一部分用户如何与新推出的功能互动,”他解释说。
六年前,格林伯格拿到了统计学的硕士学位。他希望进入政府部门工作,但却惊讶地发现,公司企业非常需要数据科学家。 “那个时候,数据科学领域还没有现在这么火爆,,”他说。现在,他每天都能从猎头那里收到一个电话或一封邮件。 “这种情况不只是发生在我身上,”他说。“所有的数据科学家可能都是这样。”
对于格林伯格来说,就业机会很好只是一个加分项,因为他本来就热爱这一行。 “我认为,要做数据科学工作,你必须得有分析头脑才行,而且还得有好奇心,”他说。“你必须得有灵活性和创造性,构思出不同的方法来解决问题。”这项工作的唯一缺点,格林伯格说,就是“清洁”数据(去掉那些没有相关性的结果)需要花费大量时间。“这部分任务并不是那么招人喜欢,你得花很多时间来做它。”他说。
Rajpurohit说,他花了很多精力来清洁数据和做研究。 “我很大一部分时间都花在做研究上,因为我经常会遇到全新的问题,因此,我需要研究特定领域最新文献,或者是找找专家,听听他们在这方面的看法,”他说。
“尽管数据科学这个名字和艺术毫不沾边,但是你需要把艺术和科学很好地结合起来。科学的部分很明显——数学,程序设计等等。但艺术部分是同样重要——创造力,对语境有着深刻的理解。把这两部分结合在一起,你就会变得善于解决问题。”
尽管如此,Rajpurohit也承认,数据科学并不像眼下很多人以为的那样善良迷人。这个领域确实是在变得越来越重要,而且也出现了很多高薪机会,但在数据科学家需要做的日常工作中,有很多其实都很枯燥。
你是当数据科学家的料吗?
每天花大量时间来编程,分析控制面板上的数据,获得相关信息,如果你对这样的工作感兴趣,那么你可能就适合干这一行。但如果你仅仅是想拿高工资,那么你可能就会觉得这样的日子过起来苦不堪言。你要知道:真正适合干这一行的人,常常会在业余时间里编写程序,分析数据,而他们这样做只是为了自娱自乐。
亚当-弗洛葛尔(Adam Flugel)是博奇公司的数据科学招聘猎头,他谈到了最近遇到的一名候选人。此人拥有博士学位,今年秋天将去电艺公司(Electronic Arts)工作。“真正让他脱颖而出的是优势是,他在空闲时间也做这种事情,而且纯粹就是为了好玩,”弗洛葛尔说。“他是多人在线游戏世界《坦克世界大战》的玩家,领导着一个玩家团队。于是他编写了一个从游戏服务器抓取数据的程序,然后进行数据分析,评估自己团队的表现。然后他利用这些信息来弄清应该如何调整自己的战略,应该招收哪些类型的成员,才能提升团队的整体表现。”
所以,如果你爱的并不是数据本身,而是它可以给你带来的高薪,那么你会发现,自己很难与那样的人竞争。但是博奇说,每个人都应该学会热爱数据,即便只是为了自己事业前途着想,也该这样做。 “十年之内,如果你不是数据大咖,你就别想升到‘首席XX官’的位置上”博奇说。
但是像史蒂夫-乔布斯、比尔-盖茨那样的情况又怎么解释呢?他们拥有远见卓识,并没有陷入数据科学的细枝末节之中。“那是30年前的事了,”博奇说。 “我说的是未来10年。”
本文来自:腾讯科技
分享到:
相关推荐
2. **职业前景广阔**:数据科学家成为领英上增长最快的职业之一,反映了该行业旺盛的需求。 3. **伦理与隐私关注增加**:随着人工智能在医疗、法律等敏感领域的应用日益广泛,数据科学界对伦理和隐私问题的关注度...
2. **数据内容**:2010-2015年的数据可能包括年龄、性别、种族、族裔、教育水平、职业、收入、家庭结构、婚姻状况、住房状况、出生地、移民状况等多种人口统计指标。这些数据通常以表格形式存在,可能包含国家、州、...
【CGSS2015年SPSS数据库】是中国综合社会调查(China General Social Survey, CGSS)在2015年度收集的数据集,它是一个基于SPSS格式的数据库,包含了丰富的社会学研究数据。SPSS(Statistical Package for the ...
标题 "1995-2015年人口1%抽样调查资料" 指的是一个涵盖了1995年至2015年间中国人口数据的统计样本。这种抽样调查是政府为了获取全国人口状况的重要手段,通常每隔一定年份进行一次,以收集关于人口数量、结构、分布...
第四届“泰迪杯”全国数据挖掘挑战赛是由中国举办的面向全国数据科学家的一项竞赛。 关于比赛举办的具体年份,文中提到的是2016年,这可以推断比赛是每届间隔一定时间周期举行的。比赛期间的日期被提及为8月16日至...
数据分析师职业发展白皮书目录数据分析职业发展历程数据科学家的能力构成与CDA能力发展体系数据分析师需求数据分析师人才供给数据分析师行业发展展望1.国外数据分析行业发展历程 2.国内数据分析师职业发展历程1....
R是一种广泛应用于统计计算和图形可视化的开源编程语言,特别适合于数据科学家和统计学家。它拥有丰富的库和工具,如ggplot2用于高级数据可视化,dplyr用于数据操作,以及caret用于构建和评估机器学习模型。 在文件...
在书籍的印刷历史上,本书的完整版本是在2016年7月5日印刷的,最初版本是在2015年12月20日完成的粗略转换。 《适用于所有人的Python:探索Python 3中的数据》这本书适合作为数据科学和数据库的学习入门书籍,它不仅...
Amherst统计建模与数据可视化课程2015春季版》是一门深度覆盖统计学核心概念和现代数据可视化技术的课程,通过学习,学生不仅可以掌握统计建模的方法,还能提升数据可视化技能,为未来在数据科学领域的职业生涯打下...
数据科学家的工作职责可能在某些行业中扩大,例如保险业,他们为适应未来的需求而做出准备。 此外,报告还指出了行为健康专业人员需求的增加。自2015年以来,行为健康技术人员的招聘增长平均每年增长了32%,这反映...
2017年中级综合能力知识点汇编主要针对全国通信专业技术人员职业考试,旨在帮助备考者掌握必要的专业知识。 1. **通信技术发展趋势**: - 数字化:通信技术的核心转变之一是向数字化迈进,这使得信息传输更加高效...
2. 疾病分布:疾病在不同人群、地区和时间上的表现,包括人群分布(如年龄、性别、职业等)、地区分布(如城市、农村、国家间)和时间分布(季节性、周期性)。 3. 流行病学研究类型:观察性研究(如队列研究、病例...
通过应用CW-LSTM算法,文章使用了某高校2011至2014级学生在2012年至2015年间的消费和行为数据进行分析,验证了该方法在识别贫困学生方面的有效性。这种方法不仅可以提高识别的准确性和效率,还有助于高校更精准地...
流生问题在中国职业教育中日益严重,根据福建省教育统计年鉴,2013至2015年中职学校学生的流失率逐年攀升,达到了惊人的比例,对职业教育的质量和效果产生了负面影响。 传统的流生研究通常将学生流失归因于内部和...