文 | 帆软数据应用研究院 水手哥
更多大数据资讯和企业案例可关注 :知乎专栏《帆软数据应用研究院》
近日,Gartner公布了2017年度数据科学和机器学习领域的最酷供应商,清一色的美国厂商,但还是实至名归的。
何为“最酷供应商”?Gartner定义为具有以下技术或服务的小型公司,有三个评选维度:一是创新力,为用户带来前所未有的工作和生活方式。二是影响力,具有或即将具有商业影响力,而不仅仅是“一种技术”。三是吸引力,在过去6个月时间内引起了分析师的兴趣或好奇心。简而言之,所谓最酷供应商,即行业的明日之星。
一、评选背景
Gartner的2017年数据科学平台魔力象限调研数据显示,人才问题,即缺乏足够技能的用户仍然是数据科学计划中最突出的障碍,机器学习和其他高级分析技能的人才需求不能得到满足。调查中同样表明,R和Python语言依然是主流语言,但是Spark的应用比例较去年翻了一番,Scala也开始崭露头角。详见下图。
数据和分析领导者正在寻求新的方法,以更好地应用数据科学和机器学习,他们迫切需要将开源技术和新概念融入到复杂的企业环境中的软件产品,从而在数据科学中的那些广受推崇的技术中获得真正价值。所以,在今年Gartner围绕开源支持、解决人才危机和在数据科学前沿研究课题创新三个方面,评选出了4个最酷的供应商。
二、4个最酷供应商
1、Continuum Analytics(www.continuum.io)
为什么酷:如果有一个企业被认为是python成功的驱动力,那么它必须是Continuum Analytics。随着其Anaconda分布的Python库,Continuum是任何Python软件工程师所熟知的。Continuum Analytics正在通过数据科学平台扩大其企业产品。Anaconda集成了最好的开源Python库,使它们易于使用和维护。它还在Python开放源代码世界中建立了参考堆栈。它还提供了可视化功能(Bokeh),一个用于Python(Numba)的快速编译器和用于大数据科学工作负载(Dask)的并行化框架。
存在的挑战: Continuum Analytics通常为提供Anaconda分发的Python库以及其包管理器Conda而着名。然而,最近已经展现了建立数据科学平台供应商的雄心。该平台目前在Anaconda的各个部分(如TensorFlow,Theano,scikit-learn,Jupyter,R,Spark)之间缺少集成组件,还需要更加一致的外观和感觉。
2、DataRobot(www.datarobot.com)
为什么酷: DataRobot为广泛的数据科学人才短缺提供了一个创新的解决方案,可能会严重影响数据科学人员配置举措和数据科学团队的最佳结构。该供应商的产品也可以作为许多个人希望在机器学习中获得兴趣的催化剂。其机器学习平台的设计利用了数据准备,功能工程,模型选择和部署自动化的自动化程序,目的是通过高级分析简化和加速洞察力的产生。Gartner将这套功能称为智能数据发现 - 商业智能(BI)和分析市场的下一波中断。
DataRobot的自动化模型构建为用户提供了从多个来源(如R,Python,H2O和Spark)中提取的最佳拟合模型的排行榜。机器学习的这种指导性方法呼吁经验丰富的数据科学家寻求更高的生产力和公民数据科学家寻求更高级的数据科学功能。
目前,DataRobot的自动化和引导界面功能比其他具有类似价值主张的产品领先一步。与其他自动化机器学习解决方案或智能数据发现工具不同的是,DataRobot不是一个黑匣子。数据科学家,数据工程师和其他好奇的分析思想可以在下面看起来,以检查解决方案的功能工程,并收集DataRobot自己的数据科学家团队优先考虑的技术。这种透明度对于高度受管制行业的数据和分析领导者,或者对于模型具有强大的治理和可审计性要求的组织特别有吸引力。
存在的挑战: DataRobot面临着自动化机器学习和智能数据发现领域的竞争,几乎全部是 “数学科学平台的魔力象限”的供应商,其中有一些用于商业智能和分析的魔力象限(如IBM与沃森分析公司,Salesforce's BeyondCore )和许多其他创业公司。数据科学领域和现代BI和分析领域的供应商将力图利用数据科学家的供求之间日益扩大的差距。超越竞争对手的这一冲击将是关键的挑战,特别是因为我们认为专利不太可能在这个领域提供足够的保护。
3、Experfy(www.experfy.com)
为什么酷: 基于哈佛创新实验室,Experfy开创了采用数据科学人才的另一种方法,解决通过高度成就的数据科学专家的市场寻找一流技能的问题。Experfy验证了市场上列出的所有个人的经验和说明的技能。这种方法可以将客户与由于缺乏预算而不能全职雇用的专家连接,或者因为这些数据科学家在学术界或更理想的雇主中高兴地工作。
Experfy的咨询市场将请求者的项目与数据科学人才进行了算术匹配,因此请求者获得竞争性投标,节省开支,同时提高质量,减少项目的时间。Experfy还通过一个正在蓬勃发展的按需培训平台,为客户的员工提供高质量的教育。它提供由专家开发和实施的50个在线课程,或者也可以在现场提供任何课程。Experfy渠道是另一个创新,Experfy将其方法应用于特定的数据科学产品,如RapidMiner和Statistica。Experfy使用其严格的验证过程策划产品专用人才库,为特定产品创建项目市场,并利用其专家为产品开发培训。
虽然它成立于2014年,但已经拥有一批高素质的企业客户,以及数据科学平台供应商和创业公司。
存在的挑战: 为了维持其目前的专家社区增长率,同时保持其高标准的进入壁垒,可能会凸显经验不足的短板。经验丰富的公司可能会面临其他创新型公司的激烈竞争,这些公司正在探索定位和应用数据科学人才的替代方法,例如,Kaggle(最近被Google收购),Gigster和Aigency。
Experfy还将面临来自封闭数据科学人才差距的其他方法的竞争。许多大型供应商和创业公司都发布了智能数据发现工具和指导性分析,可以执行数据科学家的许多任务。许多组织正在着手制定公民数据科学家培训计划,为数据科学项目做出重大贡献。大学也在本科和研究生层面生产更多的年轻人才,他们接受过R,Python和Spark等开源技术的培训。但是,在可预见的将来,对数据科学人才的需求将远远超过供应量。
4、Skymind(https://skymind.ai)
为什么酷: Skymind,独特地提供基于Java的深度学习功能,可以使用少数商业可用的开源深入学习框架之一本机利用Apache Hadoop和Spark:Deeplearning4j。Skymind为深度学习技术提供支持,培训和服务,这对大多数企业来说是新的,但具有重大的潜力。Skymind的技术适用于各种数据科学问题,如高精度推荐系统,图像识别和异常检测,欺诈检测和合规违规。
大多数其他深入学习框架具有强大的研究或学术根源(Torch,Caffe,TensorFlow,Microsoft Cognitive Toolkit),因此,它们依赖Python,R或Scala等编程语言进行原型设计。然而,这些软件语言对企业来说仍然是一些新鲜事。相反,Skymind专注于Java - 生产部署中最广泛的语言 - 呼吁企业环境,并增加对现有企业架构投资的价值。凭借Java编写,Skymind可以直接利用流行的技术来存储深入学习所需的数据--Hadoop,Kafka或Elasticsearch以及Spark。Skymind还促进基于JavaScript的可视化来说明数据的有趣方面和深入学习的结果。Skymind” 客户称赞解决方案的灵活性; 它是白盒子和开源的。
存在的挑战: 深度学习处于快速演变的状态。因此,Skymind也必须快速发展,以跟上竞争对手和终端用户的需求。Skymind的未来版本虽然更高级,但可能与当前产品不兼容。深入学习创新的步伐可能导致切入点,软件错误等缺陷。目前,Skymind通过在Gitter聊天解决了许多问题,但这可能不足以最终取得成功 - 特别是Deeplearning4j,这强调了其产品。
鉴于深度学习的巨大潜力,以及大量投资于一些深入学习的框架(如BigDL和TensorFlow),Skymind的资金可能不足以保持领先地位。
相关推荐
2017年Gartner 发布网络安全综合发展报告,内容精辟到位,可参考。
Gartner作为全球知名的IT研究与咨询公司,最近推荐了四家在数据安全领域具有创新性的供应商,它们提供的解决方案旨在帮助企业安全地最大化数据的价值。 这些创新产品主要集中在以下几个方面: 1. **扩展和简化数据...
### Gartner发布的数据安全平台市场指南关键知识点解析 #### 市场背景与定义 - **数据安全平台(Data Security Platform, DSP)**是一种能够有效整合数据安全控制、业务逻辑及细粒度授权的安全解决方案。它能够显著...
2017年2月16日,Gartner发布了2017年BI商业智能和分析平台魔力象限报告,笔者这里进行一些解读,帮助大家更好了解市场状况和趋势。
Gartner-数据分析领域10大技术趋势.pdf
人工智能正逐渐渗透到各个领域,由于计算能力的提升、海量数据的可用性和深度学习的突破,AI成为最具颠覆性的技术之一。其中包括深度学习、深度强化学习、通用人工智能、自动驾驶等。企业应关注这些技术,利用它们...
供应商正将各自的功能整合到统一的平台上,以简化管理并增强数据风险分析的能力。DSP的核心在于提供对敏感数据、政策和法规的统一视图,以及数据分类的语义能力,不再单纯依赖预设的标识符。 3. 未来状态 未来的...
### Gartner对构建数据中台的建议 #### 数据中台的概念与重要性 数据中台是一种新型的技术架构模式,旨在通过构建一个集中的数据管理和分析平台来提高企业的数据利用效率和决策质量。这一概念在中国尤为火热,许多...
《Gartner:2017年新兴技术成熟度曲线》报告揭示了当年IT行业的关键发展趋势,其中涵盖了无处不在的人工智能、透明化身临其境的体验和数字化平台这三个核心领域。这些趋势预示着技术的未来发展方向,对企业的战略...
《2017年 Gartner 领导物联网1》这本书着重探讨了物联网(IoT)在商业和技术领域的快速发展及其深远影响。物联网的核心是通过连接各种专用功能对象,如自动贩卖机、飞机引擎、智能汽车等,预计将有200亿的物体在2020...
首先,文章指出根据市场研究公司Gartner的预测,2017年全球公有云服务市场将实现显著增长,市场总额将增至2468亿美元,增幅高达18%。这显示出全球云计算服务市场的强劲增长势头。其中,基础设施即服务(IaaS)预计将...
Gartner的2021年预测研究广泛反映了数据和分析在各个领域的影响力,证明了其在支持企业战略和业务创新方面的作用。 报告中的预测涵盖了多个领域,包括但不限于: 1. 数据质量的提升:随着企业对数据分析的依赖增加...
Gartner预测2017年全球半导体营收将增长12.3%.pdf
**Gartner**在2017年的安全与风险管理峰会上,由分析师**Marc-Antoine Meunier**发表了一篇名为《2017年数据安全态势》的演讲,首次提出了“数据安全治理”的概念,并将其比喻为“风暴之眼”,以此强调其在数据安全...
本文总结了Gartner的2022年12大战略技术趋势报告,涵盖了AI工程化、超级自动化、决策智能、组装式应用生成、分布式企业云原生平台、隐私增强计算、网络安全网格、数据编织等多个领域。 一、AI工程化 AI工程化是指...
Gartner在其发布的2023年数据安全技术成熟度曲线中揭示了当前数据安全领域的关键发展趋势和挑战。安全和风险管理领导者需要关注技术创新,如数据安全态势管理和数据安全平台,同时预见到量子计算和人工智能对数据...
标题中的“Gartner发布2024年网络安全预测:IAM 和数据安全相结合,解决长期存在的挑战”揭示了未来网络安全领域的一项重要趋势,即身份和访问管理(IAM)与数据安全的融合。Gartner是一家知名的信息技术研究和顾问...
2017年企业级防火墙及2017年SWG方向的魔力象限报告、谨供大家参考
Gartner作为一家全球领先的信息技术研究和顾问公司,定期发布魔力象限报告来评估和比较各个市场领域内的领先供应商。在“Gartner 2020年商业智能和分析平台魔力象限报告”中,Gartner分析师团队深入分析了商业智能和...
供应商评分系统可以应用于各种商业领域,帮助企业对供应商进行科学的评估和管理。该系统可以帮助企业提高供应商之间的竞争力,提高供应商的销售额和毛利额,提高企业的整体竞争力。 结论 供应商评分系统是基于大...