`

迈克巴洛谈实时大数据分析学

阅读更多
原帖地址:http://www.cnblogs.com/missyxu/archive/2013/06/02/real-time-big-data-analytics.html

由迈克•巴洛所写的 实时大数据分析论:新兴设计白皮书覆盖到了大数据分析学主题以及实时大数据分析学(RTBDA)与传统分析学的区别是怎样的。迈克描述了实时大数据分析学框架的5个阶段:数据提取、模型开发、验证部署、实时评分与模型刷新。

他也谈论了大卫•史密斯所提出的RTBDA技术堆的四层:

  • 数据
  • 分析论
  • 集成
  • 决策

InfoQ在与迈克的交流中说到了有关实时大数据分析论当前的状态以及其在大数据空间像决策科学这类的新兴趋势。

InfoQ:您能定义究竟什么是大数据并解释它是如何工作的吗?

Mike:实时大数据代表科技与技能的汇聚。过去需要数月、数日或数小时的分析过程现已缩短至数分、数秒、甚至不到一秒。2年以前,许多数据分析师认为在40分以内生成一个查询结果是不可思议的事情。今天,他们能够在毫秒内即可看到结果。这实际上就是思想的速度——你想到一个查询,就立马得到结果并开始你的试验。另一方面,毫秒似乎看起来像是一个永恒对于高速交易系统,对一个被解析成微秒的世界中运作的系统来说。因此这个术语“实时”在很大程度上取决于你工作或手头任务上的需求。

InfoQ:传统分析学与实时大数据分析学有何不同?

Mike:传统分析学偏向于从一个传统数据仓库中检索结构化数据而生成报告的过程。实时大数据分析学更进了一步,通过产生洞见或推荐用于在销售点上驱动商业价值,不管销售点是实体商店还是电子商务网站。

InfoQ:在您的白皮书中,您谈到了新世纪机器开始像人一样去思考和响应,和数据科学到下一个逻辑边界:决策科学的转换。您能更多地探讨下这些革新及即将到来的趋势吗?

Mike:趋势就是面向更快速、更自动化、更加智能以及更加业务友好的分析学,快速地总结洞见并提供那些更可能产生大销量与高利润的特定的推荐。

InfoQ:您也谈到了分析学的创建与消耗是两个不同的事情。能给出这两个步骤的例子吗?

Mike:数据分析师——与数据直接打交到的人——是不同于数据的使用者或消费者的,后者更趋于接近公司实际的客户。两者都需要可视化工具理解数据,但所使用的工具不同。数据分析师和数据科学家需要工具进行数据建模。用户和消费者,不管是销售代表还是卖主,需要工具来理解数据是如何可能影响顾客行为并产生销量的。

InfoQ:什么是实时大数据分析学的新兴趋势呢?

Mike:因为有许多不同种类的分析师与多种不同类型的用户/消费者,那么一定有一个工具的选择或类别,用于可视化、解释和演绎大数据,以有趣的方式来驱动真正商业价值。目前,没有一个“万全之策”的解决方案来发动一个实时大数据平台。可喜的是,许多非常聪明并高度积极的人们在努力开发技能与策略将大数据转换成有形的企业资产。敬请期待,这应该是令人兴奋的!

 

本文链接

分享到:
评论

相关推荐

    Real-Time Big Data Analytics

    《实时大数据分析:新兴架构》这本书由迈克·巴洛(Mike Barlow)撰写,深入探讨了如何利用大数据进行实时或接近实时的数据分析,以及相关的技术和架构。本书强调了在大数据时代下,企业能够通过快速处理大量数据来...

    Real_Time_Big_Data_Analytics_Emerging_Architecture

    《实时大数据分析:新兴架构》是一本关于大数据处理和实时分析技术的经典著作,由迈克·巴洛(Mike Barlow)撰写,于2013年首次出版。本书不仅探讨了实时大数据分析的核心概念和技术细节,还提供了对这一领域的深入...

    巴洛沙星质量标准研究 (2013年)

    本研究通过对巴洛沙星进行全面的理化性质分析,并采用高效液相色谱法对其含量进行了精确测定,成功建立了巴洛沙星的质量控制标准。这些标准的建立不仅有助于提高巴洛沙星的质量水平,还能促进其在临床治疗中的广泛...

    法巴洛设置

    法巴洛无线路由器的设置方法,适合于将说明书遗失后的使用。

    货币金融理论之一货币经济学理论.pptx

    货币经济学理论是宏观经济分析的重要组成部分,它主要关注货币与经济之间的相互作用。理解货币经济学的基本原理和实证研究对于掌握整个宏观经济的运行机制至关重要,因此,它成为宏观经济学中不可或缺的分支。 在...

    利用MATLAB模拟多普勒效应.pdf

    1802年奥地利物理学家克里斯蒂安·约翰·多普勒(Christian Johann Doppler)首次提出了多普勒效应原理,而荷兰气象学家巴依斯·巴洛(H. D. Buys Ballot)在1845年首次实验验证了声音的多普勒效应。 在多普勒效应...

    mclass-sky:天文学数据的多类方法

    雅各布·纳巴洛(Jakub Nabaglo) 进行 Alasdair Tran的 作者:David Wu 介绍 该资料库包含与天文学中的主动学习方法相关的项目的集合。 单击下面的链接之一,转到特定项目的目录。 结合Alasdair Tran,Cheng ...

    阿曼达·巴洛

    3. `<head>`:头部元素,包含元数据,如标题、字符集设置(`<meta charset="UTF-8">`)和引用外部资源(如CSS和JavaScript文件)。 4. `<title>`:定义网页的标题,显示在浏览器的标签页上。 5. `<body>`:主体元素...

    三角函数发展史文件.pdf

    三角函数是数学中的基本概念,尤其在几何学、物理学、工程学...从最初的天文学应用,到后来的几何学和数理分析的基础,再到现代科学和技术中的核心工具,三角函数的历史不仅是数学史的一部分,也是人类智慧进步的见证。

    直流电机的发展史学习教案.pptx

    随后,巴洛制造出巴洛星形轮电动机,斯特金则制成了圆盘式电动机。1832年,斯特金进一步创造了带换向器的直流电动机,这标志着现代直流电动机的雏形出现。 2. **重要发明与创新**:1834年,达文波特制造的直流电动...

    直流电机的发展史PPT学习教案.pptx

    随后,巴洛、斯特金等科学家相继研制出各种类型的直流电动机,如巴洛星形轮电动机和圆盘式直流电动机,这些早期的电动机奠定了现代电机的基础。 1831年,亨利提出了电动机的概念,预见到电动机将在未来有着广泛的...

    抓教学改革建高效课堂促学生发展.docx

    最终,引入美国教育家L·A·巴洛赫的“合作课堂”模式,被认为是更符合学校实际的创新教学路径。为了帮助教师深刻理解并接受“合作课堂”的理念,学校提供了理论培训和发放指导手册等资源。 在改革的起始阶段,学校...

    barlowtwins:不适用

    1. **双胞胎架构**:在巴洛双胞胎算法中,输入数据通过两个不同的数据流分别传递到两个独立的神经网络分支,这两个分支被称为“双胞胎”。每个分支都产生一组特征向量,但这些特征向量是在没有监督信号的情况下学习...

    BarlowTwins-TF

    巴洛双胞胎(Barlow Twins)算法由Zbigniew Romaszewski等人提出,旨在减少冗余并增强数据的多样性。该方法的核心思想是通过最大化两份独立数据副本(即“双胞胎”)经过神经网络转换后的协方差矩阵的对角元素,同时...

    Celestron星特朗CM800-B 生物显微镜使用说明书.pdf

    此款显微镜不仅可以应用于微生物的研究、动植物组织的观察,还可以用于纤维等微小物体的分析,满足了专业人士和学生对高清晰度与放大倍数的需求。 使用Celestron星特朗CM800-B生物显微镜前,必须仔细阅读...

    [医学类考试密押题库与答案解析]医疗卫生系统招聘考试卫生和医学基础知识真题2010年.docx

    生理学上,降压反射(又称压力反射或巴洛反射)是一种维持动脉血压相对恒定的重要机制。当血压升高时,压力感受器会向中枢神经系统发送信号,进而引发一系列调节反应,以降低血压。 药物学方面,阿托品是一种常见的...

    冰原BOOS点精选.doc

    砺风戈壁区域的其他BOSS,如望齿魔人、塔亚龙、巴洛骨、角蜥、骑士亡魂和爆焱火龙康恩达等,同样各具特色,它们的等级、生命值、攻击力和闪避数值各有不同,为玩家提供了一系列战斗选项,体现了《冰原BOOS点精选》...

    直流电机的发展史课件PPT.ppt

    随后,巴洛制造出了巴洛星形轮电动机,斯特金则制作了圆盘式电动机,标志着直流电机的初步形态。亨利不仅提出了“电动机”的概念,还制造了首台摆动式直流电动机,为电机技术的发展开启了新的篇章。 1832年,斯特金...

    baaloo:Baaloo的源代码-bootstrap source code

    巴洛 Baaloo的源代码

Global site tag (gtag.js) - Google Analytics