现在一开电脑,尤其是一些IT性质的网站论坛,所谓大数据真是铺天盖地,很有气势。
好像每个搞IT的同仁不说点关于大数据的东西,都不好意思跟人打招呼。
关于这种疯狂,我们已经看得够多了。什么SOA、Ajax、RIA、HTML5......
当繁华过后,这写概念本身又能给我们留下点什么呢?
我们还不是得跟往常一样,像狗一样的写着下一秒就可能被否定的代码?
我不赞成炒概念,但是也不是说见着炒概念的就要批个你死我活。如果能靠这些概念忽悠让你所谓的成功一把,那也是您的能耐,至少这说明您可以不用像吾等守着电脑,一行行的敲代码了。
当然这种成功严格意义上只属于成功者个人,而不是这个行业。因为,如果你换一个人去忽悠,可能就会死的很惨很惨。
好了,说点和题目关系比较大的,大数据。
这其实不是什么新鲜的概念和技术了,就像当年Ajax出来的时候,其实也TMD就是浏览器暴露了一个可编程的js对象而已。而又因为很多浏览器的历史原因使这个对象的实现又各有不同,这时就需要一个已经写好的if else来封装一下这个脾气怪异的编程对象。。。其实整个过程就是这样,平常的不能再平常。
大数据也一样,大数据就是量比较大的数据而已。当然你把一条数据复制10亿条,量也不小,但这毫无意义。
真正的互联网大数据首先是内容丰富的。是基于互联网产品真实应用场景,由用户按照自己真实的意愿进行操作,由系统真实记录而形成的一条条反映客观情况的数据的集合。
其实每条数据之间没有任何关系,但把他们都放在一起就有了关系。
就像抛硬币,每次都各自独立,互相之间毫无关联。但当你抛很多次,并把这些情况汇总到一起的时候,你就会发现一些规律。
其实自从有了互联网,尤其是web2.0,关于通过基于网站数据分析,和数据挖掘的事就一直存在。
就像对于电商网站,从数据库里面统计下每天卖了多少商品,哪个商品卖的好一样。这真TMD是平常到不能再平常的事情了。
只是现在上网的人多了,网站多了,网络应用和产品更丰富了,我们收集到的数据更多了。
这时我们再做我们熟悉的事儿的时候就变的有点困难了,毕竟数100只羊和数100亿只羊虽然理论上一样,但操作方面却不一样,不过也就仅此而已。
这时市面上就出现了很多牛逼的数羊机器,有集中式的也有分布式的、有大厂商的也有社区的、有批处理的也有流式的、有关注吞吐量的也有关注实时性的,五花八门、琳琅满目,但这不过只是在不同时候用起来更称手的数羊机器而已。
我想强调的是,这些机器无论再牛逼也不是数据,即不能创造也不能改变数据。数据只和数据自己有关。
而数据分析和挖掘则是人类一个永恒的话题,起于互联网之前,也不会终于互联网之末。
其实就如抛硬币,我们都知道抛硬币正反面概率的经验值各是0.5,而我们也都知道只有当抛很多次的时候,统计值才会接近于经验值。只抛1次,则毫无意义。这里的“很多次”就是我们说的大数据的“大”。
其实所谓的大数据研究,就是抛很多次硬币而已。
而这是一个相当古老的话题。。。
相关推荐
大数据综合应用实践(基于医疗大数据) 大数据综合应用实践是数据科学与大数据技术专业教学的重要实践环节,本课程旨在通过实际的动手编程,加深同学对大数据编程的理解和实践能力。本课程通过四个部分的教学内容,...
大数据在风险管理中的应用正日益成为银行业提升竞争力的关键。大数据的核心在于通过海量信息的收集、分析和解读,以量化风险,优化决策,降低不确定性的影响。在银行领域,尤其是在信用风险管理中,大数据的作用尤为...
3. **大数据与云计算**:大数据密切相关的技术是云计算,因为云计算提供了处理和存储大量数据的能力。 4. **网络空间治理**:网络空间虽然与现实空间不同,但同样需要法律进行规范和管理。 5. **震网病毒攻击**:...
《不动产大数据技术白皮书》主要探讨了我国在不动产登记领域实施大数据技术的应用和重要性。该白皮书分为三大部分,分别是前言、总体介绍和产品介绍。 前言部分阐述了不动产统一登记制度的设立背景,这是我国政府...
根据给定的大数据考试题目,我们可以总结出一系列与大数据及其应用相关的知识点,这些知识点涵盖了大数据的基本概念、数据处理方法、数据分析的重要性以及数据伦理等方面。以下是详细的解析: ### 大数据的核心概念...
### 大数据技术原理与操作应用 #### HDFS(Hadoop Distributed File System)架构 - **HDFS的架构**:HDFS采用了主从架构模型,其中有一个名为NameNode的主节点负责管理文件系统的命名空间以及客户端对文件的访问...
2020年地球大数据支撑可持续发展目标报告
【大数据来源与数据类型】大数据来源于各种系统,如信息管理系统、网络信息系统、物联网系统和科学实验系统,涵盖了结构化数据(如数据库记录)、半结构化数据(如XML文档)和非结构化数据(如文本、图片、音频和...
大数据是近年来信息技术领域的重要主题,它涉及海量数据的收集、存储、分析和应用。大数据不仅仅是技术的变革,更是一种思维方式的转变,它正在深刻影响着我们的生活和社会治理。 1. 大数据概念的提出者是谷歌公司...
在当前的信息数据时代,大数据的重要性日益凸显,而学习大数据语言成为了许多IT专业人士的追求。针对这一主题,我们将深入探讨如何有效地学习大数据语言,以及需要掌握的关键知识点。 首先,Java编程技术是大数据...
【大数据技术在石油化工的应用】 大数据技术,作为信息技术的最新发展成果,正逐步改变着各个行业的运作模式,尤其在石油化工行业中发挥了显著作用。大数据是指通过物联网、传感器等多种手段收集的海量数据,其规模...
大数据,顾名思义,是指超过传统处理能力的海量数据,但其核心价值并不仅仅是数据的规模,而是通过对这些海量数据的收集、整合、分析,发掘隐藏在其中的新知识,创造新的价值,推动“大数据科学”、“大数据技术”、...
EMC大数据解决方案主要聚焦在如何构建高可用性和高效的数据中心,以应对日益增长的数据存储和管理需求。在本文档中,EMC提出了双活数据中心的概念,这是为了确保业务连续性和数据安全性,尤其是在面临单点故障风险时...
大数据开发工程师是IT行业中专注于大数据处理和分析的关键角色。他们主要负责构建、维护和优化大数据平台,确保数据的高效存储、计算和应用。以下是对大数据开发工程师主要职责和要求的详细说明: **主要职责:** ...
在大数据时代,信息安全面临着前所未有的挑战与机遇。随着技术的发展,特别是物联网、云计算和移动互联网的崛起,数据的来源和承载方式变得多样化,数据量呈现爆炸性增长。据估计,互联网上的数据每两年翻一番,2013...
《2018-2024年中国税务大数据市场现状分析研究报告》揭示了税务大数据在中国的应用与发展情况,以及其在税务领域所引发的深刻变革。报告由北京智研科研询问有限公司发布,旨在提供全面深入的市场分析和投资指导。 ...
【大数据在通信网络监控系统中的应用分析】 大数据技术在当今信息时代扮演着至关重要的角色,尤其在通信网络监控系统中,其应用价值日益凸显。通信网络监控系统借助大数据,能够实现更高效、智能的网络管理和优化,...
《大数据技术原理》是一门专为研究生设计的课程,旨在教授学生大数据处理技术的基础知识和核心技术。这门课程涵盖了大数据的概述、处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库...
2021年重点城市大数据发展指数报告 重点城市 大数据 发展指数 报告
标题中的“大数据下的热网安全与节能”是指在大数据技术的支持下,如何确保供热网络的安全运行并实现能源的有效利用。这一主题聚焦于供热行业的现代化管理,特别是如何通过信息技术改进传统供热系统的效率和安全性。...