无论大家如何进行定义,大数据自诞生之日起就饱受争议——既有毛病之词,亦不乏诋毁之声。大数据对于很多人来说包含有重要的意义,特别是科学家和零售商家。不过这项技术的出现也引发了大量的相关隐私问题与安全威胁。
到底是救世主、骗局抑或二者兼而有之?无论如何,大数据仍然在技术专家、趋势分析师、市场推广人士以及安全从业者群体中拥有极高的热度与人气。事实上,截至今天大数据仍然没有一个受到普遍认同的官方定义。那么大数据到底是什么?维基百科给出的描述可以说为大数据的概念确立之路开了个好头:“任何由于规模庞大且高度复杂而难以通过现有数据库管理工具或者传统数据处理应用进行处理的数据集。”
虽然管理这种规模庞大、形式多变且对速度要求较高(这三点也就是经典的3V定义)的数据集确实充满挑战,不过目前针对这类任务的数据共享设备的数量正呈现指数级增长的趋势,而这又给大数据难题带来更多别样的变化。这类硬件被统称为物联网,其中包括机器传感器以及面向普通消费者的设备,例如联网温控器、电灯泡、冰箱以及可穿戴式健康监测工具等。IDC公司预计,物联网市场在未来几年当中将迅猛增长——其单位安装数量将由2013年年底的91亿增长到2020年的281亿。
企业则将来自大数据的可行性分析结论视为潜在的利好消息,这不仅是因为此类结论能够帮助商家售出更多工具及服务,同时也可以更好地处理医疗事务、阻止伪劣药品流通、追踪恐怖分子甚至监控特定目标的通话内容。因此,大数据本身并没有善恶之分,真正起决定作用的还是我们的实际使用方式。
具有讽刺意味的是,尽管大数据当中蕴藏着提升人类经验的潜在可能性,但这些宝贵的信息却往往很难进行收集、筛选、分析以及最后的解释。今天的文章着重审视大数据领域的挑战与机遇,这些事实与论证数据很可能给各位带来意外惊喜。哪些内容值得期待?这个嘛,作为大数据平台中的领导者,Hadoop的发展前景一片光明。而且数据科学家与大数据相关技术人士也将在未来几年中获得丰厚的薪酬回报。
业内人士作出预测,认为“大数据”作为流行词汇将彻底消失。“一切的一切最终都会被归结为数据,仅此而已。大数据与所有以此为基础的预测行为都将成为由分析师以及众多‘大型’技术供应商负责的‘数据管理’工作,”Hortonworks公司总裁Herb Cunitz在2012年12月的一篇博文中写道。
Cunitz作出的“大数据”概念消亡预测可能为时过早,他提出了很重要的一项结论,即一切的一切最终都会被归结为数据。只有管理这些信息所必需的工具会迎来变革。现在就请大家跟随我们的脚步,一同通过图文了解与大数据紧密相关的统计及研究成果。
一、有多少数据被忽略掉了?
大多数企业估算称,他们只对自身持有的约12%数据进行了分析,Forrester研究公司在最近的一项调查中发现。这到底是好消息还是坏消息?这个嘛,被他们所忽略的88%数据当中很可能蕴藏着足以带来数据驱动结论的宝贵信息。但从另一个角度看,他们也许明智地避免了由所谓“煮沸海洋”战略所带来的巨大资源消耗。说起企业忽略绝大多数自有数据的理由,原因主要有两点:第一是缺乏相关分析工具与“可控制”数据仓库,第二则在于他们很难确切了解哪些信息能够实现价值、哪些则最好加以忽略,Forrester公司在报告中指出。
二、大数据相关工作岗位持续增长

大数据掀起的狂潮对于具备特定技能的从业人员来说不啻为一大福音。根据 Dice网站(一家专门服务于技术及工程专业人才的求职网站)的统计,目前业界对于数据专家的需求正持续激增。与上一年相比,目前针对NoSQL技术人员的招聘岗位数量增长了54%,而面向“大数据人才”的岗位也上涨了46%,该网站在今年四月的报告中指出。虽然这样的提升幅度令人印象深刻,不过与网络安全专家的职位需求相比仍然是小巫见大巫——后者的同比增长幅度高达162%。
三、大数据最终将成长至怎样的规模?

在未来六年当中,数字化领域的数据问题将由目前的3.2 ZB(即泽字节)增长到40 ZB。(1 ZB基本相当于10亿TB。)“当我们审视即将席卷而来的数据量时,其庞大的规模真的很令人兴奋,”Hortonworks公司CEO Rob Bearden在今年于加利福尼亚州圣何塞举办的2014 Hadoop峰会上表示。“从现在到2020年,企业所持有的数量问题将以每年50倍的速度递增。我认为目前最重要的任务在于清醒地认识到,其中85%的数据来自新兴网络数据源。”包括移动、社交媒体以及Web与机器生成数据在内的这些新兴数据源将给全球企业带来重大挑战与不可错过的发展机遇,Bearden指出。
转载于:https://my.oschina.net/u/1160813/blog/288269
分享到:
相关推荐
文章提出,要解决大数据时代网络谣言规制的困境,应从科学立法、行政执法、刑事司法三个层面进行源头治理、双向治理和末端治理。通过这三个方面的综合治理,可以构建出一条现实可行的法律规制路径。 首先,科学立法...
大数据技术的应用并不仅限于网络谣言治理,在金融谣言检测、智慧城市管理、贫困农户可持续发展等多个领域,大数据都显示出了其独特的价值。例如,在金融领域,通过大数据分析可以及时发现并遏制金融谣言的传播,维护...
在信息化时代,网络谣言的泛滥已成为影响社会稳定的隐患之一。...随着技术的不断进步,未来大数据在网络谣言治理领域的潜力将会进一步释放,为我们构建一个更安全、更可信的网络空间提供强有力的技术支撑。
在当今的大数据时代,信息的传播速度和范围都大大超越了以往任何一个时期。网络谣言作为一种特殊的信息传播现象,在此背景下得到了前所未有的传播土壤,其影响力也随之膨胀。这些谣言不仅能够迅速引发公众的恐慌和...
终于知道为什么微信群里都是这些“新闻谣言”!!---趣头条项目原型
大数据时代高校负面舆情的有效应对涉及多个层面的内容,本文将从大数据的特性、高校负面舆情的定义、产生原因、具体表现形式以及应对策略等方面进行深入探讨。 首先,大数据时代意味着信息量巨大、数据类型多样、...
### 基于事实证据的双通道早期谣言检测 #### 背景与意义 随着社交媒体平台的迅速发展,人们可以更加便捷地分享信息、表达观点。然而,这也为谣言的产生与传播提供了温床。谣言不仅误导公众,还可能引发社会恐慌、...
4. **网络监督与管理**:大数据技术可以帮助监控网络舆情,预防和应对网络谣言和不良信息对学生的影响,确保网络环境的健康。 5. **素质拓展**:通过大数据分析,可以发现学生的兴趣爱好和发展潜力,为他们提供更多...
4. **信息传递**:假设每个传播者只会向那些还未听说过谣言的人传播信息,而不相信谣言的人不会继续传播。 ##### (二)符号定义 - **S(t)**:在t时刻不知道谣言的人群比例。 - **I(t)**:在t时刻知道谣言的人群...
该数据为从新浪微博不实信息举报平台抓取的中文谣言数据。包含从2009年9月4日至2017年6月12日的31669条谣言。 数据说明 rumorCode: 该条谣言的唯一编码,可以通过该编码直接访问该谣言举报页面。 title: 该条谣言被...
在研究中,首先建立了一个基于微分方程的谣言传播模型,模型一假设了谣言传播者会持续不断地传播谣言,并且在足够大的人口规模下,变量可以视作连续可微。通过分离变量法求解该微分方程模型,我们可以获得谣言传播与...
互联网时代信息泛滥,导致谣言和不实信息的传播速度极快,这要求新闻工作者必须具备更高的敏锐性和辨识力,能够从海量信息中抽丝剥茧,还原事实真相。在此过程中,大数据分析技术能够提供辅助,通过对比分析,帮助...
大数据技术发展迅猛,其在信息处理、提取和分析方面展现出前所未有的优势。随着互联网社交媒体的兴起,网络群体信息认知研究成为了一个热门话题。网络群体主要可分为基于熟悉人群和陌生人群的社交群体,它们在信息...
总结来说,社交平台谣言监测是一个结合大数据、机器学习和深度学习的复杂任务,通过多模态数据的融合,可以实现更精确的谣言检测,减少虚假信息对社会的影响。这一领域的研究将持续推动信息技术的发展,为信息时代的...
在疫情期间,大数据在疫情信息、舆论传播、恐慌情绪、谣言与诈骗等方面提供了精准的分析与预判,这体现了大数据在提升社会治理现代化中的关键作用。 然而,大数据的应用也带来了一系列的风险和挑战。文章分析了...
基于长期谣言检测(CNN)、突发谣言检测(GRN、LSTN)、强化学习等深度学习方法合集.zip基于长期谣言检测(CNN)、突发谣言检测(GRN、LSTN)、强化学习等深度学习方法合集.zip基于长期谣言检测(CNN)、突发谣言...
此外,大数据技术可能会使新闻采写和编辑工作变得浅显,不法分子可能利用这一点传播谣言和不实信息,损害新闻采写编辑行业的公信力,使公众对新闻的真实性失去信心。 为了合理应用大数据技术,新闻采写编辑行业应当...
3. **新闻验证**:大数据帮助记者验证信息的真实性,通过对比和分析大量数据,可以发现潜在的虚假信息或谣言,提高新闻的准确性。 4. **新闻预测**:通过对历史数据的深度学习和模式识别,大数据可以预测未来的趋势...
中国居民营养关注度大数据白皮书详细记录了中国居民对营养的关注情况,这些数据反映了社会大众对于膳食营养的关注程度以及对健康知识的追求。白皮书结合《中国居民膳食指南(2016)》的发布,以及在移动互联网平台上...