`
wx1569510009
  • 浏览: 55483 次
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

打破谣言! 关于大数据的十个有力事实

 
阅读更多

    无论大家如何进行定义,大数据自诞生之日起就饱受争议——既有毛病之词,亦不乏诋毁之声。大数据对于很多人来说包含有重要的意义,特别是科学家和零售商家。不过这项技术的出现也引发了大量的相关隐私问题与安全威胁。


  到底是救世主、骗局抑或二者兼而有之?无论如何,大数据仍然在技术专家、趋势分析师、市场推广人士以及安全从业者群体中拥有极高的热度与人气。事实上,截至今天大数据仍然没有一个受到普遍认同的官方定义。那么大数据到底是什么?维基百科给出的描述可以说为大数据的概念确立之路开了个好头:“任何由于规模庞大且高度复杂而难以通过现有数据库管理工具或者传统数据处理应用进行处理的数据集。”


  虽然管理这种规模庞大、形式多变且对速度要求较高(这三点也就是经典的3V定义)的数据集确实充满挑战,不过目前针对这类任务的数据共享设备的数量正呈现指数级增长的趋势,而这又给大数据难题带来更多别样的变化。这类硬件被统称为物联网,其中包括机器传感器以及面向普通消费者的设备,例如联网温控器、电灯泡、冰箱以及可穿戴式健康监测工具等。IDC公司预计,物联网市场在未来几年当中将迅猛增长——其单位安装数量将由2013年年底的91亿增长到2020年的281亿。


  企业则将来自大数据的可行性分析结论视为潜在的利好消息,这不仅是因为此类结论能够帮助商家售出更多工具及服务,同时也可以更好地处理医疗事务、阻止伪劣药品流通、追踪恐怖分子甚至监控特定目标的通话内容。因此,大数据本身并没有善恶之分,真正起决定作用的还是我们的实际使用方式。


  具有讽刺意味的是,尽管大数据当中蕴藏着提升人类经验的潜在可能性,但这些宝贵的信息却往往很难进行收集、筛选、分析以及最后的解释。今天的文章着重审视大数据领域的挑战与机遇,这些事实与论证数据很可能给各位带来意外惊喜。哪些内容值得期待?这个嘛,作为大数据平台中的领导者,Hadoop的发展前景一片光明。而且数据科学家与大数据相关技术人士也将在未来几年中获得丰厚的薪酬回报。


  业内人士作出预测,认为“大数据”作为流行词汇将彻底消失。“一切的一切最终都会被归结为数据,仅此而已。大数据与所有以此为基础的预测行为都将成为由分析师以及众多‘大型’技术供应商负责的‘数据管理’工作,”Hortonworks公司总裁Herb Cunitz在2012年12月的一篇博文中写道。


  Cunitz作出的“大数据”概念消亡预测可能为时过早,他提出了很重要的一项结论,即一切的一切最终都会被归结为数据。只有管理这些信息所必需的工具会迎来变革。现在就请大家跟随我们的脚步,一同通过图文了解与大数据紧密相关的统计及研究成果。


  一、有多少数据被忽略掉了?

  大多数企业估算称,他们只对自身持有的约12%数据进行了分析,Forrester研究公司在最近的一项调查中发现。这到底是好消息还是坏消息?这个嘛,被他们所忽略的88%数据当中很可能蕴藏着足以带来数据驱动结论的宝贵信息。但从另一个角度看,他们也许明智地避免了由所谓“煮沸海洋”战略所带来的巨大资源消耗。说起企业忽略绝大多数自有数据的理由,原因主要有两点:第一是缺乏相关分析工具与“可控制”数据仓库,第二则在于他们很难确切了解哪些信息能够实现价值、哪些则最好加以忽略,Forrester公司在报告中指出。


  二、大数据相关工作岗位持续增长


  大数据掀起的狂潮对于具备特定技能的从业人员来说不啻为一大福音。根据 Dice网站(一家专门服务于技术及工程专业人才的求职网站)的统计,目前业界对于数据专家的需求正持续激增。与上一年相比,目前针对NoSQL技术人员的招聘岗位数量增长了54%,而面向“大数据人才”的岗位也上涨了46%,该网站在今年四月的报告中指出。虽然这样的提升幅度令人印象深刻,不过与网络安全专家的职位需求相比仍然是小巫见大巫——后者的同比增长幅度高达162%。


  三、大数据最终将成长至怎样的规模?



  在未来六年当中,数字化领域的数据问题将由目前的3.2 ZB(即泽字节)增长到40 ZB。(1 ZB基本相当于10亿TB。)“当我们审视即将席卷而来的数据量时,其庞大的规模真的很令人兴奋,”Hortonworks公司CEO Rob Bearden在今年于加利福尼亚州圣何塞举办的2014 Hadoop峰会上表示。“从现在到2020年,企业所持有的数量问题将以每年50倍的速度递增。我认为目前最重要的任务在于清醒地认识到,其中85%的数据来自新兴网络数据源。”包括移动、社交媒体以及Web与机器生成数据在内的这些新兴数据源将给全球企业带来重大挑战与不可错过的发展机遇,Bearden指出。

转载于:https://my.oschina.net/u/1160813/blog/288269

分享到:
评论

相关推荐

    大数据时代网络谣言法律规制的困境与出路.pdf

    文章提出,要解决大数据时代网络谣言规制的困境,应从科学立法、行政执法、刑事司法三个层面进行源头治理、双向治理和末端治理。通过这三个方面的综合治理,可以构建出一条现实可行的法律规制路径。 首先,科学立法...

    大数据支持下网络谣言智慧治理研究.pdf

    综上所述,大数据技术支持下的网络谣言智慧治理是面对信息传播新技术、新背景、新条件下的一种有力手段和有益探索。随着大数据技术的不断发展和完善,相信在不久的将来,我们可以更有效地治理网络谣言,为构建智慧...

    大数据时代网络谣言法律规制的困境与出路.zip

    本文件“大数据时代网络谣言法律规制的困境与出路.pdf”可能深入探讨了这个问题,让我们来详细解析其中可能涉及的知识点。 首先,大数据时代的网络谣言传播特性是探讨的起点。大数据技术使得信息的收集、分析和传播...

    大数据支持下网络谣言智慧治理研究.zip

    综上所述,大数据在网络谣言智慧治理中的应用涉及到数据采集、分析、预测和决策等多个环节,它为谣言治理提供了科学化、智能化的工具,对于维护网络环境的健康和公共信息的真实性具有重要意义。随着技术的不断进步,...

    大数据时代高校负面舆情的有效应对.pdf

    大数据时代高校负面舆情的有效应对涉及多个层面的内容,本文将从大数据的特性、高校负面舆情的定义、产生原因、具体表现形式以及应对策略等方面进行深入探讨。 首先,大数据时代意味着信息量巨大、数据类型多样、...

    基于事实证据的双通道早期谣言检测

    ### 基于事实证据的双通道早期谣言检测 #### 背景与意义 随着社交媒体平台的迅速发展,人们可以更加便捷地分享信息、表达观点。然而,这也为谣言的产生与传播提供了温床。谣言不仅误导公众,还可能引发社会恐慌、...

    大数据视阈民族院校大学生思想政治教育的创新探究.docx

    4. **网络监督与管理**:大数据技术可以帮助监控网络舆情,预防和应对网络谣言和不良信息对学生的影响,确保网络环境的健康。 5. **素质拓展**:通过大数据分析,可以发现学生的兴趣爱好和发展潜力,为他们提供更多...

    数学建模 谣言的传播

    4. **信息传递**:假设每个传播者只会向那些还未听说过谣言的人传播信息,而不相信谣言的人不会继续传播。 ##### (二)符号定义 - **S(t)**:在t时刻不知道谣言的人群比例。 - **I(t)**:在t时刻知道谣言的人群...

    大数据背景下新闻采编策略探析.pdf

    互联网时代信息泛滥,导致谣言和不实信息的传播速度极快,这要求新闻工作者必须具备更高的敏锐性和辨识力,能够从海量信息中抽丝剥茧,还原事实真相。在此过程中,大数据分析技术能够提供辅助,通过对比分析,帮助...

    基于大数据的网络群体信息认知研究——海量网络舆情信息主题提取研究.pdf

    大数据技术发展迅猛,其在信息处理、提取和分析方面展现出前所未有的优势。随着互联网社交媒体的兴起,网络群体信息认知研究成为了一个热门话题。网络群体主要可分为基于熟悉人群和陌生人群的社交群体,它们在信息...

    案例正文_社交平台谣言监测1

    总结来说,社交平台谣言监测是一个结合大数据、机器学习和深度学习的复杂任务,通过多模态数据的融合,可以实现更精确的谣言检测,减少虚假信息对社会的影响。这一领域的研究将持续推动信息技术的发展,为信息时代的...

    大数据视域下社会治理体系的构建路径分析.pdf

    在疫情期间,大数据在疫情信息、舆论传播、恐慌情绪、谣言与诈骗等方面提供了精准的分析与预判,这体现了大数据在提升社会治理现代化中的关键作用。 然而,大数据的应用也带来了一系列的风险和挑战。文章分析了...

    基于长期谣言检测(CNN)、突发谣言检测(GRN、LSTN)、强化学习等深度学习方法合集.zip

    基于长期谣言检测(CNN)、突发谣言检测(GRN、LSTN)、强化学习等深度学习方法合集.zip基于长期谣言检测(CNN)、突发谣言检测(GRN、LSTN)、强化学习等深度学习方法合集.zip基于长期谣言检测(CNN)、突发谣言...

    浅谈大数据技术在新闻采写与编辑中的应用.pdf

    此外,大数据技术可能会使新闻采写和编辑工作变得浅显,不法分子可能利用这一点传播谣言和不实信息,损害新闻采写编辑行业的公信力,使公众对新闻的真实性失去信心。 为了合理应用大数据技术,新闻采写编辑行业应当...

    大数据对新闻传播的影响分析.docx

    3. **新闻验证**:大数据帮助记者验证信息的真实性,通过对比和分析大量数据,可以发现潜在的虚假信息或谣言,提高新闻的准确性。 4. **新闻预测**:通过对历史数据的深度学习和模式识别,大数据可以预测未来的趋势...

    中国居民营养关注度大数据白皮书.pdf

    中国居民营养关注度大数据白皮书详细记录了中国居民对营养的关注情况,这些数据反映了社会大众对于膳食营养的关注程度以及对健康知识的追求。白皮书结合《中国居民膳食指南(2016)》的发布,以及在移动互联网平台上...

    公共卫生事件时期基于大数据的公众网络行为研究.docx

    这篇研究论文探讨了在这样的特殊时期,大数据如何揭示公众的网络行为模式,以及如何通过理解和分析这些行为来有效引导公众,减少谣言的传播,提高公众的理性认知和应对能力。 研究假设主要集中在三个方面: 1. 信息...

    懂得栖息才能在大数据汪洋中更久地翱翔.docx

    标题和描述中提到的核心知识点是大数据时代下的信息管理和个人应对策略。在大数据的汪洋中,信息量巨大且复杂,给人们的生活带来了便利,同时也带来了挑战。这些挑战主要体现在以下几个方面: 1. **信息过载**:...

Global site tag (gtag.js) - Google Analytics