BigData 综述
Big Data作为一个专有名词成为热点,主要应归功于近年来互联网、云计算、移动和物联网的迅猛发展。无所不在的移动设备、RFID、无线传感器每分每秒都在产生数据,数以亿计用户的互联网服务时时刻刻在产生巨量的交互。
根据维基百科的定义,“大数据”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。
技术人员纷纷研发和采用了一批新技术,主要包括分布式缓存、基于MPP的分布式数据库、分布式文件系统、各种NoSQL分布式存储方案等。
Eric Brewer提出著名的CAP定理,指出:一个分布式系统不可能满足一致性、可用性和分区容忍性这三个需求,最多只能同时满足两个。
BigData 处理方式
为了处理如此大量的数据,处理数据的方式势必和过去有所不同。各家厂商对于Big Data潮流都提供了不同解决方案。像数据中心的储存方案会从过去的SAN(Storage Area Network)架构,渐渐转成分布式的储存架构,而各家储存服务商,也更加强了软硬件的可靠性和速度,以回应Big Data的需求,让使用者可以获得更快、更好、更安全而且更便宜的服务。
而在数据处理的速度方面,Big Data时代的趋势是在收集数据的同时即开始分析运算,也加强软件优化,让原来需要2-3小时的运算,现在在2-3秒即可完成。而在档案的分类上,也从原来的数据库方式,变成了分布式文件格式。
分布式缓存:
memcached
分布式数据库:
Greenplum
分布式文件系统:
Google的GFS:
Hadoop: Hadoop具备低廉的硬件成本、开源的软件体系、较强的灵活性、允许用户自己修改代码等特点,同时能支持海量数据存储和计算任务。
NoSQL:
HBase :是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建大规模结构化存储集群。Google运行MapReduce来处理BigTable中的海量数据,HBase同样利用MapReduce来处理HBase中的海量数据;
MapReduce:MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。
2013年大数据趋势预测:http://www.199it.com/archives/86385.html
1、Bigdata & Spatial Data
2、Bigdata & Cloud Computing
3、Bigdata & NoSQL
4、Bigdata & MapReduce
5、Bigdata & Location Service
IBM:用大数据解决波士顿堵车难题:每秒钟都有数以百万计的数据点信息,包括GPS和手机,这些数据经过分析处理后可以提供交通智能信息,是一个大数据项目,与物联网等基础设施进行连接和整合。http://www.199it.com/archives/54725.html
大数据(Big data)在TomTom路况导航中的应用:
TomTom利用实时监测超过八千万支匿名的移动电话,一百万台以上的TomTom Live卫星导航仪在路面上的移动速度,搭配RDS-TMC的道路交通资讯系统,建构一个完整而且即时的交通资料库。
http://www.lbsvision.com/archives/9767
网站:
http://www.infoq.com/cn/mapreduce
http://www.infoq.com/cn/news/2012/12/big-data-as-a-service
http://en.wikipedia.org/wiki/Big_data
http://www.ibm.com/developerworks/cn/bigdata/index.html
相关推荐
这份压缩包包含了备考HCIE Big Data认证所需要的重要资源,包括理论知识、实验指导和模拟试题,且所有资料都已经解锁,无需密码,对于考生来说是一份宝贵的参考资料。 首先,我们要了解大数据Big Data的基本概念。...
Title: Handbook of Big Data Technologies Length: 895 pages Edition: 1st ed. 2017 Language: English Publisher: Springer Publication Date: 2017-03-26 ISBN-10: 3319493396 ISBN-13: 9783319493398 Table of...
Big Data Architect’s Handbook: A Guide to build proficiency in tools and systems used by leading Big Data experts A comprehensive end-to-end guide that gives hands-on practice in big data and ...
《华为HCIA-Big Data V3.0大数据培训教材与实验手册详解》 在当今数字化时代,大数据技术已经成为企业竞争力的重要组成部分。华为作为全球领先的ICT解决方案供应商,推出了HCIA-Big Data V3.0认证,旨在培养具备...
综上所述,《HCIA-Big Data V3.0 培训教材》全面覆盖了大数据的基础知识、核心技术、应用场景和未来趋势,是学习者踏入大数据领域的宝贵资料。通过学习,学员不仅能掌握大数据技术,还能培养解决实际问题的能力,为...
HCIP-Big Data(H13-723)知识点总结 HCIP-Big Data(H13-723)是华为公司的一种大数据认证考试,旨在考察考生的大数据处理能力、本地存储和数据仓库管理能力。下面是从给定文件中提取的相关知识点: 1. 存储过程...
【HCIA-Big Data考试题库】是针对华为认证ICT Associate(华为认证初级信息通信技术专家)中的大数据方向所设计的复习资料集合。这个压缩包包含了一份名为“HCIA-Big Data考试题库.docx”的文档,很可能包含了模拟...
大数据架构白皮书主要介绍了bigdata这一开源的RDF数据库技术细节。RDF即资源描述框架(Resource Description Framework),是用于描述网络资源的语言。Bigdata是一个遵循标准的高性能、可扩展的开源图形数据库,完全...
Big Data Analysis for Bioinformatics and Biomedical Discoveries provides a practical guide to the nuts and bolts of Big Data, enabling you to quickly and effectively harness the power of Big Data to ...
The Enterprise Big Data Lake: Delivering the Promise of Big Data and Data Science By 作者: Alex Gorelik ISBN-10 书号: 1491931558 ISBN-13 书号: 9781491931554 Edition 版本: 1 出版日期: 2019-03-24 pages ...
大数据(Bigdata)是21世纪信息技术领域的一个关键术语,它涵盖了从数据收集、存储、分析到价值提取的全过程。大数据的特点通常被概括为“5V”:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值...
MySQL 8 for Big Data 英文epub 本资源转载自网络,如有侵权,请联系上传者或csdn删除 查看此书详细信息请在美国亚马逊官网搜索此书