存储单位换算--看了hadoop权威指南 - 猫头哥（朴海林）_QQ:85977328 - ITeye博客

`

85977328

浏览: 1898915 次
性别:
来自: 北京

最近访客更多访客>>

churchchen86

xzhoujun

再见断头台

cht的大摩托

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

July01：最近了解到一款StratoIO打印控件，功能如下：1、Html ...
jquery打印指定的div
GentlemanQc： ...
quartz系列（二）spring3.2.5与quartz2.1.7集群版集成简要说明
静夜独窗：你好，能说一下server.xml增加的配置是怎么影响性能的吗 ...
tomcat7.0性能优化-挑战极限精简版
beyondfengyu： beyondfengyu 写道如果每个客户进程的时间不同步，时 ...
java并发（二十二）分布式锁
beyondfengyu：如果每个客户进程的时间不同步，时间超前的进程是不是更容易得到锁 ...
java并发（二十二）分布式锁

存储单位换算--看了hadoop权威指南

博客分类：

hadoop

阅读更多

IDC的“数字宇宙”(digital universe)中指出，2006年数据总量是0.18ZB。2011年数据总量将达到1.8ZB。

其中1ZB=1.0e+21Byte=1000EB=1000 000PB = 1000 000 000TB

1
顶

0
踩

分享到：

linux shell下，取得当前SHELL的目录 | linux远程执行shell命令

2012-09-30 14:49
浏览 1597
评论(0)
分类:非技术
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码: Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码 Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码 Hadoop 3.x（MapReduce）----【Hadoop 序列化】---- 代码 Hadoop 3.x（MapReduce）----【Hadoop ...

hadoop最新版本3.1.1全量jar包: hadoop-annotations-3.1.1.jar hadoop-common-3.1.1.jar hadoop-mapreduce-client-core-3.1.1.jar hadoop-yarn-api-3.1.1.jar hadoop-auth-3.1.1.jar hadoop-hdfs-3.1.1.jar hadoop-mapreduce-client-hs-3.1.1.jar ...

spark--bin-hadoop3-without-hive.tgz: 本压缩包“spark--bin-hadoop3-without-hive.tgz”提供了Spark二进制版本，针对Hadoop 3.1.3进行了编译和打包，这意味着它已经与Hadoop 3.x兼容，但不包含Hive组件。在CentOS 8操作系统上，这个版本的Spark已经被...

hadoop-eclipse-plugin1.2.1 and hadoop-eclipse-plugin2.8.0: 接下来，我们来看看Hadoop-Eclipse-Plugin 2.8.0。这是一个针对Hadoop 2.x（YARN）版本的插件，支持新的MapReduce v2 API。在这个版本中，开发者不仅可以处理Classic MapReduce任务，还可以处理基于YARN的Modern ...

spark-assembly-1.6.0-cdh5.9.2-hadoop2.6.0-cdh5.9.2.jar: spark-assembly-1.6.0-cdh5.9.2-hadoop2.6.0-cdh5.9.2.jar

spark-3.1.3-bin-without-hadoop.tgz: Spark与Hadoop的关系在于，Hadoop是大数据处理领域的一个基石，提供了分布式存储（HDFS）和分布式计算（MapReduce）框架。但Spark并不局限于Hadoop生态系统，它可以与多种数据源集成，如Amazon S3、Cassandra、HBase...

Hadoop权威指南----读书笔记.pdf: Hadoop权威指南----读书笔记

spark-2.0.0-bin-hadoop2.6.tgz: 本资源是spark-2.0.0-bin-hadoop2.6.tgz百度网盘资源下载,本资源是spark-2.0.0-bin-hadoop2.6.tgz百度网盘资源下载

spark-2.4.7-bin-without-hadoop: Hadoop通常用于分布式存储和处理大规模数据，但在某些情况下，用户可能已经有了自己的Hadoop集群，或者使用其他的存储系统如Amazon S3或Azure Blob Storage。在这种情况下，不带Hadoop的Spark版本允许用户更灵活地...

spark-3.2.0-bin-hadoop3.2.tgz: 引入了Tungsten项目的优化，包括代码生成和列式存储，以减少数据处理的开销。 2. **SQL增强**：Spark SQL的性能得到了显著提升，包括查询计划优化、Catalyst优化器的改进，以及对Parquet和Hive表的读写性能的优化。...

spark-3.2.1-bin-hadoop2.7.tgz: 与Hadoop 2.7的兼容性意味着Spark可以无缝地集成到Hadoop生态系统中，使用HDFS作为默认的数据存储系统，同时也能与YARN资源管理器配合，进行集群资源的管理和调度。Hadoop 2.7版本引入了YARN（Yet Another Resource ...

spark-2.4.7-bin-hadoop2.7.tgz: 这个版本兼容Hadoop 2.7，这意味着它可以在使用Hadoop 2.7作为数据存储和资源管理的环境中无缝运行。Spark的核心特性包括批处理、交互式查询（通过Spark SQL）、流处理（通过Spark Streaming）以及机器学习（通过...

spark-3.2.1 安装包下载 hadoop3.2: Spark 3.2.1是该框架的一个稳定版本，提供了对Hadoop 3.2的支持，这意味着它可以很好地集成到Hadoop生态系统中，利用Hadoop的存储和计算能力。Hadoop是一个分布式文件系统（HDFS）和MapReduce计算模型的集合，为大...

spark-3.0.0-bin-hadoop2.7.tgz: Spark-3.0.0-bin-hadoop2.7版本确保与Hadoop 2.7的兼容性，这意味着用户可以在使用Hadoop作为存储和计算平台的同时，充分利用Spark的高性能计算优势。这涵盖了HDFS（Hadoop分布式文件系统）和其他Hadoop生态系统...

spark-3.0.0-bin-without-hadoop.tgz: 这个版本特别适合那些已经拥有Hadoop环境或者打算在其他分布式存储系统上运行Spark的应用场景。 Spark的设计目标是提供比Hadoop MapReduce更快的数据处理速度，同时保持易于编程的特性。它通过引入基于内存计算的...

spark-2.1.0-bin-without-hadoop版本的压缩包，直接下载到本地解压后即可使用: 在Ubuntu里安装spark，spark-2.1.0-bin-without-hadoop该版本直接下载到本地后解压即可使用。 Apache Spark 是一种用于大数据工作负载的分布式开源处理系统。它使用内存中缓存和优化的查询执行方式，可针对任何规模...

spark-3.1.3-bin-hadoop3.2.tgz: Spark 的核心特性在于它的弹性分布式数据集（Resilient Distributed Datasets，简称RDD），这是一种可以在集群中存储和并行处理的数据结构。RDD支持各种操作，如转换和行动，允许用户以交互式的方式处理大规模数据。...

spark-3.1.2-bin-hadoop3.2.tgz: 这个版本是针对Scala 2.12编译的，并且与Hadoop 3.2兼容，这意味着它可以充分利用Hadoop生态系统的最新功能。在Linux环境下，Spark可以很好地运行并与其他Hadoop组件集成。 **Spark核心概念** 1. **DAG（有向无环...

spark-2.4.5-bin-hadoop2.7.tar.gz: spark-2.4.5-bin-hadoop2.7.tgz的安装包,适用ubuntu，Redhat等linux系统，解压即可安装，解压命令：tar -zxvf spark-2.4.5-bin-hadoop2.7.tar.gz -C dst（解压后存放路径）

Global site tag (gtag.js) - Google Analytics