hadoop指定某个文件的blocksize，而不改变整个集群的blocksize - 轻剑寂寥 - ITeye博客

`

nlslzf

浏览: 1059112 次
性别:
来自: 北京

最近访客更多访客>>

wangyy

u012363178

cwfmaker

windows9834

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

dove19900520：朋友，你确定你的标题跟文章内容对应？？？
tomcat控制浏览器不缓存
wussrc：我只想说牛逼,就我接触过的那点云计算的东西，仔细想想还真是这么 ...
别样解释云计算，太TM天才跨界了
hw_imxy： endpoint="/Hello/messagebr ...
flex+java代码分两个工程
gaohejie： rsrsdgrfdh坎坎坷坷
Flex 与 Spring 集成
李涤尘：谢谢。不过说得有点太罗嗦了。
Oracle数据库数据的导入及导出(转)

hadoop指定某个文件的blocksize，而不改变整个集群的blocksize

博客分类：

Hadoop生态圈(hadoop/hbase/pig/hive/zookeeper)

阅读更多

文件上传的时候，使用下面的命令即可

hadoop fs -D fs.local.block.size=134217728 -put local_name remote_location

参考

http://stackoverflow.com/questions/2669800/changing-the-block-size-of-a-dfs-file-in-hadoop

经过验证，上述命令在0.21版本上不行，需要改为

hadoop dfs -D dfs.blocksize=134217728 -copyFromLocal local_name remote_location

分享到：

CUDA plugin for Eclipse | 扩展CDT做自己的project wizard

2011-03-20 17:20
浏览 2122
评论(0)
分类:企业架构
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Hadoop的block Size和split Size究竟是什么关系_1: 然而，需要注意的是，Split Size不应小于Block Size，否则会导致不必要的数据复制和计算开销。总的来说，Hadoop的Block Size和Split Size之间的关系是相互作用的，它们共同决定了数据处理的并行性和效率。理解这...

hadoop集群的配置文件: `dfs.replication`参数设定了文件的默认副本数，而`dfs.blocksize`则定义了HDFS中的默认数据块大小。 3. **mapred-site.xml**：它涉及到MapReduce框架的配置，如JobTracker的位置、任务分配策略等。`mapreduce....

hadoop配置文件详解: 核心配置文件core-site.xml涉及整个Hadoop环境的设置，而hdfs-site.xml和mapred-site.xml则针对Hadoop分布式文件系统(HDFS)和MapReduce计算框架进行局部配置。 core-site.xml作为全局配置文件，定义了Hadoop集群的...

hadoop config 配置文件: HDFS相关的配置都在这里，如副本数(`dfs.replication`)、数据块大小(`dfs.blocksize`)、名称节点和数据节点的相关参数等。这些配置直接影响HDFS的性能和可靠性。 4. **yarn-site.xml** YARN是Hadoop的资源调度器...

Hadoop集群高可用与性能优化: 在大数据处理领域，Hadoop是不可或缺的核心组件，它以其分布式计算框架著称，为企业和科研机构提供了海量数据处理的能力。本篇文章将深入探讨Hadoop集群的高可用性和性能优化策略，帮助你构建更加稳定、高效的Hadoop...

Hadoop分布式文件系统的文件读写: 在Hadoop的分布式文件系统（HDFS）中，文件的读写是整个大数据处理的核心操作。HDFS的设计目标是提供高容错性、高吞吐量的数据访问，以支持大规模数据处理的应用。以下是对Hadoop文件读写及相关属性的详细说明。 ##...

Hadoop2.6.0配置文件参考.zip: 在大数据处理领域，Hadoop是不可或缺的核心框架，它提供了分布式存储和计算的能力。Hadoop 2.6.0是该框架的一个稳定...通过定期检查配置文件、日志和性能指标，可以及时发现并解决问题，提升整个Hadoop集群的运行效率。

Hadoop默认的配置文件: 在分布式计算领域，Hadoop是一个不可或缺的关键框架，它为大数据处理提供了强大而灵活的解决方案。Hadoop的核心组件包括HDFS（Hadoop Distributed File System）和MapReduce，它们各自都有自己的默认配置文件，这些...

hadoop集群各种配置文件: 在构建和管理Hadoop集群时，配置文件是至关重要的，它们定义了集群的行为、性能参数以及节点间的通信方式。以下是对这些配置文件的详细解析：首先，`core-site.xml`是Hadoop的核心配置文件，它定义了基础的系统...

Hadoop配置文件表（如需要请下载附件）: 2. **dfs.blocksize**：HDFS的默认块大小，通常设置为128MB或256MB，影响数据读写效率。 3. **mapreduce.map.memory.mb**和`mapreduce.reduce.memory.mb`：分别设定Map和Reduce任务的内存大小，影响任务执行速度和...

hadoop2.8.2安装的配置文件: 这里你可以设置NameNode和DataNode的相关参数，比如副本数量(`dfs.replication`)，块大小(`dfs.blocksize`)，以及DataNode内存和磁盘空间的使用策略等。另外，对于高可用性(HA)的Hadoop集群，还需要在此配置NameNode...

hadoop的默认配置文件: - `dfs.blocksize`：设定数据块的大小，默认为128MB，可根据实际需求调整。其次，`core-default.xml`包含了Hadoop核心组件的基础配置，比如文件系统、I/O流等。其中关键配置包括： - `io.file.buffer.size`：读写...

集群Hadoop性能测试: - **io.seqfile.compress.blocksize**: 块压缩的最小大小。测试结果显示，块压缩的设置会影响文件读写性能。 - **io.file.buffer.size**: 文件读写缓冲区的大小。调整此值可以影响I/O效率，测试中发现不同大小的...

hadoop默认配置文件x-default.xml: `dfs.blocksize`定义了HDFS的基本存储单元大小，对存储效率和计算性能有直接影响。然后，`mapred-default.xml`文件与MapReduce框架相关，它定义了任务调度、任务执行等核心参数。比如，`mapreduce.framework.name`...

常见Hadoop面试题: 2. 在 HDFS 中，NameNode 负责管理文件系统的命名空间，而 DataNode 负责存储数据块。 3. SecondaryNameNode 的作用是帮助 NameNode 合并编辑日志，减少 NameNode 启动时间。 MapReduce 知识点 1. JobTracker 是一...

【IT十八掌徐培成】Hadoop第02天-06.hadoop本地目录修改-属性查看.zip: 而`hadoop.tmp.dir`属性则定义了Hadoop进程的临时目录，用于存放日志、元数据等临时文件。在实际操作中，我们可能会遇到需要修改这些配置的情况。例如，当磁盘空间不足或需要优化I/O性能时，我们可能需要调整`...

hadoop 配置文件: 2. **hdfs-site.xml**：此文件专门针对HDFS进行配置，如副本数量（`dfs.replication`）、块大小（`dfs.blocksize`）、名称节点和数据节点的内存分配等。 3. **mapred-site.xml**：此文件用于配置MapReduce框架，...

(完整版)hadoop常见笔试题答案.docx: 11. 要修改HDFS的block大小，需要在hdfs-site.xml配置文件中设置属性`dfs.blocksize`。 12. Namenode的RPC端口号为8021，用于接收客户端的连接，提供文件系统metadata信息。 13. MapReduce是Hadoop的并行计算框架...

Hadoop集群优化手册: HDFS（Hadoop Distributed File System）作为Hadoop生态系统中的分布式文件系统，其性能直接影响着整个集群的工作效率。在调整HDFS参数时，我们需要关注以下几个方面： - **Block Size**: HDFS默认的块大小为128MB...

Global site tag (gtag.js) - Google Analytics