hadoop的超时设置 - 轻剑寂寥 - ITeye博客

`

nlslzf

浏览: 1054014 次
性别:
来自: 北京

最近访客更多访客>>

wangyy

u012363178

cwfmaker

windows9834

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

dove19900520：朋友，你确定你的标题跟文章内容对应？？？
tomcat控制浏览器不缓存
wussrc：我只想说牛逼,就我接触过的那点云计算的东西，仔细想想还真是这么 ...
别样解释云计算，太TM天才跨界了
hw_imxy： endpoint="/Hello/messagebr ...
flex+java代码分两个工程
gaohejie： rsrsdgrfdh坎坎坷坷
Flex 与 Spring 集成
李涤尘：谢谢。不过说得有点太罗嗦了。
Oracle数据库数据的导入及导出(转)

hadoop的超时设置

博客分类：

Hadoop生态圈(hadoop/hbase/pig/hive/zookeeper)

阅读更多

from http://blog.163.com/zhengjiu_520/blog/static/3559830620130510443956/

最近在测试mysql往HDFS备份的性能问题，发现对mysql执行xtrabackup进行限速之后经常出现HDFS写入不正常的情况。

1. 错误如下：

11/10/12 10:50:44 WARN hdfs.DFSClient: DFSOutputStream ResponseProcessor exception for block blk_8540857362443890085_4343699470java.net.SocketTimeoutException: 66000 millis timeout while waiting for channel to be ready for read. ch : java.nio.channels.SocketChannel[connected local=/172.*.*.*:14707 remote=/*.*.*.24:80010]

2. 修改超时设置

后来发现HDFS写入过程中有两个超时设置： dfs.socket.timeout和 dfs.datanode.socket.write.timeout；有些地方以为只是需要修改后面的dfs.datanode.socket.write.timeout项就可以，其实看报错是READ_TIMEOUT。对应在hbase中的默认值如下：

// Timeouts for communicating with DataNode for streaming writes/reads

public static int READ_TIMEOUT = 60 * 1000; //其实是超过了这个值

public static int READ_TIMEOUT_EXTENSION = 3 * 1000;

public static int WRITE_TIMEOUT = 8 * 60 * 1000;

public static int WRITE_TIMEOUT_EXTENSION = 5 * 1000; //for write pipeline

3. 修改配置文件

所以找出来是超时导致的，所以在hadoop-site.xml[hdfs-site.xml]配置文件中添加如下配置：

   <property>
     <name>dfs.datanode.socket.write.timeout</name>
     <value>3000000</value>
   </property>

   <property>
     <name>dfs.socket.timeout</name>
     <value>3000000</value>
   </property>
</configuration>

附：备份命令

innobackupex-1.5.1 –user=* –tmpdir=$BAKDEST –stream=tar $BAKDEST –slave-info | $COMPRESS | java hdfs write

分享到：

OpenSceneGraph概述 | Redis 起步

2013-06-23 11:47
浏览 2433
评论(0)
分类:企业架构
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

基于hadoop监控的grafana模板: 在大数据处理领域，Hadoop是不可或缺的核心框架，它提供了分布式存储和计算的能力。...一旦设置完成，Grafana将成为你管理Hadoop集群的得力助手，帮助你做出更明智的决策，优化系统性能，提升整体稳定性。

hadoop2.8.2安装的配置文件: 其他设置包括任务的内存分配、并行度、任务超时时间等。对于MapReduce v2 (YARN)，还需要设置`mapreduce.jobtracker.address`指向Resource Manager的位置。 4. **yarn-site.xml**: YARN是Hadoop 2引入的资源管理...

Hadoop默认配置文件: 首先，`core-default.xml`是Hadoop的核心组件配置文件，它包含了Hadoop的基本设置。这个文件主要涉及以下几个方面： 1. **文件系统**：定义了Hadoop默认的文件系统（如hdfs://localhost:9000），以及文件操作的缓冲...

hadoop_mysql-libs.rar 在linux用: Hadoop的类路径可以通过修改`HADOOP_CLASSPATH`环境变量来设置，或者在`hadoop-site.xml`配置文件中指定。 3. **测试连接**：确保Hadoop可以正确识别和加载这些库，你可以编写一个简单的Java程序，使用Hadoop的API...

hadoop的单机伪分布安装笔记: 这里通常会设置文件系统默认名称和IO传输的超时时间。对于伪分布式环境，通常需要将hadoop.tmp.dir属性设置为Hadoop的临时目录路径，并且需要配置fs.defaultFS属性来指定Hadoop的文件系统默认名称。还需要配置...

Hadoop的全部配置: - **`yarn.app.mapreduce.am.job.committer.cancel-timeout--60000`**：设置了MapReduce应用master作业提交取消超时时间为60秒。 - **`fs.ftp.host.port--21`**：指定了FTP服务器端口为21，虽然Hadoop本身并不直接...

编译Hadoop需要的其他包（2.7.5）: 这可能包括设置HADOOP_HOME、JAVA_HOME等环境变量，以及修改pom.xml配置文件中的依赖版本。 4. **获取依赖包**：这正是"编译Hadoop需要的其他包（2.7.5）"发挥作用的地方。这个压缩包很可能包含了编译Hadoop时所需...

Hadoop_RPC详细分析.doc: * 可靠性：Hadoop RPC 使用了多种机制来确保系统的可靠性，例如心跳机制、超时机制等。结论 Hadoop RPC 是 Hadoop 项目中的一个重要组件，它提供了分布式系统中的通信和数据交换机制。通过对 Hadoop RPC 的详细...

hadoop-cdh4.6配置文件: `zoo.cfg`是ZooKeeper的主要配置文件，其中包含了服务器列表、数据存储路径、会话超时时间等参数。 Spark的配置文件主要为`spark-defaults.conf`，这里可以设置执行器的内存、核心数、日志级别等。在CDH4中，Spark...

Hadoop和Hbase 配置文件-完整好的: 4. `zoo.cfg`: 虽然HBase使用ZooKeeper作为协调服务，但ZooKeeper的配置通常与Hadoop共享，这里可能包含ZooKeeper服务器列表、会话超时时间等。在使用这些配置文件时，你需要确保所有主机名正确，并且文件路径与你...

基于心跳超时机制的Hadoop实时容错技术 (2015年): 针对官方的Hadoop软件中提供的节点心跳超时容错机制对短作业并不合理，而且忽略了异构集群中各节点超期时间设置的公平性的问题，提出了公平心跳超时容错机制。首先根据每个节点的可靠性及计算性能构建节点故障误判...

hadoop+HA+zookeeper+hbase配置文件: 在实际部署环境中，还需要考虑安全性和性能优化，例如启用Hadoop的安全认证（如Kerberos）、调整HDFS和YARN的参数以适应具体硬件和负载情况，以及对Zookeeper的TTL和会话超时进行适当设置。通过以上步骤，你可以...

基于心跳超时机制的Hadoop实时容错技术: 不过，传统的Hadoop心跳超时机制对于短作业来说并不友好，原因在于它不能有效区分任务的执行时间，短作业可能因节点故障而受到不公平的超时时间设置影响。此外，异构集群中各节点超期时间的公平性也未得到合理处理，...

ES和HADOOP使用问题和需求: - **增加超时时间**：增加`discovery.zen.ping.timeout`值，以确保所有节点都有足够的时间进行通信。 - **指定候选节点**：通过`discovery.zen.ping.unicast.hosts`来指定master候选节点列表。 - **最小master节点数...

hadoop-2.2.0.tar.gz + zookeeper3.4.5: 解压zookeeper-3.4.5.tar.gz后，同样需要进行必要的配置，如设置数据存储目录、客户端连接地址等，然后启动服务。 Hadoop和Zookeeper的集成使用是大数据生态系统中常见的场景。例如，Hadoop的YARN可以依赖Zookeeper...

hadoop HA安装文档详解: - 设置Hadoop的临时目录。 - 配置ZooKeeper的地址和超时时间。 - 示例配置： ```xml <name>fs.defaultFS <value>hdfs://myha01/ <name>hadoop.tmp.dir <value>/opt/hadoop-2.7.5/data/hadoopdata/ ...

Hadoop源代码分析（三三）: 在Hadoop中，每个正在写入中的文件都有一个租约，该租约包含一个超时时间，分为“软超时”（1分钟）和“硬超时”（1小时）。当租约达到软超时时，会触发`internalReleaseLease`方法，其主要逻辑如下： - 验证文件...

细细品味Hadoop_Hadoop集群（第3期）_VSFTP安装配置: - `idle_session_timeout=600`：设置会话超时时间，防止长时间占用资源。 - `async_abor_enable=YES`：开启异步传输功能，提高传输效率。 - `ascii_upload_enable=YES`：启用ASCII模式上传，适用于文本文件。 - `...

hadoop、zookeeper、hbase、spark集群配置文件: 配置Zookeeper通常涉及到`zoo.cfg`文件，设置服务器列表、数据存储路径、会话超时时间等。 **HBase** 是一个基于Hadoop的分布式数据库，适合实时查询大规模数据。HBase使用Zookeeper进行元数据管理和故障恢复。配置...

hadoop源码阅读总结: - 为了确保稳定性，DataNode和TaskTracker设置的心跳时间应小于空闲连接的清理阈值。 #### 三、关键配置参数 - **`ipc.server.handler.queue.size`**：`callQueue`的大小，随集群规模增大而调整。 - **`ipc....

Global site tag (gtag.js) - Google Analytics