本月博客排行
-
第1名
Xeden -
第2名
fantaxy025025 -
第3名
bosschen - paulwong
- johnsmith9th
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - gengyun12
- wy_19921005
- vipbooks
- e_e
- benladeng5225
- wallimn
- ranbuijj
- javashop
- jickcai
- fantaxy025025
- zw7534313
- qepwqnp
- robotmen
- 解宜然
- ssydxa219
- sam123456gz
- zysnba
- sichunli_030
- tanling8334
- arpenker
- gaojingsong
- xpenxpen
- kaizi1992
- wiseboyloves
- jh108020
- xyuma
- ganxueyun
- wangchen.ily
- xiangjie88
- Jameslyy
- luxurioust
- mengjichen
- lemonhandsome
- jbosscn
- nychen2000
- zxq_2017
- lzyfn123
- wjianwei666
- forestqqqq
- ajinn
- siemens800
- hanbaohong
- 狂盗一枝梅
- java-007
- zhanjia
- 喧嚣求静
- Xeden
最新文章列表
DataNode启动失败解决
DataNode启动失败解决
第一步:查看日志
打开DataNode上的hadoop日志 在hadoop/logs下 查看类似于
hadoop-root-datanode-node3.log
查看错误
在日志中会看到 类似于这样的错误
Incompatible clusterIDs in /usr/hadoop/tmp/dfs/data:
namenod ...
分布式文件系统HDFS简介
本文转自http://storage.chinabyte.com/107/12416607.shtml。
Hadoop 分布式文件系统 (HDFS) 是运行在通用硬件上的分布式文件系统。HDFS 提供了一个高度容错性和高吞吐量的海量数据存储解决方案。HDFS 已经在各种大型在线服务和大型存储系统中得到广泛应用,已经成为各大网站等在线服务公司的海量存
Hadoop 源代码分析(一七)DataNode
周围的障碍扫清以后,我们可以开始分析类DataNode。类图如下:<IGNORE_JS_OP style="TEXT-TRANSFORM: none; BACKGROUND-COLOR: rgb(255,255,255); TEXT-INDENT: 0px; FONT: 14px/ ...
Spark API编程动手实战-02-以集群模式进行Spark API实战textFile、cache、count
操作HDFS:先要保证HDFS启动了:
启动spark集群:
以spark-shell运行在spark集群上:
查看下之前上传到HDFS上的”LICENSE.txt“文件:
用spark读取这个文件:
使用count统计该文件的行数:
我们可以看到count 耗时为0.239708s
对该RDD进行cache操作并执行count使得缓存生效:
hdfs-ha热备原理
下面的总结来自于:http://dongxicheng.org/hadoop-hdfs/hdfs-ha-federation-deploy/
Hadoop 2.0中的HDFS增加了两个重大特性,HA和Federaion。HA即为High Availability,用于解决NameNode单点故障问题,该特性通过热备的方式为主NameNode提供一个备用者,一旦主Na ...
Hadoop DataNode启动失败
DataNode启动失败:
2012-12-14 00:48:19,242 WARN org.apache.hadoop.hdfs.server.datanode.DataNode: Invalid directory in dfs.data.dir: Incorrect permission for /usr/hadoop/hadoop-1.0.4/data, expected: rwxr ...
hadoop集群环境下主机与从机之间使用同一账户的原因
namenode节点和datanode节点最好使用统一的用户名,并且安装目录最好一致。因为在namenode节点通过ssh控制datanode节点时,默认按照namenode节点的配置环境在datanode节点的同样目录下找寻配置文件,若安装目录或者用户名不同,则出现文件不存在或者无法找到的错误。
"DataXceiver: java.io.IOException: Connection reset by peer" erro
最近在跑mr任务的时候 ,查看datanode节点的log日志,总是会看到这个错误,仔细的查了下发现有人提过这个bug,如下:
When a client reads data using read(), it closes the sockets after it is done. Often it might not read till the end of a block. The data ...
hadoop 添加删除datanode及tasktracker
hadoop 添加删除datanode及tasktracker
首先:
建议datanode和tasktracker分开写独立的exclude文件,因为一个节点即可以同时是datanode和tasktracker,也可以单独是datanode或tasktracker。
1、删除datanode
修改namenode上的hdfs-site.xml
<property>
< ...
Hadoop配置的关键(Hdfs部分)
Hadoop配置的关键(Hdfs部分)
Hadoop配置的关键(Hdfs部分)指的是namenode和datanode几点的区别:
相同点:
1.安装hadoop相同
2.安装jdk相同(注意:jdk1.6以上)
不同点:
1.namenode和datanode的/etc/hosts中指定的内容不同:
...
hadoop重用Decommission状态的数据节点
一、背景
本篇主要针对Decommission状态的数据节点重用的处理方法。
如果是完全新增一个服务器作为新增节点,可参考本博客:http://szjian.iteye.com/admin/blog ...