`
qindongliang1922
  • 浏览: 2196438 次
  • 性别: Icon_minigender_1
  • 来自: 北京
博客专栏
7265517b-f87e-3137-b62c-5c6e30e26109
证道Lucene4
浏览量:117896
097be4a0-491e-39c0-89ff-3456fadf8262
证道Hadoop
浏览量:126299
41c37529-f6d8-32e4-8563-3b42b2712a50
证道shell编程
浏览量:60251
43832365-bc15-3f5d-b3cd-c9161722a70c
ELK修真
浏览量:71614
社区版块
存档分类
最新评论

设置Hadoop+Hbase集群pid文件存储位置

阅读更多
有时候,我们对运行几天或者几个月的hadoop或者hbase集群做停止操作,会发现,停止命令不管用了,为什么呢?
因为基于java开发的程序,想要停止程序,必须通过进程pid来确定,而hadoop和hbase默认的情况下,会把pid文件存储在Linux上的/tmp目录的某个目录下,进程名命令规则一般是  框架名-用户名-角色名.pid,而默认情况下,linux的tmp里面的东西,一天会删除一次,所以把pid文件放在这里面,并不是长久之计,为了安全起见,我们还是放到一个固定的目录下最好,当然不能放在/tmp下

如何配置避免把进程文件写到临时目录下面呢?

一:Hadoop配置:

(1)修改hadoop-env.sh
修改如下,如果没有下面的设置,可以直接添加:

export HADOOP_PID_DIR=/ROOT/server/pids_hadoop_hbase
export HADOOP_SECURE_DN_PID_DIR=/ROOT/server/pids_hadoop_hbase

上述配置,影响
NameNode
DataNode
SecondaryNameNode
进程pid存储



(2)修改mapred-env.sh
修改
export HADOOP_MAPRED_PID_DIR=/ROOT/server/pids_hadoop_hbase

上述配置,影响
JobHistoryServer
进程pid存储

(3)修改yarn-env.sh
修改或者添加(不存在此项配置时),这里面我没有找到pid的环境设置变量,所以就直接添加了

export YARN_PID_DIR=/ROOT/server/pids_hadoop_hbase

上述配置,影响
NodeManager
ResourceManager
进程pid存储


二:Hbase的配置
修改hbase-env.sh

export HBASE_PID_DIR=/ROOT/server/pids_hadoop_hbase


上述配置,影响
HMaster
HRegionServer

进程pid存储


再次启动集群,就会发现指定的pids_hadoop_hbase下有进程pid文件已经存储进来:







如此以来,就安全多了,再次关闭集群时,不用再担心进程文件找不到,而导致只能暴力 kill 相关
进程,这样做比较危险,一般情况不推荐这样做

参考文章:
http://blog.csdn.net/xiao_jun_0820/article/details/35222699


最后欢迎大家扫码关注微信公众号:我是攻城师(woshigcs),我们一起学习,进步和交流!(woshigcs)
本公众号的内容是有关搜索和大数据技术和互联网等方面内容的分享,也是一个温馨的技术互动交流的小家园,有什么问题随时都可以留言,欢迎大家来访!



  • 大小: 9.9 KB
1
2
分享到:
评论

相关推荐

    hadoop+hbase+hive集群搭建

    其中,`masters`和`slaves`文件分别指定了NameNode和DataNode的列表,`hadoop-env.sh`用于设置Java环境变量和PID目录,这些都是Hadoop集群正常运行的基础。 ### 总结 构建Hadoop+HBase+Hive集群是一项复杂而细致的...

    Hbase完全分布式集群搭建(详细+,看完就会,).docx

    HBase 是一个基于 Hadoop 的分布式 Nosql 数据库,可以提供高性能、可靠的数据存储和查询服务。为了搭建一个完全分布式的 HBase 集群,我们需要了解 HBase 的架构、组件和配置。 一、HBase 架构 HBase 的架构主要...

    hawq 详细安装手册

    在`/etc/security/limits.conf`中,为`gpadmin`用户添加以下行,以设置内存和打开文件数限制: ``` gpadmin soft nproc 32000 gpadmin hard nproc 32000 gpadmin soft nofile 65536 gpadmin hard nofile 65536...

    Impala维护操作手册.docx

    Impala是Apache Hadoop生态系统中的一个快速、分布式SQL查询引擎,用于处理存储在HDFS和HBase中的大数据集。在数据中心的Petabase集群中,Impala与其他服务协同工作,提供高效的数据分析能力。本手册将详细介绍如何...

    大数据技术之高频面试题

    搭建集群需要配置Hadoop的环境变量、节点间通信、数据存储等,还要确保硬件资源的合理分配。 **1.2.3 HDFS 读写流程** HDFS的读取流程通常包括客户端查找数据块位置、向NameNode请求数据、从DataNode读取数据。写入...

    完美卸载cloudera

    [root@master ~]# rm -rf /data/dfs /data/impala /data/yarn /dfs /impala /yarn /var/run/hadoop-* /var/run/hdfs-* /usr/bin/hadoop* /usr/bin/zookeeper* /usr/bin/hbase* /usr/bin/hive* /usr/bin/hdfs /usr/...

Global site tag (gtag.js) - Google Analytics