`
文章列表

jvm 参数设置

    博客分类:
  • jvm
1: heap size a: -Xmx 指定jvm的最大heap大小,如:-Xmx2g b: -Xms 指定jvm的最小heap大小,如:-Xms1g c: -Xmn 指定jvm中New Generation的大小,如:-Xmn256m d: -XX:PermSize 指定jvm中Perm Generation的最小值,如:-XX:PermSize=32m e: -XX:MaxPermSize 指定Perm Generation的最大值,如:-XX:MaxPermSize=64m f: -Xss 指定线程桟大小,如:-Xss128k 
JVM GC日志和内存DUMP参数配置     在JVM出现内存溢出或泄露时,为便于排查和定位,需要JVM的启动上增加相应的参数。主要是GC日志和内存DUMP参数。详细如下。 1.GC日志和内存DUMP参数配置         本文参数配置基于各厂商 ...

Linux Shell自动交互

 
#!/usr/bin/expectset timeout 30spawn ssh -l root 192.168.1.117expect "password:"send "nopasswd/r"interact ================================ set timeout 30设置超时时间的,计时单位:秒  这样的shell脚本只能是./test.sh  方式执行,不能用sh 命令 ...

shell判断和比较

shell判断和比较 1  shell 的$! ,$?, $$,$@   $n        $1 the first parameter,$2 the second... $#        The number of command-line parameters. $0        The name of current program. $?        Last command or function's return value. $$        The program's PID.
Mapreduce多目录/多文件输出   一,介绍 1,旧API中有 org.apache.hadoop.mapred.lib.MultipleOutputFormat和org.apache.hadoop.mapred.lib.MultipleOutputs MultipleOutputFormat allowing to write the output data to different output files. MultipleOutputs creates multiple OutputCollectors. Each OutputCollector can have it ...
OutputFormats是做什么的? OutputFormt接口决定了在哪里以及怎样持久化作业结果。Hadoop为不同类型的格式提供了一系列的类和接口,实现自定义操作只要继承其中的某个类或接口即可。你可能已经熟悉了默认的OutputFormat,也就是TextOutputFormat,它是一种以行分隔,包含制表符界定的键值对的文本文件格式。尽管如此,对多数类型的数据而言,如再常见不过的数字,文本序列化会浪费一些空间,由此带来的结果是运行时间更长且资源消耗更多。为了避免文本文件的弊端,Hadoop提供了SequenceFileOutputformat,它将对象表示成二进制形式而不再是文本文 ...
MapReduce设置参数防止超时 1. 如果碰到异常“Task attempt failed to report status for xxx seconds. Killing!”,最可能是碰到死循环了。 2. 如果没有死循环:控制超时的属性是:mapred.task.timeout,默认600000ms,即600s。可以设置成更大的值。可以直接在Jobconf或Configuration中修改(只对本Job起作用),也可以修改mapred-site.xml(对所有Job起作用)。 3. 如果没有死循环,但task执行时间长又不好确定,可以在Reducer或Mapper中主动发送 ...
(1)当你把一个文件加入distribution cache的时候,要注意:如果你是以addCacheFile()的方式添加的,而你在mapper中取出来的时候,却是以archive的方式取出来——getLocalCacheArchives(),那么,你将得不到cache文件的路径,因为放进去和取出来的方式要一致。 (2)在mapper中获取当前正在处理的HDFS文件名/HDFS目录名 有时候,Hadoop是按行来对数据进行处理的,由于对每一行数据,map()函数会被调用一次,我们有时可以根据文件名/目录名来获取一些信息,从而把它们输出,例如,目录名中包含了日期,则我们可以取出来并输出到 ...

vim全局替换命令

vim全局替换命令 语法为 :[addr]s/源字符串/目的字符串/[option] 全局替换命令为::%s/源字符串/目的字符串/g [addr] 表示检索范围,省略时表示当前行。 如:“1,20” :表示从第1行到20行; “%” :表示整个文件,同“1,$”; “. ,$” :从当前行到文件尾; s : 表示替换操作 [option] : 表示操作类型
  Yarn的JVM重用功能——uber 在文章开头,我想先做几点说明: 1、本文的内容来自我对Yarn的相应功能的理解和实践。而我对该部分功能的理解主要来自对Hadoop的开发者之前相应言论的分析,并且我也将我的分析发给了Hadoop community, 并得到了Yarn的创始人兼架构师Arun Murthy的肯定回复。 2、本文中uber的配置部分,主要参考之前Hadoop开发者的言论。但是我当初看该言论的时候对一些细节有所疑惑,因此在本文中我对很多地方做了修改:使一些用词的引用前后一致,并加上了很多描述性的过渡语言。 3、本文为研究性质,并非官方文档的翻译。因此,如果读者发现 ...

hive基本用法

    博客分类:
  • hive
DDL Operations 创建表 hive> CREATE TABLE pokes (foo INT, bar STRING); 创建表并创建索引字段ds hive> CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (ds STRING); 显示所有表 hive> SHOW TABLES; 按正条件(正则表达式)显示表, 

vim 下块注释

vim下 1.插入注释: 用v进入virtual模式 用上下键选中需要注释的行数 按Control+v进入列模式 按大些“I”进入插入模式, 输入注释符“#”,然后立刻按下ESC   2.删除注释   先按Control+v进入列模式 按光标键选中需要删除的注释符 按x键删除   为了便于选取文本,VIM 引入了可视(Visual)模式。要选取一段文本,首先将光标移到段首,在普通模式下按 v 进入可视模式,然后把光标移到段末。需要注意,光标所在字符是包含在选区中的。这时可以对所选的文本进行一些操作,常用的(可视模式)命令有:x或d     剪切(即删除,同时所选的文本进入剪 ...
firefox 29后。就没有了状态栏 1.安装状态栏    添加原firefox 自带的状态栏    https://addons.mozilla.org/zh-cn/firefox/addon/the-addon-bar/    这个是网友扩展     http://mozilla.com.cn/addon/47-extended-statusbar/   加强版状态栏-Extended Statusbar 2.ip地址展示   工具     这个是在状态栏上显示ip地址     http://mozilla.com.cn/addon/80/   工欲善必先利其器, ...
  Shell中字符串分割的三种方法 分类: Linux2013-05-13 21:17 6296人阅读 评论(0) 收藏 举报 问题:对于’1,2,3,4,5’这样的字符串输出采用,分隔开的1 2 3 4 5 特征:在字符串中没有空格 解决方法1
storm模块结构和api对应关系  (2012-02-28 23:00:16) 转载▼ 标签: 
Global site tag (gtag.js) - Google Analytics