jvm 参数设置

博客分类：

jvm

1: heap size a: -Xmx 指定jvm的最大heap大小,如:-Xmx2g b: -Xms 指定jvm的最小heap大小,如:-Xms1g c: -Xmn 指定jvm中New Generation的大小,如:-Xmn256m d: -XX:PermSize 指定jvm中Perm Generation的最小值,如:-XX:PermSize=32m e: -XX:MaxPermSize 指定Perm Generation的最大值,如:-XX:MaxPermSize=64m f: -Xss 指定线程桟大小,如:-Xss128k

2014-09-11 16:26
浏览 435
评论(0)
分类:编程语言

JVM GC日志和内存DUMP参数配置

博客分类：

jvm

JVM GC日志和内存DUMP参数配置在JVM出现内存溢出或泄露时，为便于排查和定位，需要JVM的启动上增加相应的参数。主要是GC日志和内存DUMP参数。详细如下。 1.GC日志和内存DUMP参数配置本文参数配置基于各厂商� ...

2014-09-10 19:13
浏览 1000
评论(0)
分类:互联网

Linux Shell自动交互

博客分类：

linux

#!/usr/bin/expectset timeout 30spawn ssh -l root 192.168.1.117expect "password:"send "nopasswd/r"interact ================================ set timeout 30设置超时时间的，计时单位：秒这样的shell脚本只能是./test.sh 方式执行，不能用sh 命令 � ...

2014-08-29 11:58
浏览 854
评论(0)
分类:编程语言

shell判断和比较

博客分类：

linux

shell判断和比较 1 shell 的$! ,$?, $$,$@ $n $1 the first parameter,$2 the second... $# The number of command-line parameters. $0 The name of current program. $? Last command or function's return value. $$ The program's PID.

2014-08-28 10:47
浏览 521
评论(0)
分类:编程语言

Mapreduce多目录/多文件输出

博客分类：

hadoop

Mapreduce多目录/多文件输出一，介绍 1，旧API中有 org.apache.hadoop.mapred.lib.MultipleOutputFormat和org.apache.hadoop.mapred.lib.MultipleOutputs MultipleOutputFormat allowing to write the output data to different output files. MultipleOutputs creates multiple OutputCollectors. Each OutputCollector can have it ...

2014-08-28 10:34
浏览 1737
评论(0)
分类:编程语言

探索Hadoop OutputFormat

博客分类：

hadoop

OutputFormats是做什么的？ OutputFormt接口决定了在哪里以及怎样持久化作业结果。Hadoop为不同类型的格式提供了一系列的类和接口，实现自定义操作只要继承其中的某个类或接口即可。你可能已经熟悉了默认的OutputFormat，也就是TextOutputFormat，它是一种以行分隔，包含制表符界定的键值对的文本文件格式。尽管如此，对多数类型的数据而言，如再常见不过的数字，文本序列化会浪费一些空间，由此带来的结果是运行时间更长且资源消耗更多。为了避免文本文件的弊端，Hadoop提供了SequenceFileOutputformat，它将对象表示成二进制形式而不再是文本文 ...

2014-08-28 10:21
浏览 830
评论(0)
分类:互联网

MapReduce设置参数防止超时

博客分类：

hadoop

MapReduce设置参数防止超时 1. 如果碰到异常“Task attempt failed to report status for xxx seconds. Killing!”，最可能是碰到死循环了。 2. 如果没有死循环：控制超时的属性是：mapred.task.timeout，默认600000ms，即600s。可以设置成更大的值。可以直接在Jobconf或Configuration中修改（只对本Job起作用），也可以修改mapred-site.xml（对所有Job起作用）。 3. 如果没有死循环，但task执行时间长又不好确定，可以在Reducer或Mapper中主动发送 ...

2014-08-27 14:47
浏览 1334
评论(0)
分类:编程语言

开发MapReduce常见问题

博客分类：

hadoop

（1）当你把一个文件加入distribution cache的时候，要注意：如果你是以addCacheFile()的方式添加的，而你在mapper中取出来的时候，却是以archive的方式取出来——getLocalCacheArchives()，那么，你将得不到cache文件的路径，因为放进去和取出来的方式要一致。（2）在mapper中获取当前正在处理的HDFS文件名/HDFS目录名有时候，Hadoop是按行来对数据进行处理的，由于对每一行数据，map()函数会被调用一次，我们有时可以根据文件名/目录名来获取一些信息，从而把它们输出，例如，目录名中包含了日期，则我们可以取出来并输出到 ...

2014-08-27 14:10
浏览 1090
评论(0)
分类:互联网

vim全局替换命令

博客分类：

linux

vim全局替换命令语法为 :[addr]s/源字符串/目的字符串/[option] 全局替换命令为：:%s/源字符串/目的字符串/g [addr] 表示检索范围，省略时表示当前行。如：“1，20” ：表示从第1行到20行； “%” ：表示整个文件，同“1,$”； “. ,$” ：从当前行到文件尾； s : 表示替换操作 [option] : 表示操作类型

2014-08-27 12:08
浏览 517
评论(0)
分类:编程语言

Yarn的JVM重用功能——uber

博客分类：

hadoop

Yarn的JVM重用功能——uber 在文章开头，我想先做几点说明： 1、本文的内容来自我对Yarn的相应功能的理解和实践。而我对该部分功能的理解主要来自对Hadoop的开发者之前相应言论的分析，并且我也将我的分析发给了Hadoop community，并得到了Yarn的创始人兼架构师Arun Murthy的肯定回复。 2、本文中uber的配置部分，主要参考之前Hadoop开发者的言论。但是我当初看该言论的时候对一些细节有所疑惑，因此在本文中我对很多地方做了修改：使一些用词的引用前后一致，并加上了很多描述性的过渡语言。 3、本文为研究性质，并非官方文档的翻译。因此，如果读者发现 ...

2014-08-27 10:55
浏览 1047
评论(0)
分类:编程语言

hive基本用法

博客分类：

hive

DDL Operations 创建表 hive> CREATE TABLE pokes (foo INT, bar STRING); 创建表并创建索引字段ds hive> CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (ds STRING); 显示所有表 hive> SHOW TABLES; 按正条件（正则表达式）显示表，

2014-08-26 12:19
浏览 690
评论(0)
分类:编程语言

vim 下块注释

博客分类：

linux

vim下 1.插入注释：用v进入virtual模式用上下键选中需要注释的行数按Control+v进入列模式按大些“I”进入插入模式，输入注释符“#”，然后立刻按下ESC 2.删除注释先按Control+v进入列模式按光标键选中需要删除的注释符按x键删除为了便于选取文本，VIM 引入了可视(Visual)模式。要选取一段文本，首先将光标移到段首，在普通模式下按 v 进入可视模式，然后把光标移到段末。需要注意，光标所在字符是包含在选区中的。这时可以对所选的文本进行一些操作，常用的(可视模式)命令有：x或d 剪切(即删除，同时所选的文本进入剪 ...

2014-08-23 16:16
浏览 835
评论(0)
分类:编程语言

firefox相关设置及有用插件

博客分类：

其他

firefox 29后。就没有了状态栏 1.安装状态栏添加原firefox 自带的状态栏 https://addons.mozilla.org/zh-cn/firefox/addon/the-addon-bar/ 这个是网友扩展 http://mozilla.com.cn/addon/47-extended-statusbar/ 加强版状态栏-Extended Statusbar 2.ip地址展示工具这个是在状态栏上显示ip地址 http://mozilla.com.cn/addon/80/ 工欲善必先利其器， ...

2014-08-23 10:13
浏览 784
评论(0)
分类:互联网

Shell中字符串分割的三种方法

博客分类：

linux

Shell中字符串分割的三种方法分类： Linux2013-05-13 21:17 6296人阅读评论(0) 收藏举报问题：对于’1,2,3,4,5’这样的字符串输出采用,分隔开的1 2 3 4 5 特征：在字符串中没有空格解决方法1

2014-08-22 11:26
浏览 1174
评论(0)
分类:编程语言

storm模块结构和api对应关系

博客分类：

storm

storm模块结构和api对应关系 (2012-02-28 23:00:16) 转载▼ 标签：

2014-08-15 18:37
浏览 633
评论(0)
分类:编程语言

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

jvm 参数设置

JVM GC日志和内存DUMP参数配置

Linux Shell自动交互

shell判断和比较

Mapreduce多目录/多文件输出

探索Hadoop OutputFormat

MapReduce设置参数防止超时

开发MapReduce常见问题

vim全局替换命令

Yarn的JVM重用功能——uber

hive基本用法

vim 下块注释

firefox相关设置及有用插件

Shell中字符串分割的三种方法

storm模块结构和api对应关系

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>