最新文章列表

hadoop 平衡空间设置方法

在hdfs-site.xml中增加设置balance的带宽,默认只有1M: <property>   <name>dfs.balance.bandwidthPerSec</name>     <value>10485760</value>     <description>         Specifies the ...
daizj 评论(0) 有1159人浏览 2015-03-25 20:42

项目中Map端数据处理不均匀性分析

  Map任务的不均匀性   最近发现Map端数据越来越不均匀,而处理输入的数据,写到本地磁盘的数据量都差不多,我们随便拿出来两个attempt任务(当前map数量为64个),33和45,33的counter:   下面是000045的Counter数据     可以看出Counter中的数据也是差不多,但是CPU时间以及GC时间相差比较大(实际上以ms为单位,也就相差不太大), ...
brandNewUser 评论(0) 有1010人浏览 2014-10-23 22:41

Hadoop中提供了balancer的机制,解决我的hive统计group问题

如果是select * from saleslog where `date`='2012-02-29' limit 5;这句是可以吐出五条数据的。 但是如下却出错了。。 hive> select goods_name,count(1) from saleslog where `date`='2012-02-29' group by goods_name; Total MapReduce ...
hao3721 评论(0) 有3732人浏览 2012-03-26 17:16

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics