0

0

回答

140 浏览

hadoop 测试文件卡死问题[已解决]5

用hadoop自带文件 wordcount 测试 发现一直卡死在 map 0% reduce 0% 怎么解决

2013年2月17日 17:54
0

0

回答

1678 浏览

java 如何调用 hadoop分析[已解决]0

我想请教 java如何调用hadoop mapper/reduce? 我用的是mapper/reduce打成jar包,java项目用Runtime.getRuntime().exec调用shell脚本,在shell脚本中 hadoop jar sas.jar $1 $2 $3 然后传递需要统计的参数,调用结束后,项目使用hadoop提供的工具类来访问统计结果 是这样吗?这样总有个问题就是调用h ...

2013年1月23日 10:35
0

1

回答

283 浏览

我要做一个网页和客户端展示[已解决]10

具体的说是这样的,我在做一个关于hadoop云存储的项目,它就和当今的网盘差不多。现在我已经有一套基于url的通用api,可以用来实现对已经上传的文件的管理(如列出当前文件夹中所有文件信息、复制、拷贝、删除等)。 由于hadoop的是一个主从式的构架,所以目前所有文件的上传都是必须先上传到他自身的主机部分,然后再由主机将这批文件分发到从节点上(或许已经有方案解决上传和从节点的直接对传,如果谁知道 ...

2012年12月28日 15:49
0

1

回答

1237 浏览

关于Nutch抓取网页的问题[已解决]5

前些时候用Nutch来抓取网页,发现是指定初始连接去抓取网页,但是对于抓取的内容是不能够控制的,假如我想指定一些关键字,然后抓取与这个关键字相关的网页,其他的都忽略掉,请问这个该怎么实现呢?我测试采用的是Nutch、Hadoop、Hbase这三个框架。谢谢!

2012年11月30日 08:27
0

0

回答

1607 浏览

Hadoop 运行报错,请教原因[已解决]5

java.lang.Exception: java.lang.NullPointerException at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:4 00) Caused by: java.lang.NullPointerException at org.apache.hadoop.mapred. ...

2012年10月07日 14:46
0

1

回答

175 浏览

关于文件解压的问题[已解决]15

不用先解压文件,怎样判断一个.tar.gz的文件是否能被解压。。。

2012年8月21日 11:30
0

1

回答

3334 浏览

通过Oozie提交MapReduce任务,抛java.io.EOFException异常[已解决]25

1. job.properties nameNode=hdfs://192.168.130.54:19000 jobTracker=192.168.130.54:19001 queueName=default #HDFS上的目录 oozie.wf.application.path=/tmp/oozie/conf oozie.libpath=/tmp/oozie/lib inputDir=/tmp/ ...

2012年7月18日 16:26
0

1

回答

2333 浏览

hdfs append追加文件上传的问题[已解决]20

各位大神们,小弟设置了hadoop-0.20-cdh3u0版本的dfs.support.append为true,然后想测试下文件追加上传。第一次上传一个文件的前4096看,第二次上传其余部分。但是发现2次上传的文件大小之和小于总文件大小。我发现问题在于,当第二次上传时,hdfs会删除第一次的文件,然后重新建立新文件再上传,所以文件大小只有第二次上传的数据大小。 以下是hadoop的日志: 2012- ...

2012年7月10日 16:05
0

0

回答

209 浏览

hadoop生成的索引文件分发问题?[已解决]10

如题: 第一个问题: hadoop生成了hdfs文件,现在想知道如何将这些索引文件分发到各个查询服务器,是通过copytolocal方式拷贝到本地吗? 第二个问题: 每个服务器的存放多少索引文件合适,通过什么方式分配索引文件保证每台服务器的索引文件都差不多(均衡)?

2012年7月04日 17:48
0

2

回答

1516 浏览

hadoop中文乱码问题[已解决]10

我在hadoop中要处理不同编码格式的文件。如:gbk ,utf-8. hadoop 默认是utf-8 执行结果是Utf-8的正常显示 gbk 的显示乱码 在网上查了 value = new String(text.getBytes(), 0, text.getLength(), encoding);这种形式。 执行结果未变化。 求指导。。。 <!--EndFragment-->

2012年6月19日 11:44
0

2

回答

455 浏览

一个hadoop问题[已解决]10

刚刚学习hadoop,搭建起集群在运行hadoop自带例子时报如下错误。请高手帮我解决下 hadoop jar c:/hadoop/hadoop-0.20.2/hadoop-0.20.2-examples.jar wordcount in/test.txt out 12/06/08 15:57:08 INFO input.FileInputFormat: Total input paths to p ...

2012年6月14日 11:44
0

0

回答

982 浏览

sqoop导出oracle问题:Field names must be greater than 0[已解决]30

用sqoop从hive导出数据到oracle遇到Field names must be greater than 0错误 oracle表:sqooptest(id varchar2(20),name varchar2(40)); hive表:create table testdata(id string,name string)row format delimited fields terminat ...

2012年5月31日 14:20
0

2

回答

8155 浏览

hadoop hdfs文件显示和编辑的问题[已解决]5

问题来源是这样的,在伪分布式模式下,我格式化了多次namenode,于是namenode启动不起来,网上查了问题是namenodespaceid和datanodespaceid不一样,需要改tmp/hadoop-root/dfs/data/current/VERSION所以我就去改。然后我在我在hadoop目录下终端输入以下命令:bin/hadoop fs -ls /tmp/hadoop-root/ ...

2012年2月23日 23:38
0

3

回答

1256 浏览

cygwin+hadoop环境 hive安装问题[已解决]5

本人初学,在windows上利用cygwin搭建了hadoop开发环境,而且执行了WorkCount,自己也写了一个Map/Reduce执行都没有问题。之后尝试安装Hive,我用的0.7.1版本,按照网上给的一些手册,下载--解压--配置环境变量,然后show tables; 一路都没有遇到问题,可是进入Hive命令行,输入show tables; 时控制台一直没反应,查看了下日志只有一行“Sess ...

2012年2月17日 17:27
0

0

回答

2226 浏览

远程在hadoop集群上跑pagerank的时候,map执行了100% 但是reduce出现了下面的错误[已解决]10

12/02/10 10:58:41 INFO mapred.JobClient: map 98% reduce 25% 12/02/10 10:58:44 INFO mapred.JobClient: map 99% reduce 25% 12/02/10 10:58:47 INFO mapred.JobClient: map 100% reduce 25% 12/02/10 10:59:01 IN ...

2012年2月10日 11:23
0

0

回答

153 浏览

hadoop中contrib/index使用哪个版本lucene类[已解决]15

请问hadoop 0.20.2中使用的是哪个版本的lucene,这个包具体如何使用啊

2012年1月01日 16:47
0

1

回答

2555 浏览

关于利用hadoop实现Lucene分布式[已解决]15

public void reduce(IntWritable key, Iterable<Text> values, Context context) throws IOException, InterruptedException { IndexWriter iw = null; Analyzer analyzer= new IKAnalyzer(); Configuratio ...

2011年12月31日 14:07

本周活跃投票用户

最新评论

Global site tag (gtag.js) - Google Analytics