ITeye问答频道

问答首页→ Hadoop× 57

票

回答

140 浏览

hadoop 测试文件卡死问题[已解决]5

用hadoop自带文件 wordcount 测试发现一直卡死在 map 0% reduce 0% 怎么解决

Hadoop

2013年2月17日 17:54

z7611019
15
0 0 4

票

回答

1678 浏览

我想请教 java如何调用hadoop mapper/reduce? 我用的是mapper/reduce打成jar包，java项目用Runtime.getRuntime().exec调用shell脚本，在shell脚本中 hadoop jar sas.jar $1 $2 $3 然后传递需要统计的参数，调用结束后，项目使用hadoop提供的工具类来访问统计结果是这样吗？这样总有个问题就是调用h ...

Java Linux Hadoop

2013年1月23日 10:35

weibei
1
0 0 2

票

回答

283 浏览

我要做一个网页和客户端展示[已解决]10

具体的说是这样的，我在做一个关于hadoop云存储的项目，它就和当今的网盘差不多。现在我已经有一套基于url的通用api，可以用来实现对已经上传的文件的管理（如列出当前文件夹中所有文件信息、复制、拷贝、删除等）。由于hadoop的是一个主从式的构架，所以目前所有文件的上传都是必须先上传到他自身的主机部分，然后再由主机将这批文件分发到从节点上（或许已经有方案解决上传和从节点的直接对传，如果谁知道 ...

Linux Hadoop 软件开发客户端

2012年12月28日 15:49

龙虎组
2
0 0 4

票

回答

1237 浏览

关于Nutch抓取网页的问题[已解决]5

前些时候用Nutch来抓取网页，发现是指定初始连接去抓取网页，但是对于抓取的内容是不能够控制的，假如我想指定一些关键字，然后抓取与这个关键字相关的网页，其他的都忽略掉，请问这个该怎么实现呢？我测试采用的是Nutch、Hadoop、Hbase这三个框架。谢谢！

Hadoop HBase 搜索 nutch 抓取网页

2012年11月30日 08:27

xtuali1
25
0 0 1

票

回答

1607 浏览

Hadoop 运行报错，请教原因[已解决]5

java.lang.Exception: java.lang.NullPointerException at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:4 00) Caused by: java.lang.NullPointerException at org.apache.hadoop.mapred. ...

Java Hadoop

2012年10月07日 14:46

z_wang
1
0 0 4

票

回答

175 浏览

关于文件解压的问题[已解决]15

不用先解压文件，怎样判断一个.tar.gz的文件是否能被解压。。。

Hadoop

2012年8月21日 11:30

天蝎座
1
0 0 2

票

回答

3334 浏览

通过Oozie提交MapReduce任务，抛java.io.EOFException异常[已解决]25

1. job.properties nameNode=hdfs://192.168.130.54:19000 jobTracker=192.168.130.54:19001 queueName=default #HDFS上的目录 oozie.wf.application.path=/tmp/oozie/conf oozie.libpath=/tmp/oozie/lib inputDir=/tmp/ ...

Hadoop oozie EOFException map-Reduce

2012年7月18日 16:26

xianneng.lin
0
0 0 4

票

回答

2333 浏览

hdfs append追加文件上传的问题[已解决]20

各位大神们，小弟设置了hadoop-0.20-cdh3u0版本的dfs.support.append为true，然后想测试下文件追加上传。第一次上传一个文件的前4096看，第二次上传其余部分。但是发现2次上传的文件大小之和小于总文件大小。我发现问题在于，当第二次上传时，hdfs会删除第一次的文件，然后重新建立新文件再上传，所以文件大小只有第二次上传的数据大小。以下是hadoop的日志： 2012- ...

Hadoop

2012年7月10日 16:05

yyx1987
4
0 0 4

票

回答

209 浏览

hadoop生成的索引文件分发问题？[已解决]10

如题：第一个问题： hadoop生成了hdfs文件，现在想知道如何将这些索引文件分发到各个查询服务器，是通过copytolocal方式拷贝到本地吗？第二个问题：每个服务器的存放多少索引文件合适，通过什么方式分配索引文件保证每台服务器的索引文件都差不多（均衡）？

Lucene Hadoop

2012年7月04日 17:48

jbpm
25
0 0 2

票

回答

1516 浏览

hadoop中文乱码问题[已解决]10

我在hadoop中要处理不同编码格式的文件。如：gbk ,utf-8. hadoop 默认是utf-8 执行结果是Utf-8的正常显示 gbk 的显示乱码在网上查了 value = new String(text.getBytes(), 0, text.getLength(), encoding);这种形式。执行结果未变化。求指导。。。

Hadoop 乱码

2012年6月19日 11:44

yaoxiaowei0909
12
0 0 3

票

回答

455 浏览

一个hadoop问题[已解决]10

刚刚学习hadoop，搭建起集群在运行hadoop自带例子时报如下错误。请高手帮我解决下 hadoop jar c:/hadoop/hadoop-0.20.2/hadoop-0.20.2-examples.jar wordcount in/test.txt out 12/06/08 15:57:08 INFO input.FileInputFormat: Total input paths to p ...

Hadoop

2012年6月14日 11:44

yaoxiaowei0909
12
0 0 3

票

回答

982 浏览

sqoop导出oracle问题：Field names must be greater than 0[已解决]30

用sqoop从hive导出数据到oracle遇到Field names must be greater than 0错误 oracle表：sqooptest(id varchar2(20),name varchar2(40)); hive表：create table testdata(id string,name string)row format delimited fields terminat ...

Oracle Hadoop hive sqoop

2012年5月31日 14:20

ｎǎ一站
0
0 0 2

票

回答

8155 浏览

hadoop hdfs文件显示和编辑的问题[已解决]5

问题来源是这样的，在伪分布式模式下，我格式化了多次namenode，于是namenode启动不起来，网上查了问题是namenodespaceid和datanodespaceid不一样，需要改tmp/hadoop-root/dfs/data/current/VERSION所以我就去改。然后我在我在hadoop目录下终端输入以下命令：bin/hadoop fs -ls /tmp/hadoop-root/ ...

Hadoop

2012年2月23日 23:38

zhudeliliang
20
0 0 3

票

回答

1256 浏览

cygwin+hadoop环境 hive安装问题[已解决]5

本人初学，在windows上利用cygwin搭建了hadoop开发环境，而且执行了WorkCount，自己也写了一个Map/Reduce执行都没有问题。之后尝试安装Hive，我用的0.7.1版本，按照网上给的一些手册，下载--解压--配置环境变量，然后show tables; 一路都没有遇到问题，可是进入Hive命令行，输入show tables; 时控制台一直没反应，查看了下日志只有一行“Sess ...

Hadoop hive hive安装

2012年2月17日 17:27

Jerrick
0
0 0 0

票

回答

2226 浏览

远程在hadoop集群上跑pagerank的时候，map执行了100% 但是reduce出现了下面的错误[已解决]10

12/02/10 10:58:41 INFO mapred.JobClient: map 98% reduce 25% 12/02/10 10:58:44 INFO mapred.JobClient: map 99% reduce 25% 12/02/10 10:58:47 INFO mapred.JobClient: map 100% reduce 25% 12/02/10 10:59:01 IN ...

Linux Hadoop Mapreduce pagerank

2012年2月10日 11:23

十三月的
20
0 0 0

票

回答

153 浏览

hadoop中contrib/index使用哪个版本lucene类[已解决]15

请问hadoop 0.20.2中使用的是哪个版本的lucene，这个包具体如何使用啊

Lucene Hadoop

2012年1月01日 16:47

RobustTm
117
0 0 3

票

回答

2555 浏览

关于利用hadoop实现Lucene分布式[已解决]15

public void reduce(IntWritable key, Iterable<Text> values, Context context) throws IOException, InterruptedException { IndexWriter iw = null; Analyzer analyzer= new IKAnalyzer(); Configuratio ...

Lucene Hadoop

2011年12月31日 14:07

RobustTm
117
0 0 3

我的问答 FAQ | 勋章

排行榜

查看全部排名>>

hadoop 测试文件卡死问题[已解决]5

java 如何调用 hadoop分析[已解决]0

我要做一个网页和客户端展示[已解决]10

关于Nutch抓取网页的问题[已解决]5

Hadoop 运行报错，请教原因[已解决]5

关于文件解压的问题[已解决]15

通过Oozie提交MapReduce任务，抛java.io.EOFException异常[已解决]25

hdfs append追加文件上传的问题[已解决]20

hadoop生成的索引文件分发问题？[已解决]10

hadoop中文乱码问题[已解决]10

一个hadoop问题[已解决]10

sqoop导出oracle问题：Field names must be greater than 0[已解决]30

hadoop hdfs文件显示和编辑的问题[已解决]5

cygwin+hadoop环境 hive安装问题[已解决]5

远程在hadoop集群上跑pagerank的时候，map执行了100% 但是reduce出现了下面的错误[已解决]10

hadoop中contrib/index使用哪个版本lucene类[已解决]15

关于利用hadoop实现Lucene分布式[已解决]15

问答分类

移动开发技术

Web前端技术

Java企业应用

编程语言技术

综合技术

入门技术

招聘求职

海阔天空

最新问题

排行榜

本周活跃投票用户

最新评论