票
回答
票
回答
java 如何调用 hadoop分析[已解决]0
我想请教 java如何调用hadoop mapper/reduce? 我用的是mapper/reduce打成jar包,java项目用Runtime.getRuntime().exec调用shell脚本,在shell脚本中 hadoop jar sas.jar $1 $2 $3 然后传递需要统计的参数,调用结束后,项目使用hadoop提供的工具类来访问统计结果 是这样吗?这样总有个问题就是调用h ...
票
回答
我要做一个网页和客户端展示[已解决]10
具体的说是这样的,我在做一个关于hadoop云存储的项目,它就和当今的网盘差不多。现在我已经有一套基于url的通用api,可以用来实现对已经上传的文件的管理(如列出当前文件夹中所有文件信息、复制、拷贝、删除等)。 由于hadoop的是一个主从式的构架,所以目前所有文件的上传都是必须先上传到他自身的主机部分,然后再由主机将这批文件分发到从节点上(或许已经有方案解决上传和从节点的直接对传,如果谁知道 ...
票
回答
关于Nutch抓取网页的问题[已解决]5
前些时候用Nutch来抓取网页,发现是指定初始连接去抓取网页,但是对于抓取的内容是不能够控制的,假如我想指定一些关键字,然后抓取与这个关键字相关的网页,其他的都忽略掉,请问这个该怎么实现呢?我测试采用的是Nutch、Hadoop、Hbase这三个框架。谢谢!
票
回答
Hadoop 运行报错,请教原因[已解决]5
java.lang.Exception: java.lang.NullPointerException at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:4 00) Caused by: java.lang.NullPointerException at org.apache.hadoop.mapred. ...
票
回答
通过Oozie提交MapReduce任务,抛java.io.EOFException异常[已解决]25
1. job.properties nameNode=hdfs://192.168.130.54:19000 jobTracker=192.168.130.54:19001 queueName=default #HDFS上的目录 oozie.wf.application.path=/tmp/oozie/conf oozie.libpath=/tmp/oozie/lib inputDir=/tmp/ ...
票
回答
hdfs append追加文件上传的问题[已解决]20
各位大神们,小弟设置了hadoop-0.20-cdh3u0版本的dfs.support.append为true,然后想测试下文件追加上传。第一次上传一个文件的前4096看,第二次上传其余部分。但是发现2次上传的文件大小之和小于总文件大小。我发现问题在于,当第二次上传时,hdfs会删除第一次的文件,然后重新建立新文件再上传,所以文件大小只有第二次上传的数据大小。 以下是hadoop的日志: 2012- ...
票
回答
hadoop生成的索引文件分发问题?[已解决]10
如题: 第一个问题: hadoop生成了hdfs文件,现在想知道如何将这些索引文件分发到各个查询服务器,是通过copytolocal方式拷贝到本地吗? 第二个问题: 每个服务器的存放多少索引文件合适,通过什么方式分配索引文件保证每台服务器的索引文件都差不多(均衡)?
票
回答
hadoop中文乱码问题[已解决]10
我在hadoop中要处理不同编码格式的文件。如:gbk ,utf-8. hadoop 默认是utf-8 执行结果是Utf-8的正常显示 gbk 的显示乱码 在网上查了 value = new String(text.getBytes(), 0, text.getLength(), encoding);这种形式。 执行结果未变化。 求指导。。。 <!--EndFragment-->
票
回答
一个hadoop问题[已解决]10
刚刚学习hadoop,搭建起集群在运行hadoop自带例子时报如下错误。请高手帮我解决下 hadoop jar c:/hadoop/hadoop-0.20.2/hadoop-0.20.2-examples.jar wordcount in/test.txt out 12/06/08 15:57:08 INFO input.FileInputFormat: Total input paths to p ...
票
回答
sqoop导出oracle问题:Field names must be greater than 0[已解决]30
用sqoop从hive导出数据到oracle遇到Field names must be greater than 0错误 oracle表:sqooptest(id varchar2(20),name varchar2(40)); hive表:create table testdata(id string,name string)row format delimited fields terminat ...
票
回答
hadoop hdfs文件显示和编辑的问题[已解决]5
问题来源是这样的,在伪分布式模式下,我格式化了多次namenode,于是namenode启动不起来,网上查了问题是namenodespaceid和datanodespaceid不一样,需要改tmp/hadoop-root/dfs/data/current/VERSION所以我就去改。然后我在我在hadoop目录下终端输入以下命令:bin/hadoop fs -ls /tmp/hadoop-root/ ...
票
回答
cygwin+hadoop环境 hive安装问题[已解决]5
本人初学,在windows上利用cygwin搭建了hadoop开发环境,而且执行了WorkCount,自己也写了一个Map/Reduce执行都没有问题。之后尝试安装Hive,我用的0.7.1版本,按照网上给的一些手册,下载--解压--配置环境变量,然后show tables; 一路都没有遇到问题,可是进入Hive命令行,输入show tables; 时控制台一直没反应,查看了下日志只有一行“Sess ...
票
回答
远程在hadoop集群上跑pagerank的时候,map执行了100% 但是reduce出现了下面的错误[已解决]10
12/02/10 10:58:41 INFO mapred.JobClient: map 98% reduce 25% 12/02/10 10:58:44 INFO mapred.JobClient: map 99% reduce 25% 12/02/10 10:58:47 INFO mapred.JobClient: map 100% reduce 25% 12/02/10 10:59:01 IN ...
票
回答
hadoop中contrib/index使用哪个版本lucene类[已解决]15
请问hadoop 0.20.2中使用的是哪个版本的lucene,这个包具体如何使用啊
票
回答
关于利用hadoop实现Lucene分布式[已解决]15
public void reduce(IntWritable key, Iterable<Text> values, Context context) throws IOException, InterruptedException { IndexWriter iw = null; Analyzer analyzer= new IKAnalyzer(); Configuratio ...
oznyang 评论了 关于oznyang发布的i18nTool工具的使用
huayang912 评论了 easyui datagrid 弹出窗口空白的解决方法
haihuichen 评论了 mybatis联teradata 查询时返回结果集为空,同样的代码在mysql下就可以返回结果集
haihuichen 评论了 mybatis联teradata 查询时返回结果集为空,同样的代码在mysql下就可以返回结果集
26762685 评论了 SOS!session串号现象
elbert 评论了 Java怎么实现打印机监控
sandy8508 评论了 Java String.format性能如何
feng_tai_jun 评论了 JSP里加return就会无法编译说Unreachable code
xiaojunjava 评论了 JAVA 连接打印机 打印作业属性设置无效果问题
xiaominzi 评论了 java.security.InvalidAlgorithmParameterException: Prime size must be multiple