上次使用java工程调用hadoop集群成功后,可以使用web工程来调用hadoop集群,web工程在下面页面下载:http://download.csdn.net/detail/fansy1990/5361645。
今次的例子还是word count程序,实现的思路大概是:
1、输入、出路径界面,供用户输入,如下:
2、用户点击提交后,程序提交到一个jsp页面,取得参数,并采用Thread调用hadoop集群运行任务;
3、调用hadoop集群运行任务后,直接跳转到另外一个jsp页面,用于不断更新map和reduce的运行状态;
总结:虽然做出来了,但是在显示map和reduce运行状态的时候后台老是显示这个错误:
13/05/12 15:27:58 INFO mapred.JobClient: map 55% reduce 11%
13/05/12 15:27:58 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same.
13/05/12 15:27:58 WARN mapred.JobClient: No job jar file set. User classes may not be found. See JobConf(Class) or JobConf#setJar(String).
13/05/12 15:27:58 INFO mapred.JobClient: Cleaning up the staging area hdfs://hadoop:9000/home/hadoop/hadooptmp/mapred/staging/Administrator/.staging/job_201305101805_0148
13/05/12 15:27:58 ERROR security.UserGroupInformation: PriviledgedActionException as:Administrator cause:org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://hadoop:9000/user/hadoop/output already exists
org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://hadoop:9000/user/hadoop/output already exists
暂时不知道原因。以前碰到这个问题是因为运行任务时,HDFS文件系统上面已经有这个文件夹了,但是这里只是显示map和reduce运行状态,并没有提交任务。或者可能是我采用的显示map和reduce状态的方法会去检查HDFS?
分享,快乐,成长
转载请注明出处:http://blog.csdn.net/fansy1990
分享到:
相关推荐
web工程调用hadoop集群的实例,包括一个wordcount例子。 输入输入和输出路径点击提交即可提交任务到hadoop集群,同时含有map和reduce过程的监控。 注意点:要把hadoop相关包放入WEB_INF/lib下面;
web 工程调用hadoop集群1.4版本,使用structs2框架,把WEB-INF/lib下面的hadoop-fz1.3.jar拷贝到hadoop集群的lib下面,然后就可以运行了,此版本暂时只支持text2vector、canopy算法。具体参考...
web 工程调用hadoop集群1.3版本,使用structs2框架,把WEB-INF/lib下面的hadoop-fz1.3.jar拷贝到hadoop集群的lib下面,然后就可以运行了,暂时只支持text2vector算法。具体参考http://blog.csdn.net/fansy1990中相应...
在现代大数据处理场景中,Web平台与Hadoop集群的集成是常见的需求,特别是在数据分析和机器学习项目中。...同时,随着Hadoop生态系统的不断发展,更多高级功能和优化手段也将被纳入到Web调用Hadoop集群的实践中。
Java Web程序调用Hadoop 2.6是一个关键的技术整合,它允许Web应用程序与Hadoop分布式文件系统(HDFS)和MapReduce框架交互,以处理大规模数据。在本示例中,我们将深入探讨如何实现这一集成,以及涉及的关键概念和...
【标题】基于WEB实现的Hadoop集群可视化上传下载增删查改系统 【描述】Hadoop作为大数据处理的核心框架,其分布式存储与计算能力在业界得到了广泛应用。然而,对于非专业用户来说,直接通过命令行操作Hadoop集群...
web调用hadoop集群的改进版,修改了job中map和reduce进度的获取方式;修改了页面跳转,添加了servlet,servlet处理数据,jsp专注展现;解压后有两个文件,一个是web工程直接导入myeclipse,另外一个是jar放在hadoop...
本篇文章将深入探讨“远程调用执行Hadoop Map/Reduce”的概念、原理及其实现过程,同时结合标签“源码”和“工具”,我们将涉及到如何通过编程接口与Hadoop集群进行交互。 Hadoop MapReduce是一种编程模型,用于大...
### Hadoop集群与单机数据处理耗时对比分析 #### 引言 随着互联网的飞速发展,数据的爆炸式增长已成为常态,这对数据处理能力提出了前所未有的挑战。传统单机处理方式在面对大规模数据集时显得力不从心,处理效率...
该实现方案首先通过网页接口收集用户的需求和输入数据,然后利用Hadoop集群的分布式计算能力,自动调用合适的处理程序进行计算。这种设计的优势在于,它可以将复杂的计算任务分散到集群中的多个节点上,从而显著提高...
"集群调用" 标签则表明该应用可能涉及到在Hadoop集群中的节点间进行通信和数据传输,这通常涉及到Hadoop的分布式文件系统(HDFS)和YARN(Yet Another Resource Negotiator)资源调度器。 从压缩包内的文件名 ...
(2)启动Spark分布式集群并查看信息 (3)网页端查看集群信息 (4)启动spark-shell控制台 1:local模式启动 2:登录master服务器,在集群模式下启动 (5)访问http://localhost:4040可以看到spark web界面 (6)从...
这可以通过构建Web服务接口或者使用Web框架(如Spring Boot)来实现,使得Web应用能够直接调用Hadoop集群进行数据处理,并将结果返回给前端。例如,可以创建RESTful API,让Web应用向Hadoop提交MapReduce作业,获取...
然后,通过Web界面检查Hadoop集群的状态,HDFS默认监听50070端口,ResourceManager监听8088端口。 以上就是基于Windows搭建Hadoop2.7.6的基本过程和涉及的关键知识点。在实际操作中,你可能会遇到各种问题,如权限...
3. **运行WordCount程序**:调用Hadoop自带的Java程序`hadoop-mapreduce-examples-2.7.7.jar`,指定输入和输出参数。 ### 四、实验结果 成功运行WordCount后,可以在指定的输出文件夹(例如/output)中看到统计...
《深入理解Hadoop Auth:构建安全的分布式计算环境》 Hadoop作为开源的大数据处理框架,其安全...通过合理地配置和调用Hadoop Auth的API,我们可以定制适合自己业务场景的安全策略,保护数据安全,防止未授权的访问。
- 将Hadoop的安装路径添加到系统环境变量`PATH`中,以便于在命令行中直接调用Hadoop命令。 - 设置`HADOOP_HOME`环境变量指向Hadoop的安装目录。 2. **配置Hadoop**: - 修改`etc/hadoop/core-site.xml`配置文件...