集群上运行MR程序---备忘 - - ITeye博客

`

鞠文婷

浏览: 17064 次
性别:
来自: 江苏南通

最近访客更多访客>>

feiyang404

narutolzj

zhp8341

javafound

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

kidding87： hashset就完啦 public static HashS ...
抽牌算法
鞠文婷： 357236417 写道到此一游~欢迎经常来踩话说大神你能 ...
抽牌算法
357236417：到此一游~
抽牌算法
鞠文婷： yangguo 写道 public class Test { ...
抽牌算法
鞠文婷： yangguo 写道 public class Test { ...
抽牌算法

集群上运行MR程序---备忘

博客分类：

备忘录

集群 mapreduce

阅读更多

最近虚拟机老出bug，又鉴于日后处理大数据时必定会用到集群，所以我缠着我们组现在已经研究到Scala的大神，不时软磨硬泡，总算在今天下午独自成功跑完一个mapreduce小程序。秉着珂姨“好记性不如烂博客”的原则，决定将其记录在案。

（1）首先要新建一个目录，我起名为test，

hadoop fs -mkdir /test；

（2）手动将存储着实验数据的txt文件放入虚拟机的文件系统中，我放在/usr/local目录下，然后将其上传至HDFS，

hadoop fs -put /usr/local/MR.txt /test。

查看test是否上传成功，可用hadoop fs -ls /test；

（3）将导出的jar文件同样复制到虚拟机的文件系统中；

（4）接着就可以执行程序了，指令形式：

hadoop jar 你的jar包的位置 jar包主类名 /test/test.txt 输出目录。

在这之前，你可以先进入存放jar文件的目录，就可以直接hadoop jar jar包主类名 /test（/MR.txt）输出目录;

Problem: 到这里我遇到了一个问题，

请教了大神，知道问题出在jdk，解决方案：点击所需项目—>点击工具栏Project中的Properties—>选中左边栏的Java compiler,如图

（5）改完后，运行，此处截取最后片段，查看是否成功，

hadoop fs -ls /output_JWT,若自动生成一个SUCCESS文件则说明执行成功

；

（6）跑程序的目的自然是查看结果，指令如下：

hadoop fs -cat /output_JWT/(系统自动生成的文件)

到这里，我的第一个集群上的MR程序就跑完了，因为实现的功能非常简单，只是统计第一列日志的各个内容出现次数，因此这里就不另附上源码了。

Welcome criticism!~

查看图片附件

1
顶

0
踩

分享到：

MapReduce框架分析 | Spark之我看（I）什么是RDD

2014-07-29 20:19
浏览 1641
评论(2)
分类:行业应用
查看更多

评论

2 楼鞠文婷 2014-07-29

357236417 写道

很好很强大

大神过奖了

1 楼 357236417 2014-07-29

很好很强大

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

redis集群以及Spring-data-redis操作集群: 3. **连接集群**：通过Spring的自动装配，应用程序可以获取到`JedisCluster`实例，进行增删改查等操作。 4. **操作示例**：如`set`、`get`、`keys`、`lpush`等，都是通过`JedisCluster`实例调用相应方法完成。 5. **...

8.1：集群及LVS简介、 LVS-NAT集群、 LVS-DR集群、总结与答疑.docx: 集群及LVS简介、LVS-NAT集群、LVS-DR集群本文档主要讲解了Linux虚拟服务器（LVS）的基本概念和实现方法，涵盖了LVS的集群模式、LVS-NAT集群、LVS-DR集群等内容。同时，文档还提供了一些实际的案例，包括使用...

03-VIP-Redis缓存高可用集群（预习）1: 3. **启动集群**：在各节点上启动配置好的Redis服务器，确保所有节点正常运行。 4. **创建集群**：使用`redis-cli`命令创建集群，这一步需要在集群中的一个节点上执行，将其他所有节点添加到集群中。在Redis 5.0...

查询所有Redis集群配置信息-data-2021-05-06 11_08_34.zip: 查询所有Redis集群配置信息-data-2021-05-06 11_08_34.zip

Hadoop搭建及MR编程-实验报告: ### Hadoop搭建及MR编程-实验报告 #### 一、实验目的 1. **了解熟悉Linux命令**：在本实验中，参与者需掌握基本的Linux命令操作，为后续Hadoop环境的搭建奠定基础。 2. **学习Hadoop的安装与配置**：包括Hadoop...

docker 运行redis-trib 带密码创建redis cluster集群配置: docker 运行redis-trib 带密码创建redis cluster集群配置，没有密码的请自己去下载一个redis-trib.rb替换

cent7-es6.2.4集群搭建-全新环境-重点: - 分别在两台机器上启动Elasticsearch服务，通过Head插件验证集群是否已成功建立并运行。总结，本文详述了在CentOS 7.3环境下搭建Elasticsearch 6.2.4集群的步骤，包括环境配置、JDK安装、Elasticsearch的部署、...

redis集群打包 rubyinstaller-2.4.10-1-x64+redis-4.0.3.gem+redis-trib.rb.zip: 在 Windows 上，你需要确保 Ruby 和 Redis gem 已正确安装，然后可以运行 `redis-trib.rb` 来执行集群操作。例如，创建一个包含 6 个节点的集群，可以使用以下命令： ``` redis-trib.rb create --replicas 1 ...

Linux运维-运维课程MP4存储专题-d3- ceph集群与owncloud存储实战-04-ceph集群部署4.mp4: Linux运维-运维课程MP4存储专题-d3- ceph集群与owncloud存储实战-04-ceph集群部署

大数据课程-Hadoop集群程序设计与开发-2.Hadoop集群的构建_lk_edit.pptx: 大数据课程——Hadoop集群程序设计与开发，教师版，提供教学大纲、教案、教学设计、实训文档等，课程内容包含教学准备环境、软件安装、作业、教学文档、演示视频，花费巨额时间亲自制作，下载后可私信提供上述所有...

windows-集群配置备忘录: Windows集群配置是一个复杂的过程，主要用于实现高可用性和负载均衡，以确保关键业务系统的稳定运行。在上述集群配置备忘录中，我们主要涉及了以下几个关键知识点： 1. **系统组成**： - 集群由两台服务器（NODE A...

eclipse运行mr插件hadoop-eclipse-plugin-2.6.0.jar: 通过这个插件，开发者可以便捷地在本地开发环境中编写和测试MapReduce程序，然后直接部署到远程Hadoop集群，降低了开发和调试的复杂性。需要注意的是，由于Hadoop的不断升级和优化，不同版本的插件可能与不同版本的...

Linux运维-6.集群-集群视频-1集群概念-02集群分类.mp4: Linux运维-6.集群-集群视频-1集群概念-02集群分类.mp4

Linux运维-6.集群-集群视频-1集群概念-01集群概述.mp4: Linux运维-6.集群-集群视频-1集群概念-01集群概述.mp4

ClusterEngine浪潮集群服务平台使用手册-V4.0(1).pdf: 综上所述，ClusterEngine浪潮集群服务平台提供了全面而强大的集群管理解决方案，使得管理高性能计算集群变得更加容易和高效。它不仅适用于浪潮天梭HPC产品，而且通过其模块化设计和权限控制的特点，可以满足不同规模...

Linux运维-6.集群-集群视频-1集群概念-03集群概念总结.mp4: Linux运维-6.集群-集群视频-1集群概念-03集群概念总结.mp4

Kubernetes集群的基本健康检查-Shell-下载: Shell脚本是一种常用的方法，通过运行特定的命令来检测集群的状态。在这个主题中，我们将深入探讨如何利用Shell脚本来对Kubernetes（K8s）集群进行健康检查，以及"Kubernetes-nagios-master"这个压缩包文件可能包含...

kafka集群部署说明-wubin-200720.doc: 以下是Kafka集群部署的详细步骤，本教程以Kafka 1.1.1版本和Zookeeper 3.6.1版本为例，部署在三台CentOS 8.1系统上的服务器上。 ### 1. 准备工作 #### 1.1. 安装基础组件 - **JDK 1.8**：Kafka运行需要Java环境，...

LTE宽带集群通信(B-TrunC)技术白皮书: 带集群（B-TrunC）产业联盟在宽带集群通信技术上的研究成果。随着全球公共安全、政务、交通、能源等行业的快速发展，行业用户在传统的语音集群基础上，对于宽带无线数据业务、多媒体集群调度的需求极为迫切。 LTE...

Global site tag (gtag.js) - Google Analytics