最近虚拟机老出bug,又鉴于日后处理大数据时必定会用到集群,所以我缠着我们组现在已经研究到Scala的大神,不时软磨硬泡,总算在今天下午独自成功跑完一个mapreduce小程序。秉着珂姨“好记性不如烂博客”的原则,决定将其记录在案。
(1)首先要新建一个目录,我起名为test,
hadoop fs -mkdir /test;
(2)手动将存储着实验数据的txt文件放入虚拟机的文件系统中,我放在/usr/local目录下,然后将其上传至HDFS,
hadoop fs -put /usr/local/MR.txt /test。
查看test是否上传成功,可用hadoop fs -ls /test;
(3)将导出的jar文件同样复制到虚拟机的文件系统中;
(4)接着就可以执行程序了,指令形式:
hadoop jar 你的jar包的位置 jar包 主类名 /test/test.txt 输出目录。
在这之前,你可以先进入存放jar文件的目录,就可以直接hadoop jar jar包 主类名 /test(/MR.txt) 输出目录;
Problem: 到这里我遇到了一个问题,
请教了大神,知道问题出在jdk,解决方案:点击所需项目—>点击工具栏Project中的Properties—>选中左边栏的Java compiler,如图
(5)改完后,运行,此处截取最后片段,查看是否成功,
hadoop fs -ls /output_JWT,若自动生成一个SUCCESS文件则说明执行成功
;
(6)跑程序的目的自然是查看结果,指令如下:
hadoop fs -cat /output_JWT/(系统自动生成的文件)
到这里,我的第一个集群上的MR程序就跑完了,因为实现的功能非常简单,只是统计第一列日志的各个内容出现次数,因此这里就不另附上源码了。
Welcome criticism!~
相关推荐
3. **连接集群**:通过Spring的自动装配,应用程序可以获取到`JedisCluster`实例,进行增删改查等操作。 4. **操作示例**:如`set`、`get`、`keys`、`lpush`等,都是通过`JedisCluster`实例调用相应方法完成。 5. **...
集群及LVS简介、LVS-NAT集群、LVS-DR集群 本文档主要讲解了Linux虚拟服务器(LVS)的基本概念和实现方法,涵盖了LVS的集群模式、LVS-NAT集群、LVS-DR集群等内容。同时,文档还提供了一些实际的案例,包括使用...
3. **启动集群**:在各节点上启动配置好的Redis服务器,确保所有节点正常运行。 4. **创建集群**:使用`redis-cli`命令创建集群,这一步需要在集群中的一个节点上执行,将其他所有节点添加到集群中。在Redis 5.0...
查询所有Redis集群配置信息-data-2021-05-06 11_08_34.zip
### Hadoop搭建及MR编程-实验报告 #### 一、实验目的 1. **了解熟悉Linux命令**:在本实验中,参与者需掌握基本的Linux命令操作,为后续Hadoop环境的搭建奠定基础。 2. **学习Hadoop的安装与配置**:包括Hadoop...
- 分别在两台机器上启动Elasticsearch服务,通过Head插件验证集群是否已成功建立并运行。 总结,本文详述了在CentOS 7.3环境下搭建Elasticsearch 6.2.4集群的步骤,包括环境配置、JDK安装、Elasticsearch的部署、...
docker 运行redis-trib 带密码创建redis cluster集群配置,没有密码的请自己去下载一个redis-trib.rb替换
在 Windows 上,你需要确保 Ruby 和 Redis gem 已正确安装,然后可以运行 `redis-trib.rb` 来执行集群操作。例如,创建一个包含 6 个节点的集群,可以使用以下命令: ``` redis-trib.rb create --replicas 1 ...
Linux运维-运维课程MP4存储专题-d3- ceph集群与owncloud存储实战-04-ceph集群部署
大数据课程——Hadoop集群程序设计与开发,教师版,提供教学大纲、教案、教学设计、实训文档等,课程内容包含教学准备环境、软件安装、作业、教学文档、演示视频,花费巨额时间亲自制作,下载后可私信提供上述所有...
通过这个插件,开发者可以便捷地在本地开发环境中编写和测试MapReduce程序,然后直接部署到远程Hadoop集群,降低了开发和调试的复杂性。需要注意的是,由于Hadoop的不断升级和优化,不同版本的插件可能与不同版本的...
Linux运维-6.集群-集群视频-1集群概念-02集群分类.mp4
Linux运维-6.集群-集群视频-1集群概念-01集群概述.mp4
综上所述,ClusterEngine浪潮集群服务平台提供了全面而强大的集群管理解决方案,使得管理高性能计算集群变得更加容易和高效。它不仅适用于浪潮天梭HPC产品,而且通过其模块化设计和权限控制的特点,可以满足不同规模...
Linux运维-6.集群-集群视频-1集群概念-03集群概念总结.mp4
Shell脚本是一种常用的方法,通过运行特定的命令来检测集群的状态。在这个主题中,我们将深入探讨如何利用Shell脚本来对Kubernetes(K8s)集群进行健康检查,以及"Kubernetes-nagios-master"这个压缩包文件可能包含...
以下是Kafka集群部署的详细步骤,本教程以Kafka 1.1.1版本和Zookeeper 3.6.1版本为例,部署在三台CentOS 8.1系统上的服务器上。 ### 1. 准备工作 #### 1.1. 安装基础组件 - **JDK 1.8**:Kafka运行需要Java环境,...
clickhouse集群部署说明-ck集群,clickhouse 集群部署以及建表语句,分布式
使用 qsub_submit_cm,可以将 MATLAB 计算提交到集群中。 输入在共享网络驱动器上传递,输出也在那里收集。 可选地,一旦计算完成,可以在提交主机上执行回调。 在...