spark-学习笔记--4 hadoop-2.4.1集群安装 - 杨中磊的博客 - ITeye博客

`

05rjyzl11

浏览: 149126 次
性别:
来自: 北京

最近访客更多访客>>

breezylee

laopo521anping

wolfwell

gzjhqh

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

isaiah282485068：怎么不出书出来啊，市场上好却这方面的书啊
mule in action翻译1 : 第一部分 mule 核心

spark-学习笔记--4 hadoop-2.4.1集群安装

博客分类：

spark

阅读更多

spark-学习笔记--4 hadoop-2.4.1集群安装

vi core-site.xml

<property>

<name>fs.default.name</name>

<value>hdfs://master:9000</value>

</property>

vi hdfs-site.xml

<property>

<name>dfs.name.dir</name>

<value>/usr/local/hadoop-2.4.1/data/namenode</value>

</property>

<property>

<name>dfs.data.dir</name>

<value>/usr/local/hadoop-2.4.1/data/datanode</value>

</property>

<property>

<name>dfs.tmp.dir</name>

<value>/usr/local/hadoop-2.4.1/data/tmp</value>

</property>

<property>

<name>dfs.replication</name>

<value>3</value>

</property>

<property>

<name>dfs.http.address</name>

<value>0.0.0.0:50070</value>

</property>

vi mapred-site.xml

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

vi yarn-site.xml

<property>

<name>yarn.resourcemanager.hostname</name>

<value>master</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

配置 slaves

格式化 namenode

hdfs namenode -format

启动hdfs

访问hdfs控制台

http://192.168.250.120:50070

启动yarn 集群

start-yarn.sh

访问控制台

http://192.168.250.120:8088

分享到：

spark-学习笔记--5 wordcount scala版 | spark-学习笔记--3 wordcount执行流程

2018-10-25 08:46
浏览 438
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

spark-2.4.1-bin-hadoop2.7.tgz: 官网下载太慢了，保存自用。

spark-3.1.3-bin-without-hadoop.tgz: 4. 启动Spark：可以启动单机模式，或者通过配置slaves文件启动集群模式。在大数据处理中，Spark的主要优势在于其内存计算能力，相比于Hadoop MapReduce的磁盘I/O，Spark可以显著提升数据处理速度。Spark SQL提供了...

spark-3.1.2.tgz & spark-3.1.2-bin-hadoop2.7.tgz.rar: - spark-3.1.2-bin-hadoop2.7.tgz：这个版本除了包含基本的Spark组件外，还集成了Hadoop 2.7的二进制依赖，方便在Hadoop集群上直接部署和运行Spark应用。 5. 安装与运行： - 解压：使用tar命令解压tgz文件，rar...

hadoop-2.4.1版本大数据: 3. **配置Hadoop**：修改`etc/hadoop`目录下的配置文件，如`hadoop-env.sh`、`core-site.xml`、`hdfs-site.xml`和`mapred-site.xml`，设置Hadoop的相关参数，如HDFS的命名节点、数据节点路径等。 4. **格式化...

spark-2.1.0-bin-without-hadoop版本的压缩包，直接下载到本地解压后即可使用: 在Ubuntu里安装spark，spark-2.1.0-bin-without-hadoop该版本直接下载到本地后解压即可使用。 Apache Spark 是一种用于大数据工作负载的分布式开源处理系统。它使用内存中缓存和优化的查询执行方式，可针对任何规模...

spark-2.4.7-bin-without-hadoop: 《Spark 2.4.7 无Hadoop版本详解及应用》 Spark 2.4.7 是 Apache Spark 的一个重要版本，它是一个流行的开源大数据处理框架，被广泛应用于大规模数据处理、机器学习以及实时流处理等领域。这次我们讨论的是"spark-...

spark-1.6.0-bin-hadoop2.6.tgz: 总结，Spark-1.6.0-bin-hadoop2.6.tgz是一个完整的Spark发行版，适用于在Linux环境下搭建Spark集群，涵盖多个核心组件，支持多种数据处理场景。通过熟练掌握Spark的安装、配置和使用，可以充分利用其强大功能处理大...

hadoop2.4.1: 根据提供的标题、描述、标签及部分内容，我们可以提炼出与Hadoop 2.4.1集群搭建及Hadoop HA相关的详细知识点。以下是对这些知识点的详细阐述： ### Hadoop 2.4.1 集群搭建与Hadoop HA #### 一、Hadoop 2.4.1 版本...

spark-3.4.1-bin-hadoop3.tgz - Spark 3.4.1 安装包(内置了Hadoop 3): 文件名: spark-3.4.1-bin-hadoop3.tgz 这是 Apache Spark 3.4.1 版本的二进制...Spark 是一种快速、通用的集群计算系统，用于大规模数据处理。这个文件包含了所有必要的组件，可以直接下载并在 Hadoop 3 环境中使用。

spark--bin-hadoop3-without-hive.tgz: 在安装和配置Spark--bin-hadoop3-without-hive时，你需要确保你的环境已经正确安装了Hadoop 3.1.3，并且配置了相应的Hadoop路径。这通常涉及设置`HADOOP_CONF_DIR`环境变量，指向Hadoop配置目录。同时，由于此版本不...

spark-3.2.4-bin-hadoop3.2-scala2.13 安装包: 为了与Hadoop集群对接，还需要配置Spark的`spark-env.sh`文件，设置Hadoop的相关路径。 5. **运行Spark**: Spark可以通过命令行工具启动，例如`spark-shell`（交互式Spark会话）或`pyspark`（Python版本的交互式...

spark-3.0.0-bin-without-hadoop.tgz: 不包含Hadoop的Spark发行版意味着用户需要自行配置Hadoop的相关依赖，如HDFS客户端、YARN客户端等，以便Spark能与已有的Hadoop集群交互。这对于那些已经拥有成熟Hadoop环境的组织来说是一个灵活的选择，因为它避免了...

spark-2.4.8-bin-hadoop2.7.tgz: 安装和配置Spark 2.4.8时，你需要根据你的环境调整配置文件，如`spark-env.sh`或`spark-defaults.conf`，以适应你的Hadoop集群或本地环境。在使用Spark时，你可以通过`spark-submit`命令提交应用程序，或者直接在...

spark-3.1.2-bin-hadoop3.2.tgz: 在Linux环境下安装Spark 3.1.2涉及以下步骤： 1. 解压下载的`spark-3.1.2-bin-hadoop3.2.tgz`文件。 2. 配置环境变量，如`SPARK_HOME`和`PATH`，以便系统能够找到Spark二进制路径。 3. 可选配置，如修改`spark/conf/...

spark-3.2.0-bin-hadoop3.2.tgz: 4. **Kubernetes集成**：Spark 3.2.0增强了对Kubernetes的原生支持，可以更方便地在Kubernetes集群上部署和运行Spark作业。 5. **新功能**：引入了新的DataFrame API，如`explode`函数的改进，以及支持时间旅行...

spark-assembly-1.5.2-hadoop2.6.0.jar: 《Spark编程核心组件：spark-assembly-1.5.2-hadoop2.6.0.jar详解》在大数据处理领域，Spark以其高效、易用和灵活性脱颖而出，成为了许多开发者的首选框架。Spark-assembly-1.5.2-hadoop2.6.0.jar是Spark中的一个...

hadoop-2.4.1-src: 这个压缩包“hadoop-2.4.1-src”包含了Hadoop 2.4.1版本的源代码，对于开发者来说，它是深入理解Hadoop内部机制、进行定制化开发或者对Hadoop进行编译的重要资源。 Hadoop的核心组件包括两个主要部分：HDFS（Hadoop...

spark-3.0.0-bin-hadoop2.7.tgz: 总的来说，Spark-3.0.0-bin-hadoop2.7.tgz是一个全面的大数据处理解决方案，涵盖了从实时流处理到机器学习的各种需求，尤其适合那些已经部署了Hadoop 2.7环境的组织使用。无论是开发人员还是数据分析师，都能从中...

spark-3.2.1-bin-hadoop2.7.tgz: 总结一下，"spark-3.2.1-bin-hadoop2.7.tgz"是一个专为Linux设计的Spark版本，与Hadoop 2.7兼容，提供了高效的大数据处理能力，涵盖了核心计算、SQL查询、流处理、机器学习和图计算等多个方面。在实际应用中，开发者...

spark-2.0.0-bin-hadoop2.6.tgz: 本资源是spark-2.0.0-bin-hadoop2.6.tgz百度网盘资源下载,本资源是spark-2.0.0-bin-hadoop2.6.tgz百度网盘资源下载

Global site tag (gtag.js) - Google Analytics