`

spark-学习笔记--4 hadoop-2.4.1集群安装

 
阅读更多

spark-学习笔记--4   hadoop-2.4.1集群安装

 

vi core-site.xml

 

<property>

      <name>fs.default.name</name>

     <value>hdfs://master:9000</value>

</property>

 

 

 

 

 

 

 vi hdfs-site.xml

 

 

<property>

      <name>dfs.name.dir</name>

      <value>/usr/local/hadoop-2.4.1/data/namenode</value>

</property>

<property>

      <name>dfs.data.dir</name>

      <value>/usr/local/hadoop-2.4.1/data/datanode</value>

</property>

<property>

      <name>dfs.tmp.dir</name>

      <value>/usr/local/hadoop-2.4.1/data/tmp</value>

</property>

<property>

      <name>dfs.replication</name>

      <value>3</value>

</property>

 

 

<property>

  <name>dfs.http.address</name>

  <value>0.0.0.0:50070</value>

</property>

 

 

 

 

 

vi mapred-site.xml

 

<property>

      <name>mapreduce.framework.name</name>

      <value>yarn</value>

</property>

 

 

 

 

 vi  yarn-site.xml

 

<property>

      <name>yarn.resourcemanager.hostname</name>

      <value>master</value>

</property>

<property>

      <name>yarn.nodemanager.aux-services</name>

      <value>mapreduce_shuffle</value>

</property>

 

 

 配置 slaves

 

格式化 namenode

 

hdfs namenode -format 

 

启动hdfs

 

访问hdfs控制台

http://192.168.250.120:50070

 

 

 

 

启动yarn 集群

 

 

 start-yarn.sh   

 

 访问控制台

 http://192.168.250.120:8088

 

 

分享到:
评论

相关推荐

    spark-2.4.1-bin-hadoop2.7.tgz

    官网下载太慢了,保存自用。

    spark-3.1.3-bin-without-hadoop.tgz

    4. 启动Spark:可以启动单机模式,或者通过配置slaves文件启动集群模式。 在大数据处理中,Spark的主要优势在于其内存计算能力,相比于Hadoop MapReduce的磁盘I/O,Spark可以显著提升数据处理速度。Spark SQL提供了...

    spark-3.1.2.tgz & spark-3.1.2-bin-hadoop2.7.tgz.rar

    - spark-3.1.2-bin-hadoop2.7.tgz:这个版本除了包含基本的Spark组件外,还集成了Hadoop 2.7的二进制依赖,方便在Hadoop集群上直接部署和运行Spark应用。 5. 安装与运行: - 解压:使用tar命令解压tgz文件,rar...

    hadoop-2.4.1版本大数据

    3. **配置Hadoop**:修改`etc/hadoop`目录下的配置文件,如`hadoop-env.sh`、`core-site.xml`、`hdfs-site.xml`和`mapred-site.xml`,设置Hadoop的相关参数,如HDFS的命名节点、数据节点路径等。 4. **格式化...

    spark-2.1.0-bin-without-hadoop版本的压缩包,直接下载到本地解压后即可使用

    在Ubuntu里安装spark,spark-2.1.0-bin-without-hadoop该版本直接下载到本地后解压即可使用。 Apache Spark 是一种用于大数据工作负载的分布式开源处理系统。它使用内存中缓存和优化的查询执行方式,可针对任何规模...

    hadoop2.4.1

    根据提供的标题、描述、标签及部分内容,我们可以提炼出与Hadoop 2.4.1集群搭建及Hadoop HA相关的详细知识点。以下是对这些知识点的详细阐述: ### Hadoop 2.4.1 集群搭建与Hadoop HA #### 一、Hadoop 2.4.1 版本...

    spark-3.4.1-bin-hadoop3.tgz - Spark 3.4.1 安装包(内置了Hadoop 3)

    文件名: spark-3.4.1-bin-hadoop3.tgz 这是 Apache Spark 3.4.1 版本的二进制...Spark 是一种快速、通用的集群计算系统,用于大规模数据处理。这个文件包含了所有必要的组件,可以直接下载并在 Hadoop 3 环境中使用。

    spark-1.6.0-bin-hadoop2.6.tgz

    总结,Spark-1.6.0-bin-hadoop2.6.tgz是一个完整的Spark发行版,适用于在Linux环境下搭建Spark集群,涵盖多个核心组件,支持多种数据处理场景。通过熟练掌握Spark的安装、配置和使用,可以充分利用其强大功能处理大...

    spark-3.2.4-bin-hadoop3.2-scala2.13 安装包

    为了与Hadoop集群对接,还需要配置Spark的`spark-env.sh`文件,设置Hadoop的相关路径。 5. **运行Spark**: Spark可以通过命令行工具启动,例如`spark-shell`(交互式Spark会话)或`pyspark`(Python版本的交互式...

    spark-3.0.0-bin-without-hadoop.tgz

    不包含Hadoop的Spark发行版意味着用户需要自行配置Hadoop的相关依赖,如HDFS客户端、YARN客户端等,以便Spark能与已有的Hadoop集群交互。这对于那些已经拥有成熟Hadoop环境的组织来说是一个灵活的选择,因为它避免了...

    spark--bin-hadoop3-without-hive.tgz

    在安装和配置Spark--bin-hadoop3-without-hive时,你需要确保你的环境已经正确安装了Hadoop 3.1.3,并且配置了相应的Hadoop路径。这通常涉及设置`HADOOP_CONF_DIR`环境变量,指向Hadoop配置目录。同时,由于此版本不...

    spark-3.1.2-bin-hadoop3.2.tgz

    在Linux环境下安装Spark 3.1.2涉及以下步骤: 1. 解压下载的`spark-3.1.2-bin-hadoop3.2.tgz`文件。 2. 配置环境变量,如`SPARK_HOME`和`PATH`,以便系统能够找到Spark二进制路径。 3. 可选配置,如修改`spark/conf/...

    hadoop-2.4.1-src

    这个压缩包“hadoop-2.4.1-src”包含了Hadoop 2.4.1版本的源代码,对于开发者来说,它是深入理解Hadoop内部机制、进行定制化开发或者对Hadoop进行编译的重要资源。 Hadoop的核心组件包括两个主要部分:HDFS(Hadoop...

    spark-3.0.0-bin-hadoop2.7.tgz

    总的来说,Spark-3.0.0-bin-hadoop2.7.tgz是一个全面的大数据处理解决方案,涵盖了从实时流处理到机器学习的各种需求,尤其适合那些已经部署了Hadoop 2.7环境的组织使用。无论是开发人员还是数据分析师,都能从中...

    spark-3.2.0-bin-hadoop3.2.tgz

    4. **Kubernetes集成**:Spark 3.2.0增强了对Kubernetes的原生支持,可以更方便地在Kubernetes集群上部署和运行Spark作业。 5. **新功能**:引入了新的DataFrame API,如`explode`函数的改进,以及支持时间旅行...

    spark-3.2.1-bin-hadoop2.7.tgz

    总结一下,"spark-3.2.1-bin-hadoop2.7.tgz"是一个专为Linux设计的Spark版本,与Hadoop 2.7兼容,提供了高效的大数据处理能力,涵盖了核心计算、SQL查询、流处理、机器学习和图计算等多个方面。在实际应用中,开发者...

    spark-2.0.0-bin-hadoop2.6.tgz

    本资源是spark-2.0.0-bin-hadoop2.6.tgz百度网盘资源下载,本资源是spark-2.0.0-bin-hadoop2.6.tgz百度网盘资源下载

    spark-3.1.3-bin-hadoop3.2.tgz

    在解压并安装"spark-3.1.3-bin-hadoop3.2.tgz"后,你需要配置环境变量,如SPARK_HOME,然后可以通过启动Master和Worker节点来建立Spark集群。对于单机测试,可以使用本地模式。使用Spark时,你可以编写Python、Scala...

    spark-assembly-1.5.2-hadoop2.6.0.jar

    《Spark编程核心组件:spark-assembly-1.5.2-hadoop2.6.0.jar详解》 在大数据处理领域,Spark以其高效、易用和灵活性脱颖而出,成为了许多开发者的首选框架。Spark-assembly-1.5.2-hadoop2.6.0.jar是Spark中的一个...

    spark-2.4.8-bin-hadoop2.7.tgz

    安装和配置Spark 2.4.8时,你需要根据你的环境调整配置文件,如`spark-env.sh`或`spark-defaults.conf`,以适应你的Hadoop集群或本地环境。在使用Spark时,你可以通过`spark-submit`命令提交应用程序,或者直接在...

Global site tag (gtag.js) - Google Analytics