`
haoningabc
  • 浏览: 1482086 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

hadoop复习 1搭建

阅读更多
参考http://hadoop.apache.org/docs/r1.0.4/cn/quickstart.html

环境变量
hadoop-env.sh
export JAVA_HOME=/usr/local/java/jdk1.6.0_45/

修改两个配置文件
[root@centos54 conf]# cat hdfs-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <property>
        <name>fs.default.name</name>
        <value>localhost:9000</value>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>1</value>                                                                                                                                         
    </property>
</configuration>



[root@centos54 conf]# cat mapred-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <property>$
        <name>mapred.job.tracker</name>$
        <value>localhost:9001</value>$
    </property>$
</configuration>

ssh本机互信,略
为了ssh
vim /etc/hosts
::1^I^Ilocalhost6.localdomain localhost


export HADOOP_HOME=/data/hadoop/hadoop-1.2.1
export HADOOP_CONF_DIR=$HADOOP_HOME/conf


初始化hdfs
bin/hadoop namenode -format
bin/start-all.sh

启动后几个进程
root@centos54 bin]# jps
23275 NameNode
23396 DataNode
23543 SecondaryNameNode

23641 JobTracker
23768 TaskTracker

运行wordcount的例子
mkdir haoning
cd haoning
../bin/hadoop fs -put ../conf input  
../bin/hadoop jar ../hadoop-examples-1.2.1.jar grep input output 'dfs[a-z.]+'



[root@centos54 haoning]# tree
.
|-- input
|   |-- capacity-scheduler.xml
|   |-- configuration.xsl
|   |-- core-site.xml
|   |-- fair-scheduler.xml
|   |-- hadoop-env.sh
|   |-- hadoop-metrics2.properties
|   |-- hadoop-policy.xml
|   |-- hdfs-site.xml
|   |-- log4j.properties
|   |-- mapred-queue-acls.xml
|   |-- mapred-site.xml
|   |-- masters
|   |-- slaves
|   |-- ssl-client.xml.example
|   |-- ssl-server.xml.example
|   |-- task-log4j.properties
|   `-- taskcontroller.cfg
`-- output
    |-- _SUCCESS
    `-- part-00000


得到的结果
[root@centos54 haoning]# cat output/*
1       dfs.replication
1       dfs.server.namenode.
1       dfsadmin


验证结果

cd input
[root@centos54 input]# grep dfs *
hadoop-env.sh:# The following applies to multiple commands (fs, dfs, fsck, distcp etc)
hadoop-policy.xml:    dfsadmin and mradmin commands to refresh the security policy in-effect. 
hdfs-site.xml:        <name>dfs.replication</name>
log4j.properties:log4j.logger.org.apache.hadoop.hdfs.server.namenode.FSNamesystem.audit=WARN
[root@centos54 input]# 


NameNode - http://localhost:50070/
JobTracker - http://localhost:50030/
~                
分享到:
评论

相关推荐

    (完整版)hadoop常见笔试题答案.docx

    1. Hadoop的核心组成部分是HDFS(Hadoop Distributed File System),它是一个分布式文件系统,其中datanode是数据的实际存储节点,而namenode则是HDFS的元数据管理器,负责文件系统的命名空间和数据块映射。...

    新版Hadoop视频教程 段海涛老师Hadoop八天完全攻克Hadoop视频教程 Hadoop开发

    10-hadoop集群搭建的无密登陆配置.avi 第二天 hdfs的原理和使用操作、编程 01-NN元数据管理机制.avi 02-NN工作机制2.avi 03-DN工作原理.avi 04-HDFS的JAVA客户端编写.avi 05-filesystem设计思想总结.av i ...

    hadoop段海涛老师八天实战视频

    10-hadoop集群搭建的无密登陆配置.avi 第二天 hdfs的原理和使用操作、编程 01-NN元数据管理机制.avi 02-NN工作机制2.avi 03-DN工作原理.avi 04-HDFS的JAVA客户端编写.avi 05-filesystem设计思想总结.avi ...

    软件工程课程设计报告Hadoop配置

    【软件工程课程设计报告Hadoop配置】主要涵盖了在软件工程课程中使用Hadoop进行课程设计的相关内容,包括环境搭建、Eclipse中的应用测试、遇到的问题与解决方案以及对Hadoop源码的分析。以下是对这些知识点的详细...

    Hadoop2.x版本完全分布式安装与部署

    步骤1:创建hadoop用户。在三台节点机上分别创建一个UID为660的用户hadoop,并设置统一密码h123456。此步骤的目的在于建立一个专用的用户来运行Hadoop服务,以保证系统的安全性和稳定性。 步骤2:设置Master节点机...

    超人学院Hadoop面试葵花宝典

    1. Hadoop环境搭建:Hadoop的搭建涉及到多个步骤,包括创建用户账户、设置IP地址、安装Java环境、配置环境变量等。在搭建Hadoop环境时,需要对Java进行配置,因为Hadoop是用Java编写的,并且需要Java环境来运行。SSH...

    hadoop源代码版本归档

    很抱歉,但根据您提供的信息,标题和描述中提到的是"hadoop源代码版本归档",而压缩包内的文件名称列表却包含了一系列法律考试复习资料,并没有与Hadoop相关的源代码或文档。这表明可能存在一个误解,因为压缩包里的...

    hadoop课件.zip

    第五章至第七章可能会涉及Hadoop的安装与配置,包括单机模式、伪分布式模式和完全分布式模式的搭建,以及相关的环境变量设置和配置文件详解。 第八章至第十章,可能会讲解Hadoop生态系统中的其他组件,如HBase...

    hadoop生态集群上.txt

    对学习的一点记录,主要记录一些关于hadoop生态的部署流程,以及注意事项,供以后复习使用,内容比较粗糙,有很多地方还需要不断改善,欢迎大佬前来批评指正。

    完整版大数据课件集合2-大数据导论-第二章-大数据处理架构Hadoop(共44页).rar

    标题中的“大数据导论-第二章-大数据处理架构Hadoop”揭示了这组课件主要集中在大数据的基础理论以及Hadoop这一关键的大数据处理框架上。...对于有经验的从业者,这也可以作为复习和深化Hadoop知识的参考资料。

    大数据期末复习总结.pdf

    以上就是大数据处理技术课程期末复习总结的内容,通过对Hadoop的各个核心组件的学习,可以更好地理解其在大数据处理中的应用,以及如何搭建和维护Hadoop集群,解决运行过程中的问题。这些知识点对于大数据工程师来说...

    Hadoop生态圈(三驾马车+ZK+Hive+Sqoop+Flume)复习脑图 version-1.0-附件资源

    Hadoop生态圈(三驾马车+ZK+Hive+Sqoop+Flume)复习脑图 version-1.0-附件资源

    电子科技大学 互联网+ 软件技术基础期末复习材料

    复习Android或iOS开发环境的搭建,理解原生开发(Java/Kotlin for Android, Swift/Objective-C for iOS)和跨平台开发(如React Native、Flutter)的区别。 七、云计算与大数据 云计算技术如AWS、Azure、Google ...

    2020大数据考点.pdf

    复习时,不仅要理解和记忆知识点,还要通过实际操作加深理解,比如模拟搭建大数据平台,亲手实践MapReduce编程,以确保理论与实践相结合,提高应试能力。同时,对于老师强调的部分,如可能出填空题、选择题的地方,...

    2017最新大数据架构师精英课程

    67_hadoop的搭建的复习6 h) {. C, f( J( @& F0 G 68_脚本分析的过程" ?' q# U7 B/ ~" W, e- I 69_开启和关闭一个进程 70_hadoop常用的命令和关闭防火墙) Q" A0 B3 M8 s3 ? 71_hadoop存储为何是128M 72_hadoop的存储...

    清华大学精品大数据实战课程(Hadoop、Hbase、Hive、Spark)PPT课件含习题(30页) 第4章 数据仓库工具Hive.pptx

    清华大学出品的大数据实战课程PPT学习课件,非常适合大学生和职场人士学习,也适合老鸟复习回顾,完全可用于自学入门,很经典好用的PPT课件哦~

    厦门大学大数据技术原理与应用配套资源

    7. **实验指南**:实验指南可能包含了一系列实践操作指导,帮助学生通过实际操作来加深对大数据技术的理解,比如Hadoop集群的搭建、数据处理任务的编写和执行等。 8. **答案版试卷**:提供了解答参考,方便学生自我...

    五分钟学大数据_超全大数据面试宝典.pdf

    例如,在Hadoop相关总结中,提到了Hadoop的配置文件、集群搭建、HDFS读写流程、MapReduce的Shuffle过程等。在Kafka相关总结中,介绍了Kafka的架构、压测、主题数量、副本数设定等。 从文档内容来看,这份面试宝典...

    超全大数据面试宝典-大数据面试有这套就够了.pdf

    - **Hadoop相关总结**:讲述Hadoop的端口号、配置文件和集群搭建,HDFS的读写流程,MapReduce的Shuffle过程,Yarn的Job提交流程和调度器,以及Hadoop参数调优和相关项目经验。 - **Zookeeper相关总结**:涵盖...

    分布式编程内容纲要及试验设计

    实验二.ppt:可能是关于部署和运行一个简单的分布式应用,比如搭建一个Hadoop集群并执行MapReduce任务,让学生亲身体验分布式计算的过程。 实验四.ppt:可能涉及到更高级的主题,如分布式数据库的使用,例如通过...

Global site tag (gtag.js) - Google Analytics