`
lingyibin
  • 浏览: 196422 次
  • 性别: Icon_minigender_1
  • 来自: 长沙
社区版块
存档分类
最新评论

ubuntu 10.10上hadoop的配置(完整版)

阅读更多

1、先装jdk。
    把jdk-6u23-linux-i586.bin 拷到某个目录下,如:/usr/local/jdk目录下面
    //运行bin,安装jdk(注意,安装时可能会提示权限不够,那是因为还没有执行权限,用chmod u+x,回车)
    ./jdk-6u23-linux-i586.bin
   
    //更改环境变量
    sudo gedit /etc/profile
加入如下内容:
export JAVA_HOME=/usr/local/jdk/jdk1.6.0_23
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:$CLASSPATH

    //更新
    source /etc/profile

    //用java和javac来测试一下是否已经安装配置成功了。

2、装完jdk后,把eclipse解压出来,重启一下电脑就可以运 行里面的eclipse主程序了。

3、可以用ailurus软件来安装 openJDK,这种方式装完之后可以不 配置环境。

4、增加一个hadoop用户组和一个hadoop用户
    sudo addgroup hadoop (增加一个新用户组)
    sudo adduser --ingroup hadoop hadoop (增加一个新用户到hadoop用户组中)
    su (切换到root用户)
    ls -l /etc/sudoers (这一步如果出问题的话,可以用如下的方法解决:
Ctrl+alt+F1进入到全命令窗口,用root用户登陆(如果登陆不了,可以用sudo passwd root这命令来为root用户添加/修改 登陆密码),运行chown 0440 /etc/sudoers,然后再按Ctrl+alt+F7返回)

5、chmod u+w /etc/sudoers
修改sudoers的权限,增加读权限
    ls -l /etc/sudoers(查看suoders的权限)
    gedit /etc/sudoers
在 root ALL=(ALL) ALL 后面添加:hadoop ALL=(ALL) ALL
    恢复sudoers的权限chmod u-w /etc/sudoers
    exit(退出root)

6、安装 openssh-server:
    sudo apt-get install openssh-server

   
7、建立 SSH KEY:
    su hadoop
    ssh-keygen -t rsa -P ""

8、启用 SSH KEY:
    cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys

9、更新一下:
    sudo /etc/init.d/ssh reload
    (这里面如果出问题的话,切换到root用户,然后在terminate里面用su hadoop进入hadoop用户再执行这条语句)

10、验 证 SSH 的配置:
    ssh localhost(结果大致如下:)
The authenticity of host 'localhost (::1)' can't be established.
RSA key fingerprint is 52:9b:e2:62:93:01:88:e6:46:a8:16:68:52:91:8a:ea.
Are you sure you want to continue connecting (yes/no)? yes
Warning: Permanently added 'localhost' (RSA) to the list of known hosts.
……

11、安装配置 hadoop
    解压hadoop包,放到某个目录下,如usr/local/hadoop里面(就是说可以用/usr/local/hadoop/bin来访问里面的bin目录),把他的权限赋给hadoop用户。sudo chown -R hadoop:hadoop hadoop
    sudo gedit /usr/local/hadoop/conf/hadoop-env.sh
如果打不开,那么直接到/usr/local/hadoop/conf/目录下去找。打开后,在里面添加JAVA_HOME环境变量,如下:
    export JAVA_HOME=/usr/local/jdk/jdk1.6.0_23

12、sudo gedit conf/core-site.xml(同样的,打不开也可以到相应的目录下去找)
    在<configuration></configuration>里面添加下面的语句:
    <property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/hadoop/tmp</value>
    </property>

13、sudo gedit conf/mapred-site.xml(同样的,打不开也可以到相应的目录下去找)
    在<configuration></configuration>里面添加下面的语句:
    <property>
        <name>mapred.job.tracker</name>
        <value>localhost:9001</value>
    </property>

14、格式化 namenode
    bin/hadoop namenode -format
(这边如果出问题的话,一般有下面几种情况:
(1)请进入到你安装hadoop的目录下:cd /usr/local/hadoop
(2)切换一下其它用户再试试。)

15、启动 命令:
    bin/start-all.sh
    (如果想关掉的话,用bin/stop-all.sh)
(这边出问题的话,可以试着用上面说到的方法试试)

16、验证hadoop是否启动成功了
    jps
    这个命令是用来查看当前的JVM运行了哪几个任务
    如果hadoop安装成功 并且启动成功的话,会出现下面几个任务
    6605 TaskTracker
    6707 Jps
    6447 JobTracker
    6385 SecondaryNameNode
    6109 NameNode

(其实到这里hadoop还没装完,为了下一节的操作,这里还得再配置一下hadoop_home,如下,在/etc/profile文件里面加上下面两句话:

export HADOOP_HOME=/usr/local/hadoop
export PATH=$HADOOP_HOME/bin:$PATH

第一句用来添加$HADOOP_HOME变量,第二句是用来把$HADOOP_HOME变量加到$PATH中去。


17、跑几个例子
    bin/hadoop dfs -mkdir test-in(创建文件夹,其中,bin/hadoop是一个可执行的文件,dfs可能是第一个参数,-mkdir这是第二个参数,这里的命令和 linux下的一些命令相同,有一个不同的是删除文件:-rmr,而linux命令是:rmdir)

    下面,先建两个文件,等会儿用(请先进入到hadoop根目录下):
    echo "hello hadoop,this is lingyibin"> testFile1.txt(创建了一个文件,并往里面写入了一些测试数据)
    echo "this is the world of lingyibin.wellcome hadoop." > testFile2.txt
   
    然后把这两个文件拷到test-in里面(其实可以直接把这两个测试文件建在test-in里面,这里只是为了让大家熟悉-copyFromLocal这个参数)
    bin/hadoop dfs -copyFromLocal /testFile1.txt test-in
    bin/hadoop dfs -copyFromLocal /testFile2.txt test-in
export HADOOP_HOME=/usr/local/hadoop
export PATH=$HADOOP_HOME/bin:$PATH
    用下面这个命令查看一下是否已经拷进入了。
    bin/hadoop dfs -ls test-in
   
    查看测试文件里面的内容
    bin/hadoop dfs -cat test-in/test_file1.txt
    bin/hadoop dfs -cat test-in/test_file*.txt

    创建一个文件夹
    bin/hadoop dfs -mkdir test-in2
    查看一下是否在
    bin/hadoop dfs -ls
    把它删除
    bin/hadoop dfs -rmr test-in2
    查看一下是否真删除了
    bin/hadoop dfs -ls
(上面这段命令只是为了让大家熟悉创建文件夹和删除文件夹的操作)

18、运行hadoop里面自带的例子,wordcount
    bin/hadoop jar hadoop-mapred-examples-0.21.0.jar wordcount test-in test-out(计算)
    bin/hadoop dfs -cat test-out/part*(查看结果)
这时会看到它把刚刚创建的两个文件里面单词出现的频率给统计出来了。

    运行第二个例子 grep,就是根据一个正则表达式来查找多个文件里面符合特定条件的一个字符串。
    bin/hadoop dfs -copyFromLocal conf/*.xml input(先拷)
    bin/hadoop jar hadoop-*-examples*.jar grep input output 'dfs[a-z.]+'
    bin/hadoop dfs -cat output/part*(查看结果)

    上面的操作有什么用呢?大家可能都能看懂上面的命令,但为什么要这么做,可能就有点迷茫了。
    其实hadoop操作的文件和文件夹是看不见的,就是说,你在本地任何目录里面都看不到用bin/hadoop dfs命令创建的文件或文件夹,那些都在云端(其实本次测试中确实只在本地,只是hadoop用自己的方式把它隐藏了),之后连接多台电脑时,就是一个真 正的小云朵了。这时的文件就真在云端了。
    我们可以用下面的操作把云端的文件取回本地:
    bin/hadoop dfs -get output output
    查看一下:
    cat output/par*
    结果和刚才的结果是一样的。

19、联机操作
    先配置一下:
    sudo gedit /etc/hosts
    在里面添加几行数据
    192.168.1.133 master(保证一个主机名对应一个 IP,这里192.168.1.133是本机地址,根据实际情况来改,下面的ip地址也是根据实际情况来定的。)
    192.168.1.144 slave1
    192.168.1.22 slave2
    192.168.1.158 slave3
    这之后就可以用master来代表本地主机了。slave1,slave2,slave3来代表其它结点

    可以先用本机直接连接其它装了ssh的机子:
    ssh hadoop@slave1
    然后再输入slave1的hadoop用户的密码就可以了
    这时终端会切换到slave1的hadoop用户,这时可以用命令行为所欲为了。
    比如:ls列出根目录里面的文件,进入桌面:cd 桌面,mkdir lingyibin。这时slave1的hadoop用户就会在桌面上创建一个lingyibin的文件夹了。rmdir lingyibin,这时就会把它删除了。

    接着,如果不想用密码登陆到slave 怎么办?用里面的rsa密钥。
    未完,待续。。。

0
0
分享到:
评论

相关推荐

    Ubuntu10.10下tftp服务器配置笔记

    Ubuntu 10.10 下 TFTP 服务器配置笔记 本文档介绍了在 Ubuntu 10.10 操作系统下如何配置 TFTP 服务器,从虚拟机网络配置到 TFTP 服务器的搭建,旨在帮助读者快速搭建 TFTP 服务器。 一、虚拟机网络配置 在 Ubuntu...

    ubuntu10.10安装配置全过程图文详解

    ### Ubuntu 10.10 安装与配置全过程详解 #### 一、准备工作与下载 ...Ubuntu 10.10 不仅在视觉上进行了革新,也在实用性和用户友好度方面有了显著提升,使其成为当时非常受欢迎的 Linux 发行版之一。

    ubuntu 10.10网络配置10步曲

    ubuntu 10.10网络配置10步曲

    Ubuntu 10.10安装配置tftp服务.doc

    TFTP服务在Ubuntu 10.10上的配置并不复杂,但需关注细节,尤其是共享目录的权限设置和服务的启动配置。通过遵循上述步骤,可以有效建立和维护TFTP服务,满足文件传输的基本需求。同时,遇到问题时,应当细致排查,...

    ubuntu-10.10镜像文件下载链接

    Ubuntu 10.10,代号Maverick Meerkat,是Ubuntu发行版的一个版本,于2010年10月10日发布。该版本在桌面环境方面进行了多项改进,并引入了新的功能,以提高用户的使用体验。Ubuntu 10.10基于Linux内核2.6.35,提供了...

    新手XP下硬盘安装ubuntu10.10图文教程

    Ubuntu 10.10在2010年10月正式发布,让众多Ubuntu用户都对这款全新的系统充满期望。毕竟,Ubuntu 10.10是Canonical公司推出的最为...而在Ubuntu 10.10系统中,Light主题得到继续采用,同时在细节上的改善使其更新美观。

    用Ubuntu10.10 dvd版本作为本地源,Ubuntu 10.10 DVD ISO挂载的方式来更新软件

    通过上述步骤,我们不仅学习了如何将Ubuntu 10.10 DVD ISO文件挂载为本地软件源,还了解了如何配置系统使其能够使用这些本地源来进行软件更新。这种方法非常适合那些网络条件较差的环境,能够有效地减少对互联网的...

    Ubuntu10.10安装指南

    - **启动Live CD**:将Ubuntu 10.10的Live CD插入计算机,重启并从光驱启动,这将引导你进入一个完整的Ubuntu桌面环境,无需进行任何安装。 - **体验模式**:在此阶段,你可以探索Ubuntu的桌面环境、应用软件和功能...

    Ubuntu10.10

    ### Ubuntu 10.10 在 Windows XP 下的安装指南及关键知识点 #### 安装环境与准备 ...以上步骤和知识点详细介绍了如何在 Windows XP 下安装 Ubuntu 10.10,以及过程中需要注意的关键技术和配置细节。

    在U盘中安装Ubuntu 10.10的方法

    要在U盘上安装Ubuntu 10.10,首先需要满足一定的硬件条件: 1. **U盘容量**:至少需要4GB以上的U盘,以确保能够容纳Ubuntu系统的最小安装需求以及必要的交换分区(Swap)。根据实际经验,推荐使用8GB或16GB的U盘,...

    Ubuntu10.10网卡配置文件重启失效.docx

    Ubuntu10.10网卡配置文件重启失效 Ubuntu10.10网卡配置文件重启失效是一个常见的问题,在Ubuntu10.10系统中,网卡配置文件的重启失效是由于/etc/network/interfaces文件的自动生成机制所致。这个文件头部有明确的...

    Ubuntu10.10下嵌入式开发环境的配置.doc

    ### Ubuntu10.10下嵌入式开发环境配置详解 #### 一、网络配置 在进行嵌入式开发之前,首先要确保Ubuntu系统的网络连接正常。对于使用锐捷网络接入方式的用户,可以通过安装`mentohust`软件来实现网络连接。 **...

    Ubuntu 10.10的安装图解过程

    综上所述,Ubuntu 10.10在安装流程、界面设计以及字体优化等方面进行了大量的改进,这些改进不仅提升了用户体验,也让Ubuntu更加贴近主流操作系统的设计理念。无论是对于新手还是老用户来说,Ubuntu 10.10都是一款...

    U盘安装ubuntu10.10图文教程

    U盘安装ubuntu10.10图文教程

    Ubuntu10.10下kgdb环境搭建

    通过以上步骤,我们可以在Ubuntu 10.10环境下成功搭建一个完整的KGDB调试环境。KGDB不仅简化了内核级别的调试工作,而且提高了开发效率。特别是对于那些初次接触内核开发的开发者来说,KGDB提供了一个非常友好的调试...

    Ubuntu10.10Tomcat、MySQL的配置.pdf

    本资源主要介绍了在 Ubuntu 10.10 操作系统上安装和配置 Tomcat 和 MySQL 的步骤,以及相关的知识点。 Java JDK 安装 Java JDK 是 Tomcat 和 MySQL 的依赖项之一,因此需要首先安装 Java JDK。在 Ubuntu 10.10 上...

    ubuntu10.10华为E261的3G上网卡上的移植文档

    【标题解析】 "ubuntu10.10华为E261的3G上网卡上的移植文档" 这个标题表明我们关注的是一个技术性的文档,主要涉及的是将华为E261 3G...对于那些希望在旧版Ubuntu上利用3G网络的用户来说,这是一个非常有价值的资源。

    g++4.4 for ubuntu10.10 64bit

    在Ubuntu 10.10(Maverick Meerkat)这个发行版中,g++4.4是默认的C++编译器,为开发者提供了稳定的开发环境。 与g++密切相关的另一个关键组件是libc,它是Linux系统的基础库,提供C语言的标准库函数。在描述中提到...

    Ubuntu10.10操作手册

    《Ubuntu 10.10 操作手册》 在深入探讨Ubuntu 10.10这一版本的操作系统...随着对系统的深入理解和实践,用户可以掌握更多高级技巧,如系统定制、软件包管理、网络配置、系统安全等,从而充分发挥Ubuntu 10.10的潜力。

Global site tag (gtag.js) - Google Analytics