`
447214075
  • 浏览: 78610 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

hadoop初步使用

 
阅读更多
hadoop在部署的过错中出现的错误。

1.本人使用ubuntu 13.10 在安装ssh时报错,安装方式sudo apt-get install ssh,错误说是找不到安装包,网上找到了解决方案,在网上找一个最新的ubuntu源问题。粘帖到/etc/apt/sources.list文件中。
2.启动hadoop后jps指令无效,提示让安装open-jdk,可我已经安装来jdk了,而且我进入jdk目录,使用jps指令能够使用。这时应该就是classpath配置有问题,打开/etc/profile发现JAVA_HOME在 export PATH后,调换一下顺序,保存,然后./source /etc/profile,这时jps指令在任何地方都能使用了。
当重启系统后,直接使用jps还是提示安装open-jdk,此时使用source命令,jps指令就能够使用了(此问题未解决,哪位好心的大神指点一下)
3.jps后发现没有namenode进程。原因是没有进行hadoop namenode -format ,重新执行就ok了
4.在调用hadoop的put指令将本地文件上传到hdfs时,put指令无效,只是将目录创建出来了,并没有将文件上传上去。例如:bin/hadoop dfs -put test.txt /input
使用bin/hadoop dfs -ls /input 时发现并没有将test.txt文件上传上去,而且没有任何错误提示。此时应该先在hdfs上将文件夹创建出来,bin/hadoop dfs -mkdir /input 然后在将文件上传到hdfs的input目录中。假如文件夹名称前没有带/ 则默认在/user/hadoop/input中。
5.运行测试程序wordcount时map为100%,但reduce始终0%,等了好大会报错误。解决方法时在/etc/hosts第一行添加127.0.0.1 计算机名(我的是masternode)。
分享到:
评论

相关推荐

    Hadoop初步了解和在单机环境下的配置

    【Hadoop初步了解和在单机环境下的配置】 Hadoop是一个开源的分布式并行编程框架,它基于MapReduce计算模型,使得程序员能够方便地编写处理大量数据的分布式应用。Hadoop还包括一个分布式文件系统——Hadoop ...

    Win10上操作Hadoop的hadoop2.7.4.rar

    在Windows 10环境下搭建...在实际应用中,还需要考虑网络配置、安全设置、资源调度等复杂因素,但以上内容已经足以让你初步了解Hadoop的操作流程。通过不断实践和学习,你将能更好地理解和掌握Hadoop的分布式计算能力。

    hadoop-3.1.4.tar.gz

    5. **支持硬件多样性**:Hadoop 3.1.4增强了对不同硬件类型的支持,包括对冷存储设备和SSD的优化,以及对非传统CPU架构(如GPU和FPGA)的初步支持。 三、Hadoop的安装与配置 1. **环境准备**:确保系统安装了Java...

    Hadoop数据分析_大数据_hadoop_数据分析_

    2. **Hive**:基于Hadoop的数据仓库工具,允许用户使用SQL-like语法查询和管理存储在HDFS中的大数据集,简化了大数据分析。 3. **Pig**:一种高级数据流语言和执行框架,用于构建大规模数据处理的管道。 4. **...

    hadoop1.0.2 hbase0.94安装

    6. **测试Hadoop**:可以使用`hadoop fs -put`命令上传文件到HDFS,然后使用`hadoop fs -ls`命令检查文件是否成功上传。 接下来是编译Hadoop-Eclipse插件的部分。这个插件允许开发者在Eclipse环境中直接编写和调试...

    hadoop简介Word版

    hadoop简介,可以初步认识hadoop

    hadoop经典系列(十一)性能分析实验初步

    在本篇“Hadoop经典系列(十一)性能分析实验初步”中,我们将深入探讨Hadoop分布式计算框架的性能分析,这是大数据处理的关键环节。通过理解Hadoop的工作原理和优化策略,我们可以有效地提升集群效率,降低任务执行...

    hadoop基础知识扫盲

    大数据hadoop基础知识扫盲,初步了解什么是hadoop

    hadoop2_7_4的bin文.zip

    在Hadoop环境中,它可能提供了关于如何配置和运行Hadoop的初步指导。 5. **Hadoop的启动与配置**:在部署Hadoop时,用户需要根据自己的环境修改配置文件,如`core-site.xml`(核心配置)、`hdfs-site.xml`(HDFS...

    Hadoop大数据管理实验详细参考文档

    "大数据管理实验之三Hadoop基础命令与编程初步.docx"则深入到Hadoop的使用层面,包括HDFS的基本命令,如上传、下载、查看文件等,以及编写MapReduce程序的初步概念,如Mapper和Reducer的工作原理,以及使用Java API...

    hadoop 编码

    在IT行业中,Hadoop是一个广泛使用的开源框架,主要用于大数据处理和分析。它的核心设计思想是分布式存储和并行计算,使得海量数据的处理变得高效、可靠且可扩展。本篇文章将深入探讨Hadoop编码的相关知识,包括其...

    Hadoop学习总结和源码分析

    通过监控Hadoop集群的性能指标,如CPU利用率、内存使用情况、磁盘I/O等,可以优化系统配置,提升处理效率。日志记录则帮助开发者追踪错误,了解程序执行的详细过程。 最后,“Hadoop源代码分析(完整版).doc”是深入...

    大数据实验报告Hadoop编程实现wordcount单词统计程序附源码.doc

    本实验报告旨在介绍使用 Hadoop 编程实现 wordcount 单词统计程序的步骤和代码实现。实验的目的在于熟悉 Hadoop 虚拟机的安装与环境的配置,初步理解 MapReduce 方法,熟悉相关语法,基本掌握编程框架。 实验环境:...

    Java写的hadoop压缩worldcount例子

    此外,为了使程序能正确运行,还需要正确配置Hadoop的环境变量,包括HADOOP_HOME、HADOOP_CONF_DIR等,确保Hadoop命令可以正常使用。同时,程序可能需要引入Hadoop的相关库,这可以通过Maven或Gradle等构建工具管理...

    Hadoop 0.20.1 配置手册-高清pdf文字版

    7. **集群监控与日志管理**:了解如何配置和使用Hadoop自带的监控工具,如Nagios、Ganglia,以及日志聚合工具Flume和Scribe,以便于监控集群状态和调试问题。 8. **故障排查**:提供常见问题及解决方案,帮助用户...

    Hadoop统计单词出现次数.rar

    在IT行业中,Hadoop是一个广泛使用的开源框架,主要用于大数据处理和分析。这个压缩包"**Hadoop统计单词出现次数.rar**"显然包含了实现一个基本Hadoop MapReduce程序的源代码,用于统计文本中的单词出现次数。这个...

    hadoop学习笔记(一)

    总的来说,这篇学习笔记的初步内容涉及到Hadoop中的基础概念,如Sqoop、MapReduce,以及如何使用MapReduce实现SQL操作。随着学习的深入,作者计划研究PIG和Hive的源码,理解它们如何构建和执行MapReduce作业,同时...

    Hadoop知识点笔记

    * Mapper:负责将输入数据切分成小块,并进行初步处理。 * Reducer:负责将Mapper的输出结果进行汇总和处理。 4. Hadoop集群配置 Hadoop集群配置主要包括HDFS、YARN和MapReduce三个方面: * HDFS配置:包括配置...

    Hadoop-1.2.1 QQ推荐好友例子

    2. **数据存储**:使用HDFS(Hadoop分布式文件系统)存储这些数据。 3. **数据分区**:根据需求将数据划分到不同的节点,便于分布式处理。 4. **Map阶段**:Mapper函数对数据进行初步处理,比如提取用户间的共同联系...

Global site tag (gtag.js) - Google Analytics