`
goon
  • 浏览: 184142 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

hadoop学习3——DistributedCache加载本地库

 
阅读更多

本地库位置:hadoop发行版的lib/native目录下

支持的平台

Hadoop本地库只支持*nix平台,已经广泛使用在GNU/Linux平台上,但是不支持 CygwinMac OS X

已经测试过的GNU/Linux发行版本:

在上述平台上,32/64位Hadoop本地库分别能和32/64位的jvm一起正常运行。

使用DistributedCache 加载本地库

用户可以通过 DistributedCache 加载本地共享库,并分发和建立库文件的符号链接

这个例子描述了如何分发库文件并在从map/reduce任务中装载库文件。

  1. 首先拷贝库文件到HDFS。
    bin/hadoop fs -copyFromLocal mylib.so.1 /libraries/mylib.so.1
  2. 启动作业时包含以下代码:
    DistributedCache.createSymlink(conf);
    DistributedCache.addCacheFile("hdfs://host:port/libraries/mylib.so.1#mylib.so", conf);
  3. map/reduce任务中包含以下代码:
    System.loadLibrary("mylib.so");

这些都是开发文档上的片段,具体还没亲自测试,先记一下,以备后续深入学习

分享到:
评论

相关推荐

    Hadoop高级编程——构建与实现大数据解决方案.rar

    本压缩包“Hadoop高级编程——构建与实现大数据解决方案”将深入探讨如何利用Hadoop进行高效的数据操作,构建实际的大数据解决方案。 一、Hadoop概述 Hadoop是由Apache基金会开发的开源项目,主要由Hadoop ...

    Hadoop-2.7.0的64位本地库

    hadoop的64位本地库,自己编译本地库比较麻烦,于是共享出来.

    Hadoop高级编程- 构建与实现大数据解决方案

    8. **性能优化**:学习如何通过调整各种参数,如Split大小、Mapper和Reducer的数量,以及数据本地性等,来提升Hadoop应用的性能。 9. **Hadoop集群的部署和管理**:掌握在单机、伪分布式和完全分布式模式下安装和...

    hadoop-2.9.2的64位本地库

    在Hadoop 2.9.2版本中,为了在64位操作系统上顺畅运行,我们需要64位的本地库,因为Apache官方默认提供的版本是32位的。32位的本地库在64位系统环境下可能会导致兼容性问题,例如性能下降、错误或无法启动等问题。 ...

    hadoop配置文件——精简版.zip

    此压缩包主要包含的是是hadoop的7个主要的配置文件,core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml、hadoop-env.sh、mapred-env.sh、yarn-env.sh精简配置优化性能,具体相关参数根据集群规模适当...

    hadoop2.4.0 本地库

    4. **配置Hadoop**:在Hadoop的配置文件(如hadoop-env.sh或core-site.xml)中指定本地库的位置,以便Hadoop在启动时加载。 5. **测试验证**:安装完成后,通过执行Hadoop的相关命令,如`hadoop version`,验证本地...

    Hadoop快速入门——第四章、zookeeper安装包

    在分布式计算领域,Apache Hadoop 和 Apache ZooKeeper 是两个至关重要的组件。本章节将深入探讨Zookeeper在Hadoop生态系统中的作用以及如何进行安装。Zookeeper是一个开源的分布式协调服务,它为分布式应用提供了高...

    hadoop 64位 本地库

    - 验证配置是否正确,可以通过运行Hadoop命令或测试程序检查本地库是否成功加载。 总的来说,Hadoop的64位本地库是提升大数据处理性能的关键组件,特别是在大规模集群环境中,它能够有效减少数据传输延迟,提高计算...

    windows下开发hadoop2.4.1程序需要覆盖的本地库文件

    3. **本地库文件**:Hadoop在Windows上运行时,需要特定的本地库文件,如`libwinio.dll`和`cygwin1.dll`等。这些库文件帮助Hadoop与Windows系统交互,例如处理文件I/O和网络通信。有时,预编译的Hadoop版本可能不...

    hadoop 64位本地库

    本资源是专为64位操作系统编译的Hadoop本地库,尤其适用于CentOS 64位系统,这对于在这样的环境中运行Hadoop集群至关重要。 首先,了解Hadoop的体系结构是必要的。Hadoop由两个主要组件构成:Hadoop Distributed ...

    hadoop2.6.0的32位本地库

    在32位系统上运行Hadoop时,可能会遇到“无法加载本地库”的错误,这是因为默认提供的库通常针对64位系统编译。 标题中提到的“hadoop2.6.0的32位本地库”正是为了解决这个问题。这个压缩包包含了在CentOS 6.6 32位...

    编译hadoop2.7.6所需的的本地仓库

    在构建和运行Apache Hadoop项目时,正确配置本地仓库至关重要,因为Hadoop依赖于一系列的第三方库和组件。Hadoop 2.7.6和CDH5.5.0(Cloudera Data Hub的一个版本)的编译过程也不例外。这里我们将深入探讨如何使用...

    最新Hadoop生态圈开发学习资料——尚硅谷

    在大数据领域,Hadoop生态圈是不可或缺的重要组成部分,它为海量数据的存储、处理和分析提供了高效可靠的...这份"最新Hadoop生态圈开发学习资料——尚硅谷"将是你学习过程中宝贵的资源,助你在大数据的世界中游刃有余。

    Hadoop2.7.0学习——Windows下hadoop-eclipse-plugin-2.7.0插件安装-附件资源

    Hadoop2.7.0学习——Windows下hadoop-eclipse-plugin-2.7.0插件安装-附件资源

    Hadoop重新编译64 位本地库全部资源包

    包括: apache-ant-1.9.4-bin.tar.gz apache-maven-3.0.5-bin.tar.gz findbugs-3.0.0.tar.gz protobuf-2.5.0.tar.gz hadoop-2.4.0-src.tar.gz (附赠:cenos-6.5-hadoop-2.6.4.tar.gz)

    hadoop-windows本地库版

    总之,"hadoop-windows本地库版"为Windows用户提供了一种方便的方式来部署和使用Hadoop,它简化了在非Unix系统上的安装过程,使大数据处理的技术门槛降低,对于学习和实践Hadoop技术的开发者来说,无疑是一份宝贵的...

    Hadoop2.7.1——NFS部署

    ### Hadoop 2.7.1 —— NFS 部署详解 #### 一、概述 随着大数据技术的发展,Hadoop作为主流的大数据处理框架之一,其分布式存储系统HDFS得到了广泛的应用。为了提高Hadoop集群的数据访问效率,通常会采用网络文件...

Global site tag (gtag.js) - Google Analytics