`

WebHDFS vs HttpFS GateWay

 
阅读更多

基于hadoop2.7.1版本

 

一、简介

 

1、 WebHDFS官方简介:

 

Introduction

 

The HTTP REST API supports the complete FileSystem/FileContext interface for HDFS.

 

2、HttpFS GateWay官方简介:

 

HttpFS is a server that provides a REST HTTP gateway supporting all HDFS File System operations (read and write). And it is inteoperable with the webhdfs REST HTTP API.

 

HttpFS can be used to transfer data between clusters running different versions of Hadoop (overcoming RPC versioning issues), for example using Hadoop DistCP.

 

HttpFS can be used to access data in HDFS on a cluster behind of a firewall (the HttpFS server acts as a gateway and is the only system that is allowed to cross the firewall into the cluster).

 

HttpFS can be used to access data in HDFS using HTTP utilities (such as curl and wget) and HTTP libraries Perl from other languages than Java.

 

The webhdfs client FileSytem implementation can be used to access HttpFS using the Hadoop filesystem command (hadoop fs) line tool as well as from Java aplications using the Hadoop FileSystem Java API.

 

HttpFS has built-in security supporting Hadoop pseudo authentication and HTTP SPNEGO Kerberos and other pluggable authentication mechanims. It also provides Hadoop proxy user support.

 

二、使用原因:

 

二者都提供基于REST的API,这使得一个集群外的host可以不用安装HADOOP和JAVA环境就可以对集群内的HADOOP进行访问,并且client不受语言的限制。

 

三、两者的区别:

 

1、WebHDFS是HDFS内置的、默认开启的一个服务,而HttpFS是HDFS一个独立的服务,若使用需要配置并手动开启。 

2、HttpFS重在后面的GateWay。即WebHDFS面向的是集群中的所有节点,首先通过namenode,然后转发到相应的datanode,而HttpFS面向的是集群中的一个节点(相当于该节点被配置为HttpFS的GateWay) 

3、WebHDFS是HortonWorks开发的,然后捐给了Apache;而HttpFS是Cloudera开发的,也捐给了Apache。

 

四、使用步骤:

 

1、使用WebHDFS的步骤:

 

(1)WebHDFS服务内置在HDFS中,不需额外安装、启动。需要在hdfs-site.xml打开WebHDFS开关,此开关默认打开。

 

<property>

    <name>dfs.webhdfs.enabled</name>

    <value>true</value>

</property>

 

(2)连接NameNode的50070端口进行文件操作。

 

curl "http://ctrl:50070/webhdfs/v1/?op=liststatus&user.name=root"

 

2、使用HttpFS GateWay的步骤:

 

(1)根据需求配置:httpfs-site.xml 

(2)配置:hdfs-site.xml,需要增加如下配置,其他两个参数名称中的root代表的是启动hdfs服务的OS用户,应以实际的用户名称代替。

 

<property>  

    <name>hadoop.proxyuser.root.hosts</name>  

    <value>*</value>  

</property>  

<property>  

<name>hadoop.proxyuser.root.groups</name>  

    <value>*</value>  

</property>

 

(3)启动:

 

ln -s /usr/hdp/2.3.0.0-2557/hadoop-httpfs/webapps /etc/hadoop-httpfs/tomcat-deployment/webapps

 

sbin/httpfs.sh start

sbin/httpfs.sh stop

 

启动后,默认监听14000端口:

 

[hadoop@master hadoop]# netstat -antp | grep 14000

tcp        0      0 :::14000   :::*       LISTEN      7415/java

[hadoop@master hadoop]#

 

(4)使用:

 

#curl -i -L "http://HttpFS_host:14000/webhdfs/v1/foo/bar?op=OPEN" 

#hdfs dfs -ls webhdfs://HttpFS_host:14000/

 

参考文章:

 

《简单说说WebHDFS和HttpFS》

《HTTPFS - Configure and Run with HDP 2.2.4.x》

分享到:
评论

相关推荐

    apache hadoop 2.7.2.chm

    HttpFS Gateway Short Circuit Local Reads Centralized Cache Management HDFS NFS Gateway HDFS Rolling Upgrade Extended Attributes Transparent Encryption HDFS Support for Multihoming Archival ...

    McAfee Secure Web Gateway产品简介

    McAfee:registered: Secure Web Gateway可保护您免受Web附带的威胁(如间谍软件、不适当Web内容、网络钓鱼诈骗攻击、病毒、蠕虫和木马)的侵扰。Secure Web Gateway能够帮助您提高员工生产力,提高您的可用带宽,...

    Sysmac Gateway使用说明 PPT.zip

    Sysmac Gateway是一款由Omron公司推出的高性能工业自动化设备通信解决方案,它主要负责连接不同设备,实现数据交换和控制指令的传递。本使用说明将详细解析Sysmac Gateway的安装与操作,帮助用户更好地理解和运用该...

    最新Spring Cloud Gateway 官方参考指南-中文版-3.x

    3. 匹配的请求被发送到Gateway Web处理器,通过过滤器链进行处理。过滤器链分为"pre"和"post"两部分,先执行所有"pre"过滤器,然后执行"post"过滤器。 配置路由、谓词和过滤器可以通过YAML或properties文件进行,有...

    McAfee_Web_Gateway产品手册

    ### McAfee Web Gateway 产品手册知识点总结 #### 一、产品概述 **McAfee Web Gateway**是一款由McAfee公司开发的企业级网络安全解决方案。它主要用于保护组织内部网络免受来自互联网的威胁,并且能够帮助企业实施...

    spring-boot-gateway 整合网关gateway +注册中心 有注释 打开可运行

    Spring Boot Gateway 是一款基于 Spring Framework 5 和 Project Reactor 的微服务网关,它旨在提供一种简单的方法来路由请求,并且具有过滤器功能,可以进行请求的预处理和后处理。这个项目集成了 Gateway 与注册...

    tp5.1+GatewayWorker 修复GatewayWorker在windows启动问题

    命令php think worker:gateway在windows下运行...根据GatewayWorker-for-win提供的demo修改的 本资源依赖GatewayWorker扩展,请先安装扩展。 使用方法,把解压后的文件夹放到项目根目录,双击start_for_win.bat,启动

    spring-cloud-gateway-server-3.1.1-API文档-中文版.zip

    赠送jar包:spring-cloud-gateway-server-3.1.1.jar; 赠送原API文档:spring-cloud-gateway-server-3.1.1-javadoc.jar; 赠送源代码:spring-cloud-gateway-server-3.1.1-sources.jar; 赠送Maven依赖信息文件:...

    thingsboard-gateway_gateway_thingsboard_thingsboardgateway_thing

    在物联网(IoT)领域,数据的采集、处理和传输是关键环节,而ThingsBoard Gateway则是连接物理世界与云端物联网平台的重要桥梁。本项目“thingsboard-gateway_gateway_thingsboard_thingsboardgateway_thing”专注于 ...

    springcloud下通过gateway转发websocket

    在IT行业中,Spring Cloud Gateway作为Spring Cloud生态体系中的一个关键组件,被广泛用于构建微服务架构中的API网关。这个框架允许我们集中处理各种请求,包括路由、过滤、安全等,极大地简化了服务间的通信。而...

    Sysmac Gateway使用说明 PPT

    ### Sysmac Gateway 使用说明知识点详解 #### 一、Sysmac Gateway 概述 - **Sysmac Gateway**:作为OMRON工业自动化系统中的一个重要组成部分,它主要用于实现计算机与OMRON控制器(如NJ系列PLC)之间的EtherCAT/...

    OMRON SYSMAC Gateway_Sample.rar

    OMRON SYSMAC Gateway 是一种工业自动化设备,它作为数据通信的桥梁,允许用户通过以太网接口与OMRON PLC(可编程逻辑控制器)以及其他SYSMAC系列设备进行交互。该Gateway支持C#编程语言,使得开发人员能够利用C#的...

    zabbix-java-gateway.tar.zip

    在实际部署中,Zabbix Java Gateway经常需要与Apache等Web服务器协同工作。例如,通过配置,它可以监控Apache的请求处理速度、连接状态、错误日志等。这种集成有助于全面了解整个IT基础设施的运行状况,及时发现并...

    springcloud Gateway网关-压测用.zip

    SpringCloud Gateway作为一款现代化的微服务网关,它在企业级分布式系统中扮演着至关重要的角色。这个名为"springcloud Gateway网关-压测用.zip"的压缩包包含了一个用于性能测试的配置,目的是评估和优化Gateway的...

    SpringCloud.03.网关Gateway 配置文件

    在Spring Cloud生态体系中,Spring Cloud Gateway作为新一代的API网关,被广泛应用于微服务架构中,用于统一处理请求路由、过滤器链、限流、熔断等核心功能。本篇将详细介绍Spring Cloud Gateway的配置文件相关知识...

    OMRON SYSMAC gateway示例代码.zip

    OMRON SYSMAC Gateway 是一种工业自动化设备,它用于连接OMRON PLC(可编程逻辑控制器)和其他网络设备,如传感器、驱动器或上位机。在工业4.0和物联网(IoT)环境下,SYSMAC Gateway 提供了数据通信和集成解决方案...

    thinkphp5.1完美集成gatewayworker

    5. 集成方案:将ThinkPHP5.1和GatewayWorker3.0整合,实现了Web应用的实时通信功能。 6. 应用升级:通过Composer可以直接升级应用,保持代码库的更新和安全。 7. 说明文档:项目根目录中的Word文档,提供了详细的...

    OMRON 的SYSMAC gateway帮助文档

    【SYSMAC Gateway 知识详解】 SYSMAC Gateway是OMRON公司推出的一款先进的设备网关,主要用于连接OMRON的PLC(可编程逻辑控制器)与其他网络系统,如Ethernet/IP、PROFINET、MODBUS TCP等,实现工业自动化环境中的...

    springboot整合Oauth2,GateWay实现网关登录授权验证

    为了整合OAuth2和Gateway,我们需要配置Spring Gateway的WebFilter,这个过滤器会检查每个请求的令牌。可以使用OAuth2的资源服务器功能来验证令牌,或者调用授权服务器的验证API。同时,我们可以设置全局过滤规则,...

    gateway网关统一管理swagger

    "Gateway网关统一管理Swagger" Gateway网关统一管理Swagger是指在Spring Cloud Gateway中使用Swagger来统一管理API文档。Swagger是一个流行的API文档工具,能够生成漂亮的API文档,并提供交互式的API测试环境。 在...

Global site tag (gtag.js) - Google Analytics