- 浏览: 306705 次
- 性别:
- 来自: 北京
文章分类
- 全部博客 (165)
- hadoop (47)
- linux (11)
- nutch (7)
- hbase (7)
- solr (4)
- zookeeper (4)
- J2EE (1)
- jquery (3)
- java (17)
- mysql (14)
- perl (2)
- compass (4)
- suse (2)
- memcache (1)
- as (1)
- roller (1)
- web (7)
- MongoDB (8)
- struts2 (3)
- lucene (2)
- 算法 (4)
- 中文分词 (3)
- hive (17)
- noIT (1)
- 中间件 (2)
- maven (2)
- sd (0)
- php (2)
- asdf (0)
- kerberos 安装 (1)
- git (1)
- osgi (1)
- impala (1)
- book (1)
- python 安装 科学计算包 (1)
最新评论
-
dandongsoft:
你写的不好用啊
solr 同义词搜索 -
黎明lm:
meifangzi 写道楼主真厉害 都分析源码了 用了很久. ...
hadoop 源码分析(二) jobClient 通过RPC 代理提交作业到JobTracker -
meifangzi:
楼主真厉害 都分析源码了
hadoop 源码分析(二) jobClient 通过RPC 代理提交作业到JobTracker -
zhdkn:
顶一个,最近也在学习设计模式,发现一个问题,如果老是看别人的博 ...
Java观察者模式(Observer)详解及应用 -
lvwenwen:
木南飘香 写道
高并发网站的架构
Hadoop RPC详细分析
本帖最后由 hadoopor 于 2009-12-30 15:56 编辑
1. 总体结构
HadoopRPC逻辑上分成三部分,如上图所示。
1.1. RPC Interface
RPC对外接口。
1.2. RPC Server
RPC服务端的实现。
1.3. RPC Client
RPC客户端的实现。
1.4. RPC Interface
RPC是对外的接口类,主要提供两个方法:getProxy和getServer。
1.4.1. getServer
Ø 说明
RPC服务端接口。为指定协议的实例,在指定的地址和端口上启动服务。
Ø 函数原型
public static Server getServer(
final Object instance,
final String bindAddress,
final int port,
final int numHandlers,
final boolean verbose,
Configuration conf) throws IOException;
复制代码
Ø 参数说明
1) Instance
RPC Server端对象实例,也就是RPC Client调用的接口实例。
2) bindAddress
RPC Server监听的IP地址。
3) Port
RPC Server监听的端口号。
4) numHandlers
处理Call队列的Handler线程个数。
5) Verbose
6) conf
配置项。
1.4.2. getProxy
Ø 说明
RPC客户端接口,创建一个指定服务端的代理。
Ø 函数原型
Ø 参数说明
1) protocol
RPC Server提供RPC服务的接口。
2) clientVersion
客户端的版本号。
3) addr
RPC Server地址。
4) ticket
5) conf
配置项。
6) factory
SOCKET工厂。
2. RPC Server2.1. RPC Server结构
2.1.1. Server
抽象的RPC服务,提供Call队列。
2.1.2. RPC.Server
Server的实现。
2.1.3. Server.Listener
RPC服务端的监听者,用来接受RPC客户端的连接请求和数据的收发。
2.1.4. Server.Handler
RPC服务端的Call处理者,和Server.Listener通过Call队列交互。
2.1.5. Server.Responder
RPC服务端的响应者。Server.Handler向RPC客户端发送响应是异步非阻塞的,如果有未发送出的数据,交由Server.Responder来完成。
2.1.6. Server.Connection
提供接收数据,解析数据包的功能。
2.1.7. Server.Call
持有客户端的Call信息。
2.2. RPC Server主要流程2.2.1. 接收Call调用
接收RPC Client的调用,并编码成Call对象,放入到Call队列中,这个过程在Listener线程中完成。
Ø 步骤说明:
1) Listener线程循环等待RPC客户端的发送数据过来
2) 当有数据可以接收时,调用Connection的readAndProcess方法
3) Connection边接收边对数据进行处理,如果接收到一个完整的Call包,则构建一个Call对象,并将这个Call对象PUSH到Call队列中,由Handler线程来处理Call队列中的所有Call。
2.2.2. 处理Call调用
处理Call队列中的每个请求,在Handler线程中完成。
Ø 步骤说明:
1) Handler线程循环监听Call队列,如果Call队列为空,则进入wait状态,否则按FIFO规则从Call队列取出Call
2) 将Call交给RPC.Server处理(调用RPC.Server的Call)
3) 借助JDK提供的Method,完成对目标方法的调用
4) 返回响应。由于响应需要通过SOCKET返回给RPC客户端,所以响应的类型必须是Writable。
3. RPC Client3.1. RPC Client结构
3.1.1. Client
RPC客户端的实现和入口类。
3.1.2. Client.ConnectionId
到RPC服务端对象连接的标识。
3.1.3. Client.Call
存储Call调用信息。
3.1.4. Client.ParallelResults
存储响应。
3.1.5. RPC.Invoker
对InvocationHandler的实现,提供invoke方法,截获RPC客户端对RPC服务端对象的调用。
3.1.6. RPC.Invocation
用来序列化和反序列化RPC客户端的调用信息,包括方法名和参数信息。
3.2. RPC Client主要流程3.2.1. Call流程
客户端RPC调用的处理流程,转化为SOCKET通信。
Ø 步骤说明:
1) RPC客户端发起一个RPC调用时,JAVA的反射机制会截获该调用,并转化为对Client.call的调用
2) 调用getConnection建立到RPC服务端的连接
3) 通过Connection将序列化后的参数发送到RPC服务端
4) 等待RPC服务端返回响应。
3.2.2. getConnection流程
该流程用来建立到RPC Server端的连接,到一个RPC Server端只会建立一个连接。
Ø 步骤说明:
1) 根据RPC服务端的地址和接口从连接池中获取一个,如果取到Connection则直接返回
2) 否则新建一个Connection,并将它放入到连接池中
3) 然后通过SocketFactory创建一个Socket,并建立到RPC服务端的连接,如果连接不成功,则重试
4) 创建和关联输入和输出流对象。
4. RPC线程关系
客户端发起的RPC调用都是同步的,而服务端处理RPC调用是异步的。客户端调用线程以阻塞同步的方式发起RPC连接,及RPC调用,将参数等信息发送给Listener,然后就等待Connection接收完响应返回。
Listener负责接收RPC连接,和RPC数据,当一个Call的数据接收完后,组装成Call,并将Call放入由Handler提供的Call队列中。
Handler线程一直监听Call队列,如果Call队列不为空,则按队列方式取出一个Call,并转为实际调用,以非阻塞方式将响应发回给Connection,剩下未发送完毕的响应交给Responder处理。
本帖最后由 hadoopor 于 2009-12-30 15:56 编辑
1. 总体结构
HadoopRPC逻辑上分成三部分,如上图所示。
1.1. RPC Interface
RPC对外接口。
1.2. RPC Server
RPC服务端的实现。
1.3. RPC Client
RPC客户端的实现。
1.4. RPC Interface
RPC是对外的接口类,主要提供两个方法:getProxy和getServer。
1.4.1. getServer
Ø 说明
RPC服务端接口。为指定协议的实例,在指定的地址和端口上启动服务。
Ø 函数原型
public static Server getServer(
final Object instance,
final String bindAddress,
final int port,
final int numHandlers,
final boolean verbose,
Configuration conf) throws IOException;
复制代码
Ø 参数说明
1) Instance
RPC Server端对象实例,也就是RPC Client调用的接口实例。
2) bindAddress
RPC Server监听的IP地址。
3) Port
RPC Server监听的端口号。
4) numHandlers
处理Call队列的Handler线程个数。
5) Verbose
6) conf
配置项。
1.4.2. getProxy
Ø 说明
RPC客户端接口,创建一个指定服务端的代理。
Ø 函数原型
public static VersionedProtocol getProxy( Class<? extends VersionedProtocol> protocol, long clientVersion, InetSocketAddress addr, UserGroupInformation ticket, Configuration conf, SocketFactory factory) throws IOException;
Ø 参数说明
1) protocol
RPC Server提供RPC服务的接口。
2) clientVersion
客户端的版本号。
3) addr
RPC Server地址。
4) ticket
5) conf
配置项。
6) factory
SOCKET工厂。
2. RPC Server2.1. RPC Server结构
2.1.1. Server
抽象的RPC服务,提供Call队列。
2.1.2. RPC.Server
Server的实现。
2.1.3. Server.Listener
RPC服务端的监听者,用来接受RPC客户端的连接请求和数据的收发。
2.1.4. Server.Handler
RPC服务端的Call处理者,和Server.Listener通过Call队列交互。
2.1.5. Server.Responder
RPC服务端的响应者。Server.Handler向RPC客户端发送响应是异步非阻塞的,如果有未发送出的数据,交由Server.Responder来完成。
2.1.6. Server.Connection
提供接收数据,解析数据包的功能。
2.1.7. Server.Call
持有客户端的Call信息。
2.2. RPC Server主要流程2.2.1. 接收Call调用
接收RPC Client的调用,并编码成Call对象,放入到Call队列中,这个过程在Listener线程中完成。
Ø 步骤说明:
1) Listener线程循环等待RPC客户端的发送数据过来
2) 当有数据可以接收时,调用Connection的readAndProcess方法
3) Connection边接收边对数据进行处理,如果接收到一个完整的Call包,则构建一个Call对象,并将这个Call对象PUSH到Call队列中,由Handler线程来处理Call队列中的所有Call。
2.2.2. 处理Call调用
处理Call队列中的每个请求,在Handler线程中完成。
Ø 步骤说明:
1) Handler线程循环监听Call队列,如果Call队列为空,则进入wait状态,否则按FIFO规则从Call队列取出Call
2) 将Call交给RPC.Server处理(调用RPC.Server的Call)
3) 借助JDK提供的Method,完成对目标方法的调用
4) 返回响应。由于响应需要通过SOCKET返回给RPC客户端,所以响应的类型必须是Writable。
3. RPC Client3.1. RPC Client结构
3.1.1. Client
RPC客户端的实现和入口类。
3.1.2. Client.ConnectionId
到RPC服务端对象连接的标识。
3.1.3. Client.Call
存储Call调用信息。
3.1.4. Client.ParallelResults
存储响应。
3.1.5. RPC.Invoker
对InvocationHandler的实现,提供invoke方法,截获RPC客户端对RPC服务端对象的调用。
3.1.6. RPC.Invocation
用来序列化和反序列化RPC客户端的调用信息,包括方法名和参数信息。
3.2. RPC Client主要流程3.2.1. Call流程
客户端RPC调用的处理流程,转化为SOCKET通信。
Ø 步骤说明:
1) RPC客户端发起一个RPC调用时,JAVA的反射机制会截获该调用,并转化为对Client.call的调用
2) 调用getConnection建立到RPC服务端的连接
3) 通过Connection将序列化后的参数发送到RPC服务端
4) 等待RPC服务端返回响应。
3.2.2. getConnection流程
该流程用来建立到RPC Server端的连接,到一个RPC Server端只会建立一个连接。
Ø 步骤说明:
1) 根据RPC服务端的地址和接口从连接池中获取一个,如果取到Connection则直接返回
2) 否则新建一个Connection,并将它放入到连接池中
3) 然后通过SocketFactory创建一个Socket,并建立到RPC服务端的连接,如果连接不成功,则重试
4) 创建和关联输入和输出流对象。
4. RPC线程关系
客户端发起的RPC调用都是同步的,而服务端处理RPC调用是异步的。客户端调用线程以阻塞同步的方式发起RPC连接,及RPC调用,将参数等信息发送给Listener,然后就等待Connection接收完响应返回。
Listener负责接收RPC连接,和RPC数据,当一个Call的数据接收完后,组装成Call,并将Call放入由Handler提供的Call队列中。
Handler线程一直监听Call队列,如果Call队列不为空,则按队列方式取出一个Call,并转为实际调用,以非阻塞方式将响应发回给Connection,剩下未发送完毕的响应交给Responder处理。
发表评论
-
博客地址变更
2013-08-16 10:29 1225all the guys of visiting the bl ... -
hadoop 源码分析(六)hadoop taskTracker 生成map 和reduce任务流程
2013-04-09 17:36 2750taskTracker 生成map reduce ... -
hadoop 源码分析(六)hadoop taskTracker 生成map 和reduce任务流程
2013-04-09 17:33 0taskTracker 生成map reduce ... -
hadoop 源码分析(五)hadoop 任务调度TaskScheduler
2013-04-01 11:07 3950hadoop mapreduce 之所有能够实现job的运行 ... -
hadoop 源码分析(四)JobTracker 添加job 到schduler 队列中
2013-03-29 18:37 2883启动 JobTracker 1. 进入main方法: ... -
hadoop 源码分析(三) hadoop RPC 机制
2013-03-28 15:13 2415Hadoop 通信机制采用自己编写的RPC. 相比于 ... -
hadoop 源码分析(二) jobClient 通过RPC 代理提交作业到JobTracker
2013-03-27 12:57 38051.JobClient 客户端类 通过 ... -
hadoop 源码分析(一) jobClient 提交到JobTracker
2013-03-26 13:41 3620Hadoop 用了2年多了.从最初一起创业的 ... -
RHadoop 安装教程
2013-02-01 17:18 1634RHadoop 环境安装 硬件: centos6 ... -
pig
2012-11-16 19:28 1220转自:http://www.hadoopor.c ... -
hadoop与hive的映射
2012-11-15 10:21 2377hadoop与hive的映射 ... -
hadoop distcp
2012-07-31 10:00 2835hadoop distcp 使用:distcp ... -
MapReduce中Mapper类和Reducer类4函数解析
2012-07-20 18:05 2133MapReduce中Mapper类和Reducer类4函数解析 ... -
hadoop metrics 各参数解释
2012-07-17 18:59 1518hadoop metrics 各参数解释 研究使用hadoo ... -
Hbase几种数据入库(load)方式比较
2012-07-17 14:52 13891. 预先生成HFile入库 这个地址有详细的说明http:/ ... -
Hadoop客户端环境配置
2012-05-11 14:59 1778Hadoop客户端环境配置 1. 安装客户端(通过端用户可以 ... -
hadoop 通过distcp进行并行复制
2012-05-02 15:25 2483通过distcp进行并行复制 前面的HDFS访问模型都集中于 ... -
linux crontab 执行hadoop脚本 关于hadoop环境变量引入
2012-04-10 12:11 0crontab问题 crontab的特点:PATH不全和无终 ... -
hadoop fs 命令封装
2012-04-09 09:39 0hadoop fs 命令封装 #!/usr/bin/env ... -
map-reduce编程核心问题
2012-02-22 13:38 12821-How do we break up a large p ...
相关推荐
《Hadoop RPC机制详解》 在分布式计算领域,Hadoop是一个不可或缺的名字,它提供了一整套处理大数据的框架。在Hadoop中,远程过程调用(RPC)是核心组件之一,它使得节点间的通信变得高效且可靠。本文将深入探讨...
在分布式计算领域,Hadoop RPC(Remote Procedure Call)是一个至关重要的组件,它使得Hadoop生态系统中的各个服务能够相互通信,实现数据的高效处理和共享。在这个实例中,我们将深入探讨Hadoop RPC的工作原理、...
Hadoop rpc源码是从Hadoop分离出的ipc,去掉了认证部分,附录使用文档.使用前请add lib包commons-logging-*.*.*.jar(我用的是1.0.4)和log4j-*.*.*.jar(我的1.2.13) 相关blog post: ...
Hadoop RPC 详细分析 Hadoop RPC(Remote Procedure Call,远程过程调用)是 Hadoop 项目中的一个重要组件,用于实现分布式系统中的通信和数据交换。下面是对 Hadoop RPC 的详细分析。 RPCInterface Hadoop RPC ...
RPC(RemoteProcedureCall)——远程过程调用,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。RPCServer实现了一种抽象的RPC服务,同时提供Call队列。RPCServer作为服务提供者由两个...
Java操作Hadoop的RPC(Remote Procedure Call)是分布式计算领域中的关键技术,它允许在不同的进程或机器之间进行远程调用,如同本地调用一样。Hadoop作为一个开源的大数据处理框架,其RPC机制是实现各个组件如...
1.java接口操作Hadoop文件系统(文件上传下载删除创建......2.RPC远程过程调用的java代码实现,便于理解Hadoop的RPC协议,具体使用方法可参考我的博客https://blog.csdn.net/qq_34233510/article/details/88142507
在分布式计算领域,Hadoop RPC(Remote Procedure Call)框架是一个至关重要的组件,它允许不同的进程之间进行通信,尤其是在大规模数据处理的场景下。Hadoop RPC是Hadoop生态系统中的基础服务,使得不同模块如HDFS...
### Hadoop RPC 深入理解 #### 一、引言 随着大数据处理需求的日益增长,Apache Hadoop 作为一款流行的开源分布式计算框架,在处理海量数据方面展现出了极高的性能和灵活性。其中,Hadoop 的远程过程调用(RPC)...
### Hadoop的RPC通信程序详解 #### 一、引言 在分布式系统中,远程过程调用(Remote Procedure Call, RPC)是一种重要的通信机制,它允许一台计算机上的程序调用另一台计算机上的子程序,而无需程序员了解底层网络...
在Hadoop中,远程过程调用(Remote Procedure Call, RPC)是一种重要的通信机制,它允许分布式系统中的组件之间进行高效且便捷的交互。Hadoop的RPC机制基于Java的客户端-服务器模型,允许客户端调用服务器上的方法,...
在Java中模拟Hadoop的RPC通讯,主要是为了理解其连接和心跳机制,这是保证Hadoop集群稳定运行的关键部分。 RPC的核心思想是透明性,即客户端可以像调用本地方法一样调用远程服务,由RPC框架负责数据的序列化、网络...
RPC,即RemoteProcdureCall,中文名:远程过程调用;...(2)Hadoop的进程间交互都是通过RPC来进行的,比如Namenode与Datanode直接,Jobtracker与Tasktracker之间等。因此,可以说:Hadoop的运行就是建立在
《Hadoop 2.X HDFS源码剖析》以Hadoop 2.6.0源码为基础,深入剖析了HDFS 2.X中各个模块的实现细节,包括RPC框架实现、Namenode实现、Datanode实现以及HDFS客户端实现等。《Hadoop 2.X HDFS源码剖析》一共有5章,其中...
1.2.1 Hadoop RPC接口 4 1.2.2 流式接口 20 1.3 HDFS主要流程 22 1.3.1 HDFS客户端读流程 22 1.3.2 HDFS客户端写流程 24 1.3.3 HDFS客户端追加写流程 25 1.3.4 Datanode启动、心跳以及执行名字节点指令...
在IT行业中,分布式计算系统的重要性日益凸显,而Hadoop作为其中的佼佼者,其核心组件之一就是远程过程调用(RPC,Remote Procedure Call)。RPC允许一个程序在某个网络中的计算机上执行另一个计算机上的程序,而...