`

rpc 原理入门

阅读更多

        

1 如何调用他人的远程服务?

由于各服务部署在不同机器,服务间的调用免不了网络通信过程,服务消费方每调用一个服务都要写一坨网络通信相关的代码,不仅复杂而且极易出错。

如果有一种方式能让我们像调用本地服务一样调用远程服务,而让调用者对网络通信这些细节透明,那么将大大提高生产力,比如服务消费方在执行helloWorldService.sayHello(“test”)时,实质上调用的是远端的服务。这种方式其实就是RPC(Remote Procedure Call Protocol),在各大互联网公司中被广泛使用,如阿里巴巴的hsf、dubbo(开源)、Facebook的thrift(开源)、Google grpc(开源)、Twitter的finagle等。

要让网络通信细节对使用者透明,我们自然需要对通信细节进行封装,我们先看下一个RPC调用的流程:

  • 1)服务消费方(client)调用以本地调用方式调用服务;
  • 2)client stub接收到调用后负责将方法、参数等组装成能够进行网络传输的消息体;
  • 3)client stub找到服务地址,并将消息发送到服务端;
  • 4)server stub收到消息后进行解码;
  • 5)server stub根据解码结果调用本地的服务;
  • 6)本地服务执行并将结果返回给server stub;
  • 7)server stub将返回结果打包成消息并发送至消费方;
  • 8)client stub接收到消息,并进行解码;
  • 9)服务消费方得到最终结果。

RPC的目标就是要2~8这些步骤都封装起来,让用户对这些细节透明。

1.1 怎么做到透明化远程服务调用?

怎么封装通信细节才能让用户像以本地调用方式调用远程服务呢?对java来说就是使用代理!java代理有两种方式:1) jdk 动态代理;2)字节码生成。尽管字节码生成方式实现的代理更为强大和高效,但代码不易维护,大部分公司实现RPC框架时还是选择动态代理方式。

下面简单介绍下动态代理怎么实现我们的需求。我们需要实现RPCProxyClient代理类,代理类的invoke方法中封装了与远端服务通信的细节,消费方首先从RPCProxyClient获得服务提供方的接口,当执行helloWorldService.sayHello(“test”)方法时就会调用invoke方法。

 

 

1.2  怎么对消息进行编码和解码?

1.2.1 确定消息数据结构

上节讲了invoke里需要封装通信细节,而通信的第一步就是要确定客户端和服务端相互通信的消息结构。客户端的请求消息结构一般需要包括以下内容:

1)接口名称

在我们的例子里接口名是“HelloWorldService”,如果不传,服务端就不知道调用哪个接口了;

2)方法名

一个接口内可能有很多方法,如果不传方法名服务端也就不知道调用哪个方法;

3)参数类型&参数值

参数类型有很多,比如有bool、int、long、double、string、map、list,甚至如struct(class);

以及相应的参数值;

4)超时时间

5)requestID,标识唯一请求id,在下面一节会详细描述requestID的用处。

同理服务端返回的消息结构一般包括以下内容。

1)返回值

2)状态code

3)requestID

1.2.2 序列化

一旦确定了消息的数据结构后,下一步就是要考虑序列化与反序列化了。

什么是序列化?序列化就是将数据结构或对象转换成二进制串的过程,也就是编码的过程。

什么是反序列化?将在序列化过程中所生成的二进制串转换成数据结构或者对象的过程。

为什么需要序列化?转换为二进制串后才好进行网络传输嘛!为什么需要反序列化?将二进制转换为对象才好进行后续处理!

现如今序列化的方案越来越多,每种序列化方案都有优点和缺点,它们在设计之初有自己独特的应用场景,那到底选择哪种呢?从RPC的角度上看,主要看三点:1)通用性,比如是否能支持Map等复杂的数据结构;2)性能,包括时间复杂度和空间复杂度,由于RPC框架将会被公司几乎所有服务使用,如果序列化上能节约一点时间,对整个公司的收益都将非常可观,同理如果序列化上能节约一点内存,网络带宽也能省下不少;3)可扩展性,对互联网公司而言,业务变化快,如果序列化协议具有良好的可扩展性,支持自动增加新的业务字段,删除老的字段,而不影响老的服务,这将大大提供系统的健壮性。

目前国内各大互联网公司广泛使用hessian、protobuf、thrift、avro等成熟的序列化解决方案来搭建RPC框架,这些都是久经考验的解决方案。

1.3  通信

消息数据结构被序列化为二进制串后,下一步就要进行网络通信了。目前有两种IO通信模型:1)BIO;2)NIO。一般RPC框架需要支持这两种IO模型,原理可参考:《一个故事讲清楚 NIO》

如何实现RPC的IO通信框架?1)使用java nio方式自研,这种方式较为复杂,而且很有可能出现隐藏bug,见过一些互联网公司使用这种方式;2)基于mina,mina在早几年比较火热,不过这些年版本更新缓慢;3)基于netty,现在很多RPC框架都直接基于netty这一IO通信框架,比如阿里巴巴的HSF、dubbo,Twitter的finagle等。

1.4  消息里为什么要带有requestID?

如果使用netty的话,一般会用channel.writeAndFlush()方法来发送消息二进制串,这个方法调用后对于整个远程调用(从发出请求到接收到结果)来说是一个异步的,即对于当前线程来说,将请求发送出来后,线程就可以往后执行了,至于服务端的结果,是服务端处理完成后,再以消息的形式发送给客户端的。于是这里出现以下两个问题:

1)怎么让当前线程“暂停”,等结果回来后,再向后执行?

2)如果有多个线程同时进行远程方法调用,这时建立在client server之间的socket连接上会有很多双方发送的消息传递,前后顺序也可能是随机的,server处理完结果后,将结果消息发送给client,client收到很多消息,怎么知道哪个消息结果是原先哪个线程调用的?

如下图所示,线程A和线程B同时向client socket发送请求requestA和requestB,socket先后将requestB和requestA发送至server,而server可能将responseA先返回,尽管requestA请求到达时间更晚。我们需要一种机制保证responseA丢给ThreadA,responseB丢给ThreadB。

怎么解决呢?

1)client线程每次通过socket调用一次远程接口前,生成一个唯一的ID,即requestID(requestID必需保证在一个Socket连接里面是唯一的),一般常常使用AtomicLong从0开始累计数字生成唯一ID;

2)将处理结果的回调对象callback,存放到全局ConcurrentHashMap里面put(requestID, callback);

3)当线程调用channel.writeAndFlush()发送消息后,紧接着执行callback的get()方法试图获取远程返回的结果。在get()内部,则使用synchronized获取回调对象callback的锁,再先检测是否已经获取到结果,如果没有,然后调用callback的wait()方法,释放callback上的锁,让当前线程处于等待状态。

4)服务端接收到请求并处理后,将response结果(此结果中包含了前面的requestID)发送给客户端,客户端socket连接上专门监听消息的线程收到消息,分析结果,取到requestID,再从前面的ConcurrentHashMap里面get(requestID),从而找到callback对象,再用synchronized获取callback上的锁,将方法调用结果设置到callback对象里,再调用callback.notifyAll()唤醒前面处于等待状态的线程。

 

 

2 如何发布自己的服务?

如何让别人使用我们的服务呢?有同学说很简单嘛,告诉使用者服务的IP以及端口就可以了啊。确实是这样,这里问题的关键在于是自动告知还是人肉告知。

人肉告知的方式:如果你发现你的服务一台机器不够,要再添加一台,这个时候就要告诉调用者我现在有两个ip了,你们要轮询调用来实现负载均衡;调用者咬咬牙改了,结果某天一台机器挂了,调用者发现服务有一半不可用,他又只能手动修改代码来删除挂掉那台机器的ip。现实生产环境当然不会使用人肉方式。

有没有一种方法能实现自动告知,即机器的增添、剔除对调用方透明,调用者不再需要写死服务提供方地址?当然可以,现如今zookeeper被广泛用于实现服务自动注册与发现功能!

简单来讲,zookeeper可以充当一个服务注册表(Service Registry),让多个服务提供者形成一个集群,让服务消费者通过服务注册表获取具体的服务访问地址(ip+端口)去访问具体的服务提供者。如下图所示:

具体来说,zookeeper就是个分布式文件系统,每当一个服务提供者部署后都要将自己的服务注册到zookeeper的某一路径上: /{service}/{version}/{ip:port}, 比如我们的HelloWorldService部署到两台机器,那么zookeeper上就会创建两条目录:分别为/HelloWorldService/1.0.0/100.19.20.01:16888  /HelloWorldService/1.0.0/100.19.20.02:16888。

zookeeper提供了“心跳检测”功能,它会定时向各个服务提供者发送一个请求(实际上建立的是一个 socket 长连接),如果长期没有响应,服务中心就认为该服务提供者已经“挂了”,并将其剔除,比如100.19.20.02这台机器如果宕机了,那么zookeeper上的路径就会只剩/HelloWorldService/1.0.0/100.19.20.01:16888。

服务消费者会去监听相应路径(/HelloWorldService/1.0.0),一旦路径上的数据有任务变化(增加或减少),zookeeper都会通知服务消费方服务提供者地址列表已经发生改变,从而进行更新。

更为重要的是zookeeper 与生俱来的容错容灾能力(比如leader选举),可以确保服务注册表的高可用性。

 

3一些开源的RPC框架

https://github.com/alibaba/dubbo

http://thrift.apache.org/?cm_mc_uid=87762817217214314008006&cm_mc_sid_50200000=1444181090

分享到:
评论

相关推荐

    RPC入门学习笔记

    本文将深入探讨RPC的概念、工作原理以及在Hadoop等分布式环境中的应用。 一、RPC的基本概念 RPC的核心思想是透明性,即客户端程序员无需关心远程服务器的具体实现,只需像调用本地方法一样调用远程服务。这种抽象...

    Windows RPC入门程序

    RPC,即Remote Procedure Call,远程过程调用,是分布式计算中的一个重要概念。它允许一个程序在一台计算机上执行...这个入门程序是一个很好的起点,可以帮助初学者快速进入RPC的世界,理解其背后的原理和实现细节。

    Apache xml-rpc入门 sevlet服务及启动服务器线程

    在这个入门教程中,我们将探讨如何在Java环境中使用Apache XML-RPC创建一个简单的Servlet服务,并启动服务器线程。 首先,我们需要了解XML-RPC的基本原理。在XML-RPC中,客户端发送一个包含方法名和参数的XML请求到...

    入门级RPC框架源码学习

    本资源是针对入门级RPC框架的源码学习,包含了学习过程中的一些流程图,对理解RPC的工作原理和实现机制非常有帮助。 首先,我们来看看“mongo”这个标签,它通常指的是MongoDB,一个流行的NoSQL数据库。在RPC框架中...

    RPC远程调用示例,zeroc入门例程

    然而,正是由于其简单性,入门例程为新手提供了一个清晰的学习路径,帮助他们快速从概念阶段过渡到实际编码阶段,并最终理解RPC远程调用的工作原理和实现方式。随着经验的不断积累,开发者可以在此基础上进一步探索...

    jsonRPC.rar

    本教程将通过"jsonRPC.rar"提供的入门案例,深入探讨JSON-RPC的基本概念、工作原理以及如何在实际项目中应用。 1. JSON-RPC简介: JSON-RPC基于JSON格式传输数据,提供了一种简单的调用远程方法的机制。与传统的...

    PHP中使用XML-RPC构造Web_Service简单入门.doc

    #### XML-RPC的工作原理 XML-RPC是一种轻量级的远程过程调用协议,其核心在于使用XML封装请求与响应数据。具体流程包括: 1. **服务器端**: - 接收来自客户端的XML格式的RPC请求。 - 解析请求中的方法名及参数...

    PHP中使用XML-RPC构造Web-Service简单入门.doc

    **XML-RPC工作原理** XML-RPC的基本流程是:客户端使用XML编码调用信息发送到服务器,服务器解析XML请求,找到对应的处理函数执行,然后将结果以XML格式返回给客户端。关键在于服务器端需要预先定义可供客户端调用...

    avro-rpc程序示例

    **Avro RPC简介** Avro是Hadoop生态系统中的一个关键组件..."avro-rpc-quickstart-master"示例项目为开发者提供了学习和实践Avro RPC的起点,通过运行和分析代码,可以深入了解Avro RPC的工作原理和Netty的使用方法。

    电源PFC入门指南:TI单相与三相维也纳整流器无桥原理图及PCB中文资料详解,TI单相三相维也纳VIENNA整流器无桥原理图与电源PFC入门指南-深入浅出学习指南,电源PFC入门 TI单相三相维也纳

    原理图是表达电子电路工作原理和结构布局的图形化工具,通过原理图,工程师可以快速地理解电路的连接方式、工作流程以及各组件之间的关系。而PCB(Printed Circuit Board,印刷电路板)中文资料则涉及电路板的设计、...

    rabbitMq入门

    本篇文章将带你入门RabbitMQ,理解其基本概念和工作原理。 【描述】: RabbitMQ基于AMQP(Advanced Message Queuing Protocol)协议,它提供了一个统一的消息模型,使得不同语言和平台的应用可以进行通信。通过...

    分布式RPC服务框架Dubbo从入门到手写Dubbo框架教程

    Dubbo 是阿里巴巴公司开源的一个高性能优秀的服务框架,使得应用可通过高性能的 RPC 实现服务的输出和输入功能,可以和 Spring 框架无缝集成。 Dubbo采用全Spring配置方式,透明化接入应用,对应用没有任何API侵入,...

    C#入门经典之web服务示例

    【C#入门经典之Web服务示例】 在深入讲解C#中的Web服务之前,我们先理解Web服务的基本概念。Web服务是一种基于互联网的、能够被不同系统和平台上的应用程序所调用的服务。它们通过标准的协议(如XML、SOAP、WSDL等...

    java高级软件工程师教程快速入门Zookeeper+dubbo视频教程

    Dubbo是一款高性能、轻量级的开源Java RPC框架,提供面向接口代理的高性能RPC调用、智能负载均衡、服务自动注册和发现、运行期流量调度、可视化服务治理和运维等功能。 本套课程中,第一阶段深入Zookeeper原理和源码...

    AMFPHP php远程调用(RPC, Remote Procedure Call)工具 快速入门教程

    在本教程中,我们将深入探讨AMFPHP的基础知识,包括它的工作原理以及如何使用它进行快速入门。 首先,让我们解释一下什么是RPC。远程过程调用(RPC)是一种计算通信协议,允许客户端向服务器发送请求,请求执行一个...

    Websphere MQ入门教程

    本入门教程将帮助初学者理解Websphere MQ的基本概念、工作原理以及其在企业级应用中的重要性。 **1. 中间件概述** 中间件是计算机软件的一种,它作为不同系统之间的桥梁,提供数据交换和功能集成的能力。它位于...

    ice入门例子

    本篇将基于提供的"ice入门例子"进行深入讲解,帮助初学者理解Ice的基本概念、工作原理以及如何在实际项目中应用。 1. **Ice简介** Ice是一个全面的解决方案,用于构建分布式系统,它支持多种编程语言,如C++、Java...

    dubbo入门示例源码

    Dubbo 是阿里巴巴开源的一款高性能、轻量级的 Java RPC 框架,它在服务治理、负载均衡、容错机制等方面具有出色的能力。本示例是针对初学者设计的,旨在帮助新手快速理解 Dubbo 的基本工作原理和使用方法。 在入门...

    ActiveMQ实践入门指南

    与传统的远程过程调用(RPC)模式相比,松耦合设计通过异步通信机制,降低了系统各组件间的依赖度,使得单一组件的变化不会立即影响到其他组件,从而大大增强了系统的灵活性和可维护性。在ActiveMQ的架构下,消息发送...

    thrift入门学习教程

    ### Thrift入门学习教程 #### 一、Thrift概述 Thrift是由Facebook开发并在2007年贡献给Apache基金会的一款开源项目。它的主要目的是解决跨平台、跨语言的系统间大数据量传输通信问题。在早期,Facebook面临着系统...

Global site tag (gtag.js) - Google Analytics