一. 远程通讯协议的基本原理
网络通信需要做的就是将流从一台计算机传输到另外一台计算机,基于传输协议和网络 IO 来实现,其中传输协议比较出名的有 http 、 tcp 、 udp 等等, http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协议,网络 IO ,主要有 bio 、 nio 、 aio 三种方式,所有的分布式应用通讯都基于这个原理而实现,只是为了应用的易用,各种语言通常都会提供一些更为贴近应用易用的应用层协议。
二. 应用级协议 Binary-RPC
Binary-RPC 是一种和 RMI 类似的远程调用的协议,它和 RMI 的不同之处在于它以标准的二进制格式来定义请求的信息 ( 请求的对象、方法、参数等 ) ,这样的好处是什么呢,就是在跨语言通讯的时候也可以使用。
来看下 Binary -RPC 协议的一次远程通信过程:
1 、客户端发起请求,按照 Binary -RPC 协议将请求信息进行填充;
2 、填充完毕后将二进制格式文件转化为流,通过传输协议进行传输;
3 、接收到在接收到流后转换为二进制格式文件,按照 Binary -RPC 协议获取请求的信息并进行处理;
4 、处理完毕后将结果按照 Binary -RPC 协议写入二进制格式文件中并返回。
问题总结:
1 、传输的标准格式是?
标准格式的二进制文件。
2 、怎么样将请求转化为传输的流?
将二进制格式文件转化为流。
3 、怎么接收和处理流?
通过监听的端口获取到请求的流,转化为二进制文件,根据协议获取请求的信息,进行处理并将结果写入 XML 中返回。
4 、传输协议是?
Http 。
三. Hessian ——一种实现远程通讯的 library
Hessian 是由 caucho 提供的一个基于 binary-RPC 实现的远程通讯 library 。
1 、是基于什么协议实现的?
基于 Binary-RPC 协议实现。
2 、怎么发起请求?
需通过 Hessian 本身提供的 API 来发起请求。
3 、怎么将请求转化为符合协议的格式的?
Hessian 通过其自定义的串行化机制将请求信息进行序列化,产生二进制流。
4 、使用什么传输协议传输?
Hessian 基于 Http 协议进行传输。
5 、响应端基于什么机制来接收请求?
响应端根据 Hessian 提供的 API 来接收请求。
6 、怎么将流还原为传输格式的?
Hessian 根据其私有的串行化机制来将请求信息进行反序列化,传递给使用者时已是相应的请求信息对象了。
7 、处理完毕后怎么回应?
处理完毕后直接返回, hessian 将结果对象进行序列化,传输至调用端。
四. Hessian机制
Hessian远程访问基于序列化和反序列化的方式。当程序运行时,程序所创建的各种对象都位于内存中,当程序运行结束,这些对象就结束了生命周期。对象的序列化主要有两种用途:
l 把对象的字节序列永久地保存到硬盘上,通常是放在一个文件中。
l 在网络上传输对象的字节序列
如下图所示:
那么Hessian就是把Java对象转变成 字节序列,然后通过Http传输到 目标服务器上(主机2),主机2收到这个字节序列后,按照一定的协议标准进行反序列,提交给对应的服务处理。处理完成以后以同样的方式返回数据。
五. Hessian 源码分析
以 hessian 和 spring dm server 整合环境为例。
1. 客户端发起请求
Hessian 的这个远程过程调用,完全使用动态代理来实现的。有客户端可以看出。
除去 spring 对其的封装,客户端主要是通过 HessianProxyFactory 的 create 方法就是创建接口的代理类,该类实现了接口, JDK 的 proxy 类会自动用 InvocationHandler 的实现类(该类在 Hessian 中表现为 HessianProxy )的 invoke 方法体来填充所生成代理类的方法体。
客户端系统启动时:
根据 serviceUrl 和 serviceInterface 创建代理。
HessianProxyFactoryBean 类
HessianClientInterceptor 类
createHessianProxy(HessianProxyFactory proxyFactory)
HessianProxyFactory 类
public Object create(Class api, String urlName)
客户端调用 hessian 服务时:
HessianProxy 类的 invoke(Object proxy, Method method, Object []args) 方法
String methodName = method.getName();// 取得方法名
Object value = args[0]; // 取得传入参数
conn = sendRequest(mangleName, args) ; // 通过该方法和服务器端取得连接
httpConn = (HttpURLConnection) conn;
code = httpConn.getResponseCode(); // 发出请求
// 等待服务器端返回相应…………
is = conn.getInputStream();
Object value = in.readObject(method.getReturnType()); // 取得返回值
HessianProxy 类的 URLConnection sendRequest(String methodName, Object []args) 方法:
URLConnection conn = _factory.openConnection(_url); // 创建 URLConnection
OutputStream os = conn.getOutputStream();
AbstractHessianOutput out = _factory.getHessianOutput(os); // 封装为 hessian 自己的输入输出 API
out.call(methodName, args);
return conn;
2. 服务器端接收请求并处理请求
服务器端截获相应请求交给:
org.springframework.remoting.caucho.HessianServiceExporter
具体处理步骤如下:
a) HessianServiceExporter 类
(HessianExporter) invoke(request.getInputStream(), response.getOutputStream());
b) HessianExporter 类
(Hessian2SkeletonInvoker) this.skeletonInvoker.invoke(inputStream, outputStream);
c) Hessian2SkeletonInvoker 类
将输入输出封转化为转化为 Hessian 特有的 Hessian2Input 和 Hessian2Output
Hessian2Input in = new Hessian2Input(isToUse);
in.setSerializerFactory(this.serializerFactory);
AbstractHessianOutput out = null;
int major = in.read();
int minor = in.read();
out = new Hessian2Output(osToUse);
out = new HessianOutput(osToUse);
out.setSerializerFactory(this.serializerFactory);
(HessianSkeleton) this.skeleton.invoke(in, out);
d) HessianSkeleton 类
读取方法名
String methodName = in.readMethod();
Method method = getMethod(methodName);
读取方法参数
Class []args = method.getParameterTypes();
Object []values = new Object[args.length];
执行相应方法并取得结果
result = method.invoke(service, values);
结果写入到输出流
out.writeObject(result);
总结: 由上面源码分析可知,客户端发起请求和服务器端接收处理请求都是通过 hessian 自己的 API 。输入输出流都要封装为 hessian 自己的 Hessian2Input 和 Hessian2Output ,接下来一节我们将去了解 hessian 自己封装的输入输出到底做了些什么!
六. Hessian 的序列化和反序列化实现
hessian 源码中 com.caucho.hessian.io 这个包是 hessian 实现序列化与反序列化的核心包。其中AbstractSerializerFactory , AbstractHessianOutput , AbstractSerializer , AbstractHessianInput ,AbstractDeserializer 是 hessian 实现序列化和反序列化的核心结构代码。
1. AbstractSerializerFactory ,它有 2 个抽象方法:
根据类来决定用哪种序列化工具类
abstract public Serializer getSerializer(Class cl) throws HessianProtocolException;
根据类来决定用哪种反序列化工具类
abstract public Deserializer getDeserializer(Class cl) throws HessianProtocolException;
2. SerializerFactory 继承 AbstractSerializerFactory 。
在 SerializerFactory 有很多静态 map 用来存放类与序列化和反序列化工具类的映射,这样如果已经用过的序列化工具就可以直接拿出来用,不必再重新实例化工具类。
在 SerializerFactory 中,实现了抽象类的 getSerializer 方法,根据不同的需要被序列化的类来获得不同的序列化工具,一共有 17 种序列化工具, hessian 为不同的类型的 java 对象实现了不同的序列化工具,默认的序列化工具是 JavaSerializer 。
在 SerializerFactory 中,也实现了抽象类的 getDeserializer 方法,根据不同的需要被反序列化的类来获得不同的反序列化工具,默认的反序列化工具类是 JavaDeserializer 。
3. HessianOutput 继承 AbstractHessianOutput 成为序列化输出流的一种实现。
它会实现很多方法,用来做流输出。
需要注意的是方法,它会先调用 serializerFactory 根据类来获得 serializer 序列化工具类
public void writeObject(Object object)
throws IOException
{
if (object == null) {
writeNull();
return;
}
Serializer serializer;
serializer = _serializerFactory.getSerializer(object.getClass());
serializer.writeObject(object, this);
}
4. 现在我们来看看 AbstractSerializer 。
其 writeObject 是必须在子类实现的方法, AbstractSerializer 有 17 种子类实现, hessian 根据不同的java 对象类型来实现了不同的序列化工具类,其中默认的是 JavaSerializer 。
而 JavaSerializer 的 writeObject 方法的实现,遍历 java 对象的数据成员,根据数据成员的类型来获得各自的 FieldSerializer ,一共有 6 中默认的 FieldSerializer 。
拿默认的 FieldSerializer 举例,还是调用 AbstractHessianOutput 的子类来 writeObject ,这个时候,肯定能找到相应的 Serializer 来做序列化
同理可以反推出 hessian 的反序列化机制。 SerializerFactory 可以根据需要被反序列化的类来获得反序列化工具类来做反序列化操作。
总结:得益于 hessian 序列号和反序列化的实现机制, hessian 序列化的速度很快,而且序列化后的字节数也较其他技术少。
相关推荐
例如,在机器学习中,距离函数的性质对于流形学习和模式识别等任务具有重要意义。 整体而言,本文通过严谨的数学推导和理论分析,揭示了空间形式中距离函数Hessian的内在规律,为黎曼流形上函数性质的研究提供了新...
1. 历史趋势:文档提到了深度学习的历史趋势,包括神经网络的名称和命运的变迁,数据量的增加,模型规模的扩大以及精度、复杂度的提升和对现实世界的冲击。 2. 线性代数:这一部分深入探讨了深度学习的数学基础,...
分工不当,没有充分认识到算法和硬件调试的关联性;以及学习方法的局限,未能快速适应项目需求。为了改进,团队需要增强硬件和软件的综合能力,改进协作方式,并采用更有效的学习策略以应对类似挑战。
本文旨在通过MATLAB这一强大的计算工具来解决数学建模中的优化问题,并力求做到通俗易懂,便于学习。 #### 二、优化的基本概念 根据数学理论定义,优化是指在一定的约束条件下寻找目标函数的最大值或最小值。这一...
在本篇文章中,我们将深入探讨北京理工大学2017-2018学年第二学期...通过对该期末试题的解答,学生能够巩固和深化对多元函数性质、积分计算、几何应用以及最优化问题的认识,为后续学习和科研工作奠定坚实的数学基础。
徐伟杰是一名正在求职的后端开发实习生,他的教育背景包括本科阶段在西安文理学院学习计算机科学与技术,以及研究生阶段在福州大学攻读计算机应用技术。在技能方面,他展现出扎实的数据结构与算法基础,对网络、操作...
通过阅读和修改这些代码,学习者可以提升自己的编程能力,同时对最优化理论有更直观的认识。 在实际应用中,最优化方法常用于机器学习的模型训练,比如神经网络的权重调整。在数据科学中,最优化被用来寻找最佳拟合...
【Dubbo简单测试DEMO详解】 Dubbo,作为阿里巴巴开源的一款高性能、轻量级的Java服务治理框架,它提供了一套完整...通过实践这个DEMO,初学者能对Dubbo有更直观的认识,并为进一步深入学习和应用Dubbo打下坚实的基础。
这表明了研究者对人工智能和机器学习领域的发展潜力有深刻的认识。 这篇文章的核心内容在于介绍了基于神经网络的数值反演方法,这种方法不仅效率高,而且通过二阶信息的应用大幅减少了计算量,这对于当时的计算技术...
毕达哥拉斯式模糊集(Pythagorean Fuzzy Set, PFS)是一种改进的模糊集概念,它允许模糊性参数的和大于1,这一特性为模型提供了更大的灵活性。 为有效训练PFDDAE模型,本文提出了一种结合Hessian-free(HF)优化和...
1. **定义**:非线性规划涉及到在一组约束条件下,寻找一个或多个变量的最优值,使得目标函数达到最大或最小,而目标函数和/或约束条件是非线性的。 2. **模型构成**:非线性规划模型通常由三部分组成:决策变量、...
直接法主要包括梯度法、拟牛顿法、共轭梯度法等,这些方法通常用于解决连续优化问题,特别是那些有解析梯度或Hessian矩阵的问题。间接法则包括遗传算法、模拟退火、粒子群优化等,适用于全局优化和无导数优化问题。 ...
RPC(Remote Procedure Call)远程过程调用机制是Dubbo的核心,了解RMI(Java远程方法调用)、Hessian、Thrift、WebService等RPC框架将有助于我们更好地理解Dubbo的工作原理。 Dubbo源码分析首先从源码阅读路径开始...
人类对物体的识别是通过学习和经验获得的,人类一生下来就开始通过视觉获取世间万物的信息,包括一种物体形状、颜色、成分等,以及通过学习认识到这种物体的其他信息比如物理的、化学的特性,这些信息是不能通过观察...
为了更具体地了解主-对偶内点法,我们首先需要认识几个关键概念:对偶性、障碍函数法和内点法。 对偶性(Duality)是凸优化领域中的一个核心概念,它允许我们将一个原始问题转化为另一个形式,即对偶问题。这种转换...
1. 图像基础知识:首先,文档可能会介绍图像的基本概念,包括图像的类型(如位图和矢量图)、色彩模式(如RGB、CMYK和灰度)、分辨率和像素。 2. 图像表示与存储:讨论图像如何在计算机中表示,如像素阵列模型,...