`
wbj0110
  • 浏览: 1618004 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

Java跨语言调用实现方案(转)

阅读更多

背景:

在大型分布式 java 应用中,为了方便开发者,通常底层的 rpc 框架都会做一些调用的封装,让应用层开发人员在开发服务的时候只用编写简单 的 pojo 对象就可以了,如流行的 spring remoting , jboss remoting 等等,都有这样的效果。

随着业务的需要,可能上层应用希望采用非 java 技术,如 php , ruby on rails ,而由于 java gc 和内存模型的限制,可能有的底层服务又需要采用更高性能和更加灵活的技术,如果 c++ , python 等。

这时候就会考虑跨语言的问题了,在如何不改动原有 pojo 实现的 rpc 框架,而让系统实现跨语言,这个难题摆在了中间件开发者的头上。

问题 :

现在我们不妨把上面说涉及的问题提取出来:

1)  不能改变原有的 java rpc 服务的发布方式,仍然采用 pojo 。

2)  上层非 java 应用可以调用到由 server 端 pojo 形式发布的服务。

3)  底层非 java 应用,如 c++ , python 等可以发布格式和 pojo service 一样的服务

4)  提供优雅的借口给应用开发者。

业界考察:

好在我们并不是第一个遇到这个问题的人,那我们来看看在我们业界的前辈们都给我们留下了哪些宝贵的财富(主要是互联网行业)。

Google protocol buffers Google 大神 总是早人一步,在 google 架构的初期就意识到了跨语言的重要性,在构建 bigtable , GFS 的同一时期就是定制出了一套跨语言方案。 那就是 google protocol buffers ,不过直到 08 年, google protocl buffers 才开源出来,正所谓国之利器不可以示人,我们所看到的, google protocl buffers 其实是阉割版,如没有 map 的支持 ( 根据一些资料表明, google 内部是有这个东西 的) , python 的 native c 性能优化,不包括 rpc service ,虽然后面补了一个,但是可用性差强人意,不能多参,不能抛异常。不过在这方面我们确实不应该报太大的希望,因为 google 自己都 说了 protocol buffers – a language-neutral, platform-neutral, extensible way of serializing structured data ,好吧,他只是一个序列化格式,而和 hessian , java 序列化有所不同的是, protocol buffers 可以用通过定义好数据结构的 proto ( IDL )文件产生目标语言代码,大大了减少了开发量,不过遗憾的是生成的代码有很强的侵 入性,并不能产生我们需要的pojo java 对象。

不过即使是这样,我们也从 google  protocol buffers 身上学到了很多东西。

  1. 编码的压缩,采用 Base 128 Varints 序列化数字,减少网络传输开销。
  2. 非自描述数据, protocol buffers 将每个数据结构的描述信息嵌入到代码中,因此只需要传输数据过来,就可以反序列化出来该数据结构的实例了。
  3. Immutable object , protocol buffers 在生成的 java 代码中采用 builder&message 模式, message 是一个不能变的对象,即只有 getter ,没有 setter ,而每一个 message 的生成由一个对应的 builder 来完成,从这点可以看出, google 已经 用上了函数式编程。
  4. Rpc 异步话,虽然 protocol buffers 的 rpc 很简陋,但是一开始就只提供异步 callback 调用形式,可见 google 已经实现异步话,如果在互联网行业的人会知道,这点是相当不容易。

Facebook thrift 4 月 1 号,呵呵,没 错, thrift 是 Facebook 于 07 年愚人节开源出来的,有点 google 的作风。 Thrift 是facebook 自己的一 套跨语言实现。有人会问这个和 protocol buffers 有啥区别。 Ok ,先看看它的定义吧。

Thrift is a software framework for scalable cross-language services development. It combines a software stack with a code generation engine to build services that work efficiently and seamlessly between C++, Java, Python, PHP, Ruby, Erlang, Perl, Haskell, C#, Cocoa, Smalltalk, and OCaml.

说得很清楚是一个跨语言的服务开发框架。包括的功能有 code generation (代码生成, protocol buffers 也有), cross-language (跨语言, protocol buffers 也有), service development (好吧,这个 protocol buffers 也有)。晕倒,这样看起来,它和 google protocol buffers 完全是同一个领域的东西,而其有点重复发明轮子的味道。

刚开始,我们也有这样一个疑惑,好吧,接着往下看, here we go 。其实除了这些共同性以外(都是解决跨语言问题嘛), thrift 还是和protocol buffers 有很大不同的。不同点如下:

1)  提供一个完整的 service stack ,定义了一整套的 rpc 服务框架栈,这个 protocol buffers 是没有,这个绝对是 thrift 的利器,如果你想要开发一个服务, thrift 甚至有个栈层的实现,我靠,爽。

2)  Ok ,在 thrift 论文有这样一句话。 Thrift enforces a certain messaging structure when transporting data, but it is agnostic to the protocol encoding in use. 嗯哼,我懂了,它是不会管,你到底采用哪种序列化方式的,hessian ,xml 甚至是protocol buffers 。Oh ,my god 。

3)  接下来不得不膜拜一下thrift 的service 接口的强大了,多参,异常,同步,异步调用的支持,这正是我们想要的, 瞬间给protocol buffers 比下去了。

4)  多集合的支持 map , set 都有,让你爽歪歪。 Protocol buffers 颤抖吧。

这时候我们亲爱的读者就会问了,那我们的问题不就解决了吗,就是 thrift 。我笑而不语 , 虽然 thrift 是如此的强大,但是它仍然 不是我们想要的, thrift 生成的代码也是强侵入性的,这样 pojo 的对象是无法发布服务的。还有一个硬伤是虽 然 thrift 的 stack 很强大,当时这和我们原有系统的 stack 肯定是不兼容的,如 jboss remoting , spring remoting ,它们都会加一些 header 信息,而 thrift 已有实现的传输中式没有header 信息的。值得一提的是现有 的 thrift service 实现中,不是线程安全的,考虑到有些语言没有对线程很好的支持,尤其是 Facebook 最常用的 PHP 语言,所以现有的实现中没 有线程安全 Client 的实现。这样就会造成 client 端 connection 不能复用的问题,相当于短连接了。( ps :其实短连接就 真的比长连接性能差吗?这是个问题。)

总结一下从 Facebook thrift 学到的东西:

1)              同步,异步都支持,这个很强悍,一般的做法是对性能要求高的服务器端采用异步方式开发,对易用性有要求的客户端采用同步方式调用,是比较完美的。

2)              从现有的非线程安全的实现看, Facebook 很有可能自己有一套更高效的线程安全的实现,估计考虑到和 thrift 关系不到,或者是核心技术,所以没有放出来,其实想自己做,也不是太难。

3)              Thrift 对很多脚本语言都进行了 native c 的性能优化,如 python 端,采用 native c 以后性能提高 20 倍。 Protocol buffers 一直在做这方面的优化,打算在 2.4 中加入,不过 protocol buffers 就像 jdk 7 一样难产,跟让人崩溃的是,前不久在论坛爆出做这块优化的哥们已经离开了 google ,不再负责了,好吧,我关心的是他去哪儿了,泪奔。

Apache Hadoop avro Avro is a data serialization system. Avro provides functionality similar to systems such as Thrift, Protocol Buffers, etc. 好吧它自己都承认了,我们就不去纠结了。

简单介绍一下, avo 是 hadoop 项目下面用来传输数据的一个架构。也是一个跨语言解决方案。不过 avro 有自己的亮点。 1 , Dynamic typing, 2 , Untagged data , 3 , . No manually-assigned field Ids

眼前一亮, Dynamic typing , oh , my god 。没错, avro 通过将 metadata 放在一个叫 schema 的对象里面,然后可以序列化对应的 pojo兑现。这个正是我想要 的,至于其他的特性,的确没有咋仔细看 avro ,感觉上比 thrift ,和 protocol buffers 跟难学习,有熟悉的读者可以给我科普一下。

解决方案:

好了,到了这里,读者大概心里也有数了, protocol buffers , thrift , avro 都有我们想要的和我们不想要的。要解决我们的问题,我们只需要扬长避短就可以了。揉揉就是我们的东西了。方案如下:

1)  采用 protocol buffers 的 message 序列化格式和代码生成。

2)  采用 thrift 的 service 生成格式,以及实现兼容 jboss remoting 或者 spring remoting 的 thrift ( jboss remoting ) stack 。

3)  原有的 pojo 对象采用 avro 的 schema 方式序列化和反序列化该对象。

分享到:
评论

相关推荐

    java调用window操作系统文本转语音并生成播放文件

    在Java编程环境中,调用Windows操作系统来实现文本转语音(Text-to-Speech, TTS)并生成播放文件是一项常见的需求。这项技术可以帮助开发者为应用程序添加语音合成功能,尤其适用于无障碍应用、语音助手或者多媒体...

    c++,java跨语言通信

    在IT领域,跨语言通信是一项重要的技术,它...总之,C++与Java之间的跨语言通信涉及到多种技术和策略,需要根据实际需求和项目规模选择合适的方案。理解并熟练掌握这些技术,能帮助开发者构建高效、可靠的分布式系统。

    java通过jacob 实现调用windows自带控件 实现文字转语音播放功能!

    在其他操作系统上,可能需要寻找其他解决方案,如使用Java的`javax.speech`包或第三方跨平台库。 在实际应用中,你可能还需要处理更多细节,比如错误处理、支持多语言、调整语音质量等。`文字转语音demo.zip`文件...

    java调用c#样例

    C# DLL通常包含.NET Framework中的方法和功能,而Java应用程序可以借助Jacob库来访问这些功能,从而实现跨语言的互操作性。 描述中提到,这是一个利用Jacob库的示例程序,展示了如何从Java中调用C# DLL的简单方案。...

    Java调用C#的DLL实现方案.rar

    在IT行业中,跨语言通信是一项常见的任务,尤其是在大型系统中,不同组件可能由不同语言编写。本案例聚焦于如何在Java环境中调用C#编写的动态链接库(DLL)。这通常涉及到中间件技术或者特定的桥接机制。下面将详细...

    Linux下跨语言调用C++实践.docx

    为了实现跨语言调用,美团团队设计了一个协作架构,确保C++、Python与Java能够无缝衔接。其中的关键在于“胶水代码”(Glue Code),它是一种C语言封装层,用于将C++接口转换为C接口,因为Python和Java默认支持调用...

    java和C#间通讯跨语言预热课

    #### 五、案例分析:基于Netty实现Java与Unity(C#)的跨语言通信 1. **方案设计**: - **Java端**:使用Netty作为网络通信框架,实现服务器端逻辑。 - **Unity端**:作为客户端,使用WebSocket或其他网络库连接到...

    C#调用JAVA方法

    一种解决方案是使用IKVM.NET,这是一个开源项目,它实现了Java虚拟机(JVM)和Java类库的.NET框架版本。IKVM使得在.NET平台上运行Java代码成为可能,并且允许.NET应用程序调用Java库。 **IKVM.NET的安装与配置** 1....

    C#调用Java接口演示

    在IT行业中,跨语言通信是常见的需求,尤其是在大型企业级应用中。本示例主要探讨的是如何使用C#调用Java接口,实现不同编程语言之间的交互。C#和Java都是广泛应用的编程语言,它们各自拥有丰富的库和生态系统,但...

    xslt中调用java

    在XSLT(可扩展样式表语言转换)中调用Java是一种常见的技术,它允许开发者利用XSLT处理XML文档时,与Java代码进行交互,从而实现更复杂的逻辑和功能。这种结合使得XSLT不仅可以进行简单的数据转换,还能执行更强大...

    Java通过JNA调用系统API

    Java是一种跨平台的编程语言,但在某些情况下,我们需要与操作系统底层进行交互,比如访问特定的系统功能或硬件设备。在这种场景下,Java Native Access (JNA) 库为我们提供了一个无需编写C语言桥接代码就能调用系统...

    C#调用java类、jar包方法

    此外,性能和稳定性可能受到跨语言调用的影响,因此在生产环境中评估这些因素是至关重要的。 总结,通过IKVM.NET,C#可以方便地调用Java类和使用Java的jar包,实现跨语言的互操作。这对于整合现有Java库或利用特定...

    java实例,通过jawin实现对dll中方法的调用

    总之,"java通过jawin调用dll实例"是Java跨平台能力的一个体现,它展示了Java如何借助第三方库与操作系统底层进行有效沟通,这对于那些需要在Java应用中集成特定本地功能的开发者来说是非常有价值的。通过学习和实践...

    java C#相互调用的全新方式

    在IT行业中,跨平台、跨语言的交互是一个常见的需求,比如Java和C#这两种不同的编程语言之间进行调用。本文将深入探讨“Java与C#相互调用的全新方式”,结合给定的标签“源码”和“工具”,我们将重点讨论如何通过...

    jcom java调用com+组件

    Java调用COM+组件是一种常见的跨语言交互技术,它允许Java应用程序利用已有的COM(Component Object Model)或COM+组件,这些组件通常是用其他语言如C++或Visual Basic编写的。这种技术对于整合遗留系统或者利用...

    使用java实现,通过zpl指令调用 zebra打印机打印标签,含二维码及中文

    Java作为一种广泛使用的开发语言,具有跨平台的优势,因此是实现这一功能的理想选择。 首先,理解ZPL指令至关重要。ZPL指令是基于文本的命令,用于定义打印内容的布局、样式和格式。例如,`^FO`代表“First Offset...

    java调用vc的dll

    使用JNI调用DLL虽然能实现跨语言交互,但会带来一定的性能开销,因为Java与C/C++之间的数据转换和函数调用都需要额外的时间。如果频繁调用,可能影响程序性能。 8. **替代方案** 除了JNI,还可以考虑其他技术,如...

    Java调用C#的DLL实现方案.docx

    在Java和C#之间进行跨语言交互时,有时我们需要调用C#编写的DLL库来利用特定的功能,例如本文档中的加密解码工具。这里提供了一种Java调用C#DLL的方法,主要涉及以下几个关键步骤: 1. **环境准备**: 首先,确保...

    Java应用程序和java Web调用Matlab配置实例

    通过阅读和理解这份文档,你应该能成功地在Java应用程序或Web应用中调用Matlab,实现跨技术栈的协同工作。 总的来说,Java调用Matlab是一个强大且实用的技术结合,它允许开发者充分利用Matlab的计算能力,同时借助...

Global site tag (gtag.js) - Google Analytics