本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
fantaxy025025 - johnsmith9th
- xiangjie88
- zysnba
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wy_19921005
- vipbooks
- benladeng5225
- e_e
- wallimn
- javashop
- ranbuijj
- fantaxy025025
- jickcai
- gengyun12
- zw7534313
- qepwqnp
- 解宜然
- ssydxa219
- zysnba
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- gaojingsong
- kaizi1992
- xpenxpen
- 龙儿筝
- jh108020
- wiseboyloves
- ganxueyun
- xyuma
- xiangjie88
- wangchen.ily
- Jameslyy
- luxurioust
- lemonhandsome
- mengjichen
- jbosscn
- zxq_2017
- lzyfn123
- nychen2000
- forestqqqq
- wjianwei666
- ajinn
- zhanjia
- siemens800
- Xeden
- hanbaohong
- java-007
- 喧嚣求静
- mwhgJava
最新文章列表
Schema Registry
https://docs.confluent.io/current/schema-registry/docs/index.html#
什么是Schema Registry?
Schema Registry 主要用于管理Avro的Schema. Schema不断的演变,Schema Registry可以把它的版本变化管理起来。同时它提供了一个Restful API接口,你可以通过这 ...
spark -外部数据源
1.在Spark1.2中提供了External DataSource API,开发者可以根据接口来实现自己的外部数据源,如avro, csv, json, parquet等等。
(1)spark自带的外部数据源
(2)其他开发者贡献的 https://spark-packages.org/
以avro为例,点击homepage,跳转到github网址:https://gi ...
跨语言通信方案的比较—Thrift、Protobuf和Avro
thrift由facebook出品,protobuffer由google出品;
下面对比一下这两个的区别。参考:http://zhidao.baidu.com/link?url=yNLBeHhWokfwB677UZHoyv4vLyPOZEEQypUMiX__YIhp5E7UmpvIWTArKPMab32xj5gkRo4a6CXoZ1nxore82kXyOzfXdaRRhOAPynxYmB7
1 ...
Java跨语言实现数据传递方案
一.背景
在大型分布式 java 应用中,为了方便开发者,通常底层的 rpc 框架都会做一些调用的封装,让应用层开发人员在开发服务的时候只用编写简单的 pojo 对象就可以了,如流行的 spring remoting , jboss remoting 等等,都有这样的效果。
随着业务的需要,可能上层应用希望采用非 java 技术,如 php , ruby o ...
serialization-Avro
感受最快的序列化和反序列化工具:Avro
参考阅读:
http://tech.meituan.com/serialization_vs_deserialization.html
官网:
http://avro.apache.org/docs/current/gettingstartedjava.html#Creating+users
代码结构图:
pmo 引入:
<dependency ...
二进制序列化格式对比
二进制序列化格式
序列化 (Serialization)将对象的状态信息转换为可以存储或传输的形式的过程。在大多数情况下,二进制序列化格式是不可读的,但它可以有效地压缩数据,这是对于缓存,进程间通信,消息代理等非常有用,选择好的二进制序列化格式对开发任务来说非常重要,可用于分布式系统间的通信和存储。让我们来看看这些格式的区别。BSONBSON(Binary Serialized Documen ...
RPC调用框架比较分析
什么是RPC:
RPC(Remote Procedure Call Protocol)——远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。
简言之,RPC使得程序能够像访问本地系统资源一样,去访问远端系统资源。
比较关键的一些方面包括,通讯协议,序列化,资源(接口)描述,服务框架,性能,语言支持等。
典型RPC调用框架:
RPC的实现和调用框架,五花八 ...
[实验]avro与non-avro的mapred例子-wordcount改写
avro非常适合用于hadoop。在开发的时候可能有这样的场景,输入的文件是non-avro的,输出的文件是avro的。这样就需要一个是非avro的mapper和一个avro的reducer。下面通过改写wordcount例子演示这个过程。
Mapper
public class WordCountMapper extends MapReduceBase implements
Mapper ...
[笔记]avro 介绍及官网例子
Apache Avro是一个独立于编程语言的数据序列化系统。旨在解决Hadoop中Writable类型的不足:缺乏语言的可移植性。其强调数据的自我描述,依赖于它的schema。即支持动态加载schema,动态映射;也支持代码生成的描述性映射。
官网的介绍:
引用Apache Avro™ is a data serialization system. Avro provides:
Rich data ...
轻量级开源RPC框架——avro-rpc性能测试
1:介绍
avro-rpc是一个支持多序列化方式的RPC框架,目前支持Avro,Protocol Buffers ,Json,Hessian,Java序列化方式。网络传输层使用Netty的NIO实现,协议层可扩展,用户可以自定义协议格式及注册新的序列化方式。
基本特点
1:跨语言,可作为跨语言系统之间的分布式服务框架。
2:简洁高效易扩展,代价简洁 ...
avro-rpc一个轻量级的开源的RPC框架,支持序列化方式有Avro,Json,Hessian,Java
avro-rpc http://code.google.com/p/avro-rpc/1.开发背景 公司的运营管理平台建立在J2EE平台之上,采用多层分布式的架构体系。分布式服务节点之间需要通讯和交互(业务节点和资源节点之间),服务端和客户端需要交互(终端客户端需要调用服务端的远程服务,客户端有C实现的,也有Java等其他语言实现的)。因此基础平台需要提供一个稳定、高效的、可伸缩的RPC服务性组 ...