AVRO介绍及同其他序列化系统的比较 - guibin - ITeye博客

`

guibin

浏览: 367522 次
性别:
来自: 北京

最近访客更多访客>>

zhang_sun

yflwz

leizeonban

快了的男孩

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

cywhfe：看完了关于quickfixj的文章，国内最服这一系列。lz高人 ...
QuickFix/J 源代码研究（三）
leonana：你好，这篇文档记录了很多实用的场景，非常有价值。（但显然有些相 ...
GIT基本概念和用法总结
wujyou：太感谢了，刚好和我的问题完全一样
在MAC上查找和设置$JAVA_HOME
huangfq：总结的不错，但是我看到后面有点晕
GIT基本概念和用法总结
LIPENGYU：有错误。JAVA_HOME=`/usr/libexec/jav ...
在MAC上查找和设置$JAVA_HOME

AVRO介绍及同其他序列化系统的比较

博客分类：

AVRO

Apache 数据结构 Hadoop Gmail Google

阅读更多

AVRO介绍及同其他序列化系统的比较
guibin.beijing@gmail.com

AVRO是用来将数据序列化的系统，是apache hadoop的子项目，详情请参考官方网址http://avro.apache.org

AVRO介绍（翻译自http://avro.apache.org/docs/current）

avro是一个数据序列化系统。它提供了

富数据结构
紧凑的、快捷的二进制数据格式
用于存储持久化数据的容器文件
提供了远程过程调用(Remote procedure call-PRC)
与动态语言简便的集成。读、写数据文件或者实现PRC协议都不需要生成代码。代码生成仅仅是一个用于优化的可选项，仅仅是为了静态类型语言而实现。

AVRO和其他序列化系统的比较（翻译自http://avro.apache.org/docs/current）

Avro提供了和Thrift, Protocol Buffers序列化系统相类似的功能。

动态类型：Avro并不强制要求提前生成解析代码，而采取将数据和定义数据的schema同时存放的方式避免了使用提前生成的解析代码和静态类型定义等。这种便利性有利于构建通用数据处理系统和处理语言。
未打标签的数据：由于在读取数据时能够同时访问到该数据的schema，因此只需要将相当少的类型信息编码到数据中，结果就使得序列化之后的数据体积变得更小。
不存在手动分配的域ID：当schema改变之后，在处理相关数据时可以同时访问新老schema，因此新老数据的差异可以通过数据域的名字（field name）很容易的解决。

1
顶

1
踩

分享到：

AVRO1.4.1规范－Schema的定义和声明 | GIT基本概念和用法总结

2011-05-01 10:26
浏览 2545
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Avro数据序列化系统(1): Avro是Apache Hadoop项目的一部分，它是一种高效的数据序列化系统，被广泛应用于大数据处理和分布式计算领域。作为Hadoop开发基础知识的重要组成部分，理解并掌握Avro对于开发高效率、可扩展的分布式应用至关重要。 ...

avro序列化: Avro是由Hadoop团队设计的一种数据序列化系统，它主要服务于分布式计算环境。Avro的数据模型非常灵活，支持动态类型，这意味着在编写代码时无需预先定义数据结构，可以在运行时解析数据。此外，Avro使用JSON格式来...

几种序列化的实现方法 java自带, Writable, Avro: 在Java和其他编程语言中，有多种序列化实现方法，包括Java自带的序列化、Writable接口（常见于Hadoop生态系统）以及Avro。下面将详细介绍这三种序列化方式。 1. **Java自带的序列化** Java内置的序列化机制是通过...

Avro 1.8.2 序列化规范: 从提供的部分内容来看，文档主要介绍了Avro序列化的几个关键方面： #### Schema Declaration（模式声明） - **PrimitiveTypes（基本类型）**：包括null、boolean、int、long、float、double、bytes、string等，其中...

protobuf/thrift/avro-序列化性能测试工程: protobuf（Protocol Buffers）、thrift和avro是三种广泛使用的序列化框架，它们在分布式系统、网络通信以及数据存储中扮演着重要角色。这个名为"protobuf/thrift/avro-序列化性能测试工程"的项目专注于对比这三种...

Hadoop大数据零基础实战培训教程- Avro数据序列化系统(1): Hadoop是什么，为什么要学习Hadoop? Hadoop是一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，...此外，Hadoop 依赖于社区服务器，因此它的成本比较低，任何人都可以使用。

python-avro-json-serializer, 使用AVRO模式将数据序列化为JSON格式.zip: python-avro-json-serializer, 使用AVRO模式将数据序列化为JSON格式 python Avro JSON序列化程序 AvroJsonSerializer 使用AVRO模式将数据序列化为JSON格式。为什么我们需要序列化程序而不只是转到 JSON？验证数据与...

Hadoop大数据零基础实战培训教程_Avro数据序列化系统.rar: Hadoop是一个分布式系统基础架构，由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统（Hadoop Distributed File ...

avro4s：Scala的Avro模式生成和序列化反序列化: Avro4s是用Scala编写的用于的模式/类生成以及序列化/反序列化库。目的是允许与Scala无缝使用，而无需自己编写样板转换，也不需要反射的运行时开销。因此，这是一个基于宏的库，并在编译时生成用于Avro的代码。该...

Java序列化_Java序列化结构_: 序列化在许多场景下都非常有用，比如在分布式系统中传输对象、保存对象到磁盘或数据库中，以及实现对象的持久化状态。 Java中的序列化主要通过实现`java.io.Serializable`接口来完成。虽然这个接口没有任何方法，...

Hadoop 2.0 生态系统第三章序列化Avro1: Hadoop 2.0 生态系统第三章序列化Avro1

Hadoop 2.0 生态系统第三章序列化Avro2: Hadoop 2.0 生态系统第三章序列化Avro2

序列化与反序列化Demo: 此外，Java还提供了其他的序列化库，如Google的Protocol Buffers、Facebook的Thrift和Apache的Avro，它们提供了更高效、跨语言的序列化解决方案。总结一下，序列化与反序列化是编程中必不可少的技术，它们用于数据...

java serializable 序列化与反序列化: Java的序列化与反序列化是Java开发中的一项重要...在实际应用中，要根据具体需求来选择合适的序列化库，如Google的Protocol Buffers、Facebook的Thrift或Apache Avro等，它们提供了更高效、更灵活的序列化解决方案。

序列化与反序列化经典例子: 可以使用特定的序列化库，如Google的Protocol Buffers或Apache Avro，它们提供更高效的数据编码。 4. **自定义序列化**：有时，我们可能希望对序列化过程有更精细的控制，比如忽略某些字段或使用特定的序列化策略。...

avro_sample.rar: 描述中提到"avro序列化数据C++代码"，这意味着这个压缩包包含的是用C++实现的Avro数据序列化代码。使用Visual Studio 2017可以直接打开项目，意味着这些代码是为Windows平台编写的，并且已经过测试，确认可以正常...

avro linux C++动态库: 总之，Avro Linux C++动态库为开发者提供了在C++中方便地使用Avro序列化和反序列化的功能，便于在跨语言、跨平台的环境中实现高效、灵活的数据交换。正确配置和使用这些库，可以帮助开发人员实现复杂的数据处理任务...

apache avro 简介: Apache Avro是Hadoop生态系统中的一个关键组件，它是一个数据序列化系统，旨在提供高效的、易于使用的数据交换格式。Avro的数据模型与JSON类似，但更加强大且适合大规模数据处理。它的设计目标是简化分布式应用程序...

对象的序列化和反序列化: 除此之外，还有其他的序列化库和框架，比如Google的Protocol Buffers、Apache Avro和JSON序列化库Jackson等。这些库提供了更高效、更灵活的序列化方案，支持不同的数据格式，且通常具有更好的性能和可扩展性。总之...

Global site tag (gtag.js) - Google Analytics