`

(转)Protocol Buffers概览-中译

阅读更多

开发向导

欢迎来到protocol buffers的开发者文档,protocol buffers是语言中立,平台中立,易于扩展的结构化数据序列化方法,它可以用在通讯协议,数据存储等方面。

这份文档的目标读者是试图在应用中使用protocol buffers的Java, C++或者Pytho开发者。这份概览告诉你如何开始-然后你可以去教程或者深入到protocol buffer编码API参考文档同样以三种语言提供,包括编写.proto文件的编程语言代码风格指导。

什么是protocol buffers?

Protocol buffers是一种可伸缩,高效的,自动化的结构化数据序列化机制,它比较像XML但是更小,更快,更简单。定义好你的数据结构,然后你就可以使用生成的特殊的源代码读写你的结构化数据,数据来源可以是各种数据流,也可以使用各种编程语言。你甚至可以在不破坏使用旧格式编译并已经部署的程序的情况下更新数据结构。

他们如何工作的?

通过在.proto文件中定义protocol buffer消息类型,说明需要被序列化的信息需要保持什么样的结构。一个protocol buffer消息是一小片信息的逻辑记录,包含一系列的名称-值对。这里是一个非常基础的例子,他定义了包含个人信息的消息:

message Person {
required string name = 1;
required int32 id = 2;
optional string email = 3;

enum PhoneType {
MOBILE = 0;
HOME = 1;
WORK = 2;
}

message PhoneNumber {
required string number = 1;
optional PhoneType type = 2 [default = HOME];
}

repeated PhoneNumber phone = 4;
}

可以看到,消息格式很简单 - 每个消息有一个或多个编号的字段,每个字段有一个名字和一个类型,类型可以是数字(整形或浮点),布尔,字符串,原生字节或是其他protocol buffer消息类型(如上例)。你可以指明可选字段,必选字段和重复字段。关于编写.proto文件的更多信息请见Protocol Buffer语言指导

定义好消息后,就可以运行针对你的程序语言的protocol buffer编译器来编译.proto文件。这些类对每个字段提供简单存取器(例如query()和set_query())和序列化整个结构到原生字节或从原生字节解析结构的方法的。然后你可以在程序中用这个Persion类生成,序列化或者从protocl buffer消息中取得Person对象。你可能写这样的代码来操作:

Person person;
person
.set_name("John Doe");
person
.set_id(1234);
person
.set_email("jdoe@example.com");
fstream output
("myfile", ios::out| ios::binary);
person
.SerializeToOstream(&output);

然后你可以马上读回消息:

fstream input("myfile", ios::in| ios::binary);
Person person;
person
.ParseFromIstream(&input);
cout
<<"Name: "<< person.name()<< endl;
cout
<<"E-mail: "<< person.email()<< endl;

你可以在消息中添加新的字段而不破坏向后的兼容性。老的程序在解析时简单的忽略新字段。所以如果你使用protocol buffers作为你的通讯协议的数据格式,你可以扩展你的协议而不用担心破坏既有的代码。

你可以在API参考找到使用生成的protocol buffer代码的完整的参考,在Protocol Buffer编码有更多关于protocol buffer消息如何编码的信息。

Why not just use XML?干嘛不直接用XML?

相较于XML,Protocol buffers在序列化结构化数据方面有许多优点。它:

  • 更简单
  • 3至10倍小
  • 快20-100倍
  • 更少的模糊性
  • 对编程来讲,生成数据访问类更容易使用。

比如说,你想建模一个person,它有name和email。如果用XML,你需要写:

  <person>
<name>John Doename>
<email>jdoe@example.comemail>
person>

然而对应的protocol buffer消息( protocol buffer 文本格式)是这样:

# Textual representation of a protocol buffer.
# This is *not* the binary format used on the wire.
person {
name: "John Doe"
email: "jdoe@example.com"
}

当这个消息被编码为二进制格式(文本格式)后,可能只有28字节长,并且解析只需要大约100-200纳秒。XML的版本至少69字节不包括空格,需要花费5,000-10,000纳秒解析。

Also, manipulating a protocol buffer is much easier:同样,操作protocol buffer也容易得多:

  cout <<"Name: "<< person.name()<< endl;
  cout
<<"E-mail: "<< person.email()<< endl;

而用XML你得这样写:

  cout <<"Name: "
       
<< person.getElementsByTagName("name")->item(0)->innerText()
       
<< endl;
  cout
<<"E-mail: "
       
<< person.getElementsByTagName("email")->item(0)->innerText()
       
<< endl;

然而,protocol buffers并不总是比XML好 - 例如,protocol buffers就不适合建模基于文本的有标记文档(如HTML),因为你很难在文字中插入结构信息。另外,XML是可读的并且易于手工编辑的;protocol buffers,至少在原生格式上不是这样。XML还是(某种程度上)自描述的。而protocol buffer仅仅在你有关于它的定义文件(.proto文件)的时候才有意义。

听起来对我有用!我怎么开始用它?

下载软件包 - 它包含了Java, Python, C++的protocol buffers编译器的所有源代码,还有用于I/O和测试的类。构建和安装它的方法请参见附带的README。

这些准备好以后,你就可以试试看针对你使用的编程语言的教程,它将带你一步一步创建一个使用protocol buffers的简单应用。

一点历史

Protocol buffers最初是在Google开发出来处理一个索引服务器的request/response协议的。在protocol buffers以前,有一个手动marshalling/unmarshalling请求/响应的处理格式,结果是看起来非常丑陋的代码,就像:

if(version ==3){
   
...
 
}elseif(version >4){
   
if(version ==5){
     
...
   
}
   
...
 
}

显式的格式化的协议也会把新版本协议的发布搞的很复杂,因为开发者必须保证在请求发起者和实际处理者这两端启用新协议之前,它们之间的所有的服务器,都必须理解新版本的协议。

Protocol buffers被设计来解决许多这样的问题:

  • 新的字段可以很容易被引入,不需要检查新增数据的中间服务器可以像之前一样解析原有数据并一起传输他们,不需要知道新的字段。
  • 格式是自描述的,可以被广泛的编程语言处理(C++, Java, 等)

然而,用户仍然需要手写他们自己的解析代码。

随着系统的进化,它已经有了一些其他特性和用途:

  • 自动生成的序列化和反序列化代码,用户可以不用手工编写解析代码了。
  • 除了被用作短期的RPC(远程过程调用)请求,人们开始用protocol buffers作为一种便利的自描述格式来持久化存储数据(比如Bigtable)。
  • 服务器的RPC接口开始声明成为protocol文件的一个部分,还有protocol编译器生成的类,用户可以用实际的实现重写他们。

Protocol buffers现在是Google交流数据的主要交际语 - 撰写本文时,Google的代码树中有12,183个.proto文件,包含有48,162个不同的消息类型定义。它们被用在RPC系统和各种存储系统的数据的持久化的存储。

分享到:
评论

相关推荐

    Protocol Buffers概览

    Protocol Buffers是由Google开发的一种高效、灵活的数据序列化机制,旨在替代XML和其他传统序列化方式。Protocol Buffers允许用户定义数据结构,然后自动生成特定编程语言的源代码,以便轻松地序列化和反序列化数据...

    Protocol_Buffer官网文档中文版

    2. **编译Protocol Buffers文件** - 使用编译器生成Java源代码。 3. **Protocol Buffer API使用** - **枚举和嵌套类**:处理枚举类型和嵌套消息。 - **Builders对Messages**:构建消息对象。 - **标准的Message...

    netty 官方文档

    - **Google Protocol Buffers 集成:**支持 Protocol Buffers 数据格式,适用于需要序列化的场景。 #### 四、Netty 解决的问题 1. **传统协议库的局限性:**通常情况下,通用的协议库无法很好地满足特殊场景下的...

    scala-protobuf-docs:解释如何在Scala中使用协议缓冲区和gRPC的文档

    标题"scala-protobuf-docs:解释如何在Scala中使用协议缓冲区和gRPC的文档"表明,这是一个关于在Scala编程环境中利用Protocol Buffers(简称Protobuf)以及gRPC框架的文档集合。Protocol Buffers是Google开发的一种...

    .新浪微博.构建高性能的微博系统

    此外,Google还推荐在公共API中使用Protocol Buffers,以提高传输效率。 #### 性能优化实践 - **缓存策略**:合理的缓存策略可以显著降低数据库的负担。例如,通过一致性哈希算法实现分布式缓存的负载均衡。 - **...

    caffe 官方教程 中文版

    ### Caffe 官方教程中文版知识点概览 #### 前言 Caffe是一款高效且灵活的深度学习框架,广泛应用于计算机视觉、自然语言处理等领域。本篇文档旨在为中文用户详细介绍Caffe的核心概念、架构设计以及使用方法,帮助...

    PPT caffe by Jia Yangqing

    ### PPT caffe by Jia ...此外,通过使用 Protocol Buffers 定义网络结构,Caffe 还能够轻松地扩展和维护网络模型。对于研究人员和开发者而言,Caffe 不仅是一款强大的工具,也是深入理解深度学习算法的重要途径之一。

    netty3.1中文用户手册.pdf

    - **Google Protocol Buffers整合**:讨论了Netty如何与Google Protocol Buffers结合使用,以实现高效的序列化和反序列化。 - **总述**:总结了本章中介绍的主要内容,为读者提供了一个关于Netty架构的全面理解。 ...

    netty-3.2.5终极手册

    - **Google Protocol Buffers集成**:支持与Google Protocol Buffers的集成,提高数据交换的效率。 #### 五、总结 Netty 3.2.5作为一款成熟的网络编程框架,不仅提供了丰富的功能,还具备出色的性能和稳定性。无论...

    Hadoop权威指南

    - **序列化**:提供了多种序列化方式,如Writables和Protocol Buffers,便于在网络上传输对象。 - **基于文件的数据结构**:介绍了适合于Hadoop处理的大规模数据结构设计。 #### 五、MapReduce应用开发 - **配置与...

    RCF 远程调用框架

    - **Protocol Buffers**:使用 Google 的 Protocol Buffers 进行高效序列化。 - **JSON-RPC**:基于 JSON 的远程过程调用协议。 #### 四、总结 RCF 作为一个全面而强大的远程调用框架,不仅提供了基本的远程过程...

    编程框架(1).pdf

    - gRPC原理解析:讲述gRPC的原理,包括其基于HTTP/2和Protocol Buffers的设计理念。 7. Dubbo: - Dubbo是什么及能做什么:介绍Dubbo的定义、功能以及为什么要在项目中使用它。 - Dubbo面试题:提供针对Dubbo...

    hackpra.Burp技巧大全Nicolas_Gregoire

    - Protobuf解码:对于使用Google Protocol Buffers编码的消息,可以使用专门的扩展程序`burp-protobuf-decoder`进行解码,前提是提供一个`.proto`文件作为参考。 #### 五、GUI导航 - **上下文相关的按钮**:Burp ...

    Netty教程用户手册

    - **2.4.4 Google Protocol Buffer集成**:支持Google Protocol Buffers,便于序列化复杂数据结构。 - **2.5 总结**:概括本章的核心概念和技术要点。 通过以上内容的学习,开发者可以掌握Netty的基本原理和实际...

    Hadoop MapReduce v2 Cookbook, 2nd Edition-Packt Publishing(2015) 高清完整版PDF下载

    - **压缩与序列化**:通过对数据进行压缩和选择高效的序列化库(如Avro或Protocol Buffers),可以显著提高数据传输效率。 - **本地性优化**:通过优化数据读取的本地性,减少网络延迟对性能的影响。 #### 五、案例...

    google protobuf C教程

    Google Protobuf(Protocol Buffers)是一种高效、灵活的数据序列化机制,由Google开发,用于结构化数据的序列化。它类似于XML、JSON等数据格式,但更小、更快、更简单。Protobuf提供了语言中立、平台中立的接口,...

    Netty 3.2 用户手册

    Netty框架能够有效地支持多种协议,包括但不限于HTTP、WebSocket、SSL/TLS和Google Protocol Buffers等。由于它的设计允许开发者在不牺牲性能和稳定性的情况下,轻松地实现这些协议,因此它在需要处理大数据量、高...

    netty参考文档

    - **Google Protocol Buffers 集成**:支持高效的数据交换格式。 #### 三、入门示例详解 1. **丢弃服务**(Writing a Discard Server):演示如何创建一个简单的 TCP 服务器,接收客户端连接但不处理任何数据。 2...

    prodbg-third-party:ProDBG 使用的第三方库

    3. 数据解析与序列化库:ProDBG在读取和写入调试信息时,可能会用到如JSON for Modern C++ (nlohmann/json)或者Protocol Buffers等库。nlohmann/json是轻量级的C++11库,使得JSON解析和生成变得简单。Protocol ...

Global site tag (gtag.js) - Google Analytics