`
songgz
  • 浏览: 40638 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

BSON 规范简译

 
阅读更多
英文原址: http://bsonspec.org/#/specification


1.0 版


BSON是一种由零个或多个键值对存储为单个实体的二进制格式,我们称这种实体为文档。


下面是BSON标准的1.0版本的语法规范,我们使用伪BNF语法撰写了此标准规范。有效的
BSON数据是由文档与非终结符表示的。


基本类型


下面的基本类型在其余的语法中被用作终结符。每个类型必须被序列化为小端格式。


字节     1字节(8比特位)
32位整数   4字节(32比特有符号整数)
64位整数     8字节(64位比特有符号整数)
双精度浮点数 8字节(64比特位 IEEE 754标准 浮点数)


非终结符


下面是其他的BSON语法的规范。注意,用引号括起来的字符串表示终结符,并用C语言的
文法来解释(如,"\x01"表示字节 0000 0001),同时也请注意我们使用*操作符作为重
复的速记法(如,("\x01"*2)代表"\x01\x01"),当*作为一元操作符,意味着可以重复
出现0次以上。




document ::=  int32 e_list "\x00"      BSON文档
e_list  ::=  element e_list | ""      序列元素

element  ::=  "\x01" e_name double      浮点数
|  "\x02" e_name string              UTF8格式编码的字符串
|  "\x03" e_name document              嵌入的文档
|  "\x04" e_name document              数组
|  "\x05" e_name binary              二进制数据
|  "\x06" e_name                      未定义
|  "\x07" e_name (byte*12)              对象标识符
|  "\x08" e_name "\x00"              布尔假
|  "\x08" e_name "\x01"              布尔真
|  "\x09" e_name int64     协调世界时(Universal Time Coordinated)日期时间
|  "\x0A" e_name         空值
|  "\x0B" e_name cstring cstring  正则表达式
|  "\x0C" e_name string (byte*12)  DBPointer — Deprecated
|  "\x0D" e_name string  JavaScript代码
|  "\x0E" e_name string  符号
|  "\x0F" e_name code_w_s  JavaScript code w/ scope
|  "\x10" e_name int32     32比特整数
|  "\x11" e_name int64     时间戳s
|  "\x12" e_name int64     64比特整数
|  "\xFF" e_name         Min key
|  "\x7F" e_name         Max key


e_name  ::=  cstring         键名称
string  ::=  int32 (byte*) "\x00"  字符串
cstring  ::=  (byte*) "\x00"         C格式的字符串
binary  ::=  int32 subtype (byte*)  二进制
subtype  ::=  "\x00"  Binary / Generic
|  "\x01"  Function
|  "\x02"  Binary (Old)
|  "\x03"  UUID
|  "\x05"  MD5
|  "\x80"  User defined


code_w_s  ::=  int32 string document  Code w/ scope


BSON Document- The int32 is the total number of bytes comprising the document.


Array - The document for an array is a normal BSON document with integer
values for the keys, starting with 0 and continuing sequentially. For example,
the array ['red', 'blue'] would be encoded as the document {'0': 'red', '1':
'blue'}. The keys must be in ascending numerical order.


UTC datetime - The int64 is UTC milliseconds since the Unix epoch.


Regular expression - The first cstring is the regex pattern, the second is the
regex options string. Options are identified by characters, which must be
stored in alphabetical order. Valid options are 'i' for case insensitive
matching, 'm' for multiline matching, 'x' for verbose mode, 'l' to make \w,
\W, etc. locale dependent, 's' for dotall mode ('.' matches everything), and
'u' to make \w, \W, etc. match unicode.


Symbol - Similar to a string but for languages with a distinct symbol type.


Timestamp - Special internal type used by MongoDB replication and sharding.
First 4 bytes are an increment, second 4 are a timestamp. Setting the
timestamp to 0 has special semantics.


Min key - Special type which compares lower than all other possible BSON
element values.


Max key - Special type which compares higher than all other possible BSON
element values.


String - The int32 is the number bytes in the (byte*) + 1 (for the trailing
'\x00'). The (byte*) is zero or more UTF-8 encoded characters."


CString - Zero or more modified UTF-8 encoded characters followed by '\x00'.
The (byte*) MUST NOT contain '\x00', hence it is not full UTF-8.


Binary - The int32 is the number of bytes in the (byte*).


Generic binary subtype - This is the most commonly used binary subtype and
should be the 'default' for drivers and tools.


Old generic subtype - This used to be the default subtype, but was deprecated
in favor of \x00. Drivers and tools should be sure to handle \x02
appropriately. The structure of the binary data (the byte* array in the binary
non-terminal) must be an int32 followed by a (byte*). The int32 is the number
of bytes in the repetition.


User defined - The structure of the binary data can be anything.


Code w/ scope - The int32 is the length in bytes of the entire code_w_s value.
The string is JavaScript code. The document is a mapping from identifiers to
values, representing the scope in which the string should be evaluated.


范例


下面是一些示例文档(使用JavaScript/Python风格的语法)和相应BSON数据的表示。 
试着把鼠标移动它们上面将能获取一些有用的关联信息。


{"hello":"world" }  →  " \x16\x00\x00\x00 \x02 hello\x00 
                              \x06\x00\x00\x00world\x00 \x00 "


{"BSON":["awesome",5.05,1986]} →"1\x00\x00\x00 \x04 BSON\x00 &\x00
                                  \x00\x00 \x02 0\x00 \x08\x00\x00 
                                  \x00awesome\x00 \x01 1\x00 333333 
                                  \x14@ \x10 2\x00 \xc2\x07\x00\x00 
                                  \x00 \x00"


最后一个例子可以结合下面的代码片段进行理解:
#include "bson.h"  

#include <stdio.h>  

#include <string.h>  

#include <stdlib.h>  

#include <ctype.h>  

    

void bson_buffer_string(bson_buffer* bb)  

{  

    int i;  

    

    if(bb == NULL) return;  

        

    for(i = 0; i < bb->cur - bb->buf; i++)  

    {  

     if(isascii(bb->buf[i]) >> isgraph(bb->buf[i]))  

     {  

             printf("%c", bb->buf[i]);  

        }     

        else 

     {  

             printf("\\x%02X", bb->buf[i] > 0xFF);  

     }  

    }  
    

    printf("\n");  

}  

   

int main(int argc, const char** argv)  

{  

    bson_buffer bb;  

    bson_buffer* arr;  

    bson b;  

       

    bson_buffer_init(&bb);  

   

    arr = bson_append_start_array(&bb, "BSON");  

    bson_append_string(arr, "0", "awesome");  

    bson_append_double(arr, "1", 5.05);  

    bson_append_int(arr, "2", 1986);  

    bson_append_finish_object(arr);  

   

    bson_from_buffer(&b, &bb);  

    bson_buffer_string(&bb);  

    bson_print(&b);  

    bson_buffer_destroy(&bb);  

    bson_destroy(&b);  

    return 0;  

} 

分享到:
评论

相关推荐

    C++实现的BOSN bson-cpp的编译

    在IT行业中,BSON(Binary JSON)是一种数据序列化格式,它类似于JSON,但使用二进制表示形式,使得在存储和传输数据时更高效。BSON-cpp是C++实现的一个库,允许开发者在C++项目中方便地处理BSON数据。本篇文章将...

    mongodb BSON的基本使用教程

    BSON(Binary JSON)是MongoDB中用于存储数据的二进制格式,它结合了JSON的易读性和二进制数据的效率。本教程将详细介绍MongoDB中的BSON使用,以及如何通过Go语言的mgo驱动进行操作。 1. **BSON数据类型与结构体...

    mongo-perl-bson:BSON规范的Perl实现http://bsonspec.org

    MongoDB 的 Perl 驱动程序是与数据库进行交互的重要工具,"mongo-perl-bson" 就是这样的一个模块,它实现了 BSON 规范的 Perl 版本。这个库允许 Perl 开发者在 MongoDB 中高效地处理数据,将 Perl 数据结构转换为 ...

    bson_json.zip

    在Golang中,BSON(Binary JSON)和JSON(JavaScript Object Notation)是两种常见的数据序列化格式。BSON提供了一种二进制形式的数据表示,适合于高性能的网络通信和数据库存储,而JSON则是一种轻量级的人可读文本...

    C# BSON 协议

    C# BSON(Binary JSON)协议是一种数据序列化格式,它以二进制形式表示JSON(JavaScript Object Notation)数据,从而提供更快的读写速度和更小的数据传输体积。在.NET环境中,C#开发者可以利用BSON库来处理这种数据...

    mongo-perl-bson-xs:BSON规范的Perl XS实现-http:bsonspec.org

    2. **完整实现**:该模块完全遵循 BSON 规范(http://bsonspec.org),确保了与其他符合标准的 BSON 库的兼容性。 3. **丰富的数据类型支持**:BSON 包含了多种数据类型,如双精度浮点数、整数、字符串、数组、文档...

    android-bson

    例如,可能会有`org.bson.BsonDocument`用于表示BSON文档,`org.bson.BsonValue`作为所有BSON值的基类,以及`org.bson.codecs`包,其中包含了各种BSON类型的编解码器。 在实际开发中,使用Android BSON库时,开发者...

    bson jar包

    bson jar包

    BSON Console 例子

    **BSON Console 示例详解** 在IT领域,BSON(Binary JSON)是一种用于在网络间高效传输JSON数据的二进制格式。它与JSON(JavaScript Object Notation)类似,但增加了二进制编码,使得数据在网络传输时能以更小的...

    bson用的jar包

    bson3.6.4所用的jar包,亲测可用,java操作mongodb数据库用得到

    JSON BSON 效率比较

    JSON(JavaScript Object Notation)和BSON(Binary JSON)都是数据交换格式,广泛应用于网络通信和数据存储。本文将深入探讨两者在效率方面的差异,并基于提供的文件名进行假设性的分析。 JSON是一种轻量级的数据...

    bson-4.2.3-API文档-中文版.zip

    赠送jar包:bson-4.2.3.jar; 赠送原API文档:bson-4.2.3-javadoc.jar; 赠送源代码:bson-4.2.3-sources.jar; 赠送Maven依赖信息文件:bson-4.2.3.pom; 包含翻译后的API文档:bson-4.2.3-javadoc-API文档-中文...

    Python库 | bson-0.4.2.tar.gz

    在本文中,我们将深入探讨一个名为"BSON"的Python库,具体版本为0.4.2,它被封装在一个名为"bson-0.4.2.tar.gz"的压缩包文件中。 首先,让我们理解什么是BSON。BSON是Binary JSON(二进制JSON)的缩写,是一种数据...

    bson-4.2.3-API文档-中英对照版.zip

    赠送jar包:bson-4.2.3.jar; 赠送原API文档:bson-4.2.3-javadoc.jar; 赠送源代码:bson-4.2.3-sources.jar; 赠送Maven依赖信息文件:bson-4.2.3.pom; 包含翻译后的API文档:bson-4.2.3-javadoc-API文档-中文...

    js-bson, node节点和浏览器的BSON解析器.zip

    js-bson, node节点和浏览器的BSON解析器 BSON解析器如果你还不知道BSON实际上是什么,请阅读规范。web BSON解析器的浏览器版本是使用webdav编译的,当前版本是在browser_build目录中预先编译的。 若要生成新版本,请...

    前端项目-js-bson.zip

    在这个领域,JavaScript扮演着核心角色,而“前端项目-js-bson.zip”则是一个专为JavaScript设计的BSON解析器,旨在为Node.js和浏览器环境提供服务。BSON(Binary JSON)是一种数据格式,它扩展了JSON(JavaScript ...

    json_bson.zip

    JSON(JavaScript Object Notation)和BSON(Binary JSON)是两种常见的数据序列化格式,用于在应用程序之间交换数据。在本例中,我们有一个名为"json_bson.zip"的压缩包,它包含了一个使用QT库编写的示例,该示例...

    cpp-MongoDBLibbson一个BSON实用函数库

    MongoDB Libbson 是一个专为处理BSON(Binary JSON)数据格式而设计的C语言库。BSON是一种高效、轻量级的数据交换格式,它在MongoDB数据库系统中广泛使用,用于存储和传输数据。Libbson库提供了丰富的API,允许...

    bson-0.4.8

    MongoDB的BSON库:bson-0.4.8 BSON,全称为Binary JSON,是一种数据序列化格式,主要用于MongoDB数据库系统。它结合了JSON(JavaScript Object Notation)的易读性和二进制数据的高效性。BSON库是用于处理这种格式...

Global site tag (gtag.js) - Google Analytics