`

java与yaml解析

    博客分类:
  • YAML
 
阅读更多
YAML Ain't Markup Language

和GNU一样,YAML是一个递归着说“不”的名字。不同的是,GNU对UNIX说不,YAML说不的对象是XML。

YAML不是XML。



为什么不是XML呢?因为:

YAML的可读性好。
YAML和脚本语言的交互性好。
YAML使用实现语言的数据类型。
YAML有一个一致的信息模型。
YAML易于实现。
上面5条也就是XML不足的地方。同时,YAML也有XML的下列优点:

YAML可以基于流来处理;
YAML表达能力强,扩展性好。
总之,YAML试图用一种比XML更敏捷的方式,来完成XML所完成的任务。

更多的内容及规范参见http://www.yaml.org。

语法

Structure通过空格来展示。Sequence里的项用"-"来代表,Map里的键值对用":"分隔.

这几乎就是所有的语法了.

比如……

一般YAML文件扩展名为.yaml。比如:John.yaml

name: John Smith age: 37 spouse:     name: Jane Smith     age: 25 children:     -   name: Jimmy Smith         age: 15     -   name: Jenny Smith         age 12         

John今年37岁,有一个幸福的四口之家。两个孩子Jimmy 和Jenny活泼可爱。妻子Jane年轻美貌。

如果深入研究的话还可能发现一些社会问题。

可见YAML的可读性是不错。

JYaml——YAML的Java实现

YAML已经有了不少实现,详细的实现列表参见http://www.yaml.org/download.html。

其中JYaml(http://jyaml.sourceforge.net)是YAML的Java实现。

JYaml简介

YAML使用实现语言的数据类型。我们看一下一些JYaml支持的Java数据类型:

原始数据和封装类(比如int,java.lang.Integer)
JavaBean兼容对象(Structure支持)
Collection (sequence支持)
List
Set
Map (map支持)
Arrays (sequence支持)
BigInteger 和BigDecimal
Date
我们给出John.yaml的java描述:

public class Person {     private String name;     private int age;     private Person sponse;     private Person[] children;     // setXXX, getXXX方法略. }

现在让我们装配一个Jone:

    Person john = new Person();     john.setAge(37);     john.setName("John Smith");     Person sponse = new Person();     sponse.setName("Jane Smith");     sponse.setAge(25);     john.setSponse(sponse);     Person[] children = {new Person(), new Person()};     children[0].setName("Jimmy Smith");     children[0].setAge(15);     children[1].setName("Jenny Smith");     children[1].setAge(12);     john.setChildren(children);

使用JYaml把Jone“Dump”出来:

    File dumpfile = new File("John_dump.yaml");     Yaml.dump(john, dumpfile);

下面我们看看John_dump.yaml是什么样子:

--- !yaml.test.internal.Person age: 37 children: !yaml.test.internal.Person[]   - !yaml.test.internal.Person     age: 15     name: Jimmy Smith   - !yaml.test.internal.Person     age: 12     name: Jenny Smith name: John Smith sponse: !yaml.test.internal.Person   age: 25   name: Jane Smith

其中!yaml.test.internal.Person是一些类型的信息。load的时候需要用。

现在用JYaml把Jone_dump.yaml load进来:

    Person john2 = (Person) Yaml.loadType(dumpfile, Person.class);

还可以用下面的代码dump出没有类型信息的John.yaml:

Yaml.dump(john,dumpfile, true);

我们再来看看JYaml对流处理的支持。

为简便起见,我们只是把同一个john写10次:

    YamlEncoder enc = new YamlEncoder(new FileOutputStream(dumpfile));     for(int i=0; i<10; i++){         john.setAge(37+i);         enc.writeObject(john);         enc.flush();     }    enc.close();

下面再把这十个对象一个一个读出来(注意while循环退出的方式):

      YamlDecoder dec = new YamlDecoder(new FileInputStream(dumpfile));       int age = 37;       while(true){           try{               john = (Person) dec.readObject();               assertEquals(age, john.getAge());               age++;           }catch(EOFException eofe){               break;           }       }

JYaml对JDK14的支持

JYaml的源码是基于JVM5的。也提供对JVM5功能的一些支持,比如对枚举类型的支持。

JYaml的JVM14的支持是通过retrotranslator(http://retrotranslator.sourceforge.net). retrotranslator使用ASM(http://asm.objectweb.org )动态修改JVM5字节码成JVM14,使JYaml在JVM14下可用。会牺牲一些效率。Debug时也会失真。

我修改了JYaml作者Toby Ho的一些源码(基于Beta2.2),使之与JVM14兼容。当然,为此也去掉了对JVM5才有的类型的支持(比如枚举类型). 这个牺牲应该是值得的。需要的人可以来信索取。

YAML和SDO(只讨论双方的java实现)

如果读者想了解更多SDO的概念, 请参见http://www.ibm.com/developerworks/library/specification/j-commonj-sdowmt/index.html 。这里我们只讨论SDO的java实现。

SDO里有一个很重要的概念,DataObject。从DataObject的接口里,可以看出有两类的数据类型,一类是JYaml支持的,诸如String, List之类,一类是DataObject。因此我们只需要增加一种支持DataObject的类型,就可以完成对SDO DataObject的支持。

不妨叫YamlDataObject。下面是它的数据结构。

public class YamlDataObject {     private String uRI;     private String name;     private Map attributes; }

YamlDataObject里用到的类型,都是JYaml能够支持的。其中,uRI和name用来描述DataObject自身。attributes 来描述DataObject里的值。这些值可能为DataObject,也可能是JYaml所支持的其他类型。我们希望用YamlDataObject来 担当DataObject的角色,因此YamlDataObject和DataObject要能互相转化。增加两个API:

private static YamlDataObject newInstance(DataObject dataobject){... private DataObject toDataObject() {...

上面两个之所以是private的,是因为我们打算遵照JYaml的习惯,增加两个接口,dump和load,这样newInstance和toDataObject只在内部使用了。下面是dump和load的定义:

public static void dump(DataObject dataobject, File dumpfile)                    throws FileNotFoundException{... public static Object load(File file)                    throws FileNotFoundException{...

下面是一小段测试代码:

// ... create dataobject ... File bodump=new File("bodump.yaml"); YamlDataObject.dump(dataobject,bodump); assertTrue(bodump.exists()); DataObject dataobject2 = (DataObject) YamlDataObject.load(bodump);  // check result assertNotNull(dataobject2); for(int i=0; i<5; i++){    assertEquals(dataobject.get(i),dataobject2.get(i)); }

具体的实现细节就不谈了。读者可以作为练习题,熟悉一下这两个数据整合方案。

YAML和Ruby

Ruby和YAML的联系,甚至比Java与XML的联系还要紧密。Ruby把YAML用到了和数据相关的方方面面。配置文件的约定格式是YAML。同时YAML还是Ruby的文本序列化格式,就像XML是SDO的文本序列化格式一样。

不夸张的说,YAML是Ruby中流动的血液。

那,Ruby为什么不选XML呢?

其一,XML对Ruby这样的脚本语言而言,解析起来比较困难。效率肯定是会有问题。Ruby的XML解析没有完全实现,走的是实用主义的路线,可能也缘于此。而YAML要轻快很多。

另外,XML使用自定义类型。就算解析出来,也不能直接用,还要再转一次。而YAML不定义自己的类型,直接使用宿主语言本身类型,直截了当。

下面给一个Ruby YAML的简介。

我们使用Ruby写一个Person类:

class Person   attr_accessor :name, :age, :sponse, :children   def initialize(name, age, sponse=nil, children=nil)     @name = name     @age  = age     @sponse = sponse     @children = children   end end

把John装配起来:

jane = Person.new("Jane Smith", 25) children = [Person.new("Jimmy Smith", 15), Person.new("Jenny Smith", 12)] john = Person.new("John Smith", 37, jane, children)

Dump出John到John.yaml:

File.open('John_ruby.yaml', 'w') do |os|   YAML::dump(john, os) end

我们看看Dump的结果:

--- !ruby/object:Person age: 37 children: - !ruby/object:Person   age: 15   children:   name: Jimmy Smith   sponse: - !ruby/object:Person   age: 12   children:   name: Jenny Smith   sponse: name: John Smith sponse: !ruby/object:Person   age: 25   children:   name: Jane Smith   sponse:

仔细观察会发现和JYaml Dump出来的还是有些区别的。

首先类型信息不一样。这还好说,虽然Ruby load Java的不太可能,但Java加载Ruby的应该没问题。

还有就是一些实现上细微的区别。比如Ruby::Yaml的"spone:",JYaml认为是不合法的。还有children的不缩行。尽管Ruby::Yaml很流行,但JYaml认为这是Ruby的Bug。网上有相应的争论。

不过在一个语言里使用还是没问题的。下面是load John的代码:

john2 = File.open('John.yaml') { |is|  YAML::load(is) }

YAML的Ruby实现出现的很早。但由于某些原因,YAML的Ruby实现是不严格的。随着其他语言的YAML实现慢慢出现,这个问题日益明显了。

毕竟每个实现语言的类型不一样的,不同语言文化也不同。因此不同实现的YAML的交互是个问题。兼容性需要YAML规范来保证。而具体的实施还有很长的道路要走。

但YAML在单一语言中,YAML的应用是没有问题的。

YAML在Ruby On Rails中经常用作配置文件。比如数据库信息的配置:

test:   adapter: mysql   database: weblog_test   username: root   password:   host: localhost  production:   adapter: mysql   database: weblog_production   username: root   password:    host: localhost

熟悉ROR的读者应该能看出这是`config/database.yml'文件。

YAML的适用范围

由于实现简单,解析成本很低,YAML特别适合在脚本语言中使用。列一下现有的语言实现:Ruby,Java,Perl,Python,PHP,OCaml,JavaScript。除了Java,其他都是脚本语言.

YAML比较适合做序列化。因为它是宿主语言数据类型直转的。

YAML做配置文件也不错。比如Ruby on Rails的配置就选用的YAML。对ROR而言,这很自然,也很省事.

由于兼容性问题,不同语言间的数据流转建议现在不要用YAML.

YAML存在的意义

无论多么完美的事物,都需要有对立面,有说“NO”的声音。XML也不例外。当然,站在主流的对立面,需要勇气和智慧。

YAML 和XML不同,没有自己的数据类型的定义,而是使用实现语言的数据类型。这一点,有可能是出奇制胜的地方,也可能是一个败笔。如果兼容性保证的不好的 话,YAML数据在不同语言间流转会有问题。如果兼容性好的话,YAML就会成为不同语言间数据流通的桥梁。建议yaml.org设立兼容认证机制,每个 语言的实现必须通过认证。

假如兼容性没问题的话,YAML就太完美了。轻巧,敏捷,高效,简便,通用。这才是理想中的数据模型。当然就现在而言,这还只是个理想。


参考资料

参与论坛讨论。

JYaml项目主页:http://jyaml.sourceforge.net

JYaml入门: http://jyaml.sourceforge.net/tutorial.html

YAML主页: http://www.yaml.org

SDO: http://www.ibm.com/developerworks/library/specification/j-commonj-sdowmt/index.html

Ruby: http://www.ruby-lang.org
分享到:
评论

相关推荐

    yaml文件解析(java)

    首先,为了在Java项目中使用YAML解析功能,我们需要引入相关的库。在Maven项目中,可以在`pom.xml`文件中添加SnakeYAML的依赖: ```xml &lt;groupId&gt;org.yaml &lt;artifactId&gt;snakeyaml &lt;version&gt;1.28 ``` 添加...

    Snakeyaml(java解析Yaml文件)

    Java解析Yaml文件jar包资源

    JAVA源码YAML解析器SnakeYAML

    JAVA源码YAML解析器SnakeYAML

    java资源YAML解析器SnakeYAML

    java资源YAML解析器 SnakeYAML提取方式是百度网盘分享地址

    基于java的YAML解析器 SnakeYAML.zip

    5. **自定义构造函数**: 用户可以通过实现`Representer`和`Constructor`接口来自定义如何将Java对象转化为YAML,或者将YAML解析为特定的Java类型。 ### 使用SnakeYAML 在Java项目中,首先需要将SnakeYAML库添加到...

    基于Java的YAML解析器 SnakeYAML.zip

    **SnakeYAML:Java中的YAML解析库** SnakeYAML是一个用Java编写的开源库,专门用于解析和生成YAML(YAML Ain't Markup Language)格式的文档。YAML是一种简洁且直观的数据序列化语言,常用于配置文件、数据交换以及...

    JAVA基于SnakeYAML实现解析与序列化YAML

    JAVA基于SnakeYAML实现解析与序列化YAML JAVA基于SnakeYAML实现解析与序列化YAML是JAVA开发中的一种常见需求,本文主要介绍了如何使用SnakeYAML库将YAML文档转换为Java对象,以及Java对象如何序列化为YAML文档。...

    yaml-parser:Java的简单Yaml解析器

    **yaml-parser: Java的简单Yaml解析器** 在软件开发中,数据序列化是一个至关重要的环节,它使得程序能够将复杂的数据结构转化为可存储或可传输的格式。YAML(YAML Ain't Markup Language)是一种易读易写的、人类...

    java源码:YAML解析器 SnakeYAML.zip

    总之,"java源码:YAML解析器 SnakeYAML.zip"提供了深入学习和理解YAML解析技术的机会,无论你是Java新手还是经验丰富的开发者,都能从中获益。通过分析源代码,你可以学习到如何编写高效、灵活且安全的序列化库,这...

    java的YAML解析器 SnakeYAML源码

    - 对于更底层的访问,你可以使用`EventEmitter`和`Parser`接口,基于事件流来处理YAML解析。 6. **错误处理**: - SnakeYAML在遇到解析错误时会抛出`YAMLException`。你可以捕获并处理这些异常以提高程序的健壮性...

    java 一键读取yaml、propertites配置文件内容,转换为一级map

    纯java底层读取配置文件,生成map,可以根据key模糊匹配查询,封装好了方法。比如getVal("spring.dubbo*url")

    解析yml、yaml的工具类库文件

    压缩包子文件的文件名称"snakeyaml-1.24.jar"揭示了我们正在讨论的具体工具——SnakeYAML,这是一个Java实现的开源YAML解析器和生成器。SnakeYAML提供API供Java开发者读取和写入YAML文档,它支持YAML 1.1规范,能够...

    基于Java的实例源码-YAML解析器 SnakeYAML.zip

    **SnakeYAML:Java中的YAML解析器** SnakeYAML是一个用Java编写的开源库,专门用于解析和生成YAML(YAML Ain't Markup Language)格式的文档。YAML是一种简洁且直观的数据序列化语言,常用于配置文件、数据交换以及...

    YAML解析器 SnakeYAML.7z

    5. **事件驱动的解析**:对于更复杂的解析需求,SnakeYAML提供了事件处理器接口,允许你监听YAML解析过程中的各种事件,如遇到键、值、映射开始和结束等。 6. **安全性**:SnakeYAML具有防止代码注入的安全特性,当...

    YAML解析器 SnakeYAML

    SnakeYAML作为Java平台上的YAML解析器,为开发者提供了一种高效、安全的方式处理YAML数据。无论是在配置管理、数据交换还是构建复杂的应用程序中,它都是一个可靠的工具。了解并熟练使用SnakeYAML,可以帮助开发者...

    matlab基于SnakeYAML的MATLAB YAML解析器和发射器.zip

    SnakeYAML是一个流行的Java库,用于解析和生成YAML格式的数据,而这个"matlab基于SnakeYAML的MATLAB YAML解析器和发射器"项目则提供了将SnakeYAML的功能引入MATLAB平台的解决方案。 YAML是一种易读的、人可写的语言...

    yaml配置文件解析-yaml

    1. **大小写敏感**:YAML中的关键字和标识符都是大小写敏感的,例如`name`与`Name`是不同的。 2. **缩进表示层次关系**:YAML通过空格缩进来定义元素之间的层级关系,而不是使用括号或花括号。请注意,必须使用空格...

    通过yaml为json中的某个变量赋值

    1. **JSON到YAML转换**:使用JSON解析库(如Python的`json`模块)读取JSON文件,并将其内容转化为YAML格式。这可以通过YAML库(如Python的`pyyaml`)实现,将JSON对象转换为YAML字符串并写入新文件。 2. **修改YAML...

    MatLab的YAML库文件

    在处理YAML时,可能使用了Java的YAML解析器,如SnakeYAML,这是Java的一个开源库,能够处理YAML的解析和生成。MATLAB通过`javaaddpath`命令加载Java库,然后可以像调用MATLAB函数一样调用Java方法。 5. **MATLAB与...

    yaml文件加载和解析

    - Go:go-yaml库是Go语言中的YAML解析库。 三、加载YAML文件 1. Python示例: ```python import yaml with open('config.yaml', 'r') as file: config = yaml.safe_load(file) print(config) ``` 2. JavaScript...

Global site tag (gtag.js) - Google Analytics