浏览 2909 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2008-11-16
最后修改:2008-12-09
Javascript Html Extractor v0.0.1 当前的版本是 v0.0.1。 项目地址:http://code.google.com/p/javascripthtmlextractor/
该内容提取器主要用于快速提取指定的html字符串中的指定内容。 如有发现问题或有建议,请留言,谢谢。
先看示例: 示例一:"<div><p>div1</p></div>".jhe_im("div") 返回:["<p>div1</p>"] 示例二:"<div id='attr_div1'>div1</div>".jhe_ma("div", "id") 返回: ["attr_div1"] 示例三:"<div><p>div1</p></div>".jhe_mt("div") 返回: ["div1"] 示例四:"<div>div1</div><div>div2</div>".jhe_om("div") 返回: ["<div>div2</div>", "<div>div2</div>"] 示例五:"<div>div1</div><div id='div2'>div2 content</div>".jhe_im("div", "@id=div2") 返回: 'div2 content' 示例六:"<div><p>div1<p></div><div><div><p>div2</div></div>".jhe_im("div", "p") 返回:["div1", "div2"] 示例七:"<div><p>div1<p></div><div><div><p>div2</div></div>".jhe_im("div", ">p") 返回: ["div1"] 示例八:"<p>11</p><div>div2</div>".jhe_im("^div") 返回: [] 示例九:"<div>div2</div><p>11</p>".jhe_im("^div") 返回: ["div2"] 更多的示例可以看代码中的单元测试文件。
该方法返回符合匹配参数的标签内的所有内容,返回值类型是数组。 该方法返回符合匹配参数标签及其标签内的所有内容,返回值类型是数组。 该方法返回符合匹配参数标签的指定属性的属性值,返回值类型是数组。 该方法返回符合匹配参数的标签下的所有文本内容, 返回值类型是数组。 属性表达式: @attributeName=attributeValue, 如 '@class=red', '@id=container',表示需要匹配的标签的属性必须符合指定条件 属性表达式: @@attributeName=attributeValue, 如 '@@class=\\w', '@id=[1-9]*',表示需要匹配的标签的属性必须符合指定的正则式条件 ^+html标签:,表示当前html字符串的第一个标签 >+html标签 : ,表示紧接前一标签的下一标签 声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |
发表时间:2008-12-26
你的项目里没有源码吧,能把源码共享吗?
|
|
返回顶楼 | |
发表时间:2008-12-26
zhjzh1016 写道 你的项目里没有源码吧,能把源码共享吗? 有源码的 |
|
返回顶楼 | |