`

快速處理HTML/XML文件

阅读更多
XML文件我是用ReXML啦.. 不過我這邊不是要介紹ReXML,是要來介紹hpricot這個Library的
安裝方式:
gem install hpricot
or
gem install hpricot --source http://code.whytheluckystiff.net

第一個會連線到gem server去抓來裝,不會有最新的更新;第二個會連到指定的gem server,那邊更新速度較快,我還看到jruby版本的gem..

OK,廢話不多說,趕緊來看看
官方網站是:http://code.whytheluckystiff.net/hpricot/

如果會jQuery的人,這個是用jQuery當底層的喔!
我來個例子吧

require 'rubygems'
require 'hpricot'
require 'open-uri'
doc = Hpricot(open("http://article.zuso.org.tw/show.php?id=1453"))
tb = doc.search("//table")
puts "Tables: #{tb.size}"
puts tb[0]
分享到:
评论

相关推荐

    HTML/XML解析器 lxml2.2 源码

    # 解析XML文件 tree = etree.parse('example.xml') root = tree.getroot() # 使用XPath选取元素 elements = root.xpath('//element[@attr="value"]') # 遍历HTML元素 html = etree.HTML('<html><body><h1>Hello, ...

    xml入门教程/xml入门教程

    XML文件的要求 - **格式良好**:必须符合XML的语法规则。 - **有效**:除了格式良好之外,还必须遵循定义的文档类型定义(DTD)或XML Schema。 #### 4. XML的应用场景 - **数据交换**:在不同系统之间传输数据。...

    XML文件批量转换CSV文件工具.rar

    总的来说,这个“XML文件批量转换CSV文件工具”是数据处理工作流中的实用工具,尤其适用于需要将XML数据整合到电子表格或数据库中的情况。其简单易用的界面和批量处理能力,使得即使是不太熟悉编程的用户也能快速...

    快速紧凑HTML / XML扫描器/令牌生成器

    标题中的“快速紧凑HTML / XML扫描器/令牌生成器”是指一种专为高效处理HTML(超文本标记语言)和XML(可扩展标记语言)文档设计的解析工具。这种工具的主要功能是快速扫描输入的HTML或XML文档,并将其分解成一系列...

    好用的 xml.html一键解密工具

    1. **支持多种格式**:它不仅能够处理XML文件,还能处理HTML文件,满足用户对不同类型的解密需求。 2. **一键操作**:用户界面设计简洁,通过简单的点击或拖放操作,即可完成文件的解密工作,无需复杂的设置或专业...

    超轻量级 JSON / XML / YAML 解析门面 API,用法简单,不依赖具体的 JSON / XML / YAML 实现

    JSON(JavaScript Object Notation), XML(eXtensible Markup Language)和 YAML(YAML Ain't Markup Language)是数据交换格式的三种常见选择,广泛应用于网络服务、配置文件和数据存储等领域。这篇介绍的是一个...

    c#读写XML文件 超好用

    根据给定文件的信息,本文将深入探讨如何使用C#进行XML文件的读写操作,并详细介绍相关的知识点和技术细节。 ### C#中的XML处理简介 在.NET框架中,XML是一种非常重要的数据交换格式,广泛应用于Web服务、配置文件...

    ADO/ASP/CSharp/VB/Wepservice/Framework/XML程序员大本营

    在ASP中,开发者可以使用VBScript或JScript编写代码,处理用户请求,与服务器上的数据库或其他数据源交互,然后返回HTML页面给客户端浏览器。 3. **ASP.NET**:ASP的下一代产品,是.NET Framework的一部分。ASP.NET...

    XML文件解析编辑小工具

    除此之外,这款工具可能还包含了其他高级特性,如XML Schema设计、XML编码和解码、XML Diff和Merge(比较和合并XML文件)、XML数据绑定等功能,这些功能使得XML文件的处理更加全面和高效。 总之,"XML文件解析编辑...

    xml 文件编辑查阅工具

    9. **XML到HTML转换**:可以将XML文件转换为HTML,以便于在浏览器中查看。 10. **编码支持**:支持多种字符编码,如UTF-8、UTF-16等。 "XML Edit"这款工具可能包含了以上所述的功能,旨在提供一个友好的界面,让...

    xml文件查看源代码

    4. **XSLT**:转换语言,用于将XML文件转换成其他格式,如HTML或另一个XML文件。 在实际应用中,你可能需要结合编程语言,如Java、Python或C#,使用相应的XML库来处理XML文件。例如,Java的JAXB、DOM、SAX库,...

    jsoup解析xml文件

    通过学习和使用jsoup解析XML,开发者可以快速地从XML文件中提取数据,实现数据处理和分析。在这个提供的资源中,`jsoupxml`可能是包含示例代码的文件,读者可以参考它来进一步了解如何实际应用jsoup解析XML。

    ios小程序--解析xml文件,读取新闻

    在iOS中,处理XML文件通常有两种方式:使用NSXMLParser或使用第三方库如SWXMLHash。NSXMLParser是Apple提供的原生XML解析器,它提供了一个事件驱动的接口来处理XML文档。以下是如何使用NSXMLParser解析XML的步骤: ...

    格式化 html js css xml文件利器

    "格式化 html js css xml文件利器"是一个专为这四种常见编程语言(HTML、JavaScript、CSS和XML)设计的高效工具,能够帮助开发者快速整理和美化他们的代码。 HTML(超文本标记语言)是网页的基础结构,良好的格式能...

    xml转换html

    可以使用XSLT编写一个样式表来转换这个XML文件: ```xml <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"> <xsl:template match="/"> <html> <h2>Bookstore</h2> ...

    XML 处理.rar

    主要方法包括`parse()`用于解析XML文件,`ElementTree()`用于构建ElementTree对象,`Element()`用于创建元素,以及`iter()`、`find()`、`findall()`和`text`属性用于查找和访问元素。 2. 解析XML:以下代码展示了...

    xml文件编辑器

    XML文件编辑器是一种专门设计用于处理XML(可扩展标记语言)文档的应用程序,它提供了高级功能,使得XML的创建、修改和分析变得更为便捷。在IT领域,XML因其结构化和自描述性而广泛应用于数据交换、配置文件、文档...

    xml解析文件

    SAX解析器不保存整个文档的结构,占用内存小,适合处理大型XML文件。但是,由于其基于事件的特性,不便于进行复杂的查询和修改操作。 3. DOM4J解析: DOM4J是Java的一个开源库,提供了灵活的XML处理功能,结合了DOM...

    html对树形xml节点读取(一个很实用的demo)初学者必备

    例如,一个简单的XML文件可能如下所示: ```xml <title>JavaScript高级程序设计</title> <author>Y. Douglas</author> </book> <title>HTML与CSS设计与构建网站</title> <author>Jon Duckett</author> ...

    XML/HTML解析器(Swift).zip

    在实际项目中,Ji可以用来解析API响应、网页内容,甚至处理本地存储的XML/HTML文件。其高效的性能和易于理解的API,使得开发过程变得更加顺畅。 总之,Ji (戟) 是Swift开发者处理XML和HTML的强大工具。通过其提供的...

Global site tag (gtag.js) - Google Analytics