`

Html的tidy 设置路径

阅读更多
Specifying path for tidy rubygem
HTML Tidy is a library used to fix invalid HTML and give the source code a reasonable layout. It was developed by Dave Raggett of W3C, and is now maintained as a Sourceforge project. These are several versions of tidy available for various operating system. But the quickest way(not always easiest) to install on various unix systems are given below.
On debian based OS such as ubuntu, use apt-get to install
apt-get install tidy

On RPM based OS like fedora centOS, use yum to install
yum install tidy

On mac os x, use macports to install
port install tidy
For tidy to be used in ruby, a rubygem is available here. Just fire up gem install tidy to get it installed on your development machine. A nice documentation is provided here for reference.
gem install tidy

require 'tidy'
Tidy.path = '/usr/lib/tidylib.so'
html = 'Body'
xml = Tidy.open(:show_warnings=>true) do |tidy|
tidy.options.output_xml = true
puts tidy.options.show_warnings
xml = tidy.clean(html)
puts tidy.errors
puts tidy.diagnostics
xml
end
puts xml

While I was working on tidy on my mac, I noticed the Tidy.path variable explained above did not work for me. I figured out an equivalent path to be used on mac,

Tidy.path = '/usr/lib/libtidy.A.dylib'
Similar was the case with my production servers hosted on fedora/CentOS, I had to modify my path as
Tidy.path = '/usr/lib/libtidy-0.99.so.0'

To use both paths on my development and production environment, I modified the line 2 in the example above as
begin
Tidy.path = '/usr/lib/libtidy-0.99.so.0'
rescue LoadError
Tidy.path = '/usr/lib/libtidy.A.dylib'
end

Update:
If you’re getting the error:



/opt/ruby/ruby-1.8.6/lib/ruby/gems/1.8/gems/tidy-1.1.2/lib/tidy/tidybuf.rb:40: [BUG] Segmentation fault
Apply the following patch to fix it.
分享到:
评论

相关推荐

    notepad++好用的html代码格式化插件Tidy2.dll.rar

    用一些软件导出的html代码用notepad++打开后...手动安装实际就是把 Tidy2.dll 文件放到安装目录里去,安装很简单,找到notepad++安装路径,一般为C:Program FilesNotepad++plugins,放到目录里,重启notepad++即可。

    tidy_Source.zip_ tidylib_Tidy html source_tidy.h

    例如,可以设置是否保留原始的HTML注释,是否允许某些非标准的HTML特性,以及如何处理CSS和JavaScript等。 10. **错误和警告**:tidy在处理HTML时会报告遇到的问题,包括错误和警告。这些信息对于调试和优化HTML...

    免费 Tidy2 for Notepad++ 64位

    - **自定义配置**:用户可以根据自己的喜好和项目需求调整Tidy2的设置,比如选择缩进方式(空格还是制表符),设定标签的排序方式等。 通过集成Tidy2,Notepad++不仅成为了一个功能强大的文本编辑器,还变成了一个...

    Tidy2.dll安装

    这些设置通常可以在“Plugins” -> “Tidy2” -> “Configure Tidy2”中找到。 在实际开发中,Tidy2.dll对于处理不规范的HTML或XML文档非常有用,尤其是当你接手他人代码或者从网络上获取数据时。它可以极大地节省...

    Notepad++ Tidy2.dll 格式化html代码

    对于初学者,推荐保持默认设置,随着对Tidy2的理解加深,可以逐步调整。 5. 完成配置后,你可以通过“Plugins” -> “Tidy2” -> “Format Document”或快捷键(通常是Ctrl+Shift+F)来格式化当前打开的HTML文件。 ...

    32位Tidy2.dll.rar

    Tidy2.dll是Tidy库的一个版本,Tidy是一个开源的、跨平台的工具,主要用于清理和格式化HTML及XML文档。Tidy最初由Dave Raggett开发,它的主要功能包括修复不正确的HTML标记,添加缺失的结束标签,转换非标准的属性和...

    notepad++ Tidy libtidy.dll

    这个压缩包文件 "plugins" 可能包含了用于Notepad++的Tidy插件的更新或完整版本,用户需要将其解压到Notepad++的安装目录,确保 "libtidy.dll" 文件位于正确的位置,以便在编辑HTML和XML文档时能正常使用Tidy提供的...

    SublimeLinter-html-tidy:适用于html的SublimeLinter 3插件

    SublimeLinter-html-tidy 这个插件提供了一个整洁的接口( 或版本)。 它将与具有“ HTML”语法的文件一起使用。...启用HTML子语法要为另一种语法启用html-tidy,请编辑SublimeLinter用户设置。 此示例

    html转成pdf所需jar包

    这个资源提供了一组必要的jar包,能够帮助开发者实现这一功能,并且还包含了tidy工具,用于将HTML转换成XML格式,以便更好地处理和解析。 首先,我们来详细了解HTML转PDF的过程。这个过程通常涉及到一个库或工具,...

    jsoup和jtidy 对html操作,将不规范的html转换为xhtml

    Jtidy基于Tidy,一个C++实现的HTML解析器,它能将不规范的HTML转换为结构化的XHTML。Jtidy允许开发者调整许多清理和规范化选项,比如是否强制所有标签闭合,是否删除不合法的HTML属性等。这使得Jtidy在处理大量不...

    html2pdf代码.7z

    Document doc = tidy.parseDOM(new ByteArrayInputStream(html.getBytes()), null); ``` 这里的`html`是待转换的HTML内容。 2. ** wkhtmltopdf介绍**: wkhtmltopdf是一个开源命令行工具,它基于WebKit渲染引擎...

    ntidy:Tidy的.Net包装器-开源

    3. **处理HTML字符串或文件**:可以传入HTML字符串或文件路径,NTidy会返回清理和格式化后的HTML内容。 4. **错误和警告处理**:NTidy会报告在清理过程中遇到的问题,帮助开发者定位和修复HTML代码的错误。 5. **...

    jtidy-r938.zip

    在这个例子中,我们创建了一个`Tidy`对象,设置了几个关键的属性,比如禁用警告信息,设定输出为XHTML格式。然后,我们将HTML字符串输入到`parse`方法中,将转换后的XML输出到`ByteArrayOutputStream`,最后将结果...

    html转PDF所需的jar

    5. **Tidy.jar**: Tidy是一个HTML清理和修复工具,它可以将不规范的HTML代码规范化,使其更符合W3C标准,从而确保转换过程的准确性和稳定性。 6. **core-renderer.jar**: 这个jar包可能是特定转换框架的核心渲染...

    关于html_jsp_xml编辑的eclipse插件

    但是,如果你需要更高级的功能,比如预览、代码片段管理、模板支持等,可以安装"HTML Tidy"或"Web Tools Platform (WTP)"项目提供的HTML编辑器插件。这些插件将帮助你编写更规范、更高效的HTML代码。 JSP(Java...

    libtidy.dll

    **libtidy.dll** 是一个动态链接库(DLL)文件,它是Tidy库的一部分,用于处理HTML和XML文档。Tidy是一个开源的、跨平台的工具,主要用于清理和修复不规范的HTML代码,使其符合W3C的标准。DLL文件是Windows操作系统...

    JMETER 断言几种方式

    - **Tidy Settings**: 设置Tidy的解析选项,用于处理不规范的HTML。 - **Doctype**: 选择文档类型,可以是忽略、动态、严格或宽松。 - **Format**: 选择期望的输出格式,通常是HTML或XHTML。 在实际测试中,一个...

    Sosoo 1.0网络爬虫程序.doc

    Sosoo 的开发依赖于 Jobo 爬虫的实现、Tidy HTML 解析器、Log4j 日志记录器和 Apache 正则表达式库。 Sosoo 1.0 网络爬虫程序提供了一套灵活的框架,使得开发者可以根据需求定制网络爬虫,从设置基本参数到实现复杂...

    eclipse 配置说明

    - 基于HTML Tidy的HTML/XML校验和格式化工具。 17. **Eclipse UML** - 强大的UML建模插件,支持各种模型图绘制。 18. **Call Hierarchy** - 显示方法调用层次结构,便于理解代码逻辑。 19. **Tomcat Plugin...

    notepad ++ 64位 for windows

    安装过程中,用户可以选择自定义安装路径、是否创建桌面快捷方式等选项,以满足个人需求。 总的来说,Notepad++ 64位版本是一个强大的文本编辑器,特别是对于JavaScript和HTML开发人员,配合tidy2和jstool这样的...

Global site tag (gtag.js) - Google Analytics