`
liujinmarshall
  • 浏览: 118223 次
  • 性别: Icon_minigender_1
社区版块
存档分类
最新评论

用HTML Workshop 从中文UTF-8的HTML生成可见的HtmlHelp(CHM)

阅读更多

  这个主题比较长,前几天做ICU4J的Investigation发现的,实在比较麻烦。

 我们有几个包含中文的UTF-8的文档,还有HHC(就是Table of Contents), HHK(Index), HHP(Project)几个文件,用微软官方的Html Workshop(HHC)生成HtmlHelp 。假定所有的都是UTF-8格式的。

 事实上,如果我们直接生成的话,文章里面的中文是可以看得见的。但是有一个问题:文档的内容不能被搜索。因为我们搜索输入的文档是ASCII的,而内容却是UTF-8的,所有搜不到。另外,索引和TOC也是乱码。

所以我们需要转换编码,从UTF-8->ASCII。如果你只转换HHK,HHC的话,代价比较小,而且可见的部分都不会出现乱码,但是你的搜索功能就不能用了~~另外,HHP里有一项Language,换成中文(可以手动改成0x804,这是微软官方的代码,就是zh-cn,也可以在HTML workshop里的图形界面里选,更方便)。要是转换了所有的文档的话,搜索也可以用了,记得要把HTML里的那些meta header里有关UTF-8的信息都去掉,不然浏览器会把这个文档 当成UTF-8的解析,所有的东东也都是乱码了。

1.3的Help里说开始支持Unicode了,完全是在扯蛋。所谓的支持仅仅是可以显示了。事实上显示也不是workshop的功劳,而是IE的解析起了作用。听说HTML workshop下一个版本会全面支持Unicode,不知道会是怎么样。



分享到:
评论

相关推荐

    javadoc转chm.docx

    为了避免这种情况,可以在生成Javadoc时通过VMoptions设置编码为UTF-8,如:`-encoding UTF-8 -charset UTF-8`。 - 生成英文版本:如果需要英文版本的Javadoc,可以在VMoptions中添加`-locale en_US`,但需注意,该...

    编程语言javadoc转chm.pdf

    使用GBK编码生成Javadoc通常不会有大问题,但如果项目默认编码是UTF-8,可能会导致警告,并且无法正确生成Javadoc。解决方法是在生成Javadoc时,通过VM options设置编码为UTF-8,例如:`-encoding UTF-8 -charset ...

    javadoc转chm (2).pdf

    解决方法是在生成Javadoc时添加VM options,设置编码为UTF-8,即`-encoding UTF-8 -charset UTF-8`。 另一个问题是生成英文版本的Javadoc。这可以通过在VM options中添加`-locale en_US`来实现,但要注意,这个选项...

    javadoc转chm.pdf

    但如果你的项目采用UTF-8编码,Javadoc生成时可能会出现警告,因为GBK无法完全映射UTF-8的所有字符,导致乱码。为了解决这个问题,你需要在生成Javadoc时通过VM options指定编码设置,如`-encoding UTF-8 -charset ...

    javadoc转chm (2).docx

    - 编码问题:Java代码可能采用GBK或UTF-8编码,GBK编码生成Javadoc通常没问题,但如果项目默认编码是UTF-8,未设置编码参数会导致警告甚至无法生成。解决方案是在生成Javadoc时指定VM选项:`-encoding UTF-8 -...

    chm文件制作视频教程

    7. **语言和编码**:确保所有HTML文件使用正确的字符编码(通常为UTF-8),以支持多语言内容。如果需要,你还可以添加国际化元素,如右-to-left布局支持。 8. **测试和调试**:在编译后,你需要测试CHM文件的完整性...

    Doxygen代码注释规范.docx

    在 Expert 中选择输出目录,输出语言,并设置输入编码方式为 GBK 方式,以确保输出中不会由于 UTF-8 方式导致乱码。 五、Doxygen 生成 CHM 文件 在 Doxygen 中生成 CHM 文件需要安装 HTML Help Workshop 软件,并...

    CHM帮助文档制作教程 CHM

    1. **编码问题**:确保所有HTML文件使用相同的字符编码,通常为UTF-8,以避免乱码。 2. **相对路径**:在HTML文件中使用相对路径引用资源,以确保在不同环境下能正确加载。 3. **超链接兼容性**:确保所有的内部链接...

    制作chm文档已经整理好做法

    6. **生成HTML帮助文件**:在项目设置完成后,使用HTML Help Workshop的"编译"功能生成CHM文件。 7. **测试与调整**:打开生成的CHM文件进行测试,检查内容是否完整,链接是否正确,索引是否准确。 **三、注意事项*...

    Doxygen代码注释规范

    * 需要将输入编码方式改为GBK方式,确保输出中不会由于UTF-8方式导致乱码 * 需要将CHM索引的编码类型修改为GB2312,否则可能出现中文乱码的情况 Doxygen是一种功能强大且灵活的文档生成工具,能够满足大型程序开发...

    Doxygen 1.7.4 安装配置指南(windows)

    解决方法是将 index.hhc、index.hhk、index.hhp 文件转换为 UTF-8 格式。 Doxygen 是一个功能强大且易用的文档生成工具。通过按照以上步骤安装和配置 Doxygen,可以生成高质量的文档,提高代码的可读性和维护性。

    Doxygen 配置说明

    1. **`DOXYFILE_ENCODING`**:设置Doxyfile文件的编码类型,例如UTF-8。 2. **`PROJECT_NAME`**:项目名称,用于生成的文档标题。 3. **`PROJECT_NUMBER`**:项目版本号,可以为空。 4. **`OUTPUT_DIRECTORY`**:...

Global site tag (gtag.js) - Google Analytics