问题描述及分析:
使用MyEclipse导出doc时,最终使用的还是JDK的javadoc命令。
Javadoc命令可以设置命令执行参数(参看文档后附录),其中-encoding <名称> 指定了源码文件的编码方式。由于JDK是国际版的(参考网络资料),所以默认使用的是系统编码。
这段代码可以查看系统的编码格式
public class TestFileEncoding {
public static void main(String[] args) {
System.out.println(System.getProperty("file.encoding"));
}
}
输出结果
GBK
如果需要导出的源码文件的编码格式不是GBK,那么后台就会报“编码GBK的不可映射字符”。
解决方案:
使用Export命令导出导出javadoc,添加执行参数
Javadoc命令的使用及参数说明
用法:javadoc [选项] [软件包名称] [源文件] [@file]
-overview <文件> 读取 HTML 文件的概述文档
-public 仅显示公共类和成员
-protected 显示受保护/公共类和成员(默认)
-package 显示软件包/受保护/公共类和成员
-private 显示所有类和成员
-help 显示命令行选项并退出
-doclet <类> 通过替代 doclet 生成输出
-docletpath <路径> 指定查找 doclet 类文件的位置
-sourcepath <路径列表> 指定查找源文件的位置
-classpath <路径列表> 指定查找用户类文件的位置
-exclude <软件包列表> 指定要排除的软件包的列表
-subpackages <子软件包列表> 指定要递归装入的子软件包
-breakiterator 使用 BreakIterator 计算第 1 句
-bootclasspath <路径列表> 覆盖引导类加载器所装入的
类文件的位置
-source <版本> 提供与指定版本的源兼容性
-extdirs <目录列表> 覆盖安装的扩展目录的位置
-verbose 输出有关 Javadoc 正在执行的操作的消息
-locale <名称> 要使用的语言环境,例如 en_US 或 en_US_WIN
-encoding <名称> 源文件编码名称
-quiet 不显示状态消息
-J<标志> 直接将 <标志> 传递给运行时系统
通过标准 doclet 提供:
-d <directory> 输出文件的目标目录
-use 创建类和包用法页面
-version 包含 @version 段
-author 包含 @author 段
-docfilessubdirs 递归复制文档文件子目录
-splitindex 将索引分为每个字母对应一个文件
-windowtitle <text> 文档的浏览器窗口标题
-doctitle <html-code> 包含概述页面的标题
-header <html-code> 包含每个页面的页眉文本
-footer <html-code> 包含每个页面的页脚文本
-top <html-code> 包含每个页面的顶部文本
-bottom <html-code> 包含每个页面的底部文本
-link <url> 创建指向位于 <url> 的 javadoc 输出
-linkoffline <url> <url2> 利用位于 <url2> 的包列表链接至位于
档
-excludedocfilessubdir <name1>:..排除具有给定名称的所有文档文件子目
-group <name> <p1>:<p2>..在概述页面中,将指定的包分组
-nocomment 不生成描述和标记,只生成声明。
-nodeprecated 不包含 @deprecated 信息
-noqualifier <name1>:<name2>:...输出中不包括指定限定符的列表。
-nosince 不包含 @since 信息
-notimestamp 不包含隐藏时间戳
-nodeprecatedlist 不生成已过时的列表
-notree 不生成类分层结构
-noindex 不生成索引
-nohelp 不生成帮助链接
-nonavbar 不生成导航栏
-serialwarn 生成有关 @serial 标记的警告
-tag <name>:<locations>:<header> 指定单个参数自定义标记
-taglet 要注册的 Taglet 的全限定名称
-tagletpath Taglet 的路径
-charset <charset> 用于跨平台查看生成的文档的字符集。
-helpfile <file> 包含帮助链接所链接到的文件
-linksource 以 HTML 格式生成源文件
-sourcetab <tab length> 指定源中每个制表符占据的空格数
-keywords 使包、类和成员信息附带 HTML 元标记
-stylesheetfile <path> 用于更改生成文档的样式的文件
-docencoding <name> 输出编码名称
- 大小: 104.6 KB
- 大小: 43.9 KB
- 大小: 101.1 KB
- 大小: 66.3 KB
- 大小: 53.7 KB
分享到:
相关推荐
IDEA编码GBK不可映射字符解决方法 IDEA是一款功能强大且广泛应用的集成开发环境(Integrated Development Environment),它提供了大量实用的功能来提高开发效率和代码质量。但是,在使用IDEA时,开发者可能会遇到...
本篇将深入探讨"cxf3.2.0编码GBK的不可映射字符问题",并提供解决方案。 在Java中,默认的字符编码是UTF-8,而GBK是一个中文常用的编码格式,它包含了更多的中文字符。当XML或者HTTP请求的数据采用GBK编码,而CXF...
标题中的“cxf2.7.18编码GBK的不可映射字符问题”直指Apache CXF 2.7.18版本在处理GBK编码时遇到了问题。GBK是一种扩展的GB2312编码,包含了更多的汉字,但在与UTF-8或其他非GBK编码交互时,如果处理不当,就会出现...
### ant打包时编码 GBK 的不可映射字符 #### 背景介绍 在软件开发过程中,使用构建工具如Ant来自动化编译、打包等任务是十分常见的做法。但是,在处理包含非ASCII字符(例如中文)的源代码时,可能会遇到字符编码...
GBK编码是中文字符集的一种,它扩展了GB2312,包含了更多的汉字,但在处理非GBK字符集的数据时可能会引发“不可映射字符”的错误。 Apache CXF是一个开放源码的服务框架,它允许开发人员通过SOAP、RESTful等Web服务...
在Java开发过程中,遇到“文件名.java:1: 错误: 编码GBK的不可映射字符”这类问题较为常见,尤其是在处理包含中文字符的代码文件时。这个问题通常出现在Windows操作系统下的开发环境中,由于编码方式不一致导致的...
### GBK编码表知识点解析 #### 一、GBK编码概述 **GBK编码**,全称为“汉字内码扩展规范”,是中国国家技术监督...尽管随着国际化趋势的发展,UTF-8逐渐成为主流编码,但GBK编码依然在特定领域发挥着不可替代的作用。
最新cxfjar包,开发过程中遇到字符编码gbk不可映射问题
cxf创建客户端出现GBK编码问题解决的jar 评分: cxf在创建客户端出现编码GBK-不可映射字符的编码问题解决的jar
字符编码是一种规则,它将字符(如字母、数字、符号)映射为特定的数字或二进制序列,以便计算机能够存储和处理这些字符。Unicode是一个全球通用的字符集标准,包含了世界上几乎所有的文字系统,使用统一的编码方式...
GBK 使用双字节编码,最多可表示 20,902 个不同的字符,覆盖了大部分中文字符集。 " Utf2Unicode.exe " 这个文件名表明它是一个可执行程序,可能是用于进行编码转换的工具。从标题和描述来看,这个工具的功能是将...
**问题描述**:在Hibernate框架中,当找不到指定实体的映射信息时,会抛出此类异常。 **解决方案**: - 检查映射文件是否存在,并且是否位于正确的目录中。 - 确认映射文件中的配置信息正确无误。 ##### 10. ...
1. **字符编码**:字符编码是将字符映射到二进制数字的过程,以便计算机能够理解和处理文字。常见的字符编码有ASCII、GB2312、GBK、Big5、Unicode(UCS)和UTF系列等。 2. **ASCII编码**:ASCII是最基础的字符编码...
GBK编码作为中文信息处理的重要组成部分,在嵌入式开发领域具有不可替代的作用。理解GBK编码的特点、使用方法及其与嵌入式开发的关系对于开发高质量的中文支持产品至关重要。随着技术的发展,虽然新的编码标准不断...
UTF-8的基本原理是根据Unicode字符的范围,将其映射成不同长度的编码,具体规则如下: - 每个英文字母、数字占用1个字节; - 泛欧语系、斯拉夫语字母占用2个字节; - 汉字占用3个字节。 这种编码方式的优点在于它...
转换过程中可能遇到GBK中特有的字符,需要正确地映射到Unicode。 4. **UTF-8转CP936**: 转换为CP966时,需要把UTF-8编码的字符串解码成Unicode,然后查找每个字符在GBK中的对应位置,最后按照GBK编码规则重新编码...
- 包括33个不可打印的控制字符(从0到31,以及127),以及94个可打印字符(从32到126)。 - 控制字符用于通信协议中的特殊指令,如换行(0x0A)、回车(0x0D)等。 - 可打印字符包括大写英文字母(A-Z)、小写...
Unicode最常见的实现是UTF-8,它是一种可变长度的编码,可以表示从基本拉丁字母到中文、日文等复杂字符的所有字符。Unicode的优势在于它的兼容性和扩展性,使得处理多种语言的文本变得更加简单。 在C#中,我们可以...