IntelliJ IDEA 10.0 使用javac 编译程序出现“非法字符: \65279 ”解决方法
一、问题描述:
将在eclipse 创建的项目代码导入 IntelliJ IDEA 10.0 后发现中文乱码,使用工具将源文件编码统一转为“ UTF-8 ”后,显示正常,但在修改文件后,编译出现“ 非法字符: \65279 ”。
二、产生原因:
IntelliJ IDEA 10.0 对设置为“ UTF-8 ”编码的文件在修改后保存时自动加入了 UTF-8文件签名,即 BOM (将文件以十六进制形式查看,可见文件首部为“ EF BB BF ”) .
三、解决方法:
(1) 使用Eclipse 编译器进行编译,在 IntelliJ IDEA 10.0 中设置的方法为 Settings ( Ctrl+Alt+S ) ->Project Setting->Compiler->Java Complier->Use complier选择 Eclipse ,点击 OK
(2) 使用EditPlus 去除 BOM ( EditPlus 版本为 3.01 )
具体方法:先设置去除UTF-8 的文件签名,然后打开文件,另存为 UTF-8 即可
设置方法:工具-> 首选项 -> 文件 -> 默认编码方式: UFT-8 , UTF-8 标识:总是删除签名。
分享到:
相关推荐
IDEA编码GBK不可映射字符解决方法 IDEA是一款功能强大且广泛应用的集成开发环境(Integrated Development Environment),它提供了大量实用的功能来提高开发效率和代码质量。但是,在使用IDEA时,开发者可能会遇到...
UTF-8编码广泛应用于网页、文件系统、数据库等领域,特别是在国际化应用中,其能够支持几乎所有的语言文字,成为现代信息技术中不可或缺的一部分。 通过以上分析可以看出,“UTF-8汉字码表.txt”所涉及的知识点主要...
UTF-8的特点是前几个常用的ASCII字符(如英文字符)使用单字节编码,而其他非ASCII字符则使用2到4个字节。这种设计使得UTF-8与ASCII兼容,同时支持全球多种语言的字符。在网页、编程语言和操作系统中,UTF-8已成为...
在Java开发过程中,遇到“文件名.java:1: 错误: 编码GBK的不可映射字符”这类问题较为常见,尤其是在处理包含中文字符的代码文件时。这个问题通常出现在Windows操作系统下的开发环境中,由于编码方式不一致导致的...
2. **UTF-8**:UTF-8是一种可变长度的字符编码,它可以用于编码所有Unicode字符,并且兼容ASCII编码。对于英文等使用较少字节就能表示的文字,UTF-8非常高效。 3. **Unicode**:Unicode是一种标准,旨在为世界上所有...
UTF-8,全称为“8位统一 Transformation Format”,是一种可变长度的Unicode编码,它能够表示几乎所有的世界语言的字符。 UTF-8的特点在于其灵活性和兼容性。它使用1到4个字节来编码一个字符,其中英文字符仅需1个...
当XML或者HTTP请求的数据采用GBK编码,而CXF服务端按照UTF-8进行解码时,如果数据中存在GBK编码下无法映射到Unicode的字符,就会引发“不可映射字符”错误。这种问题通常会导致数据解析失败,服务端返回错误信息,...
然而,在处理中文字符时,可能会遇到编码问题,如“GBK的不可映射字符”问题。这个问题通常出现在使用GBK编码处理非GBK编码的数据时,导致字符无法正确显示或引发异常。 标题中的“cxf2.7.18编码GBK的不可映射字符...
UTF-8是Unicode Transformation Format的8位变种,是一种可变长度的字符编码方式,它可以表示Unicode字符集中所有的字符。UTF-8的优点在于其兼容性:任何有效的ASCII字符串都是有效的UTF-8字符串,而且在Web上广泛...
在这个场景中,我们关注的是在C语言环境下,于Linux系统中实现UTF-8到GBK的字符编码转换,且要求不依赖任何外部库,以确保代码的可移植性。`Utf8ToGbk.c`和`Utf8ToGbk.h`是实现这个功能的核心文件。 UTF-8是一种...
由于其良好的向后兼容性、可扩展性和高效性,UTF-8已成为Web上的标准编码格式。 3. **中文字符编码**:中文字符属于Unicode中的一部分,通常占用2到4个字节不等。 #### 三、中文转UTF-8编码原理 在UTF-8编码中,...
UTF-8的特点是可变长度,根据字符的不同,可以使用1至4个字节来表示。对于ASCII字符,UTF-8编码与ASCII完全相同,这样就保持了向后兼容性。而对于非ASCII字符,如汉字,UTF-8使用多个字节表示,这种设计既节省空间...
### ant打包时编码 GBK 的不可映射字符 #### 背景介绍 在软件开发过程中,使用构建工具如Ant来自动化编译、打包等任务是十分常见的做法。但是,在处理包含非ASCII字符(例如中文)的源代码时,可能会遇到字符编码...
在PHP编程语言中,将汉字转换为...总的来说,PHP汉字转拼音是处理中文数据时不可或缺的技术,而UTF-8编码则保证了在不同系统和平台间数据的兼容性。通过选择合适的库并理解其工作原理,开发者可以高效地实现这一功能。
UTF-8是一种可变长度的字符编码格式,它支持Unicode标准中的所有字符。其最大优点是向后兼容ASCII码,即对于ASCII字符集中的字符,UTF-8编码与ASCII编码完全相同。对于非ASCII字符,UTF-8使用1到4个字节进行编码,...
而UTF-8支持Unicode,理论上可编码140万多个字符。 2. **编码长度**:GBK使用固定长度的双字节,UTF-8则根据字符的不同,使用1-4字节不等。 3. **兼容性**:GBK主要适用于中文环境,对非中文字符支持有限;UTF-8能...
GBK和UTF-8是两种广泛使用的字符编码标准,它们各自有不同的特点和应用场景。本文将深入探讨GBK与UTF-8的差异,以及如何在C语言中实现它们之间的无库转换。 GBK是中国大陆广泛采用的一种多字节字符编码,它是GB2312...
标题“UTF8_TO_HEX”指的是一个程序或功能,它的主要任务是将UTF-8编码的字符串转换成拉丁字母(Latin1)编码表示的形式。在计算机领域,字符编码是用来表示文本的一种方式,不同的编码标准适用于不同的语言和地区。...
要将GB2312编码的文本转换为Unicode或UTF-8,首先需要识别每个GB2312编码对,然后将这两个字节映射到Unicode码点。由于GB2312编码仅适用于简体中文,所以转换时可以确保每个双字节对都代表一个汉字。将码点转换为...