`
shendixiong
  • 浏览: 398513 次
  • 性别: Icon_minigender_1
  • 来自: 长沙
社区版块
存档分类
最新评论

编码 UTF-8 的不可映射字符

阅读更多

IntelliJ IDEA 10.0  使用javac 编译程序出现“非法字符:  \65279 ”解决方法

 

一、问题描述:

将在eclipse 创建的项目代码导入 IntelliJ IDEA 10.0 后发现中文乱码,使用工具将源文件编码统一转为“ UTF-8 ”后,显示正常,但在修改文件后,编译出现“ 非法字符: \65279 ”。

二、产生原因:

IntelliJ IDEA 10.0 对设置为“ UTF-8 ”编码的文件在修改后保存时自动加入了 UTF-8文件签名,即 BOM (将文件以十六进制形式查看,可见文件首部为“ EF BB BF ”) .

三、解决方法:

(1) 使用Eclipse 编译器进行编译,在 IntelliJ IDEA 10.0 中设置的方法为 Settings Ctrl+Alt+S ->Project Setting->Compiler->Java Complier->Use complier选择 Eclipse ,点击 OK

(2) 使用EditPlus 去除 BOM EditPlus 版本为 3.01

具体方法:先设置去除UTF-8 的文件签名,然后打开文件,另存为 UTF-8 即可

设置方法:工具-> 首选项 -> 文件 -> 默认编码方式: UFT-8 UTF-8 标识:总是删除签名。

分享到:
评论
1 楼 guomingzhang2008 2012-11-01  
thinks

相关推荐

    IDEA编码GBK不可映射字符解决方法

    IDEA编码GBK不可映射字符解决方法 IDEA是一款功能强大且广泛应用的集成开发环境(Integrated Development Environment),它提供了大量实用的功能来提高开发效率和代码质量。但是,在使用IDEA时,开发者可能会遇到...

    UTF-8汉字码表.txt

    UTF-8编码广泛应用于网页、文件系统、数据库等领域,特别是在国际化应用中,其能够支持几乎所有的语言文字,成为现代信息技术中不可或缺的一部分。 通过以上分析可以看出,“UTF-8汉字码表.txt”所涉及的知识点主要...

    UTF-8转ANSI文本文件转换器

    UTF-8的特点是前几个常用的ASCII字符(如英文字符)使用单字节编码,而其他非ASCII字符则使用2到4个字节。这种设计使得UTF-8与ASCII兼容,同时支持全球多种语言的字符。在网页、编程语言和操作系统中,UTF-8已成为...

    Java乱码问题

    在Java开发过程中,遇到“文件名.java:1: 错误: 编码GBK的不可映射字符”这类问题较为常见,尤其是在处理包含中文字符的代码文件时。这个问题通常出现在Windows操作系统下的开发环境中,由于编码方式不一致导致的...

    多字节与UTF-8、Unicode之间的转换

    2. **UTF-8**:UTF-8是一种可变长度的字符编码,它可以用于编码所有Unicode字符,并且兼容ASCII编码。对于英文等使用较少字节就能表示的文字,UTF-8非常高效。 3. **Unicode**:Unicode是一种标准,旨在为世界上所有...

    UTF-8编码转换器

    UTF-8,全称为“8位统一 Transformation Format”,是一种可变长度的Unicode编码,它能够表示几乎所有的世界语言的字符。 UTF-8的特点在于其灵活性和兼容性。它使用1到4个字节来编码一个字符,其中英文字符仅需1个...

    cxf3.2.0编码GBK的不可映射字符问题

    当XML或者HTTP请求的数据采用GBK编码,而CXF服务端按照UTF-8进行解码时,如果数据中存在GBK编码下无法映射到Unicode的字符,就会引发“不可映射字符”错误。这种问题通常会导致数据解析失败,服务端返回错误信息,...

    cxf2.7.18编码GBK的不可映射字符问题

    然而,在处理中文字符时,可能会遇到编码问题,如“GBK的不可映射字符”问题。这个问题通常出现在使用GBK编码处理非GBK编码的数据时,导致字符无法正确显示或引发异常。 标题中的“cxf2.7.18编码GBK的不可映射字符...

    Encode-Decode-ANSI-UTF-8.rar

    UTF-8是Unicode Transformation Format的8位变种,是一种可变长度的字符编码方式,它可以表示Unicode字符集中所有的字符。UTF-8的优点在于其兼容性:任何有效的ASCII字符串都是有效的UTF-8字符串,而且在Web上广泛...

    UTF-8转GBK C语言 Linux

    在这个场景中,我们关注的是在C语言环境下,于Linux系统中实现UTF-8到GBK的字符编码转换,且要求不依赖任何外部库,以确保代码的可移植性。`Utf8ToGbk.c`和`Utf8ToGbk.h`是实现这个功能的核心文件。 UTF-8是一种...

    中文转UTF-8编码

    由于其良好的向后兼容性、可扩展性和高效性,UTF-8已成为Web上的标准编码格式。 3. **中文字符编码**:中文字符属于Unicode中的一部分,通常占用2到4个字节不等。 #### 三、中文转UTF-8编码原理 在UTF-8编码中,...

    字符编码ASCIIUnicodeUTF-8GB2312

    UTF-8的特点是可变长度,根据字符的不同,可以使用1至4个字节来表示。对于ASCII字符,UTF-8编码与ASCII完全相同,这样就保持了向后兼容性。而对于非ASCII字符,如汉字,UTF-8使用多个字节表示,这种设计既节省空间...

    ant打包时编码 GBK 的不可映射字符.txt

    ### ant打包时编码 GBK 的不可映射字符 #### 背景介绍 在软件开发过程中,使用构建工具如Ant来自动化编译、打包等任务是十分常见的做法。但是,在处理包含非ASCII字符(例如中文)的源代码时,可能会遇到字符编码...

    php汉字转拼音 降汉字转换为拼音,utf-8

    在PHP编程语言中,将汉字转换为...总的来说,PHP汉字转拼音是处理中文数据时不可或缺的技术,而UTF-8编码则保证了在不同系统和平台间数据的兼容性。通过选择合适的库并理解其工作原理,开发者可以高效地实现这一功能。

    UTF-8与GB2312之间的互换.doc

    UTF-8是一种可变长度的字符编码格式,它支持Unicode标准中的所有字符。其最大优点是向后兼容ASCII码,即对于ASCII字符集中的字符,UTF-8编码与ASCII编码完全相同。对于非ASCII字符,UTF-8使用1到4个字节进行编码,...

    gbk与utf-8的区别

    而UTF-8支持Unicode,理论上可编码140万多个字符。 2. **编码长度**:GBK使用固定长度的双字节,UTF-8则根据字符的不同,使用1-4字节不等。 3. **兼容性**:GBK主要适用于中文环境,对非中文字符支持有限;UTF-8能...

    gbk和 utf-8 转换

    GBK和UTF-8是两种广泛使用的字符编码标准,它们各自有不同的特点和应用场景。本文将深入探讨GBK与UTF-8的差异,以及如何在C语言中实现它们之间的无库转换。 GBK是中国大陆广泛采用的一种多字节字符编码,它是GB2312...

    UTF8_TO_HEX

    标题“UTF8_TO_HEX”指的是一个程序或功能,它的主要任务是将UTF-8编码的字符串转换成拉丁字母(Latin1)编码表示的形式。在计算机领域,字符编码是用来表示文本的一种方式,不同的编码标准适用于不同的语言和地区。...

    gb2312,unicode,utf-8转换

    要将GB2312编码的文本转换为Unicode或UTF-8,首先需要识别每个GB2312编码对,然后将这两个字节映射到Unicode码点。由于GB2312编码仅适用于简体中文,所以转换时可以确保每个双字节对都代表一个汉字。将码点转换为...

Global site tag (gtag.js) - Google Analytics