编码 UTF-8 的不可映射字符 - dison - ITeye博客

`

shendixiong

浏览: 401488 次
性别:
来自: 长沙

最近访客更多访客>>

zhlei163

belllab

lvbomr

loadingsmc

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

18335864773：可以尝试用一下pageoffice插件生成excel。同样可以 ...
poi设置excel表格边框
a1334480360：楼主你好，我用这种方式，回执消息里面并没有携带接收到消息的ID ...
openfire 消息回执
yun9157：楼主在么？能否留一个联系方式，我现在需要做消息回执这一块。需 ...
openfire 服务端消息回执添加和响应
shendixiong： efei 写道不知楼主用openfire的时候是否存在丢包的问 ...
openfire 服务端消息回执添加和响应
shendixiong： jxufecs2008 写道楼主，你好，这个消息回执请求和响应 ...
openfire 服务端消息回执添加和响应

编码 UTF-8 的不可映射字符

博客分类：

android(安卓)

不可映射字符编码

阅读更多

IntelliJ IDEA 10.0 使用javac 编译程序出现“非法字符： \65279 ”解决方法

一、问题描述：

将在eclipse 创建的项目代码导入 IntelliJ IDEA 10.0 后发现中文乱码，使用工具将源文件编码统一转为“ UTF-8 ”后，显示正常，但在修改文件后，编译出现“ 非法字符： \65279 ”。

二、产生原因：

IntelliJ IDEA 10.0 对设置为“ UTF-8 ”编码的文件在修改后保存时自动加入了 UTF-8文件签名，即 BOM （将文件以十六进制形式查看，可见文件首部为“ EF BB BF ”） .

三、解决方法：

（1）使用Eclipse 编译器进行编译，在 IntelliJ IDEA 10.0 中设置的方法为 Settings （ Ctrl+Alt+S ） ->Project Setting->Compiler->Java Complier->Use complier选择 Eclipse ，点击 OK

（2）使用EditPlus 去除 BOM （ EditPlus 版本为 3.01 ）

具体方法：先设置去除UTF-8 的文件签名，然后打开文件，另存为 UTF-8 即可

设置方法：工具-> 首选项 -> 文件 -> 默认编码方式： UFT-8 ， UTF-8 标识：总是删除签名。

分享到：

UNEXPECTED TOP-LEVEL EXCEPTION | 取消自动获取焦点(默认进来焦点到edittext ...

2011-09-22 15:22
浏览 14331
评论(1)
分类:移动开发
查看更多

评论

1 楼 guomingzhang2008 2012-11-01

thinks

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

IDEA编码GBK不可映射字符解决方法: IDEA编码GBK不可映射字符解决方法 IDEA是一款功能强大且广泛应用的集成开发环境（Integrated Development Environment），它提供了大量实用的功能来提高开发效率和代码质量。但是，在使用IDEA时，开发者可能会遇到...

UTF-8汉字码表.txt: UTF-8编码广泛应用于网页、文件系统、数据库等领域，特别是在国际化应用中，其能够支持几乎所有的语言文字，成为现代信息技术中不可或缺的一部分。通过以上分析可以看出，“UTF-8汉字码表.txt”所涉及的知识点主要...

UTF-8转ANSI文本文件转换器: UTF-8的特点是前几个常用的ASCII字符（如英文字符）使用单字节编码，而其他非ASCII字符则使用2到4个字节。这种设计使得UTF-8与ASCII兼容，同时支持全球多种语言的字符。在网页、编程语言和操作系统中，UTF-8已成为...

Java乱码问题: 在Java开发过程中，遇到“文件名.java:1: 错误: 编码GBK的不可映射字符”这类问题较为常见，尤其是在处理包含中文字符的代码文件时。这个问题通常出现在Windows操作系统下的开发环境中，由于编码方式不一致导致的...

多字节与UTF-8、Unicode之间的转换: 2. **UTF-8**：UTF-8是一种可变长度的字符编码，它可以用于编码所有Unicode字符，并且兼容ASCII编码。对于英文等使用较少字节就能表示的文字，UTF-8非常高效。 3. **Unicode**：Unicode是一种标准，旨在为世界上所有...

UTF-8编码转换器: UTF-8，全称为“8位统一 Transformation Format”，是一种可变长度的Unicode编码，它能够表示几乎所有的世界语言的字符。 UTF-8的特点在于其灵活性和兼容性。它使用1到4个字节来编码一个字符，其中英文字符仅需1个...

cxf3.2.0编码GBK的不可映射字符问题: 当XML或者HTTP请求的数据采用GBK编码，而CXF服务端按照UTF-8进行解码时，如果数据中存在GBK编码下无法映射到Unicode的字符，就会引发“不可映射字符”错误。这种问题通常会导致数据解析失败，服务端返回错误信息，...

cxf2.7.18编码GBK的不可映射字符问题: 然而，在处理中文字符时，可能会遇到编码问题，如“GBK的不可映射字符”问题。这个问题通常出现在使用GBK编码处理非GBK编码的数据时，导致字符无法正确显示或引发异常。标题中的“cxf2.7.18编码GBK的不可映射字符...

Encode-Decode-ANSI-UTF-8.rar: UTF-8是Unicode Transformation Format的8位变种，是一种可变长度的字符编码方式，它可以表示Unicode字符集中所有的字符。UTF-8的优点在于其兼容性：任何有效的ASCII字符串都是有效的UTF-8字符串，而且在Web上广泛...

UTF-8转GBK C语言 Linux: 在这个场景中，我们关注的是在C语言环境下，于Linux系统中实现UTF-8到GBK的字符编码转换，且要求不依赖任何外部库，以确保代码的可移植性。`Utf8ToGbk.c`和`Utf8ToGbk.h`是实现这个功能的核心文件。 UTF-8是一种...

中文转UTF-8编码: 由于其良好的向后兼容性、可扩展性和高效性，UTF-8已成为Web上的标准编码格式。 3. **中文字符编码**：中文字符属于Unicode中的一部分，通常占用2到4个字节不等。 #### 三、中文转UTF-8编码原理在UTF-8编码中，...

字符编码ASCIIUnicodeUTF-8GB2312: UTF-8的特点是可变长度，根据字符的不同，可以使用1至4个字节来表示。对于ASCII字符，UTF-8编码与ASCII完全相同，这样就保持了向后兼容性。而对于非ASCII字符，如汉字，UTF-8使用多个字节表示，这种设计既节省空间...

ant打包时编码 GBK 的不可映射字符.txt: ### ant打包时编码 GBK 的不可映射字符 #### 背景介绍在软件开发过程中，使用构建工具如Ant来自动化编译、打包等任务是十分常见的做法。但是，在处理包含非ASCII字符（例如中文）的源代码时，可能会遇到字符编码...

php汉字转拼音降汉字转换为拼音，utf-8: 在PHP编程语言中，将汉字转换为...总的来说，PHP汉字转拼音是处理中文数据时不可或缺的技术，而UTF-8编码则保证了在不同系统和平台间数据的兼容性。通过选择合适的库并理解其工作原理，开发者可以高效地实现这一功能。

UTF-8与GB2312之间的互换.doc: UTF-8是一种可变长度的字符编码格式，它支持Unicode标准中的所有字符。其最大优点是向后兼容ASCII码，即对于ASCII字符集中的字符，UTF-8编码与ASCII编码完全相同。对于非ASCII字符，UTF-8使用1到4个字节进行编码，...

gbk与utf-8的区别: 而UTF-8支持Unicode，理论上可编码140万多个字符。 2. **编码长度**：GBK使用固定长度的双字节，UTF-8则根据字符的不同，使用1-4字节不等。 3. **兼容性**：GBK主要适用于中文环境，对非中文字符支持有限；UTF-8能...

gbk和 utf-8 转换: GBK和UTF-8是两种广泛使用的字符编码标准，它们各自有不同的特点和应用场景。本文将深入探讨GBK与UTF-8的差异，以及如何在C语言中实现它们之间的无库转换。 GBK是中国大陆广泛采用的一种多字节字符编码，它是GB2312...

gb2312,unicode,utf-8转换: 要将GB2312编码的文本转换为Unicode或UTF-8，首先需要识别每个GB2312编码对，然后将这两个字节映射到Unicode码点。由于GB2312编码仅适用于简体中文，所以转换时可以确保每个双字节对都代表一个汉字。将码点转换为...

UTF8_TO_HEX: 标题“UTF8_TO_HEX”指的是一个程序或功能，它的主要任务是将UTF-8编码的字符串转换成拉丁字母（Latin1）编码表示的形式。在计算机领域，字符编码是用来表示文本的一种方式，不同的编码标准适用于不同的语言和地区。...

Global site tag (gtag.js) - Google Analytics