最新文章列表

探索java编码——UNICODE、GBK、UTF-8等

  必须知道的几个简单概念:   1. unicode:字符集,包含了全世界几乎所有的字符。解除了ascii、iso-8859-1等字符集的局限。   2. unicode码:与每一个字符相对应的数字,一对一映射,常用的BMP区段范围在0x0000—0xffff。编码时,通过字符找到数字,解码时,相反。   3. utf-16:编码方式,将unicode中的每个字符转换成两个字节,并与BMP保 ...
cqupt123 评论(0) 有2464人浏览 2012-11-04 02:15

用js实现编码转换gb2312转utf8

[size=medium]在文件编码为gb2312的html文件中,提交表单到utf8页面中会出现乱码的现象,针对这样的问题既可以从前端下手也可以从后端进行处理,为了方便,决定从前端下手,从网上搜集到了相关js特分享如下:[/size] [code="js"] <script language="JavaScript"> <!-- ...
bzlrj 评论(0) 有2218人浏览 2012-10-23 15:15

代码编译出现(illegal character: \65279)

今天在代码打包时报如下错误::1: illegal character: 5279 查看文件确实是UTF-8的最后在高人指点下看到 http://blog.csdn.net/shixing_11/article/details/6976900 这篇blog,总算明白什么原因了,与这个几乎完全一样的问题 网上看到了很多解决方法,一番折腾后还是我的工具比较神器NotePad++自带去除BOM功能 ...
田智伟 评论(0) 有24995人浏览 2012-10-11 17:28

字符编码笔记:ASCII,Unicode和UTF-8

本文转自:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html 作者: 阮一峰 日期: 2007年10月28日 今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料。 结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步搞清楚。 下面就
sailqi 评论(0) 有810人浏览 2012-10-09 17:38

文件与字符串之间的转化

package demo; import java.io.Closeable; import java.io.File; import java.io.IOException; import java.util.ArrayList; import java.util.List; import org.apache.commons.io.FileUtils; import org.apa ...
晨必须的 评论(0) 有1162人浏览 2012-09-27 13:16

eclipse导出javadoc文档

项目完成了,想把java源码生成doc文档,使用eclipse的export/javadoc就可以完成。 使用eclipse生成文档(javadoc)主要有三种方法: 1,在项目列表中按右 ...
accpxudajian 评论(0) 有2085人浏览 2012-08-15 11:21

MySQL设置字符集为UTF8(Windows版)

Windows版MySQL设置字符集全部为utf8的方式   MySQL安装目录下的my.ini文件   [client]节点 #修改客户端默认字符编码格式为utf8 default-character-set=utf8    (增加)   [mysql]节点 default-character-set=utf8    (修改)   ...
snoopy7713 评论(0) 有8924人浏览 2012-08-07 08:40

关于UTF-8和GBK的选择

UTF-8:Unicode Transformation Format-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如果是UTF8编码,则在外国人的英文IE上也能显示 ...
阿拉丁没有神灯 评论(0) 有1307人浏览 2012-08-06 23:57

字符编码原理 ASCII,Unicode和UTF-8

字符编码笔记:ASCII,Unicode和UTF-8 作者: 阮一峰 今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料。 结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步搞清楚。 下面就是我的笔记,主要用来整理自己的思路。但是,我尽量试图写得通俗易懂,希望能对其他朋友有用。毕竟,字符编码是计算机技术的基石,想 ...
ling凌yue月 评论(1) 有6118人浏览 2012-08-06 14:35

apache Http post方式

public String doPost(String url, Map<String, String> params) { String response = null; log.info("url为:" + url + ",params为:" + params); HttpClient httpClient = new ...
hezhiyu 评论(0) 有2178人浏览 2012-07-31 19:26

Windows 7 右键新建记事本为UTF-8格式 设置方式

目前状况是,新建记事本(txt)文档时默认的编码格式是ANSI编码的,其缺点是有些中文、特殊符号在保存时会丢失,为了方便大家不用每次存档时都要另存为utf-8或者unicode等编码,特从Microsoft的问答论坛找到一个解决方法(仅限于右键“新建-->文本文档”): 1. 打开目录(没有则自己新建) 引用C:\WINDOWS\SHELLNEW 2. 在该目录下创建一个文本文档(txt): ...
Simon.C 评论(0) 有9224人浏览 2012-06-21 00:04

Unicode和UTF-8之间的转换详解

    通过这几天的研究,终于明白了Unicode和UTF-8之间编码的区别。Unicode是一个字符集,而UTF-8是Unicode的其中一种,Unicode是定长的都为双字节,而UTF-8是可变的,对于汉字来说Unicode占有的字节比UTF-8占用的字节少1个字节。Unicode为双字节,而UTF-8中汉字占三个字节。                         网魂小兵 http://x ...
zjhwl 评论(0) 有1046人浏览 2012-06-13 11:15

HttpClient 处理中文乱码

  HttpClient 请求的中文乱码问题 相关类库: commons-codec-1.3.jar,commons-httpclient-3.1.jar,commons-logging-1.1.1.jar  --给请求传递参数 HttpClient client = new HttpClient(); HttpMethod method= new PostMethod(url); H ...
晨必须的 评论(1) 有27469人浏览 2012-06-03 22:57

BOM

引子 最近做项目导出UTF-8的文档,结果用MS Excel打开出现乱码,检查了字符串编码,输出编码设置都正确,后来用notepad++打开,显示正确,查看编码才发现编码是UTF-8 without BOM,原来是这个BOM在作怪,查询了下资料,把这个家伙弄处理说说。 BOM是什么 BOM,是Byte Order Mark的缩写,是Unicode用来标识字节码顺序(Big endian/ Li ...
jamie.wang 评论(0) 有1326人浏览 2012-05-30 11:17

mysql中文排序

数据库采用utf-8编码,order by 无法对中文按照拼音排序 ,对中文字段转为GBK后排序即可。     SELECT * FROM dept ORDER BY CONVERT( fd_dept_name USING gbk ) ;
zyn010101 评论(0) 有1386人浏览 2012-05-23 10:07

java 中文字符编码的思维定式

在JAVA代码中,总想写下面的代码:myString.getCharsetName(),也就是想获取字符串的当前编码,可是根本没有这样的方法。     在写代码时,很有可能遇到这样的情况:读取一个文件(假设文件的编码是GBK),本地环境为UTF-8,按照默认的方式读取后发现出现了乱码,于是想把读入的字符串编码格式转换成UTF-8,在调用如下的方法:new InputStreamReader(_in ...
单眼皮大娘 评论(0) 有2081人浏览 2012-05-16 16:56

[转]Mysql字符集设置

MySQL的字符集支持(Character Set Support)有两个方面: 1、字符集(Character set) 2、排序比较方式(Collation)。 通过命令:show character set 和 show collation 可以分别查看Mysql支持的字符集和排序方式。 mysql> show character set; mysql> show col ...
czj4451 评论(0) 有1620人浏览 2012-05-13 21:11

php输出UTF-8格式XML文件中文乱码问题(含asp,asp.net,jsp代码)

下面是asp.net,php,jsp等语言在输出utf-8是需要在输出开始添加三个字节的内容,不让输出的文件会有一定的问题,希望对大家有所帮助。 Using ASP.NET C#       Response.ContentType="text/xml; characterset=utf-8" ;      Response.BinaryWrite( new byte[] ...
abc123456789cba 评论(0) 有2325人浏览 2012-05-02 15:33

UTF-8 GBK UTF8 GB2312 之间的区别和关系(转)

UTF-8:Unicode TransformationFormat-8bit,允许含BOM,但通常不含BOM。是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24 ...
king_wangyao 评论(0) 有1285人浏览 2012-05-01 12:15

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics