最新文章列表

字符集简介

ISO8859-1(西欧字符集)(1个字节) 可以表示多种字母式语言 GB2312 大陆使用最早、最广的简体中文字符集,包含ISO8859-1字符集 GBK GB2312的扩展,可以表示繁体中文 GB18030 GBK的扩展,可以表示中国少数民族语言 BIG5 大五码,台湾地区使用编码,表示繁体中文 Unicode(UTF-8,UTF-16) 国际通用字符集 Java采用Unic ...
guaaug 评论(0) 有709人浏览 2013-07-31 15:26

字符编码:ASCII,Unicode和UTF-8

1. ASCII码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111。 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的 ...
zhaiyuehui 评论(0) 有604人浏览 2013-07-23 13:43

JS 正则表达式的那点事

//提取字符串中的所有中文 var reg = /[\u4e00-\u9fa5]*/g; //g 全局变量   \u4e00-\u9fa5  Unicode字符集 var pval = arr[0].match(reg);//在 字符串的这个范围内查找 符合 reg条件的语句 兵提取出来 成为一个数组
lishouxinghome 评论(0) 有657人浏览 2013-07-16 16:34

【转载】字符编码的故事(unicode,ansi,utf-8,unicode big endian 编码区别)

引用 这是一篇介绍字符编码历史的短文,活泼幽默,非常值得一看。原文刊登于http://spaces.msn.com/haoxiaobo/blog/cns!D1C72860197EBF38!425.entry,但是早已无法访问了。最早的转载我只看到08年11月份的。再此转载下,供大家饭后小酌。         快下班时,爱问问题的小朋友Nico又问了一个问题: “sqlserver里面有char和 ...
futeng 评论(0) 有1165人浏览 2013-07-11 17:12

多端点传输杜绝乱码方案

多个端点之前传输字符串(String),实际上是传输字节流(Byte[])。如果发送方采用UTF8编码将字符串变为字节流(Byte[]=String.getBytes("UTF8")),当接收方 ...
lazy_ 评论(3) 有2110人浏览 2013-07-05 08:11

java字符串与unicode转换

/** * 字符串转化为unicode * @param gbString * @return */ public static String encodeUnicode(final String gbString) { char[] utfBytes = gbString.toCharArray() ...
yangmeng_3331 评论(0) 有714人浏览 2013-06-07 13:27

Unicode和UTF-8的关系

1. ASCII码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态对应一个符号,就是256个符号,从0000000到11111111。 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之 ...
xiaoqiS 评论(0) 有844人浏览 2013-06-07 10:02

常用字符编码转换

       不论是web开发或是移动开发,在不同场景总是需要用的编码的转换,之前一直没有去深入的研究其中的转换关系,今天抽空学习了下(字符编码介绍很多,我只是将之间的关系总结了下,具体介绍可自行wiki)。        先介绍下几种主要的编码方式ASCII、Unicode、UTF-8、GBK、BASE64、URLEncode。 ASCII:美国信息交换标准代码,是基于拉丁字母的一套电 ...
答案在风中 评论(0) 有6273人浏览 2013-05-09 01:41

java各种处理字符串情况乱码原因分析及其解决方法

                      JAVA编解码                           ---- 乱码问题   ---- 通过一个事例进行分析 一、需求:   二、过程分析:   第一步:java文件编码格式    文件格式非固定:
王树雄 评论(2) 有13600人浏览 2013-04-27 15:32

ANSI与Unicode字符编码简介

ANSI (American National Standards Institute)字符集: ASCII字符集+MBCS(Multi-Byte Character System)字符集,如GB2312。 写道 ASCII : 最初,ANSI只包括一种字符集(ASCII-American Standard Code for Information Interchange)。ASCII码 ...
myclqr 评论(0) 有1157人浏览 2013-04-03 17:34

2、字符编码

一、字符编码   字符流的出现为了方便操作字符 更重要的是加入了编码转换 通过子类转换流来完成 InputStreamReader OutputStreamWriter 在两个对象进行构造的时候可以加入字符集 二、编码表的由来   计算机只能识别二进制数据,早期由来是电信号 为了方便应用计算机,让它可以识别各个国家的文字 就将各个国家的文字用数字来表示,并一一对应,形 ...
豆豆咖啡 评论(0) 有813人浏览 2013-03-14 13:10

UNICODE与UTF8和GBK之间的关系

声明:以下内容为网上搜集。 需要注意的是,Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储,互联网 ...
darrenzhu 评论(0) 有2269人浏览 2013-02-27 11:36

Unicode和UTF-8转换方法的理解

    下面是关于Unicode和UTF-8之间转换方法的引用。 写道 互联网的普及,强烈要求出现一种统一的编码方式。UTF-8就是在互联网上使用最广的一种unicode ...
yuanc00 评论(0) 有1095人浏览 2013-02-23 19:04

字符编码小研究

在Grails项目中,实现国际化,遇到了中文乱码的问题,几经学习问题解决了。本着打破砂锅的精神,又折腾到凌晨2点,初步研究了一下字符编码等知识。 ====基础==== ---ANSI--- 字符编码: ASCII = 英文字母编码 GB2312 = ASCII + 简体编码(对ASCII的中文扩展) Big5 = ASCII + 繁体编码 (还有针对日语、韩语等字符编码) 以上统称为AN ...
Jcat 评论(1) 有2201人浏览 2013-02-20 12:44

用java实现打印汉字的Unicode和GBK编码一览表

import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.UnsupportedEncodingException; public class ChineseCharEncodingList{ private static final int MIN_INDEX ...
lusam06 评论(0) 有6503人浏览 2013-02-20 11:34

常用汉字的unicode 编码

包含汉字: 的一是了我不人在他有这个上们来到时大地为子中你说生国年着就那和要她出也得里后自以会家可下而过天去能对小多然于心学么之 都好 ...
lusam06 评论(0) 有1882人浏览 2013-02-20 11:27

字符编码笔记:ASCII,Unicode和UTF-8

今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料。 结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步搞清楚。 下面就是我的笔记,主要用来整理自己的思路。但是,我尽量试图写得通俗易懂,希望能对其他朋友有用。毕竟,字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得一点字符编码的知识。 1. ASCII码 我们知道,在计算机内部,所有的信息最终都 ...
hejiajunsh 评论(0) 有1249人浏览 2013-01-23 14:12

Python2.x中支持unicode的configparser

Python2.x中支持unicode的configparser by cnDenis http://cndenis.iteye.com 2013年1月16日 Python2.x中许多内置模块不支持unicode,确实是很烦的事。configparser就是其中之一。 解决方法是使用Python3.x中configparser的backport,http://pypi.python.org/ ...
cnDenis 评论(0) 有2536人浏览 2013-01-16 11:06

Unicode码和字符间的相互转换

//************************************************************************** //UnicodetoChar public class UnicodetoChar { //以空格为分隔 private String theString; public UnicodetoCh ...
zhangIT 评论(0) 有1673人浏览 2013-01-12 22:36

zz Unicode 详解

本文转自 http://tech.idv2.com/2008/02/21/unicode-intro/   个人觉得是一篇很不错的,深度控制得很好的 介绍Unicode的文章,之所以列在“String 研究”分类下,因为unicode是Character的基础,当然也是String的基础。 基本知识 介绍Unicode之前,首先要讲解一些基础知识。虽然跟Unicode没有直接的关系, 但想 ...
leonzhx 评论(0) 有1238人浏览 2013-01-07 17:04

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics