- 浏览: 27918 次
- 性别:
- 来自: 杭州
最新评论
文章列表
深入了解字符集和编码
- 博客分类:
- Java
一、什么是字符集?什么是编码?
字符(Character)是文字与符号的总称,包括文字、图形符号、数学符号等。
一组抽象字符的集合就是字符集(Charset)。
字符集常常和一种具体的语言文字对应起来,该文字中的所有字符或者大部分常用字符就构成了该文字的字符集,比如英文字符集。
一组有共同特征的字符也可以组成字符集,比如繁体汉字字符集、日文汉字字符集。
字符集的子集也是字符集。
计算机要处理各种字符,就需要将字符和二进制内码对应起来,这种对应关系就是字符编码(Encoding)。
制定编码首先要确定字符集,并将字符集内的字符排序,然后和二进制数字对应起来。根据字符 ...
精确解释Unicode
- 博客分类:
- Java
转自 http://blog.csdn.net/gqqnb/article/details/6266542
我决心了解一下编码知识——主要是Unicode——及相关概念,搜索阅读了网上的很多文章,明白了一些,另一些却很模糊,而且有一些不同文章的描述是冲突的!我因此查阅了很多网上的资料,主要有中英文维基百科和Unicode.org,终于明白了其中的奥妙。
独乐乐不如众乐乐,我因此撰此文帮助大家最大程度地厘清Unicode、UCS、UTF-8、UTF-16、UCS-2
from http://blog.csdn.net/stilling2006/article/details/4129700
很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们看到8个开关状态是好的,于是他们把这称为"字节"。
再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出很多状态,状态开始变来变去。他们看到这样是好的,于是它们就这机器称为"计算机"。
开始计算机只在美国用。八位的字节一共可以组合出256(2的8次方)种不同的状态。
他们把其 ...
Single quotes will ensure that the quoted value will be assigned to the reference as is. Double quotes allow you to use velocity references and directives to interpolate, such as "Hello $name", where the $name will be replaced by the current value before that string literal is assigned to t ...
http://www.cnblogs.com/MyFavorite/archive/2010/10/19/1855758.html
1. 关于InputStream.read() 在从数据流里读取数据时,为图简单,经常用InputStream.read()方法。这个方法是从流里每次只读取读取一个字节,效率会非常低。 更好的方 ...
基本概念
• 字符(Character)是指人类语言中最小的表义符号。例如’A’、’B’等;
• 给定一系列字符,对每个字符赋予一个数值,用数值来代表对应的字符,这一数值就是字符的编码(Encoding)。例如,我们给字符’A’赋予数值0,给字符’B’赋予数值1,则0就是字符’A’的编码;
• 给定一系列字符并赋予对应的编码后,所有这些字符和编码对组成的集合就是字符集(Character Set)。例如,给定字符列表为{’A’,’B’}时,{’A’=>0, ‘B’=>1}就是一个字符集;
• 字符序(Collation)是指在同一字符集内字符之间的比较规则;
• ...
下文对MYSQL IFNULL函数的使用进行了详细的叙述,供您参考学习,如果您在MYSQL IFNULL函数使用方面遇到过类似的问题,不妨一看。
MYSQL IFNULL(expr1,expr2)
如果expr1不是NULL,IFNULL()返回expr1,否则它返回expr2。IFNULL()返回 ...
一个简单的windows 文件名 正则表达式,不检查文件名如 con 等
^[^/\\\:\*\?\"\<\>\|\\]{1,255}$
参考了
http://blog.csdn.net/lsj19830812/article/details/4137003
jquery 1.4 的contenttype 默认是
contentType: 'application/x-www-form-urlencoded;charset=UTF-8',
1.6变为
contentType: 'application/x-www-form-urlencoded',
如果不在$.ajax 中加
contentType: 'application/x-www-form-urlencoded;charset=UTF-8',
传回 request 的 charactor charset 是 null
最近在做一个百度词典的采集,http://dict.baidu.com,发现了一个可以值得探讨的一个问题,汉字的编码问题。首先,我们输入一个汉字词语进行搜索,比如,我们,URL上的地址变成http://dict.baidu.com/s?wd=%CE%D2%C3%C7,前面的http://dict.baidu.com/s?wd=就不用管了,都知道是什么意思,我们关注一下后面“%CE%D2%C3%C7”这几个东西。显然是词语“我们”这个的汉字编码。我们知道PHP有个函数urlencode,可以把汉字转换为类似那样行事的。,得到结果为:%E6%88%91%E4%BB%AC。
显然,不是%CE ...
作者:孙东国
标准参考
URI 的组成如下所示:
foo://example.com:8042/over/there?name=ferret#nose
\_/ \______________/\_________/ \_________/ \__/
| | | | |
scheme authority path query fragment
| _____________ ...
参考了http://www.kei.tw/blogger/39-5.html
position :static relative absolute fixed
static 不可重叠,忽略坐标
relative 无坐标类似static,有坐标则是相对坐标,相对其本应该处得位置,正数为 下 右 方向。
absolute 默认重叠,坐标是相对于其parent的边框距离,如果是 right 值,正数越大,越往左走,负数向右走, 无parent相对于浏览器。
fixed 无论父子关系,以浏览器坐标左上角为准,下 右 方向为正数。
支持的JDBC类型
为了未来的参考,MyBatis通过包含的jdbcType枚举型,支持下面的JDBC类型。
BIT
FLOAT
CHAR
TIMESTAMP
OTHER
UNDEFINED
TINYINT
REAL
VARCHAR
BINARY
BLOB
NVARCHAR
SMALLINT
DOUBLE
LONGVARCHAR
VARBINARY
CLOB
NCHAR
INTEGER
NUMERIC
DATE
LONGVARBINARY
BOOLEAN
NCLOB
BIGINT
DECIMAL
TIME
NULL
C ...
【原创】各种编码的关系
- 博客分类:
- Java
以下为个人总结,有问题欢迎指出。
ASCII 8位
ISO 8859-1,正式编号为ISO/IEC 8859-1:1998,又称Latin-1或“西欧语言”,是国际标准化组织内ISO/IEC 8859的第一个8位字符集。它以ASCII为基础,在空置的0xA0-0xFF的范围内,加入96个字母及符号,藉以供使用附加符号的拉丁字母语言使用。曾推出过 ISO 8859-1:1987 版。
utf-32 是 ucs4的子集,他们都是用32位来编码,utf-32 是只在0到10FFFF的字碼空間。
utf-16 是 ucs2的父集, utf 16,在0到65535,用16位表示,大于65 ...
来源:http://www.quora.com/What-is-Facebooks-architecture (由Micha?l Figuière回答)
根据我现有的阅读和谈话,我所理解的今天Facebook的架构如下:
Web 前端是由 PHP 写的。Facebook 的 HipHop [1] 会把PHP转成 C++ 并用 g++编译,这样就可以为 ...