Unicode 转UTF-8

duty_001

浏览: 36225 次
性别:
来自: 北京

最近访客更多访客>>

jasonshaw

jeffreyljc

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

C C++C#PHP

基础知识
UTF-8 　　UTF-8以字节为单位对Unicode进行编码。从Unicode到UTF-8的编码方式如下：　　
Unicode编码(16进制)　║　UTF-8 字节流(二进制) 　
000000 - 00007F　║　0xxxxxxx 　　
000080 - 0007FF　║　110xxxxx 10xxxxxx 　　
000800 - 00FFFF　║　1110xxxx 10xxxxxx 10xxxxxx 　
010000 - 10FFFF　║　11110xxx 10xxxxxx 10xxxxxx 10xxxxxx 　
   　UTF-8的特点是对不同范围的字符使用不同长度的编码。对于0x00-0x7F之间的字符，UTF-8编码与ASCII编码完全相同。UTF-8编码的最大长度是4个字节。从上表可以看出，4字节模板有21个x，即可以容纳21位二进制数字。Unicode的最大码位0x10FFFF也只有21位。　　例1：“汉”字的Unicode编码是0x6C49。0x6C49在0x0800-0xFFFF之间，使用用3字节模板了：1110xxxx 10xxxxxx 10xxxxxx。将0x6C49写成二进制是：0110 1100 0100 1001，用这个比特流依次代替模板中的x，得到：11100110 10110001 10001001，即E6 B1 89。　　例2：Unicode编码0x20C30在0x010000-0x10FFFF之间，使用用4字节模板了：11110xxx 10xxxxxx 10xxxxxx 10xxxxxx。将0x20C30写成21位二进制数字（不足21位就在前面补0）：0 0010 0000 1100 0011 0000，用这个比特流依次代替模板中的x，得到：11110000 10100000 10110000 10110000，即F0 A0 B0 B0。
参考文章：
http://baike.baidu.com/view/40801.htm

//从Unicode转到UTF8   PHP
function uc2html($str) {

   $ret = '';

   for( $i=0; $i<strlen($str)/2; $i++ ) {

       $charcode = ord($str[$i*2])+256*ord($str[$i*2+1]);//得到每个unicode

             if($charcode<127)

         $ret .=chr($charcode);//127以前ASCII,UTF-8一样

       else

         $ret .= $this->u2utf8($charcode);//转换成UTF-8

   }

       return $ret;

}

function u2utf8($c) {
$str="";
if ($c < 0x80) {
$str.=$c;
} else if ($c < 0x800) {
$str.=chr(0xC0 | $c>>6);
$str.=chr(0x80 | $c & 0x3F);
} else if ($c < 0x10000) {
$str.=chr(0xE0 | $c>>12);
$str.=chr(0x80 | $c>>6 & 0x3F);
$str.=chr(0x80 | $c & 0x3F);
} else if ($c < 0x200000) {
$str.=chr(0xF0 | $c>>18);
$str.=chr(0x80 | $c>>12 & 0x3F);
$str.=chr(0x80 | $c>>6 & 0x3F);
$str.=chr(0x80 | $c & 0x3F);
}
return $str;
}

分享到：

给EXCEL 取出乱码使用VBA

2011-06-21 11:09
浏览 6881
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Unicode 转UTF-8

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Unicode 转UTF-8

评论

发表评论

相关推荐

mysql mysql的replace函数很容易

得到服务器绝对路径的PHP代码

zencart 配置邮件问题

Illegal mix of collations

zend studio7 调试配置/网页调试

phpmyadmin报错原因及解决方法：无法在发生错误时创建会话，请检查 PHP 或网站服务器日志，并正确配置 PHP 安装。

unicode 转HTML

最近访客更多访客>>