`
Tony小熊
  • 浏览: 35083 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

PHP unicode 转 utf8

    博客分类:
  • php
 
阅读更多
function unicodeToUTF8($str, $code = 'UTF-8') {
        $str = str_replace('\u', '%u', $str);
        $str = rawurldecode($str);
        preg_match_all("/(?:%u.{4})|.{4};|&#\d+;|.+/U", $str, $r);
        $ar = $r[0];
        foreach ($ar as $k => $v) {
                if (substr($v, 0, 2) == "%u") {
                        $ar[$k] = iconv("UCS-2", $code, pack("H4", substr($v, -4)));
                } elseif (substr($v, 0, 3) == "") {
                        $ar[$k] = iconv("UCS-2", $code, pack("H4", substr($v, 3, -1)));
                } elseif (substr($v, 0, 2) == "&#") {
                        echo substr($v, 2, -1) . " ";
                        $ar[$k] = iconv("UCS-2", $code, pack("n", substr($v, 2, -1)));
                }
        }
        return join("", $ar);
}
分享到:
评论

相关推荐

    PHP如何实现Unicode和Utf-8编码相互转换

    $utf8Bytes = substr($utf8Str, $i, 3); $codePoint = unpack('N', "\x0" . $utf8Bytes)[1]; $decodedUnicodeStr .= chr(($codePoint & 0x0000FF) >> 8) . chr($codePoint & 0x00FF); } echo "Unicode: $unicode...

    用PHP将Unicode 转化为UTF-8的实现方法(推荐)

    总结而言,使用PHP进行Unicode到UTF-8的转换主要依赖于`rawurldecode()`和`iconv()`函数,正确处理不同平台上的字节序差异,以及适当地设置终端的编码转换,都是确保字符正确显示的关键步骤。对于开发者来说,理解...

    字符编码转换类,支持 ANSI、Unicode、Unicode big endian、UTF-8、UTF-8+Bom互相转换

    本文将深入探讨PHP中的字符编码转换,特别是针对ANSI、Unicode(包括Little Endian和Big Endian)、UTF-8以及UTF-8+BOM的转换。 首先,让我们了解这些编码格式的含义: 1. ANSI编码:通常指的是Windows系统的默认...

    php网页utf8字符串与unicode互转

    utf8字符串与unicode的相互转换。 在utf8编码的网页上输入字符串后, 可产生unicode编码字符串, 然后再还原回原先的utf8字符串。html/PHP实现。

    php 编码相互转换类(gbk转换utf8)

    标题中的"php 编码相互转换类(gbk转换utf8)"就是这样一个解决方案,它提供了一种更可靠的方式来将GBK编码的字符串转换为UTF-8编码。这个转换类通常包含一系列方法,用于处理各种编码转换的细节,如错误处理、异常...

    GBK批量转utf8(支持整个目录)

    "GBK批量转utf8(支持整个目录)"这个工具正是为了解决在处理多语言文件时遇到的编码问题。当你需要将一个使用GBK编码的目录全部转换为UTF-8编码时,这个工具可以大大提高效率。它能遍历指定目录下的所有文件,包括...

    用PHP实现UTF-8和Unicode编码转换的技术.pdf

    "用PHP实现UTF-8和Unicode编码转换的技术.pdf" 本文档主要讨论了使用PHP实现UTF-8和Unicode编码转换的技术。首先,文章对UTF-8和Unicode的编码特征进行了分析,并探索了这两种编码之间的转换关系。然后,使用PHP...

    简单谈谈php中的unicode和utf8编码

    重新认识unicode和utf8编码 直到今天,准确的说是刚才,我才知道UTF-8编码和Unicode编码是不一样的,是有区别的囧 他们之间是有一定的联系的,看看他们的区别: UTF-8的长度是不一定的,有可能是1、2、3字节 Unicode...

    unicode与GB18030(GB2312,GBK) 转换码表

    Unicode最广泛采用的形式是UTF-8,它是一种变长编码,可以表示从基本多语言平面(BMP)到辅助多语言平面(SMP)的所有Unicode字符。 GB18030是中国国家标准的字符编码,它是GB2312和GBK的升级版,进一步扩展了汉字...

    字符串处理类:将GBK,UTF8字符串转化为Unicode编码的php类库.zip

    3. **调用转换方法**:类库通常会提供转换方法,如`toUnicode()`和`fromUnicode()`,分别用于将GBK或UTF8字符串转为Unicode,以及将Unicode转回GBK或UTF8。根据实际需求,调用相应的方法并传入要转换的字符串。 4. ...

    ajax使用示例-unicode转换中文

    这个示例中,前端JavaScript通过Ajax向PHP发送Unicode字符串,PHP使用`json_decode`解码并转换为UTF-8编码的中文字符串,然后将结果返回给前端。整个过程无需刷新页面,实现了异步数据交互。 总结来说,这个"ajax_...

    php网页中utf-8编码转换gb2312实用类

    public static function utf8ToGb2312($str) { return iconv('UTF-8', 'GB2312', $str); } public static function gb2312ToUtf8($str) { return iconv('GB2312', 'UTF-8', $str); } } ``` 这个`Utf8Gb2312...

    PHP编码转换函数utf-gb-big5

    4. `utf82u`和`u2utf8`涉及到的是UTF-8和Unicode(U)的转换。PHP内建函数`json_encode`和`json_decode`可以用于此目的,因为JSON字符串默认使用UTF-8编码。例如: ```php $utf8_str = "你好,世界"; $u_str = ...

    php ASCII 字符转换 (汉字及特殊字符) 宽字符 (uft8/unicode)

    $ascii_string = mb_convert_encoding($utf8_string, "ASCII", "UTF-8"); ``` 这段代码会尝试将UTF-8编码的汉字和特殊字符转换成最接近的ASCII字符,无法转换的字符通常会被替换为问号或其他替代字符。 对于汉字和...

    php汉字转拼音 降汉字转换为拼音,utf-8

    3. **Unicode与UTF-8**: UTF-8是一种基于Unicode的编码方式,对于汉字转拼音来说,确保输入的字符串是UTF-8编码是非常重要的,因为非UTF-8编码可能会导致乱码。 4. **拼音处理**: 在转换过程中,需要考虑多音字(一...

    最好的汉字转换拼音utf-8 php版 权威

    "utf-8"编码是Unicode的一种变体,能够表示世界上几乎所有的字符,包括汉字。在PHP中处理UTF-8编码的数据,需要确保所有涉及字符串操作的函数都支持多字节字符,比如使用mb_string扩展来处理,避免出现乱码问题。 ...

    utf8, PHP的可移植和高性能 utf 8,Unicode和字形集群.zip

    utf8, PHP的可移植和高性能 utf 8,Unicode和字形集群 面向PHP的 UTF-8 Patchwork UTF-8 为 PHP developpers提供了 UTF-8 和字形集群的广泛。端口和高性能句柄。它同时提供:mbstring,iconv 和国际 Normalize

    php pdf 中文 utf8软件

    标题“php pdf 中文 utf8软件”表明这是一个关于PHP使用PDF库处理中文UTF-8编码的工具或方法。描述中提到的“基于fpdf完美解决中文utf8及gb2312下中文显示问题”,意味着这个解决方案不仅解决了UTF-8编码的中文问题...

    zh-cn-utf8

    描述中的“unicode(utf8)”提到了Unicode和UTF-8的关系。Unicode是一个庞大的字符集,包含了世界上几乎所有的文字和符号,旨在统一各种不同的字符编码。而UTF-8是Unicode的一种实现方式,它是一种变长的字符编码,...

Global site tag (gtag.js) - Google Analytics