`
yukar
  • 浏览: 128305 次
  • 性别: Icon_minigender_1
  • 来自: 厦门
社区版块
存档分类
最新评论

PHP如何获取中文字符串长度 utf8_strlen()

    博客分类:
  • php
阅读更多

PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员。下面简要的剖析一下PHP对中文字符串长度的处理:

PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例:

$enStr = ‘Hello,China!’;
echo strlen($enStr); // 输出:12

而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异。

gbk编码下每个中文字符所占字节为2,例:

$zhStr = ‘您好,中国!’;
echo strlen($zhStr); // 输出:12

utf-8编码下每个中文字符所占字节为3,例:

$zhStr = ‘您好,中国!’;
echo strlen($zhStr); // 输出:18

那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现。

这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串):

$zhStr = ‘您好,中国!’;
$str = ‘Hello,中国!’;

// 计算中文字符串长度
function utf8_strlen($string = null) {
// 将字符串分解为单元
preg_match_all(“/./us”, $string, $match);
// 返回单元个数
return count($match[0]);
}

echo utf8_strlen($zhStr); // 输出:6
echo utf8_strlen($str); // 输出:9

分享到:
评论

相关推荐

    字符串长度函数strlen和mb_strlen的区分示例介绍_.docx

    在UTF-8编码中,一个中文字符通常由三个字节组成,因此,使用`strlen`函数计算含有中文字符的字符串长度时,每个中文字符会被计作三个字节。 #### mb_strlen函数概述 与`strlen`相比,`mb_strlen`函数更加灵活且...

    PHP 计算字符串长度

    总结来说,`strlen()`是PHP中计算字符串长度的基本工具,但在处理多字节字符时,应考虑使用`mb_strlen()`。结合其他字符串函数,我们可以完成各种字符串操作和验证。对于`str.php`文件,可以期望找到与这些知识点...

    php strlen mb_strlen计算中英文混排字符串长度

    在PHP中,处理字符串长度计算时,有两个常用的函数:`strlen`和`mb_strlen`。它们在处理纯英文字符串时表现相同,但在处理包含中文字符的字符串时,两者的计算方式有所不同,尤其在UTF-8编码环境下。 `strlen`函数...

    字符串长度函数strlen和mb_strlen的区别示例介绍

    虽然它们都是用来计算字符串长度,但在处理多字节字符集(如UTF-8、GBK等)时,两者的计算方式有所不同,这在处理中文字符时尤为明显。 `strlen()`函数是PHP内建的字符串长度函数,它返回字符串的字节数。这意味着...

    PHP统计字符串长度

    `PHP统计字符串长度`这个主题主要涉及如何在PHP中准确地获取一个字符串中包含的字符数量,无论是汉字还是字母,都被视为一个字符。这里我们将深入探讨PHP中两个常用的函数:`strlen()`和`count()`,以及它们在字符串...

    PHP程序设计-3期(KC016) 2.8.1字符串长度 拓展知识.doc

    本节将深入探讨PHP中的两种主要方法来获取字符串长度:`strlen()`和`mb_strlen()`。 首先,`strlen()`函数是PHP内建的用于计算字符串长度的函数,它返回字符串的字节数。然而,当涉及到非ASCII字符,如中文字符时,...

    PHP字符串长度计算 - strlen()函数使用介绍

    总的来说,`strlen()`适用于简单的字符串长度计算,尤其是英文和单一字节编码的字符串。而当处理包含多字节字符的字符串,特别是中文字符串时,应优先使用`mb_strlen()`以确保得到准确的字符数。正确理解和使用这两...

    PHP程序设计-3期(KC016) 2.8.1字符串长度 常见问题.docx

    这里,`'UTF-8'`参数告诉`mb_strlen()`使用UTF-8编码来计算字符串长度,确保了计算的准确性。 总结一下,理解和正确使用`strlen()`与`mb_strlen()`是PHP编程中必不可少的技能。`strlen()`适用于简单的ASCII字符串,...

    PHP中文处理 中文字符串截取(mb_substr)和获取中文字符串字数

    本文将详细介绍如何使用`mb_substr()`函数进行中文字符串截取以及使用`mb_strlen()`函数来获取中文字符串的字数。 首先,我们来看`mb_substr()`函数。这个函数是PHP中的多字节字符串函数,专门用来处理包含多字节...

    php中strlen和mb_strlen用法实例分析

    1. PHP字符串长度计算 - `strlen()`函数使用介绍 2. PHP中计算中文字符串长度、截取中文字符串的函数代码 3. PHP自定义函数实现统计中文字符串长度的方法 4. 最准确的PHP截取字符串长度函数 5. PHP中preg_match函数...

    PHP程序设计-3期(KC016) 2.8.1字符串长度习题.doc

    这里我们关注的是字符串长度的计算,主要涉及`strlen()`和`mb_strlen()`两个函数。这两个函数用于获取字符串的长度,但它们在处理多字节字符(如中文字符)时有所不同。 1. `strlen()`函数是PHP内置的函数,用于...

    PHP字符串长度计算 – strlen()函数使用介绍

    首先,`strlen()` 函数是最基本的字符串长度计算函数,其函数原型为 `int strlen(string string_input);`。这个函数返回字符串占用的字节数。在ASCII编码中,一个英文字符、数字或符号通常占用一个字节,因此它们的...

    浅析PHP中strlen和mb_strlen的区别

    字符串长度的计算通常依赖于两个函数:strlen和mb_strlen。这两个函数在处理英文字符时表现一致,但当字符串包含中文或其他多字节字符时,它们的计算结果会有所差异。本文将详细分析strlen和mb_strlen在不同情况下的...

    PHP中strlen()和mb_strlen()的区别浅析

    在PHP中,计算字符串长度是常见的操作,但处理包含多国字符或中文字符的字符串时,需要特别注意。本文将详细解析PHP中的`strlen()`和`mb_strlen()`两个函数的区别。 `strlen()`是PHP内建的字符串长度函数,它返回...

    PHP 不区分中英文截取utf8字符串

    在PHP编程中,处理UTF-8编码的字符串时,由于UTF-8是一种多字节的字符编码,中文和英文字符的长度是不一致的。在进行字符串截取时,如果不考虑编码特性,可能会导致截取结果错误。这篇博客“PHP 不区分中英文截取utf...

    详解PHP中strlen和mb_strlen函数的区别

    在PHP编程语言中,字符串长度的测量是一个经常遇到的需求,但有时候字符串的编码方式会导致得到的长度与实际的字符数不符。在这种情况下,strlen()和mb_strlen()两个函数可以用来计算字符串的长度,但它们在处理多...

Global site tag (gtag.js) - Google Analytics