http://it.oyksoft.com/post/49/
// Returns true if $string is valid UTF-8 and false otherwise.
function is_utf8($word)
{
if (preg_match("/^([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1}){1}/",$word) == true || preg_match("/([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1}){1}$/",$word) == true || preg_match("/([".chr(228)."-".chr(233)."]{1}[".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1}){2,}/",$word) == true)
{
return true;
}
else
{
return false;
}
} // function is_utf8
分享到:
相关推荐
在实际应用中,判断字符串编码可以应用在各种场景,比如从数据库中读取数据后自动判断编码、处理网络传输数据、处理用户输入数据等等。正确处理编码不仅能够提高程序的稳定性,还能够保证用户体验的连贯性和数据的...
PHP判断字符串编码是UTF-8还是GB2312的知识点主要包括两部分:一种是使用自定义函数进行判断,另一种是通过正则表达式和iconv函数进行判断。 第一种方法涉及到编写一个函数is_gb2312($str),其逻辑是遍历字符串中每...
在php开发中有时候会用到转码函数,比如iconv(),mb_convert_encoding()函数,在用函数转码的时候或者解码的时候我们有时候需要先判断当前字符串编码类型,不如是否是utf-8编码,是的话然后进行编码转换等操作。...
检测字符串编码可以有很多种方法,如利用ord获得字符的进制然后进入判断,或利用mb_detect_encoding函数来处理,下面整理了四种常用方法供大家参考。 例子1 复制代码 代码如下:/** * 检测字符串是否为UTF8编码 * @...
根据给定文件信息,我们可以提炼出关于UTF-8编码和字符串截取函数的知识点。 首先,UTF-8编码是一种针对Unicode字符集的可变长度的字符编码方法。在UTF-8编码中,一个字符可能由1到4个字节表示,这取决于字符的...
在PHP中,判断字符串是否为UTF-8编码是一个常见的需求,尤其是在处理国际化网站或应用程序时。UTF-8是互联网上使用最广泛的Unicode字符编码,它支持世界上大多数语言的字符。在PHP中,有多种方法可以检测字符串是否...
在上述文件中,提供了一个PHP函数,该函数旨在兼容两种常见字符编码utf-8和gb2312,并能准确截取字符串。 首先,了解字符编码的概念是必要的。UTF-8是一种编码方式,它可以用来表示Unicode字符,通常用在国际化程序...
示例代码中定义了`u8_title_substr`函数,通过循环遍历字符串中的每个字符,根据字符的编码类型(1、2、3或4字节)累加相应的权重值,最终实现了等宽度截取UTF-8编码的中英文字符的功能。 #### 五、注意事项 - 在...
给出的示例中,有一个名为`strlen_weibo()`的函数,该函数接受两个参数:要计算的字符串和字符串的编码类型(目前只支持GBK和UTF-8)。函数通过逐字节分析字符串,根据不同的字节值判断字符类型,从而正确计算出微博...
1. **`mb_strlen`**:这个函数用于计算多字节字符(如UTF-8编码)的字符串长度。与`strlen`不同,`mb_strlen`可以正确处理非ASCII字符,比如中文、日文等。 2. **`str_pad`**:这个函数可以将字符串填充到指定长度...
但 iconv 只能解决编码预先知道的情况,如果字符串编码未知,则需要先探测其编码,这时可能会用到 mb_string 扩展库: 复制代码 代码如下:mb_detect_encoding(‘软件开发网’); 可是 mb_detect_encoding 存在一个...
文章中提供了一个名为`cutstr()`的自定义函数,用来在保证不出现乱码的情况下截取UTF-8字符串。这个函数通过计算每个字符的实际字节数来逐个处理字符串,而不是简单地按固定字节长度截取。 函数首先获取字符串的...
PHP字符串编码问题是许多使用PHP进行开发的程序员都会遇到的问题,特别是当处理多种语言文本时。在PHP中,不同的字符编码代表着不同的内存占用和处理方式,尤其UTF-8和GBK这两种编码,UTF-8编码的中文字符通常占用3...
函数内,通过`is_string()`判断传入参数是否为字符串。如果是字符串,则利用`mb_detect_encoding()`检测字符串的编码格式,然后使用内置函数`strrev()`实现字符串翻转。如果输入的参数非字符串,函数会给出相应提示...
- 使用`ord()`函数判断字符是否为中文(GB2312编码下中文的ASCII值范围),如果是,则跳过下一个字符,因为一个中文字符在GB2312中占两个字节。 **1.1.2 示例代码** ```php echo mysubstr('善良能够培养一个人的...
当输入编码为UTF-8时,函数通过正则表达式来匹配字符,而当输入编码为GB2312时,则通过双字节字符的判断逻辑来正确截取字符串。这种类型的函数非常适用于多编码混用的环境,能够提高代码的可移植性和通用性。 4. ...