//将utf-8字符串转换成字节
function strToByteArr($str){
//$str = iconv('gbk', 'utf-8', $str);
$arr=array();
$len=strlen($str);
for($i=0;$i<$len;$i++){
if(ord(substr($str,$i,1))>0xa0){
//$arr[$i]= substr($str,$i,3);//汉字双字节
$arr[$i]= substr($str,$i,1);//汉字双字节
$i++;
$arr[$i]= substr($str,$i,1);//汉字双字节
$i++;
$arr[$i]= substr($str,$i,1);//汉字双字节
}else{
$arr[$i]=substr($str,$i,1);//单字节
}
}
echo strlen($str);
//$narr=array_values($arr);
//print_r($arr);
return $arr;
}
测试调用代码:
print_r(strToByteArr("欢迎你访问400电话办理
中心,我们的网站是:htttp://www.my400800.cn
"));
分享到:
相关推荐
- 将字符串从ANSI转换为Unicode或UTF-8 - 将Unicode(Little Endian或Big Endian)转换为其他编码 - 实现UTF-8与UTF-8+BOM之间的转换 - 提供批量转换文件或目录中所有文件的编码的功能 使用这样的类,你可以方便地...
1. **字符串转换**:可以将字符串在不同的字符编码之间转换,例如从ISO-8859-1到UTF-8,或者从GBK到UTF-8,这对于处理来自不同来源的数据非常有用。 2. **字符检测**:能够检测字符串是否是有效的UTF-8编码,避免...
3. **多字节序列处理**:在UTF-8中,有些字符由多个字节组成,转换时必须确保按正确的顺序处理,否则会导致乱码。 4. **预检查和后处理**:在转换前,检查字符串中是否存在目标编码不支持的字符;转换后,再次检查...
UTF-8编码字符理论上可以最多到6个字节长,但是16位BMP字符最多只用到3个字节长。UTF-8编码使用多字节串来表示一个字符,其中每个字节都有标记位集。这样可以使重新同步非常容易,并使编码无国界,且很少受丢失字节...
为了解决UTF-8编码字符串截取的问题,需要特别注意的是,UTF-8编码下的多字节字符在被截取时,必须同时保留字符的完整性。由于一个UTF-8编码的字符可能由1到4个字节组成,所以不能以字节为单位进行简单的截取操作。 ...
这个`Utf8Gb2312Converter`类提供了两个静态方法,分别用于将UTF-8字符串转为GB2312和将GB2312字符串转为UTF-8。`iconv`是PHP内置的字符编码转换函数,它可以处理多种编码间的转换。在上述代码中,我们指定源编码和...
// 将UTF-8字符串转换为JSON,实际是Unicode编码的字符串 $decoded_utf8_str = json_decode($u_str, false); // 再次解码,得到原始UTF-8字符串 ``` 在实际项目中,文件`pub_charset.php`可能包含了这些转换函数...
在PHP中处理UTF-8编码的数据,需要确保所有涉及字符串操作的函数都支持多字节字符,比如使用mb_string扩展来处理,避免出现乱码问题。 在提供的文件列表中,"qq.php"可能是实现汉字转拼音功能的PHP源代码文件。...
在PHP中,处理文件内容和编码转换通常涉及到字符串操作函数,如`file_get_contents()`用来读取文件内容,`str_replace()`或`preg_replace()`用于查找并替换特定模式(在这种情况下是BOM),以及`file_put_contents()...
- 对于每个Unicode码点,首先确定它需要的UTF-8字节数。小于0x80的字符需要1个字节,0x80到0x7FF需要2个字节,0x800到0xFFFF需要3个字节,以此类推。 - 将码点转换为二进制形式,然后按照UTF-8的规则,将高位填充...
在处理PHP中的字符串时,尤其是涉及到UTF-8编码的中文字符串时,常常会遇到字符串被错误地截取,从而产生乱码的问题。这通常是因为UTF-8编码中,一个中文字符可能由多个字节组成,简单的按字节截取可能会将一个中文...
将文件从其他编码格式转换为UTF-8时,可能会在文件开头自动生成一个BOM(Byte Order Mark)标记。BOM标记可能导致浏览器在显示中文时出现乱码。移除BOM标记的方法包括: - 使用Dreamweaver打开文件并重新保存; -...
- JavaScript中的字符串处理,如DOM操作、AJAX请求等,应确保字符串是以UTF-8编码的。 - AJAX请求时,设置Content-Type头为UTF-8,例如: ```javascript xhr.setRequestHeader("Content-Type", "application/x-...
例如,将UTF-8编码的字符串转换为GB2312: ```php iconv('UTF-8', 'GB2312', $utf8_string); ``` 反之,将GB2312转换为UTF-8: ```php iconv('GB2312', 'UTF-8', $gb2312_string); ``` 当涉及到数据库操作时,...
3. **转换编码**:使用编程语言提供的函数或库,如Python的`codecs`模块,将GB2312字节序列解码为Unicode字符串,再将该字符串按照UTF-8编码规则重新编码为字节序列。 4. **写入新文件**:最后,将转换后的字节序列...
对于非ASCII字符集(如UTF-8),PHP提供mb_string扩展,支持多字节字符串操作,如`mb_strlen()`、`mb_substr()`等。 通过Dreamweaver8的集成环境,初学者可以更直观地理解和操作这些PHP字符串功能,结合动态网站的...
1. **字符串操作函数**:PHP提供了诸如`mb_string`、`iconv`等多字节字符串处理函数,用于正确处理UTF-8编码的字符串,包括拼接、截取、转换等操作。 2. **数据库交互**:在与MySQL、PostgreSQL等支持UTF-8的数据库...
5. **PHP页面的UTF-8转换**:在PHP中,可以使用`mb_convert_encoding()`函数进行字符串编码的转换。同时,文件编码应保持一致,使用`header('Content-Type: text/html; charset=utf-8')`设定响应头的编码。 6. **...
注意,由于字符可能由多个字节组成(如UTF-8编码中的多字节字符),因此截取字节时可能会截断字符。为了确保完整性,通常需要以字符边界进行截取,这可能需要借助于`codecs`库的`decode()`和`iterdecode()`等方法。 ...
同样,要将UTF-8转换为Windows-1250,可以写成: ```php $str_utf8 = "你的字符串"; $str_windows1250 = mb_convert_encoding($str_utf8, "Windows-1250", "UTF-8"); ``` 在处理捷克语、斯洛伐克语和匈牙利语时,...