`
xiaolanglang123
  • 浏览: 26355 次
  • 性别: Icon_minigender_1
  • 来自: 厦门
文章分类
社区版块
存档分类

轻松解决PHP中文编码苦恼的小技巧

阅读更多

PHP中文编码这个问题,曾经令很多小伙伴们感到很困扰的,不过应该大部分人已经解决了这个问题,不过今天小编还是要将这些小技巧再重复下。
 
PHP程序设计中中文编码问题曾经困扰很多人,导致这个问题的原因其实很简单,每个国家(或区域)都规定了计算机信息交换用的字符编码集,如美国的扩展 ASCII 码,中国的 GB2312-80,日本的 JIS 等。作为该国家/区域内信息处理的基础,字符编码集起着统一编码的重要作用。字符编码集按长度分为 SBCS(单字节字符集),DBCS(双字节字符集)两大类。早期的软件(尤其是操作系统),为了解决本地字符信息的计算机处理,出现了各种本地化版本(L10N),为了区分,引进了 LANG, Codepage 等概念。但是由于各个本地字符集代码范围重叠,相互间信息交换困难; 软件各个本地化版本独立维护成本较高。因此有必要将本地化工作中的共性抽取出来,作一致处理,将特别的本地化处理内容降低到最少。这也就是所谓的国际化(118N)。各种语言信息被进一步规范为 Locale 信息。处理的底层字符集变成了几乎包含了所有字形的 Unicode。
 
现在大部分具有国际化特征的软件核心字符处理都是以 Unicode 为基础的,在软件运行时根据当时的ocale/Lang/Codepage 设置确定相应的本地字符编码设置,并依此处理本地字符。在处理过程中需要实现 Unicode 和本地字符集的相互转换,甚或以 Unicode 为中间的两个不同本地字符集的相互转换。这种方式在网络环境下被进一步延伸,任何网络两端的字符信息也需要根据字符集的设置转换成可接受的内容。
 
数据库中的字符集编码问题
 
流行的关系数据库系统都支持数据库字符集编码,也就是说在创建数据库时可以指定它自己的字符集设置,数据库的数据以指定的编码形式存储。当应用程序访问数据时,在入口和出口处都会有字符集编码的转换。对于中文数据,数据库字符编码的设置应当保证数据的完整性。GB2312、GBK、UTF-8 等都是可选的数据库字符集编码; 当然我们也可以选择 ISO8859-1 (8-bit),只是我们得在应
 
用程序写数据之前先将 16Bit 的一个汉字或 Unicode 拆分成两个 8-bit 的字符,读数据之后也需要将两个字节合并起来,同时还要判别其中的 SBCS 字符,因此我们并不推荐采用 ISO8859-1 作为数据库字符集编码。这样不但没有充分利用数据库自身的字符集编码支持,而且同时也增加了编程的复杂度。编程时,可以先用数据库管理系统提供的管理功能检查其中的中文数据是否正确。
 
PHP 程序在查询数据库之前,首先执行 mysql_query("SET NAMES xxxx"); 其中 xxxx 是你网页的编码(charset=xxxx),如果网页中 charset=utf8,则 xxxx=utf8,如果网页中 charset=gb2312,则xxxx=gb2312,几乎所有 WEB 程序,都有一段连接数据库的公共代码,放在一个文件里,在这文件里,加入 mysql_query("SET NAMES xxxx") 就可以了。
 
SET NAMES 显示客户端发送的 SQL 语句中使用什么字符集。因此,SET NAMES 'utf-8' 语句告诉服务器"将来从这个客户端传来的信息采用字符集 utf-8"。它还为服务器发送回客户端的结果指定了字符集(例如,如果你使用一个 SELECT 语句,它表示列值使用了什么字符集)。
 
定位问题时常用的技巧
 
定位中文编码问题通常采用最笨的也是最有效的办法―在你认为有嫌疑的程序处理后打印字符串的内码。通过打印字符串的内码,你可以发现什么时候中文字符被转换成 Unicode,什么时候Unicode 被转回中文内码,什么时候一个中文字成了两个 Unicode 字符,什么时候中文字符串被转成了一串问号,什么时候中文字符串的高位被截掉了……
 
取用合适的样本字符串也有助于区分问题的类型。如:"aa啊 aa?@aa" 等中英相间,GB、GBK特征字符均有的字符串。一般来说,英文字符无论怎么转换或处理,都不会失真(如果遇到了,可以尝试着增加连续的英文字母长度)。
 
解决各种应用的乱码问题
 
1) 使用标签设置页面编码
 
这个标签的作用是声明客户端的浏览器用什么字符集编码显示该页面,xxx 可以为 GB2312、GBK、UTF-8(和 MySQL 不同,MySQL 是 UTF8)等等。因此,大部分页面可以采用这种方式来告诉浏览器显示这个页面的时候采用什么编码,这样才不会造成编码错误而产生乱码。但是有的时候我们会发现有了这句还是不行,不管 xxx 是哪一种,浏览器采用的始终都是一种编码,这个情况我后面会谈到。
 
请注意, 是属于 HTML 信息的,仅仅是一个声明,仅表明服务器已经把 HTML 信息传到了浏览器。
 
2) header("content-type:text/html; charset=xxx");
 
这个函数 header() 的作用是把括号里面的信息发到 http 标头。如果括号里面的内容为文中所说那样,那作用和 标签基本相同,大家对照第一个看发现字符都差不多的。但是不同的是如果有这段函数,浏览器就会永远采用你所要求的 xxx 编码,绝对不会不听话,因此这个函数是很有用的。为什么会这样呢?那就得说说 http 标头和 HTML信息的差别了:
 
http 标头是服务器以 http 协议传送 HTML 信息到浏览器前所送出的字串。而 标签是属于 HTML 信息的,所以 header() 发送的内容先到达浏览器,通俗点就是 header() 的优先级高于 (不知道可不可以这样讲)。假如一个PHP页面既有header("content-type:text/html; charset=xxx"),又有,浏览器就只认前者 http 标头而不认 meta 了。当然这个函数只能在PHP页面内使用。
 
同样也留有一个问题,为什么前者就绝对起作用,而后者有时候就不行呢?这就是接下来要谈的Apache 的原因了。
 
3) AddDefaultCharset
 
Apache 根目录的 conf 文件夹里,有整个 Apache 的配置文档 httpd.conf。
 
用文本编辑器打开 httpd.conf,第 708 行(不同版本可能不同)有 AddDefaultCharset xxx,xxx为编码名称。这行代码的意思:设置整个服务器内的网页文件 http 标头里的字符集为你默认的 xxx字符集。有这行,就相当于给每个文件都加了一行 header("content-type:text/html; charset=xxx")。这下就明白为什么明明 设置了是 utf-8,可浏览器始终采用 gb2312 的原因。
 
如果网页里有 header("content-type:text/html; charset=xxx"),就把默认的字符集改为你设置的字符集,所以这个函数永远有用。如果把 AddDefaultCharset xxx 前面加个"#",注释掉这句,而且页面里不含 header("content-type…"),那这个时候就轮到 meta 标签起作用了。
 
下面列出以上的优先顺序:
 
.. header("content-type:text/html; charset=xxx")
 
.. AddDefaultCharset xxx
 
..
 
如果你是 web 程序员,建议给你的每个页面都加个header("content-type:text/html; charset=xxx"),这样就可以保证它在任何服务器都能正确显示,可移植性也比较强。
 
4)PHP.ini 中的 default_charset 配置:
 
php.ini 中的 default_charset = "gb2312" 定义了PHP的默认语言字符集。一般推荐注释掉此行,让浏览器根据网页头中的 charset 来自动选择语言而非做一个强制性的规定,这样就可以在同台服务器上提供多种语言的网页服务。
 
其实PHP开发中的中文编码并没有想像的那么复杂,虽然定位和解决问题没有定规,各种运行环境也各不尽然,但后面的原理是一样的。了解字符集的知识是解决字符问题的基础。不过,随着中文字符集的变化,不仅仅是PHP编程,中文信息处理中的问题还是会存在一段时间的。
 
以上这些内容是送给还没有解决PHP开发中的中文编码问题的小伙伴们一些解决性建议,也希望正在学习php的小伙伴们多多了解这些知识。

文章来源于:http://www.alqsoft.com/xinwenzixun/phpkaifa/2014/0708/130.html

分享到:
评论
1 楼 haixin3036 2014-07-17  

相关推荐

    新手福利 _ Burpsuite你可能不知道的技巧.pdf

    #### 一、Burp Suite中文乱码问题解决方案 对于使用Burp Suite过程中经常出现的中文乱码问题,本文将提供有效的解决方法。 **背景**:当我们新建一个PHP文件,输出中文内容(例如:“街上打滚”),并使用Firefox...

    Ajax的一些有用的小技巧.pdf

    ### Ajax的一些有用的小技巧 #### 使用JavaScript库提升开发效率 在使用Ajax进行Web开发时,开发者往往会遇到诸如浏览器兼容性、编码问题等挑战。为了更好地应对这些难题,使用现成的JavaScript库是一种高效的解决...

    PHP基础教程 是一个比较有价值的PHP新手教程!

    只要了解一些基本的语法和语言特色,你就可以开始你的PHP编码之旅了。之后你在编码过程中如果遇到了什么麻烦,还可以再去翻阅相关文档。 PHP的语法与C,Perl,ASP或者JSP。对于那些对上述之一的语言较熟悉的人来说...

    国外PHP动态第四期

    通过掌握这些技能,开发者可以更有效地定位和解决问题,提高代码质量和应用性能。 #### 十一、FROMPHPTORUBY-30SIMILARITIESANDDIFFERENCES 《FROMPHPTORUBY-30SIMILARITIESANDDIFFERENCES》比较了PHP和Ruby这两种...

    pro php and jquery

    - 他为众多知名企业和小规模组织提供过定制化的Web解决方案,现任教于德克萨斯大学奥斯汀分校,在那里从事自由编程工作。 综上所述,《Pro PHP and jQuery》这本书不仅深入浅出地介绍了如何使用PHP和jQuery开发...

    php面试题目及答案

    根据提供的文件信息,以下是从标题、描述、以及部分问题中提炼出的相关IT知识点...以上知识点涵盖了从基本概念到高级技巧的一系列PHP面试中常见的问题及其解答,有助于准备面试者充分了解PHP语言的关键特性和实际应用。

    Google开放API生成二维码/php生成二维码

    - `choe` 参数用于指定字符编码,通常设置为 `UTF-8` 以支持中文字符。 在PHP中,我们可以使用cURL或file_get_contents函数来发起HTTP请求,获取并显示这个URL生成的二维码图像。以下是一个简单的示例: ```php <?...

    基于PHP的精迅CMS(jxcms)php网站管理系统2.1UTF8源码.zip

    系统采用UTF8编码,确保在全球化背景下能够支持多语言内容的展示。在这款2.1版本的源码中,我们可以深入探讨一些关键的PHP技术和Web开发实践。 首先,PHP作为服务器端脚本语言,是构建动态网页和Web应用的基础。PHP...

    基于PHP的disk网盘MiniUTF-8源码.zip

    【标题】"基于PHP的disk网盘MiniUTF-8源码.zip" 提供的是一个使用PHP语言开发的小型网络硬盘系统。这个系统可能是为个人或小型团队设计的...通过分析和研究这个源码,开发者可以学习到实际项目中的应用技巧和最佳实践。

    小黄鸡php接口加强版

    总结来说,"小黄鸡php接口加强版"是一个实用的PHP工具,可以帮助开发者便捷地处理API调用,它的设计思路和实现技巧对学习和理解API接口开发具有很高的参考价值。无论你是PHP初学者还是有经验的开发者,都可以从中...

    如何从零基础学习PHP

    2. **挑战难题**:不断给自己设定新的目标和挑战,比如开发一个完整的CMS系统,这样不仅能巩固已学知识,还能提升解决问题的能力。 3. **构建个人作品集**:将自己完成的项目整理成作品集,这不仅有助于找工作,还能...

    ueditor1_4_3_3-gbk-php.zip

    对于中文环境,UEditor内置了GBK编码支持,确保了在处理中文字符时的准确无误,这一点在“gbk-php”这一标签中得到了体现,表明该版本特别关注中文环境下的PHP服务器集成。 在实际应用中,UEditor广泛应用于博客、...

    SVN1.8.3.24901-x64中文语言包

    - **乱码问题**: 如果在使用中文语言包时出现乱码,可以尝试更改系统的区域设置或将SVN客户端的编码设置为UTF-8。 #### 结论 SVN作为一款强大的版本控制工具,在软件开发领域中扮演着极其重要的角色。通过使用中文...

    XOOPS简体中文使用指南

    在使用MySQL 4.1及更高版本时,为了避免数据表中的乱码问题,需要确保数据表和字段的字符集都设置为UTF-8。 ##### 7.2 虚拟主机的数据库设置 如果网站部署在虚拟主机上,还需要确保虚拟主机提供商支持UTF-8,并且...

    php+mysql学生成绩查询(系统).rar

    PHP支持多种数据库,包括MySQL,通过PHP,开发者可以轻松地与数据库进行交互,实现数据的增删改查。 二、MySQL数据库 MySQL以其高性能、高可靠性和易用性而广受欢迎。在学生成绩查询系统中,MySQL作为后端数据库,...

    Head.First.PHP.&.MySQL.rar.rar

    6. **最佳实践**:学习编码规范、注释、调试技巧,以及如何编写可维护和可扩展的代码。 7. **面向对象编程(OOP)**:深入理解PHP的面向对象特性,如类、对象、继承、封装和多态,以及如何在实践中应用这些概念。 ...

    NUSOAP参考文档 PHP

    通过阅读这份文档,你可以了解到更多关于NUSOAP的高级特性,如自定义SOAP消息编码、处理复杂数据类型、调试技巧以及与其他PHP库的集成。 在学习和使用NUSOAP时,记得结合参考文档进行实践,以加深理解和掌握。同时...

    php笔记-欢迎增加

    - **XML编码**:处理XML文档中的字符编码问题。 - **页面编码**:设置网页的字符编码。 - **BOM编码**:处理文件开头的字节顺序标记(Byte Order Mark)。 #### 五、缓存逻辑 - **目的**:提高应用程序性能,...

    PHP实例开发源码—Difeye 轻量级PHP框架.zip

    依赖注入是Difeye框架中实现解耦的重要手段,允许对象在运行时动态地获取依赖,而不是硬编码在类内部。这种设计使得代码更易于测试,同时提高了组件的复用性。 4. **控制器(Controller)**: 控制器是处理HTTP...

    PHP实例开发源码—SpeedPHP 框架系统 UTF8 (附chm手册).zip

    7. **UTF8支持**:全面支持UTF8编码,能够轻松应对多语言网站的需求,避免了字符集问题带来的困扰。 8. **社区活跃**:SpeedPHP有一个活跃的开发者社区,可以获取到及时的技术支持和更新资讯,同时也能与其他开发者...

Global site tag (gtag.js) - Google Analytics