`

MySql, php乱码 产生原因及其解决方法

阅读更多
MySQL中文乱码,phpmyadmin乱码,php乱码 产生原因及其解决方法
近日发现很多人为MySQL中文乱码问题所困扰。于是就这个问题做一下浅析。不正确的地方希望大家指正
更多数据库知识请参考 http://www.phpfans.net/view.php?id=4
 
/*
作者:我不是鱼
网址:http://www.phpfans.net
博客:http://www.phpfans.net/space/index.php/2
email:deng5765@163.com
*/


乱码产生原因

mysql字符编码是版本4.1引入的,支持多国语言,而且一些特性已经超过了其他的数据库系统。

我们可以在MySQL Command Line Client 下输入如下命令查看mysql的字符集

mysql> SHOW CHARACTER SET;
+----------+-----------------------------+---------------------+--------+
| Charset  | Description                 | Default collation   | Maxlen |
+----------+-----------------------------+---------------------+--------+
| big5     | Big5 Traditional Chinese    | big5_chinese_ci     | 2      |
| dec8     | DEC West European           | dec8_swedish_ci     | 1      |
| cp850    | DOS West European           | cp850_general_ci    | 1      |
| hp8      | HP West European            | hp8_english_ci      | 1      |
| koi8r    | KOI8-R Relcom Russian       | koi8r_general_ci    | 1      |
| latin1   | cp1252 West European        | latin1_swedish_ci   | 1      |
| latin2   | ISO 8859-2 Central European | latin2_general_ci   | 1      |
| swe7     | 7bit Swedish                | swe7_swedish_ci     | 1      |
| ascii    | US ASCII                    | ascii_general_ci    | 1      |
| ujis     | EUC-JP Japanese             | ujis_japanese_ci    | 3      |
| sjis     | Shift-JIS Japanese          | sjis_japanese_ci    | 2      |
| hebrew   | ISO 8859-8 Hebrew           | hebrew_general_ci   | 1      |
| tis620   | TIS620 Thai                 | tis620_thai_ci      | 1      |
| euckr    | EUC-KR Korean               | euckr_korean_ci     | 2      |
| koi8u    | KOI8-U Ukrainian            | koi8u_general_ci    | 1      |
| gb2312   | GB2312 Simplified Chinese   | gb2312_chinese_ci   | 2      |
| greek    | ISO 8859-7 Greek            | greek_general_ci    | 1      |
| cp1250   | Windows Central European    | cp1250_general_ci   | 1      |
| gbk      | GBK Simplified Chinese      | gbk_chinese_ci      | 2      |
| latin5   | ISO 8859-9 Turkish          | latin5_turkish_ci   | 1      |
| armscii8 | ARMSCII-8 Armenian          | armscii8_general_ci | 1      |
| utf8     | UTF-8 Unicode               | utf8_general_ci     | 3      |
| ucs2     | UCS-2 Unicode               | ucs2_general_ci     | 2      |
| cp866    | DOS Russian                 | cp866_general_ci    | 1      |
| keybcs2  | DOS Kamenicky Czech-Slovak  | keybcs2_general_ci  | 1      |
| macce    | Mac Central European        | macce_general_ci    | 1      |
| macroman | Mac West European           | macroman_general_ci | 1      |
| cp852    | DOS Central European        | cp852_general_ci    | 1      |
| latin7   | ISO 8859-13 Baltic          | latin7_general_ci   | 1      |
| cp1251   | Windows Cyrillic            | cp1251_general_ci   | 1      |
| cp1256   | Windows Arabic              | cp1256_general_ci   | 1      |
| cp1257   | Windows Baltic              | cp1257_general_ci   | 1      |
| binary   | Binary pseudo charset       | binary              | 1      |
| geostd8  | GEOSTD8 Georgian            | geostd8_general_ci  | 1      |
| cp932    | SJIS for Windows Japanese   | cp932_japanese_ci   | 2      |
| eucjpms  | UJIS for Windows Japanese   | eucjpms_japanese_ci | 3      |
+----------+-----------------------------+---------------------+--------+
36 rows in set (0.02 sec)

更多mysql的字符集知识可以参考本论坛的
http://www.phpfans.net/bbs/viewt ... &extra=page%3D1
或者mysql官方的
http://dev.mysql.com/doc/refman/5.1/zh/charset.html

MySQL 4.1的字符集支持(Character Set Support)有两个方面:字符集(Character set)和排序方式(Collation)。对于字符集的支持细化到四个层次: 服务器(server),数据库(database),数据表(table)和连接(connection)。
查看系统的字符集和排序方式的设定可以通过下面的两条命令:

mysql> SHOW VARIABLES LIKE 'character_set_%';
+--------------------------+-------------------------------------------+
| Variable_name            | Value                                     |
+--------------------------+-------------------------------------------+
| character_set_client     | latin1                                    |
| character_set_connection | latin1                                    |
| character_set_database   | latin1                                    |
| character_set_filesystem | binary                                    |
| character_set_results    | latin1                                    |
| character_set_server     | latin1                                    |
| character_set_system     | utf8                                      |
| character_sets_dir       | D:\MySQL\MySQL Server 5.0\share\charsets\ |
+--------------------------+-------------------------------------------+
8 rows in set (0.06 sec)

mysql> SHOW VARIABLES LIKE 'collation_%';
+----------------------+-------------------+
| Variable_name        | Value             |
+----------------------+-------------------+
| collation_connection | latin1_swedish_ci |
| collation_database   | latin1_swedish_ci |
| collation_server     | latin1_swedish_ci |
+----------------------+-------------------+
3 rows in set (0.02 sec)

上面列出的值就是系统的默认值。latin1默认校对规则是latin1_swedish_ci,默认是latin1的瑞典语排序方式.
为什么呢默认会是latin1_swedish_ci呢,追溯一下mysql历史很容易发现

1979年,一家瑞典公司Tcx欲开发一个快速的多线程、多用户数据库系统。Tcx 公司起初想利用mSQL和他们自己的快速低级例程 (Indexed Sequential Access Method,ISAM)去连接数据库表,然而,在一些测试以后得出结论:mSQL对其需求来说不够快速和灵活。这就产生了一个连接器数据库的新SQL接口,它使用几乎和mSQL一样的API接口。这个API被设计成可以使那些由mSQL而写的第三方代码更容易地移植到MySQL。

相信如果mysql是中国开发的,那么汉语也是默认编码了

当然我们也可以自己需要修改mysql的默认字符集
在mysql配置文档my.ini,找到如下两句:

[mysql]

default-character-set=latin1



# created and no character set is defined
default-character-set=latin1

修改后面的值就可以。

这里不建议改,仍保留默认值
也就是说启动 mysql时,如果没指定指定一个默认的的字符集,这个值继承自配置文件中的;
此时 character_set_server 被设定为这个默认的字符集; 当创建一个新的数据库时,
除非明确指定,这个数据库的字符集被缺省设定为 character_set_server; 当选定了一个数据库时,
character_set_database 被设定为这个数据库默认的字符集; 在这个数据库里创建一张表时,
表默认的字符集被设定为 character_set_database,也就是这个数据库默认的字符集;
当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集。

这样问题就随之而来了,假如一数据库是gbk编码。如果访问数据库时没指定其的字符集是gbk。
那么这个值将继承系统的latin1,这样就做成mysql中文乱码。

乱码解决方法

要解决乱码问题,首先必须弄清楚自己数据库用什么编码。如果没有指明,将是默认的latin1。
我们用得最多的应该是这3种字符集 gb2312,gbk,utf8。

那么我们如何去指定数据库的字符集呢?下面也gbk为例

【在MySQL Command Line Client创建数据库 】

mysql> CREATE TABLE `mysqlcode` (
    -> `id` TINYINT( 255 ) UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY ,
    -> `content` VARCHAR( 255 ) NOT NULL
    -> ) TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
Query OK, 0 rows affected, 1 warning (0.03 sec)

mysql> desc mysqlcode;
+---------+-----------------------+------+-----+---------+----------------+
| Field   | Type                  | Null | Key | Default | Extra          |
+---------+-----------------------+------+-----+---------+----------------+
| id      | tinyint(255) unsigned | NO   | PRI |         | auto_increment |
| content | varchar(255)          | NO   |     |         |                |
+---------+-----------------------+------+-----+---------+----------------+
2 rows in set (0.02 sec)

其中后面的TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
就是指定数据库的字符集,COLLATE (校勘),让mysql同时支持多种编码的数据库。

当然我们也可以通过如下指令修改数据库的字符集
alter database da_name default character set 'charset'.
php爱好者站 http://www.phpfans.net

客户端以 gbk格式发送 ,可以采用下述配置:

SET character_set_client='gbk'
SET character_set_connection='gbk'
SET character_set_results='gbk'

这个配置就等价于 SET NAMES 'gbk'。

现在对刚才创建的数据库操作

mysql> use test;
Database changed

mysql> insert into mysqlcode values(null,'php爱好者');
ERROR 1406 (22001): Data too long for column 'content' at row 1

没有指定字符集为gbk,插入时出错

mysql> set names 'gbk';
Query OK, 0 rows affected (0.02 sec)

指定字符集为 gbk

mysql> insert into mysqlcode values(null,'php爱好者');
Query OK, 1 row affected (0.00 sec)

插入成功

mysql> select * from mysqlcode;
+----+-----------+
| id | content   |
+----+-----------+
| 1  | php爱好着 |
+----+-----------+
1 row in set (0.00 sec)

在没有指定字符集gbk时读取也会出现乱码,如下

mysql> select * from mysqlcode;
+----+---------+
| id | content |
+----+---------+
| 1  | php???  |
+----+---------+
1 row in set (0.00 sec)

分享到:
评论

相关推荐

    小结下MySQL中文乱码,phpmyadmin乱码,php乱码 产生原因及其解决方法第1/3页

    本文主要针对MySQL中文乱码、phpMyAdmin中文乱码以及PHP中文乱码的产生原因进行小结,并提供相应的解决方法。 首先,了解MySQL中文乱码产生的原因是十分必要的。由于MySQL的字符编码机制,如果数据库、表、字段以及...

    mysql的乱码解决方法.pdf

    本文将深入探讨MySQL的乱码解决方案,重点针对MySQL 4.1及其以上版本。 首先,我们需要理解MySQL中的两个核心概念:字符集(Character Set)和排序规则(Collation)。字符集定义了数据库、表或列可以存储的数据...

    mysql乱码问题解决

    ### MySQL中文乱码问题解析与解决方案 #### 一、乱码原因分析 在MySQL数据库中遇到中文乱码问题,通常可以归结为以下几个方面: 1. **Server本身的设定问题**:比如服务器使用的字符集仍停留在老旧的`latin1`而非...

    MySQL 远程访问及中文乱码问题

    总的来说,解决 MySQL 的远程访问和中文乱码问题,需要理解数据库权限、字符集原理以及开发工具的使用。通过细心的配置和测试,我们可以确保数据库系统的正常运行,同时保障数据的完整性和可读性。

    Mysql中文乱码问题完美解决方案

    ### MySQL中文乱码问题及其解决方案 #### 一、问题根源分析 在MySQL中遇到中文乱码问题通常是由于以下几个方面的原因: 1. **Server本身的设定问题**:比如服务器使用的字符集仍为`latin1`(一个仅支持西欧语言的...

    PHP+MYSQL使用UTF8中文乱码终极解决办法

    ### PHP+MYSQL使用UTF8中文乱码终极解决办法 #### 背景介绍 在进行Web开发时,尤其是在处理中文内容时,经常会遇到一个让人头疼的问题——中文乱码。这通常发生在使用PHP与MySQL组合搭建的网站上。中文乱码不仅影响...

    完美解决PHP中文乱码

    ### 完美解决PHP中文乱码 #### 一、PHP网页的编码问题 在处理PHP中文乱码问题时,首要任务是确保PHP文件本身的编码与其所声明的网页编码相匹配。这涉及到设置正确的HTTP头部信息以及调整文件的实际编码格式。 ###...

    PHP+MYSQL 出现乱码的解决方法

    解决PHP+MySQL乱码问题的第一种方法是针对Windows系统导入数据出现乱码的情况。在此情况下,可以使用MySQL的命令行工具,在导入数据前,显式地设置MySQL的客户端字符集为GBK或UTF-8。例如,如果需要将数据库字符集...

    常见php与mysql中文乱码问题解决办法

    以下将详细阐述三种常见的中文乱码问题及其解决方案。 问题一:PHP网页显示MySQL数据时汉字变成问号 这种现象通常发生在使用PHPmyAdmin在数据库中输入汉字正常,但通过PHP网页显示时出现乱码。原因在于PHP页面没有...

    php中文乱码解决方案

    除了以上常见的乱码问题及其解决方法外,还有一些特殊情况需要注意: ##### 1. 数据库编码为UTF8但页面编码为GB2312的情况 **解决方案**: - 在查询数据库前,先设置数据库连接的编码。例如,使用`mysql_query(...

    php中文乱码问题 初学php最学见的问题

    本篇文章将详细分析PHP中文乱码产生的原因,并提供一系列有效的解决方法。 #### 一、乱码产生的原因 1. **服务器端编码与客户端浏览器编码不一致**:如果服务器端使用的字符集与客户端浏览器设置的字符集不同,就...

    PHP乱码终极版必杀.

    ### PHP乱码终极版必杀知识点详解 #### 一、HTML页面转UTF-8编码问题 **1. 在head后,title前加入元标签** - **知识点**: 确保文档头部正确声明了字符集。 - **解决方法**: 在`<head>`标签后、`<title>`标签前...

    mysql+php中文乱码问题及mysql时间函数.pdf

    本文将深入探讨这些乱码问题及其解决方案,并介绍MySQL中的日期时间函数。 首先,MySQL+PHP中文乱码问题主要源于编码不一致。数据库、表、字段以及网页的编码设置必须统一。如果MySQL数据库的默认编码是UTF-8,而...

    mysql 字符集 乱码问题

    本文将根据提供的文件信息,详细解释如何解决MySQL中的字符集通讯设置不匹配导致的乱码问题。 #### 一、理解MySQL中的字符集配置 首先,我们需要了解MySQL中涉及到字符集的一些关键变量及其作用: 1. **character...

    MYSQL字符集与乱码问题分析

    总之,《MYSQL字符集与乱码问题分析》不仅回顾了字符集的发展历程,还详细解析了MySQL环境下字符集的配置与优化方法,对于预防和解决乱码问题具有重要的实践指导意义。通过对字符集的深入了解,开发者能够更好地应对...

    PHP中文乱码处理方法.docx

    本文将详细探讨PHP中文乱码的处理方法,分为三个主要部分:PHP网页编码、PHP与MySQL的数据交互以及PHP与操作系统的兼容性。 首先,我们来看PHP网页的编码。PHP文件本身及其输出的网页编码需保持一致。若选择GB2312...

    网页乱码问题的解决方案

    ### 网页乱码问题的解决方案:深入解析与应对策略 #### 一、问题概述 在网页开发中,字符编码问题常常导致显示乱码,尤其是涉及到多语言环境时更为常见。网页乱码通常源于服务器端数据库编码设置、前端页面编码...

    php读取mysql乱码,用set names XXX解决的原理分享

    首先,解决PHP读取MySQL乱码问题是一个在数据库交互中常见的技术挑战。乱码的产生,通常是由于客户端与服务器端字符编码不一致造成的。要解决这种问题,常用的一个方法是使用MySQL的“SET NAMES”命令来声明字符集...

    DW中链接mysql数据库时,建立字符集中文出现乱码的解决方法

    接下来,我们将详细解析在DW(Dreamweaver)中连接MySQL数据库时遇到的中文乱码问题及其解决方法。 首先,乱码问题产生的根本原因在于字符编码不统一。在Web开发中,字符编码通常指的是用于文本数据存储和传输的...

Global site tag (gtag.js) - Google Analytics