`
dazhilao
  • 浏览: 245910 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

【转】MySQL下数据表混乱的字符编码处理以及一些处理字符编码时的常用命令整理

阅读更多
  因为不知道什么时候的原因,我们有一个数据库超级无赖的具有了无敌的特性:数据表的编码是Latin1-swXXXX什么的。而保存在里面的中文又是 php强制以utf8保存在其中。因此,出了各种乱七八糟的怪里怪气的毛病。让我等对于mysql这种数据库本就没有什么爱的人深感恶心。
  因此,今日在研究之下终于解决此问题。再次说明,本文是把latin1转为utf8。
  问题的核心还是在于要改变已有保存字符的混乱问题,最彻底和便捷的方法就是直接导出,然后再以对应所需的字符导入。
  为了能够正确的导入,我们必须要确保导出的数据在你的文字编辑器下能够正常显示中文。对于我们这次的这个数据库,我们最终的导出语句是:
  view plaincopy to clipboardprint?
   /usr/local/mysql/bin/mysqldump -p --opt --default-character-set=latin1 sends> /home/test/sends.sql
  /usr/local/mysql/bin/mysqldump -p --opt --default-character-set=latin1 sends> /home/test/sends.sql
  导出后你就自觉的先看看中文显示正不正常吧,如果不正常就回去改个编码继续导。。。。
  如果正常,继续:
  现在要准备导入,但是导入的工作之前有个预备工作要做,如果你之前只导出一个表。那修改你导出的文件中的这一行:
  view plaincopy to clipboardprint?
  /*!40101 SET NAMES latin1 */;
  
  成为
  
  /*!40101 SET NAMES utf8 */;
  /*!40101 SET NAMES latin1 */;
  成为
  /*!40101 SET NAMES utf8 */;
  如果不幸你导出的是整个有很多不同编码的数据表的数据库,ok。请使用替换工具把原来有的各种编码都替换成你要的目的编码。我这里原来有utf8和latin1,所以只需要把Latin1全部替换成utf8即可。
  之后新建一个要导入数据的数据库:
  view plaincopy to clipboardprint?
  mysql> create database `TARGET_DB` default character set utf8 collate utf8_general_ci
  mysql> create database `TARGET_DB` default character set utf8 collate utf8_general_ci
  OK,现在可以导入数据表了:
   view plaincopy to clipboardprint?
  mysql -uroot -p TARGET_DB --default-character-set=utf8 < /home/test/sends.sql
  mysql -uroot -p TARGET_DB --default-character-set=utf8 < /home/test/sends.sql
  这样,导回去以后世界就清静了。回顾以前,原来一直不大成功都是因为我们没有去修改.sql文件里面的那些编码设置。这次终于好了。这个破数据库,麻烦死了。我以后写程序绝对不用mysql了。。。。。
  最后附带一些mysql操作字符集的时候会用到的命令,都是从网上收集的:
  view plaincopy to clipboardprint?
  1. 修改 MySQL 数据库默认字符集(mysql database default character set)
  
   alter database testdb default character set = gb2312;
  2. 修改 MySQL 数据表默认字符集(mysql table default character set)
  
  alter table ip_to_country default character set = gb2312;
  注意:修改 MySQL 的默认字符集,不管是在数据库级别,还是数据表级别, 对已经存储的字符数据无任何改变。只是新增的表或列,开始使用新的 字符集。
  
  3. 转换 MySQL 数据表字符集(mysql table character set)
  
  MySQL 中有一个数据表 ip_to_country,以前该表字符列数据都是以 utf8 编码格式存放的, 现在想转换为 gb2312 编码格式存放。需要使用 MySQL 转换字符集命令:convert to character set
  
  alter table ip_to_country convert to character set gb2312;
  提示:convert to 也会把数据表 ip_to_country 的默认字符集从 utf8 更改为 gb2312。
  
  4. 转换 MySQL 数据表中某个列的字符集(mysql column character set)
  
  alter table ip_to_country modify country_name varchar(50) character set gb2312;
  这个语句把单独一个列 country_name 的字符集转换为 gb2312。这在用法在实际中比较少见, 因为大多数情况下,都是改变整个表的字符集。
  
  来自:http://www.sqlstudy.com/sql_article.php?id=2008082102
  1. 修改 MySQL 数据库默认字符集(mysql database default character set)
   alter database testdb default character set = gb2312;
  2. 修改 MySQL 数据表默认字符集(mysql table default character set)
  alter table ip_to_country default character set = gb2312;
  注意:修改 MySQL 的默认字符集,不管是在数据库级别,还是数据表级别, 对已经存储的字符数据无任何改变。只是新增的表或列,开始使用新的 字符集。
  3. 转换 MySQL 数据表字符集(mysql table character set)
  MySQL 中有一个数据表 ip_to_country,以前该表字符列数据都是以 utf8 编码格式存放的, 现在想转换为 gb2312 编码格式存放。需要使用 MySQL 转换字符集命令:convert to character set
  alter table ip_to_country convert to character set gb2312;
  提示:convert to 也会把数据表 ip_to_country 的默认字符集从 utf8 更改为 gb2312。
  4. 转换 MySQL 数据表中某个列的字符集(mysql column character set)
  alter table ip_to_country modify country_name varchar(50) character set gb2312;
  这个语句把单独一个列 country_name 的字符集转换为 gb2312。这在用法在实际中比较少见, 因为大多数情况下,都是改变整个表的字符集。
  来自:http://www.sqlstudy.com/sql_article.php?id=2008082102
  view plaincopy to clipboardprint?
  创建一个名为test的数据库,并且设置字符集都是 utf8:
  create database `test` default character set utf8 collate utf8_general_ci

  
  查看ta数据库中类似test的数据表的信息:
  show table status from ta like '%test%';
  
  查看 MySQL 数据库服务器和数据库字符集。
  show variables like '%char%';
   +--------------------------+-------------------------------------+------
  | Variable_name | Value |......
   +--------------------------+-------------------------------------+------
  | character_set_client | utf8 |...... -- 客户端字符集
  | character_set_connection | utf8 |......
  | character_set_database | utf8 |...... -- 数据库字符集
  | character_set_filesystem | binary |......
  | character_set_results | utf8 |......
  | character_set_server | utf8 |...... -- 服务器字符集
  | character_set_system | utf8 |......
  | character_sets_dir | D:\MySQL Server 5.0\share\charsets\ |......
  
  
  查看 MySQL 数据表(table) 的字符集。
  
  show table status from sqlstudy_db like '%countries%';
   +-----------+--------+---------+------------+------+-----------------+------
  | Name | Engine | Version | Row_format | Rows | Collation |......
   +-----------+--------+---------+------------+------+-----------------+------
  | countries | InnoDB | 10 | Compact | 11 | utf8_general_ci |......
  
  
  查看 MySQL 数据列(column)的字符集。
  
  show full columns from countries;
   +----------------------+-------------+-----------------+--------
  | Field | Type | Collation | .......
  +----------------------+-------------+-----------------+--------
  | countries_id | int(11) | NULL | .......
  | countries_name | varchar(64) | utf8_general_ci | .......
  | countries_iso_code_2 | char(2) | utf8_general_ci | .......
  | countries_iso_code_3 | char(3) | utf8_general_ci | .......
  | address_format_id | int(11) | NULL | .......
  
  
  查看当前安装的 MySQL 所支持的字符集。
  
  show charset; 或
  show char set;
   +----------+-----------------------------+---------------------+--------+
  | Charset | Description | Default collation | Maxlen |
   +----------+-----------------------------+---------------------+--------+
  | big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 |
  | dec8 | DEC West European | dec8_swedish_ci | 1 |
  | cp850 | DOS West European | cp850_general_ci | 1 |
  | hp8 | HP West European | hp8_english_ci | 1 |
  | koi8r | KOI8-R Relcom Russian | koi8r_general_ci | 1 |
  | latin1 | cp1252 West European | latin1_swedish_ci | 1 |
  | latin2 | ISO 8859-2 Central European | latin2_general_ci | 1 |
  | swe7 | 7bit Swedish | swe7_swedish_ci | 1 |
  | ascii | US ASCII | ascii_general_ci | 1 |
  | ujis | EUC-JP Japanese | ujis_japanese_ci | 3 |
  | sjis | Shift-JIS Japanese | sjis_japanese_ci | 2 |
  | hebrew | ISO 8859-8 Hebrew | hebrew_general_ci | 1 |
  | tis620 | TIS620 Thai | tis620_thai_ci | 1 |
  | euckr | EUC-KR Korean | euckr_korean_ci | 2 |
  | koi8u | KOI8-U Ukrainian | koi8u_general_ci | 1 |
  | gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci | 2 |
  | greek | ISO 8859-7 Greek | greek_general_ci | 1 |
  | cp1250 | Windows Central European | cp1250_general_ci | 1 |
  | gbk | GBK Simplified Chinese | gbk_chinese_ci | 2 |
  | latin5 | ISO 8859-9 Turkish | latin5_turkish_ci | 1 |
  | armscii8 | ARMSCII-8 Armenian | armscii8_general_ci | 1 |
  | utf8 | UTF-8 Unicode | utf8_general_ci | 3 |
  | ucs2 | UCS-2 Unicode | ucs2_general_ci | 2 |
  | cp866 | DOS Russian | cp866_general_ci | 1 |
  | keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci | 1 |
  | macce | Mac Central European | macce_general_ci | 1 |
  | macroman | Mac West European | macroman_general_ci | 1 |
  | cp852 | DOS Central European | cp852_general_ci | 1 |
  | latin7 | ISO 8859-13 Baltic | latin7_general_ci | 1 |
  | cp1251 | Windows Cyrillic | cp1251_general_ci | 1 |
  | cp1256 | Windows Arabic | cp1256_general_ci | 1 |
  | cp1257 | Windows Baltic | cp1257_general_ci | 1 |
  | binary | Binary pseudo charset | binary | 1 |
  | geostd8 | GEOSTD8 Georgian | geostd8_general_ci | 1 |
  | cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2 |
  | eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 |
  
  
  修改表和字段的字符集
  //修改表
  alter table 表名 convert to character set gbk;
  // 修改字段
  alter table 表名 modify column '字段名' varchar(30) character set gbk not null;(王朝网络 wangchao.net.cn)
分享到:
评论

相关推荐

    Mysql字符集编码详解

    Mysql字符集编码详解 Mysql数据库中的字符集编码问题是许多开发者经常遇到的一个问题,特别是在JAVA项目中。解决这个问题需要从多方面入手,包括服务器、数据库、数据表和连接等四个层次。这篇文章将详细介绍如何...

    mysql字符集转换

    本文将围绕“MySQL字符集转换”这一主题展开讨论,通过对给定文件中的标题、描述、标签以及部分内容进行分析,旨在深入讲解MySQL字符集转换的相关知识点。 #### 二、MySQL字符集概述 在开始详细介绍之前,我们先来...

    Unity3D教程:修改mysql字符编码成为UTF82

    本教程将介绍如何解决Unity3D中与MySQL数据库连接时的字符编码问题,确保数据能够正确地以UTF-8格式存储和读取。 首先,我们遇到的问题是即使设置表的默认字符集为UTF8,并且在发送查询时使用UTF-8编码,仍然会出现...

    Mysql数据库编码问题 (修改数据库,表,字段编码为utf8)

    MySQL数据库编码问题涉及到字符集的选择、配置以及数据的迁移和处理。字符集是决定数据库中存储和检索文本数据的方式,对于多语言支持和数据迁移至关重要。UTF-8是一种广泛使用的多字节字符编码,支持全球大部分语言...

    SQLyog MysqL汉化界面 可设字符编码

    用户可以根据需求设定数据库、表或字段的字符编码,支持多种字符集,如UTF-8、GBK等,确保跨语言数据的正确存储和显示。 7. **备份与恢复**:SQLyog提供一键备份和恢复功能,可设置定时任务自动执行,保障数据安全...

    修改MySQL数据库中表和表中字段的编码方式的方法

    在MySQL数据库中,字符编码(Character Set)和排序规则(Collation)对于存储和处理包含多种语言或特殊字符的数据至关重要。编码方式决定了数据如何被存储和解析,而排序规则则影响到数据的比较和排序。当数据库、...

    mysql保存微信昵称特殊字符的方法

    在MySQL中保存微信昵称,特别是包含特殊字符如表情符号(Emoji)的昵称时,可能会遇到插入数据时报错的问题。这是因为MySQL的默认UTF-8字符集(实际上是`utf8`,并非完全标准的UTF-8)仅支持最多3字节的字符,而一些...

    mysql字符集等常用命令

    MySQL支持多种字符集,其中UTF-8是最常用的一种,它能够支持全球几乎所有的字符编码。但在实际应用中,由于各种原因(如配置不一致、迁移过程中的编码转换错误等),可能会遇到乱码的问题。因此,了解MySQL中字符集...

    MySQL中文编码设置

    - 如果无法修改MySQL配置文件或连接字符串,也可以通过SQL命令来临时改变会话级别的字符集设置,如下所示: ```sql set character_set_client=utf8; set character_set_connection=utf8; set character_set_...

    字符编码表新版.zip

    在这个名为"字符编码表新版.zip"的压缩包中,我们有一个“字符编码表新版.pdf”文件,它很可能包含了最新的字符编码标准,特别是针对多语言环境的设计。这份文档对于开发者来说是一个宝贵的资源,因为它可以帮助他们...

    中英文字符编码查询助手.zip

    - **ASCII编码**:英文字符编码的基础,包含128个字符,包括大写和小写字母、数字以及一些特殊符号。 - **Unicode**:为了解决全球不同语言字符集的统一,Unicode应运而生。它是一个庞大的字符集,包含了几乎世界...

    MySQL5.0常用命令与数据恢复.pdf

    ### MySQL5.0常用命令与数据恢复知识点解析 #### 一、启动MySQL服务器 ...以上就是MySQL5.0常用命令及数据恢复的一些关键知识点和具体命令示例,这些命令可以帮助用户有效地管理和操作MySQL数据库。

    mysql数据库互相转换及同步工具-MySQL_MySQL字符集互转

    本文将详细探讨“MySQL_MySQL字符集互转”这一主题,以及如何利用工具如"MSSQL2MySQLSync"进行数据库之间的转换与同步。 MySQL是一种广泛使用的开源关系型数据库管理系统,其支持多种字符集,包括UTF-8、GBK等。...

    教程:修改mysql字符编码成为UTF8.docx

    MySQL 数据库的字符编码问题一直是开发者们头疼的问题,尤其是在多语言环境下。如果您的 MySQL 数据库的字符编码不是 UTF8,可能会导致数据乱码、无法读取等问题。今天,我们将教您如何将 MySQL 字符编码修改为 UTF8...

    mysql 测试数据集,单表200万条数据

    本测试数据集提供了一张包含200万条数据的单表,这对于数据库性能测试、查询优化、大数据处理以及系统负载测试等方面具有极高的价值。下面将围绕这个主题,详细介绍MySQL数据库的相关知识点。 1. 数据库设计: 在...

    深入UTF8字符编码.pdf

    Windows系统的字符编码经历了从单字节编码到多字节编码的演变,其中GB2312、GBK和GB18030是中文环境下常用的编码标准。自Windows 2000以后,默认字符编码为GBK,该编码支持更多的汉字及符号。然而,随着全球化和多...

    设置mysql字符集

    字符集(Character Set)定义了数据在存储和处理时所采用的编码标准,而校对集(Collation)则规定了字符集下的排序规则和比较方式。在MySQL中,主要涉及以下几个关键变量: - `character_set_system`:系统默认...

    设定mysql字符集解决终端乱码

    ### 设定 MySQL 字符集解决终端...具体而言,需要注意客户端和服务端之间的字符集设置、创建表时的字符集选择以及数据插入和查询时的字符集处理等几个方面。希望本文能帮助大家更好地理解和处理 MySQL 中的字符集问题。

    MYSQL修改字符集默认问题

    在MySQL数据库管理与维护的过程中,修改字符集是一个常见的需求,特别是在需要处理多语言或特定编码格式的情况下。本文将详细介绍如何解决“MySQL修改字符集默认问题”,包括修改步骤、注意事项以及可能遇到的问题...

Global site tag (gtag.js) - Google Analytics