当前,utf8_unicode_ci校对规则仅部分支持Unicode校对规则算法。一些字符还是不能支持。并且,不能完全支持组合的记号。这主要影响越南和俄罗斯的一些少数民族语言,如:Udmurt 、Tatar、Bashkir和Mari。
utf8_unicode_ci的最主要的特色是支持扩展,即当把一个字母看作与其它字母组合相等时。例如,在德语和一些其它语言中‘ß’等于‘ss’。
utf8_general_ci是一个遗留的 校对规则,不支持扩展。它仅能够在字符之间进行逐个比较。这意味着utf8_general_ci校对规则进行的比较速度很快,但是与使用utf8_unicode_ci的 校对规则相比,比较正确性较差)。
例如,使用utf8_general_ci和utf8_unicode_ci两种 校对规则下面的比较相等:
Ä = A
Ö = O
Ü = U
两种校对规则之间的区别是,对于utf8_general_ci下面的等式成立:
ß = s
但是,对于utf8_unicode_ci下面等式成立:
ß = ss
对于一种语言仅当使用utf8_unicode_ci排序做的不好时,才执行与具体语言相关的utf8字符集 校对规则。例如,对于德语和法语,utf8_unicode_ci工作的很好,因此不再需要为这两种语言创建特殊的utf8校对规则。
utf8_general_ci也适用与德语和法语,除了‘ß’等于‘s’,而不是‘ss’之外。如果你的应用能够接受这些,那么应该使用utf8_general_ci,因为它速度快。否则,使用utf8_unicode_ci,因为它比较准确
分享到:
相关推荐
用了这么长时间,发现...那么在utf8_bin中你就找不到 txt = ‘A’ 的那一行, 而 utf8_general_ci 则可以. utf8_general_ci 不区分大小写,这个你在注册用户名和邮箱的时候就要使用。 utf8_general_cs 区分大小写,如果
这里我们将深入探讨UTF8和UTF8MB4两种编码格式,以及它们各自的排序规则`utf8mb4_unicode_ci`和`utf8mb4_general_ci`。 首先,UTF-8是一种广泛使用的Unicode字符编码方案,它允许使用1到4个字节来表示不同的字符。...
在MySQL中,utf8_unicode_ci和utf8_general_ci都是针对UTF8字符集的校对集,它们的主要任务是对字符串进行比较和排序。 utf8_unicode_ci,正如其名,是基于Unicode标准的校对集。它尽可能地遵循Unicode的排序规则,...
在数据库层面,确保数据表的字符集设置为utf8_general_ci,同时数据表的排序规则也要设置为utf8_general_ci,字段也应当使用utf8_general_ci编码。这样一来,数据库层面的编码问题便得到了解决。 对于已经存在的...
Illegal mix of collations (utf8_unicode_ci,IMPLICIT) and (utf8_general_ci,IMPLICIT) for operation '= 所以,自己把还没产生数据的表都删除,重新建立ut8表 此文件sql语句都是没产生数据的表,直接可以用py或者...
ALTER TABLE TABLE_NAME CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci; ``` 记得替换`TABLE_NAME`为你要转换的表名。 通过以上步骤,你的MySQL数据库将成功切换到utf8mb4编码,从而能更全面地...
collation-server = utf8mb4_unicode_ci init_connect='SET NAMES utf8mb4' ``` 5. 重启Mysql服务: ``` /etc/init.d/mysqld stop /etc/init.d/mysqld start ``` 或者 ``` service mysqld restart ``` 6. 升级Mysql...
default-collation=utf8_general_ci ``` 4. **重启MySQL服务**: - 右键点击“我的电脑”->“管理”->“服务和应用程序”->“服务”,找到MySQL服务并重启。 完成以上步骤后,乱码问题应该能得到解决。 #### ...
在选择校对集时,`utf8_unicode_ci` 和 `utf8_general_ci` 的主要区别在于字符比较规则。`utf8_unicode_ci` 更符合Unicode标准,对于德语和法语的拼写规则更精确,但可能会影响性能。而 `utf8_general_ci` 在处理...
例如,utf8_general_ci和utf8_unicode_ci都是UTF-8字符集的不同排序规则。 2. **检查当前字符集设置** - 使用`SHOW VARIABLES LIKE 'character\_set\_%';`和`SHOW VARIABLES LIKE 'collation\_%';`命令来查看MySQL...
在本文中,服务器数据库使用的是 utf8mb4_unicode_ci,而本地数据库使用的是 utf8_general_ci,这就导致了新表和旧表无法建立外键的问题。 知识点 3: 解决数据库字符集和排序规则不一致的问题 解决该问题可以从两...
CREATE DATABASE mydb CHARACTER SET utf8 COLLATE utf8_general_ci; USE mydb; CREATE TABLE mytable ( ... ) CHARACTER SET utf8 COLLATE utf8_general_ci; ``` 这样,数据库和表都将使用UTF-8,可以正确存储中文...
MySQL中的比对方法通常基于字符集,如'utf8_general_ci','ci'代表'Case Insensitive',表示不区分大小写;而'utf8_bin'则区分大小写并更关注字节级别的比较。 在SQL语句中,我们可以通过创建数据库、表或者列时...
ALTER TABLE table_name MODIFY column_name column_type CHARACTER SET utf8 COLLATE utf8_general_ci; ``` 在执行以上操作前,请确保备份你的数据,以防意外情况发生。如果你的数据库已经存在中文乱码,尝试...
例如,`utf8_general_ci`和`utf8_bin`都是`utf8`字符集下的校对集,其中`utf8_general_ci`区分大小写但不区分重音,而`utf8_bin`则区分大小写和重音。 - **校对集示例**:在创建表或列时,可以通过`COLLATE`关键字...
- 登录MySQL数据库,确保目标数据库和数据表的字符集均为`utf8`或`utf8mb4`,并且排序规则为`utf8_general_ci`。可以通过执行以下SQL语句来查看和修改表的字符集: ```sql -- 查看表的字符集 SHOW CREATE TABLE ...