http://www.cnblogs.com/suifu/p/5848269.html
公司有新要求,ios客户端要上线评论中可以使用emoji表情的功能,在mysql 5.5 之前,UTF-8编码只支持1-3个字节;从MySQL 5.5开始,可以支持4个字节UTF编码 utf8mb4 ,一个字符能够支持更多的字符集,也能够支持更多表情符号。
utf8mb4兼容utf8,且比utf8能表示更多的字符,是utf8字符集的超集。所以现在一些新的业务,比如ISO中的emoji表情,会将MySQL数据库的字符集设置为utf8mb4。
先看问题:
Caused by: java.sql.SQLException: Incorrect string value: '\xF6\x9D\x98\x84' for column 'comment' at row 1 at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:1074) at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:4096) at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:4028) at com.mysql.jdbc.MysqlIO.sendCommand(MysqlIO.java:2490) at com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2651) at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2734) at com.mysql.jdbc.PreparedStatement.executeInternal(PreparedStatement.java:2155) at com.mysql.jdbc.PreparedStatement.executeUpdate(PreparedStatement.java:2458)
如果我们将列comment设置为varchar(100),用于存储评论信息,现在上线新功能存储emoji表情,插入emoji表情就会报出上述错误,UTF-8编码有可能是两个、三个、四个字节。Emoji表情是4个字节,而Mysql的utf8编码最多3个字节,所以数据插不进去。utf8mb4兼容utf8,且比utf8能表示更多的字符。
解决方案:将Mysql的编码从utf8转换成utf8mb4。
网上的文章各执一词,本文就生产环境中真实可用的参数进行记录
整体操作流程其实并不难
一:首先我们修改my.cnf参数
[client] default-character-set=utf8mb4 [mysql] default-character-set=utf8mb4 [mysqld] character-set-server = utf8mb4 collation-server = utf8mb4_unicode_ci init_connect = 'SET NAMES utf8mb4' character-set-client-handshake = false
二:对数据库相关的表进行字符集修改
将数据库转换为utf8mb4
mysql> ALTER DATABASE erp CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
将已经建好的表也转换成utf8mb4
mysql>ALTER TABLE `erp_comment` CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
将需要使用emoji的字段设置类型为:
mysql>ALTER TABLE `erp_comment` MODIFY COLUMN `comment` varchar(100) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
三:重启数据库服务器使之生效
[root@HE3 ~]# /etc/init.d/mysqld restart Shutting down MySQL.. SUCCESS! Starting MySQL.... SUCCESS!
四:登录数据库检查是否如下:
mysql> SHOW VARIABLES WHERE Variable_name LIKE 'character%' OR Variable_name LIKE 'collation%';
+--------------------------+--------------------+
| Variable_name | Value |
+--------------------------+--------------------+
| character_set_client | utf8mb4 |
| character_set_connection | utf8mb4 |
| character_set_database | utf8mb4 |
| character_set_filesystem | binary |
| character_set_results | utf8mb4 |
| character_set_server | utf8mb4 |
| character_set_system | utf8 |
| collation_connection | utf8mb4_unicode_ci |
| collation_database | utf8mb4_unicode_ci |
| collation_server | utf8mb4_unicode_ci |
+--------------------------+--------------------+
rows in set (0.00 sec)
特别说明下:collation_connection/collation_database/collation_server如果是utf8mb4_general_ci,没有关系。但必须保证character_set_client/character_set_connection/character_set_database/character_set_results/character_set_server为utf8mb4。
四:让开发那边的pom配置中,去掉characterEncoding参数,并重新编译一下
如果你用的是java服务器,升级或确保你的mysql connector版本高于5.1.13,否则仍然无法使用utf8mb4
最后再让前端应用插入emoji表情,就可以了。
一些小知识点
其中character-set-server 和 collation-server 这些设置为utf8mb4字符集是比较容易理解的,就是将MySQL数据库相关的字符集都设置为utf8mb4;
但为了实现客户端utf8连接到MySQL后,使用的也是utf8mb4字符集,就在 mysqld配置中配置了 init_connect='SET NAMES utf8mb4' 表示初始化连接都设置为utf8mb4字符集,再配置一个 skip-character-set-client-handshake = true 忽略客户端字符集设置,不论客户端是何种字符集,都按照init_connect中的设置进行使用,这样就满足了应用的需求。
相关推荐
Mysql支持emoji表情符号升级编码为UTF8MB4 在使用Mysql数据库时,如果需要支持emoji表情符号,需要对数据库的编码进行升级,以便正确地存储和显示emoji表情符号。下面是升级Mysql编码为UTF8MB4的步骤和注意事项: ...
### MySQL保存emoji表情 在Java开发环境中,当数据库使用MySQL且编码设置为UTF-8时,尝试存储包含emoji表情的数据可能会遇到如下错误: ``` java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x93' ...
MySQL数据库在5.7.6版本之后开始正式支持Unicode 8.0,这其中包括了大量的emoji表情。这个实例展示了如何在MySQL数据库中存储、查询和使用emoji。以下是对这个实例的详细解析: 一、MySQL数据库与emoji支持 1. **...
emoji表情在我们日常开发中经常会遇到,但是最近在mysql中插入emoji表情遇到了问题,通过查找相关的资料终于解决了,所以将这次解决的过程分享出来,这篇文章主要就给大家介绍了MySQL插入emoji表情失败问题的解决...
然而,当涉及到后端处理,如PHP和MySQL数据库存储时,emoji表情可能会带来一些挑战。本文将深入探讨如何在PHP环境下有效地处理和存储iOS的emoji表情,并在MySQL数据库中保存它们。 首先,我们需要了解emoji的本质。...
MySQL默认使用的`utf8`字符集只支持最多3个字节的Unicode字符,而大多数emoji表情符号属于4字节的Unicode范围(UTF-8编码下的U+10000到U+10FFFF)。因此,如果直接使用`utf8`存储,会遇到无法正确保存和读取emoji的...
但是utf8的超集utf8mb4一个字符最多能有4字节,所以能支持emoji表情的存储。 下面话不多说了,来一起看看详细的介绍吧 解决方案 一. 修改database、table、column字符集 修改database字符集 ALTE
总的来说,存储Emoji表情主要的问题是字符集编码的问题,需要将MySQL的字符集升级为utf8mb4,并确保JDBC驱动版本支持Emoji表情,最后通过正确配置JDBC连接字符串和可能需要调整代码中设置编码集来解决存储Emoji表情...
而MySQL数据库默认的utf8字符集只支持每个字符最多三个字节的编码,因此,当尝试将四字节的emoji表情存入只支持三字节的utf8字段时,就会出现错误。 具体来说,报错信息"\xF0\x9F\x8E\x80\xE5\xA4..."是emoji表情的...
最近开发的iOS项目因为需要用户文本的存储,自然就遇到了emoji等表情符号如何被mysql DB支持的问题。下面这篇文章主要介绍了关于让Java后台MySQL数据库能够支持emoji表情的方法,需要的朋友可以参考下。
这个问题主要是由于MySQL的默认编码格式UTF8不支持四字节的Unicode编码,而emoji表情正是属于这一类别。为了解决这个问题,我们需要对MySQL数据库进行一些配置更改,确保它能够正确地处理和存储emoji数据。 首先,...
而MySQL中的utf8编码只支持最多3个字节的字符,因此当尝试存储4字节的Emoji表情字符时,会导致错误。具体的错误信息是:java.sql.SQLException:Incorrect string value: '\xF0\x9F\x92\x94' for column 'name' at ...
MySQL 需要支持 emoji 表情符号版本需要大于5.5.3,且字符集需要设置为utf8mb4 字符集。 utf8mb4和utf8到底有什么区别呢?原来以往的mysql的utf8一个字符最多3字节,而utf8mb4则扩展到一个字符最多能有4字节,所以...
在IT项目开发中,特别是在构建用户界面或者与用户交互的应用时,使用Emoji表情可以增加界面的生动性和趣味性,提高用户的参与度。本资源“在项目中使用Emoji表情【源代码】”提供了一种实现这一功能的方法。接下来,...
原因在于标准的Mysql的utf8字符集只支持最多三个字节的UTF-8编码,而emoji表情是使用四个字节的UTF-8编码,因此无法正确存储和显示。 为了解决这一问题,文章介绍了三种处理emoji表情的方法: 方法一:使用utf8mb4...
在项目中使用Emoji表情是一种流行且实用的方式,可以增加用户界面的趣味性和亲和力。在现代软件开发中,尤其是在Web应用、移动应用以及社交网络相关的项目中,使用Emoji已经成为一种趋势。本压缩包文件“在项目中...
这种问题通常是由于字符集设置不支持Emoji表情所导致的。Emoji表情是使用UTF-8编码,特别是UTF-8中的"四字节字符"来表示的。而MySQL的默认字符集utf8并不支持这种编码,它只能支持最多三字节的UTF-8字符。因此,要...
Java emoji表情存储解决方法 Java 中 emoji 表情存储的解决方法是指在 Java 应用程序中处理和存储 emoji 表情数据的方法。随着社交媒体和即时通信应用程序的普及,emoji 表情变得越来越流行,然而在 Java 应用程序...