UTF-8 encodes everything in the basic multilingual plane (i.e. U+0000 to U+FFFF inclusive) in 1-3 bytes. Therefore, you just need to check whether everything in your string is in the BMP.
In Java, that means checking whether any char
(which is a UTF-16 code unit) is a high or low surrogate character, as Java will use surrogate pairs to encode non-BMP characters:
publicstaticboolean isEntirelyInBasicMultilingualPlane(String text){for(int i =0; i < text.length(); i++){if(Character.isSurrogate(text.charAt(i))){returnfalse;}}returntrue;}
If you do not want to support beyond BMP, you can just strip those characters before handing it to MySQL:
publicstaticString withNonBmpStripped(String input ){if( input ==null)thrownewIllegalArgumentException("input");return input.replaceAll("[\\ud800-\\udfff]","");}
If you want to support beyond BMP, you need MySQL 5.5+ and you need to change everything that's utf8
to utf8mb4
(collations, charsets ...). But you also need the support for this in the driver that I am not familiar with. Handling these characters in Java is also a pain because they are spread over 2 chars
and thus need special handling in many operations.
原因是当前mysql的字符集为utf-8,最多3个字节,但遇到像emoji表情这样的特殊字符时,需要4个字节来表示。所以导致insert报错。
mysql> show character set;
+----------+-----------------------------+---------------------+--------+
| Charset | Description | Default collation | Maxlen |
+----------+-----------------------------+---------------------+--------+
| utf8 | UTF-8 Unicode | utf8_general_ci | 3 |
+----------+-----------------------------+---------------------+--------+
解决办法:
1.备份数据库
2.升级Mysql Server到v5.5.3+
Upgrade the MySQL server to v5.5.3+
3.修改database,table,column字符集
# For each database:
ALTER DATABASE database_name CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;
# For each table:
ALTER TABLE table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
# For each column:
ALTER TABLE table_name CHANGE column_name column_name VARCHAR(191) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
# (Don’t blindly copy-paste this! The exact statement depends on the column type, maximum length, and other properties. The above line is just an example for a `VARCHAR` column.)
4.修改my.ini(linux下为my.cnf)
[client]
default-character-set = utf8mb4
[mysql]
default-character-set = utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect='SET NAMES utf8mb4'
重新启动Mysql,检查字符集:
mysql> SHOW VARIABLES WHERE Variable_name LIKE 'character\_set\_%' OR Variable_name LIKE 'collation%';
+--------------------------+--------------------+
| Variable_name | Value |
+--------------------------+--------------------+
| character_set_client | utf8mb4 |
| character_set_connection | utf8mb4 |
| character_set_database | utf8mb4 |
| character_set_filesystem | binary |
| character_set_results | utf8mb4 |
| character_set_server | utf8mb4 |
| character_set_system | utf8 |
| collation_connection | utf8mb4_unicode_ci |
| collation_database | utf8mb4_unicode_ci |
| collation_server | utf8mb4_unicode_ci |
+--------------------------+--------------------+
10 rows in set (0.00 sec)
5.如果是用java连接的mysql,需要升级mysql-connector-java.jar至少到5.1.14
参考资料:
http://mathiasbynens.be/notes/mysql-utf8mb4#utf8-to-utf8mb4
http://technovergence-en.blogspot.jp/2012/03/mysql-from-utf8-to-utf8mb4.html
http://dev.mysql.com/doc/refman/5.5/en/charset-unicode-upgrading.html
http://stackoverflow.com/questions/7814293/how-to-insert-utf-8-mb4-characteremoji-in-ios5-in-mysql
http://stackoverflow.com/questions/8709892/mysql-throws-incorrect-string-value-error
相关推荐
原来问题出在mysql上,mysql如果设置编码集为utf8那么它最多只能支持到3个字节的UTF-8编码,而4个字节的UTF-8字符还是存在的,这样一来如果你建表的时候用的utf8字符集出异常就理所当然了。 解决方法很简单,修改
在本例中,报错信息为“Incorrect string value :'\xE5\x8F\xAC' for column 'XXX' at row 1”,这通常意味着尝试插入的文本包含了MySQL无法识别的字符编码,或者字段类型不能容纳特定的字符序列。 首先,我们需要...
这个是我遇到问题后修改了的.ini文件。因为自己在改的时候也是错了好多次,试过去试过来都不行。所以我把我改过的.ini文件上传,希望能帮到跟我一样的小白,在搞不动的时候还有一条出路。 当然如果懒得自己改也可以...
在MySQL数据库操作中,有时会遇到“1366 Incorrect string value…”的错误提示,这通常是由于字符编码不匹配导致的。错误发生时,表明正在尝试插入的数据包含无法被当前数据库或表的字符集识别的字符。在Windows...
由于这个数据库服务器存放的数据库比较多且都是小数据库,...insert into doc_main (title,typeid,uptime,intro,ifhot,imgurl1,doctype,fileurl1,shunxu,titleurl,qitype) values(‘test’,’13’,’2011-5-30′,’tes
### 解决MySQL无法插入中文问题:“Incorrect string value” 在日常使用MySQL数据库的过程中,有时我们会遇到一个常见的问题——无法向数据库中插入中文字符,并且会收到错误提示“Incorrect string value”。这种...
在MySQL数据库中,当尝试向一个`text`类型的字段插入数据时,如果遇到"Incorrect string value: '\xE5\x8F\xAC'"这样的错误,这通常意味着你正在尝试存储的字符串包含不受支持或者编码不正确的字符。这个错误信息...
刚开始学习数据库操作,今天存数据时发现,保存的时候报错(Error 1292: Incorrect datetime value: '0000-00-00' for column 'deleted_at' at row 1) ,之后就搜索了下原因,是因为MySQL存日期时不允许出现这种格式...
在保存微信客户昵称的时候数据库遇到如下错误,原因在于UTF-8编码有可能是两个、三个、四个字节。Emoji表情或者某些特殊字符是4个字节,而Mysql的utf8编码最多3个字节,所以数据插不进去。 Cause: java.sql....
MySQL数据库在处理字符串数据时,可能会遇到“Incorrect string value”这样的乱码问题,这通常是由于字符集不匹配或不兼容导致的。字符集是决定如何存储、解析和显示字符的规则集,对于支持多语言环境的系统,尤其...
最近,业务方反馈有个别用户信息插入失败,报错提示类似”Incorrect string value:”\xF0\xA5 ….. ” 看这个提示应该是字符集不支持某个生僻字造成的。 下面是在虚拟机里复现的场景: step1、模拟原始表结构字符集...
### MySQL 错误 "Incorrect string value" 解析与解决方案 #### 背景介绍 在MySQL操作过程中,可能会遇到“Incorrect string value”这样的错误提示,尤其是在处理包含中文字符的数据时更为常见。根据提供的文件...
1. **表的字符集设置**:新创建的表默认字符集可能不是UTF-8。 2. **服务器与数据库之间的数据传输格式**:服务器端设置的数据编码格式与数据库要求的格式不一致。 #### 解决方案 针对上述问题,可以采取以下步骤来...
主要给大家介绍了关于MySQL存储表情时报错:java.sql.SQLException: Incorrect string value: 'xF0x9Fx92xA9x0Dx0A...'的解决方法,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面来一起看看吧。
用户昵称中存在emoji表情,调用jdbc往mysql数据库插入的时候抛出异常 java.sql.SQLException: Incorrect string value: '\xF0\x9F\x90\x9B' 失败原因 mysql的utf8编码的一个字符最多3个字节,但是一个emoji表情为4...
在MySQL 5.x及以上版本中,用户可能会遇到错误#1929,提示"Incorrect datetime value: '' for column 'createtime'"。这个错误通常出现在尝试插入或更新包含日期时间值的列时,如果该列的值为空,而数据库配置不允许...
解决这个问题的关键在于将MySQL的字符集由标准的UTF-8升级到UTF-8的扩展版本——UTF-8mb4。 #### 序言 随着移动互联网的发展,emoji表情成为了用户表达情感的重要方式之一。因此,在设计与无线互联网相关的MySQL...