锟斤拷是什么?我也是最近才搞明白的。
http://www.baidu.com/baidu?word=%EF%BF%BD%EF%BF%BD
http://www.google.com/search?hl=en&q=%E9%94%9F%E6%96%A4%E6%8B%B7
我考证了一下,这个乱码的原因来源相当经典。
Unicode和老编码体系的转化过程中,肯定有一些字,用Unicode是没法表示的,Unicode官方用了一个占位符来表示这些文字,这就是:U+FFFD REPLACEMENT CHARACTER
那么U+FFFD的UTF-8编码出来,恰好是 '\xef\xbf\xbd'。
如果这个'\xef\xbf\xbd',重复多次,例如 '\xef\xbf\xbd\xef\xbf\xbd',然后放到GBK/CP936/GB2312/GB18030的环境中显示的话
一个汉字2个字节,最终的结果就是:锟斤拷 哈哈。。。
Python代码:
>>> u'\uFFFD'.encode('utf-8')*2
'\xef\xbf\xbd\xef\xbf\xbd'
>>>
>>> print u'\uFFFD'.encode('utf-8')*2
锟斤拷
例如这个招聘就非常经典:
单位性质: 外商独资企业 所属行业: 线缆
单位规模: 100 - 499人 注册资金: 1299
联 系 人: 锟斤拷锟斤拷 联系人职位: 锟斤拷锟斤拷
传 真: 021-69178632 联系电话:
电子信箱: xuan_guo@walsin.com
通信地址:
邮 编:
单位网址:
单位介绍: 台锟斤拷锟斤拷业锟斤拷台锟斤拷锟斤拷锟侥碉拷f锟斤拷锟斤拷锟斤拷锟?锟斤拷锟斤拷/锟斤拷锟斤拷
招聘职位:锟斤拷锟斤拷 人数:20人
发布日期: 2007-07-17
联系人: 锟斤拷锟斤拷
编码问题真是个TMD烦人的问题。例如:
最后我在wikipedia上开了一个 锟斤拷 的页面。瓦咔咔。。瓦咔咔。。。
分享到:
相关推荐
Stata跨版本乱码问题解决方案,Stata跨版本乱码问题解决方案Stata跨版本乱码问题解决方案Stata跨版本乱码问题解决方案Stata跨版本乱码问题解决方案Stata跨版本乱码问题解决方案Stata跨版本乱码问题解决方案Stata跨...
甲:哦,这是乱码。 乙:为什么会出现乱码呢? 甲:说来话可长了… 乙:快说!快说! 甲:美国人发明电脑时,需要存储字符,所以使用了一个数字一个字符的方法,有128个字符。 乙:太少了。 甲:嗯。确实少。它只有7...
在IT领域,乱码问题是一个常见的困扰,尤其是在处理文本数据时。乱码通常指的是字符显示不正确或无法识别,这可能由于编码格式不匹配、文件损坏、程序设置不当等原因引起。下面将详细讨论乱码产生的原因、解决方案...
因此,一个在Linux环境下正常工作的程序,在Windows下可能会遇到乱码问题,反之亦然。 描述中的“编码转码工具”就是为了解决这类问题。这个名为`encoding_p.java`的Java源代码文件,应该包含了一个简单的类或函数...
在IT领域,乱码是一个常见的问题,特别是在处理文本编码或数据传输时。"简易乱码解码器"是一个专门设计用于解决这类问题的工具。它可能包含一系列算法和功能,帮助用户识别和修复由于编码不匹配、文件损坏或格式转换...
在信息技术领域,乱码问题是指字符在计算机中由于编码不一致或者不正确而导致的显示错误,通常表现为无法识别的特殊符号或者乱糟糟的方块。润乾报表乱码问题尤其令人头疼,因为它影响了数据的显示和传输,尤其是对于...
使用java IO技术实现将多文件中的内容集中到一个文件上 只需输入一个文件夹的路径和目的路径即可完成文件拷贝复制 并且解决了中文乱码的问题s
文本乱码转换,解决乱码问题
你也许听说过“国际C 语言乱码大赛(IOCCC)”,能获奖的人毫无疑问是世界顶级C程序员。这是他们利用C 语言的特点极限挖掘的结果。下面这个例子就是网上广为流传的一个经典作品:
"乱码问题的解决" 在 Web 开发中,乱码问题是常见的难题之一。乱码问题的出现主要是由于编码不一致引起的。编码不一致可能出现在多个方面,如页面编码、服务器编码、客户端编码、数据库编码等。在本文中,我们将...
总之,这段代码是1988年国际C语言乱码大赛的一个经典示例,它不仅考验了参赛者的编程技能,也反映了他们对C语言特性的深入理解和创新应用。通过分析这样的代码,我们不仅可以学习到C语言的高级用法,还能领略到编程...
在IT行业中,韩文乱码转换是一个常见的问题,特别是在处理韩语文本时。"韩文乱码转换器"是一款专门解决此类问题的软件工具。它主要用于解决计算机在显示或处理韩文字符时出现的编码不匹配,导致显示为无法识别的乱码...
PL/SQL 乱码解决办法 PL/SQL 乱码问题是 Oracle 数据库开发中常见的问题之一,当我们使用 PL/SQL Developer 查询数据时,可能会遇到中文乱码的问题。下面我们将详细介绍 PL/SQL 乱码的解决办法。 问题描述 在使用...
Linux系统中文乱码解决完整方案 本文档旨在解决 Linux 系统中文乱码问题,提供了一个完整的解决方案。该问题是由于 Linux 和 Windows 系统下所用户的字符集不同,Linux 系统使用的是 Unicode 字符集,而 Windows ...
南极星乱码转换器是一款专为Windows 9X操作系统设计的软件,主要用于处理在使用不同语言文字时出现的乱码问题。这款工具尤其对简体、繁体、日文和韩文之间的乱码转换有着显著的效果,使得用户在运行这些语言的游戏...
在IT行业中,尤其是在前端开发领域,我们经常遇到各种编码问题,比如在本例中的"layui分页表格及日期乱码"。layui是一个流行的JavaScript组件库,它提供了丰富的UI元素,如表格(laytable)、分页(laypage)和日期...
乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理文件乱码处理...
【标题】"日文乱码转换工具"涉及的是在处理日语文本时可能出现的编码问题。乱码通常出现在计算机系统不支持或识别错误的字符编码格式时,导致文本无法正常显示。日文乱码尤其常见,因为日语使用了多种字符集,包括...
标题中的“日文乱码解决利器”指的是针对中文系统下显示日文文本出现乱码问题的一种解决方案。在处理跨语言的计算机系统时,尤其是中文系统显示非中文字符集(如日文)时,由于编码不匹配,往往会出现乱码现象。这种...
"解决中文乱码问题" 在Java编程中,中文乱码是一个常见的问题。为了解决这个问题,我们需要从多个方面入手。首先,我们需要将Eclipse的编码方式设置为UTF-8,以便正确地显示中文字符。其次,我们需要在浏览器中将...