`
letitbe
  • 浏览: 235148 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

用utf-8还是GBK

    博客分类:
  • java
阅读更多
编码只是表示字符一种方式,字符还是那个字符,只不过其数值表示的不一样而已。字体、样式和用什么编码表示字符没有任何关系。不可能存在UTF-8达不到的效果。除非你处理字符串的方式有问题,例如后台程序写死了一个中文等于两个字节。或者你的css文件编码有问题。例如html用了UTF-8编码,而css文件用了GB编码,又没有用charset指定css的编码等等。而对于前台HTML来说,无论页面什么编码,JavaScript内建的字符串类型是UTF-16编码的,不存在任何问题。 UTF-8的编码是变长的,从1字节(兼容ASCII)到4字节不等。用UTF-8的好处是它能表示任意Unicode字符,而GBK/GB2312做不到,除了不能表示一些外国文字外,一些古老的中文(如康熙字典里的一些字)也不能表示,但在Unicode里就有。后来发展出的GB18030可以表示任意Unicode字符,也是变长编码,兼容GBK,最长4个字节。编码问题是很麻烦的事情,尤其是同一个系统中存在多种编码的情况。由于每种编码表示的字符范围有限,所以转码过程中有可能丢失字符信息。因此,如果你的程序着眼于全球市场,而不仅仅局限于中文用户,或者未来发展有这方面的需求,那么就应该坚持程序内部都使用同一种Unicode编码,如UTF-8,这样以后程序在国际化时就不会存在什么编码问题。
来源: http://news.csdn.net/n/20080509/115815.html

http://blog.cathayan.org/item/1765
http://hedong.3322.org/archives/000355.html
分享到:
评论

相关推荐

    UTF-8toGBK_labview编码gbk_LabVIEWUTF-8_utf-8toGbk_

    用户可以通过输入UTF-8编码的字符串,然后通过这个VI得到GBK编码的结果,以便在需要GBK编码的环境中使用。 LabVIEW的"转换编码"函数通常需要指定源编码和目标编码,对于这个特定的案例,源编码应该是UTF-8,目标...

    UTF-8toGBK_labview编码gbk_LabVIEWUTF-8_utf-8toGbk_源码.zip

    UTF-8的特点是英文字符用单字节表示,而大多数非英文字符,如中文,使用2至4个字节。这样设计使得UTF-8在处理英文为主的文本时效率较高,并且与ASCII兼容。 GBK编码,全称为“汉字内码扩展规范”,是中国大陆地区...

    c++ utf-8转gbk

    UTF-8是一种广泛使用的Unicode编码,而GBK是中国大陆常用的简体中文编码。`codecvt`是C++标准库中的一个组件,用于处理不同编码间的转换。本项目针对VS2010和2012两个版本的Visual Studio提供了UTF-8到GBK,以及GBK...

    GBK、UTF-8编码转换工具

    GBK、UTF-8批量文件3秒快速转码工具(支持GBK,UTF-8免费转换),UTF-8/GBK编码在线转换工具,压缩包可以有多目录与文件,如目录中有图片不会转码,但是会随转码好的文件一起打包下载。 使用帮助 . 上传压缩包(仅支持zip...

    UTF-8或者GBK文本格式判断

    Recognize类判定指定文本文件为UTF-8还是GBK编码格式。

    UTF-8与GBK

    1. 字符识别:首先,需要识别输入的字节流是属于UTF-8还是GBK编码。可以通过字节的特定模式来判断,例如UTF-8的多字节字符以10开头,而GBK的每个字节都不是。 2. 字符解码:对于UTF-8,需要识别出字符的字节数,并...

    UTF-8转GBK C语言 Linux

    UTF-8是一种广泛使用的Unicode编码方式,它用1到4个字节表示一个字符,可以兼容ASCII码,并能表示世界上大部分语言的字符。GBK是中国大陆的汉字编码标准,它是GB2312的扩展,包含更多的汉字和符号,但不支持Unicode...

    简单的UTF-8与GBK之间相互转码工具

    Linux通常使用UTF-8,而早期的Windows系统可能使用GBK或GBK的变种。因此,一个在Linux环境下正常工作的程序,在Windows下可能会遇到乱码问题,反之亦然。 描述中的“编码转码工具”就是为了解决这类问题。这个名为`...

    C#写的 GBK GB2312 UTF-8转换

    GBK、GB2312和UTF-8是三种常见的字符编码标准,每种都有其特定的应用场景和特点。C#作为.NET框架下的主要编程语言,提供了丰富的类库支持对不同编码格式之间的转换。 1. **GBK编码**:GBK是中国大陆广泛使用的汉字...

    UTF-8与GBK的区别

    ### UTF-8与GBK的区别详解 #### 一、从字节上区分 **GBK编码**是一种双字节编码方案,也就是说无论是中文字符还是英文字符,GBK都使用两个字节(即16位)来表示。为了区分中文字符,GBK将最高位设置为1。这种固定...

    UTF-8 Unicode GBK GB2312 编码之间的区别和联系

    - 对于需要支持GBK编码的插件或软件,在没有UTF-8支持的情况下,可能需要使用GBK编码。 #### 八、总结 UTF-8作为一种高效且广泛的字符编码方式,在全球范围内得到了广泛应用。相比之下,GBK和GB2312虽然在某些特定...

    java 编码 UTF-8、ISO-8859-1、GBK

    例如,如果数据库是UTF-8,JSP是GBK,可以使用 `new String(rs.getBytes(1),"UTF-8")` 将数据库中的UTF-8字节流转换为GBK字符串。反之,如果JSP是UTF-8,数据库是GBK,需要先将GBK字符串转换为字节流,然后再次转换...

    Python使用pandas读取csv文件支持utf-8和gbk编码自动识别

    Python 简单使用 pandas 读取excel 的 csv文件处理,支持utf-8和gbk编码自动识别。

    GBK 与 UTF-8 间编码转换

    描述中提到的“用vs2017写的”小程序就是为了解决这个问题,通过编程实现GBK到UTF-8或者UTF-8到GBK的转换,以提高工作效率。 编码转换的原理通常是读取原始编码的字节流,然后根据目标编码的规则重新分配字节。对于...

    c语言gbk、utf8转换编码表及函数

    在C语言中,字符编码是非常重要...通过`utf8gbk.h`和`utf8gbk.c`这两个文件,你可以直接在C程序中实现GBK与UTF-8的转换,从而满足项目的需求。不过,要注意,这些函数可能需要根据具体环境和需求进行适当的修改和优化。

    STM32 MDK utf8 gbk编码转换

    例如,一个可能的`gbk_to_utf8`函数会遍历GBK编码的输入字符串,根据GBK编码规则将其转换为对应的Unicode码点,然后根据UTF-8的编码规则,将Unicode码点转换为UTF-8编码的字节序列。类似地,`utf8_to_gbk`函数则相反...

    utf8转gbk-C语言版本.rar

    UTF-8的编码规则是:英文字符用1个字节表示,大部分常用汉字用3个字节表示,其他不常用的字符则可能用4或更多字节表示。这种设计使得UTF-8在处理英文文本时非常高效,且与ASCII兼容。 GBK编码,又称为GB2312-80的...

    utf-8.rar_c++ string utf-8_string to utf-8_utf_utf 8_utf-8

    然而,如果你从其他编码格式(如ASCII或GBK)转换到UTF-8,就需要使用编码转换函数。例如,可以使用iconv库进行这样的转换。 在处理UTF-8字符串时,常见的操作包括: 1. **字符遍历**:由于UTF-8的多字节特性,...

    GBK与UTF-8转码(C++)

    ### GBK与UTF-8转码(C++) #### 知识点概述 本文将详细介绍如何在Microsoft Foundation Classes (MFC)环境下实现GBK与UTF-8之间的编码转换。该技术适用于那些需要处理不同字符集数据的应用程序开发场景,特别是在...

    批量转 GBK 转 UTF-8 gb2312 Iso-8959-1 转 UTF-8

    在标题和描述中提到的“批量转 GBK 转 UTF-8”、“gb2312 转 UTF-8”以及“Iso-8859-1 转 UTF-8”是指将使用这些编码格式的文件转换成UTF-8编码。这是因为UTF-8具有广泛的兼容性和通用性,许多系统和软件默认使用UTF...

Global site tag (gtag.js) - Google Analytics