中文编码主要有以下四种:
GB2312:简体中文编码,一个汉字占用2字节,在大陆是主要编码方式。当文章/网页中包含繁体中文、日文、韩文等等时,这些内容可能无法被正确编码。
BIG5:繁体中文编码。主要在台湾地区采用。
GBK:支持简体及繁体中文,但对他国非拉丁字母语言还是有问题。
UTF-8:Unicode编码的一种。Unicode用一些基本的保留字符制定了三套编码方式,它们分别UTF-8,UTF-16和UTF-32。在UTF-8中,字符是以8位序列来编码的,用一个或几个字节来表示一个字符。这种方式的最大好处,是UTF-8保留了ASCII字符的编码做为它的一部分。UTF-8俗称“万国码”,可以同屏显示多语种,一个汉字占用3字节。为了做到国际化,网页应尽可能采用UTF-8编码。
当然,处理中文时http头也要改成UTF-8编码的-----加上<meta http-equiv="Content-Type" content="text/html; charset=utf-8">。
字符集
常用字符集分类
ASCII及其扩展字符集
作用:表语英语及西欧语言。
位数:ASCII是用7位表示的,能表示128个字符;其扩展使用8位表示,表示256个字符。
范围:ASCII从00到7F,扩展从00到FF。
ISO-8859-1字符集
作用:扩展ASCII,表示西欧、希腊语等。
位数:8位,
范围:从00到FF,兼容ASCII字符集。
GB2312字符集
作用:国家简体中文字符集,兼容ASCII。
位数:使用2个字节表示,能表示7445个符号,包括6763个汉字,几乎覆盖所有高频率汉字。
范围:高字节从A1到F7, 低字节从A1到FE。将高字节和低字节分别加上0XA0即可得到编码。
BIG5字符集
作用:统一繁体字编码。
位数:使用2个字节表示,表示13053个汉字。
范围:高字节从A1到F9,低字节从40到7E,A1到FE。
GBK字符集
作用:它是GB2312的扩展,加入对繁体字的支持,兼容GB2312。
位数:使用2个字节表示,可表示21886个字符。
范围:高字节从81到FE,低字节从40到FE。
GB18030字符集
作用:它解决了中文、日文、朝鲜语等的编码,兼容GBK。
位数:它采用变字节表示(1 ASCII,2,4字节)。可表示27484个文字。
范围:1字节从00到7F; 2字节高字节从81到FE,低字节从40到7E和80到FE;4字节第一三字节从81到FE,第二四字节从30到39。
UCS字符集
作用:国际标准 ISO 10646 定义了通用字符集 (Universal Character Set)。它是与UNICODE同类的组织,UCS-2和UNICODE兼容。
位数:它有UCS-2和UCS-4两种格式,分别是2字节和4字节。
范围:目前,UCS-4只是在UCS-2前面加了0x0000。
UNICODE字符集
作用:为世界650种语言进行统一编码,兼容ISO-8859-1。
位数:UNICODE字符集有多个编码方式,分别是UTF-8,UTF-16和UTF-32。
按所表示的文字分类
语言 字符集 正式名称
英语、西欧语 ASCII,ISO-8859-1 MBCS 多字节
简体中文 GB2312 MBCS 多字节
繁体中文 BIG5 MBCS 多字节
简繁中文 GBK MBCS 多字节
中文、日文及朝鲜语 GB18030 MBCS 多字节
各国语言 UNICODE,UCS DBCS 宽字节
分享到:
相关推荐
本文将深入探讨“常用编码与解码”,主要关注UTF-8、GB2312和GBK这三种常见的中文编码格式。 首先,我们要理解什么是编码。编码是将字符(如汉字、字母、数字等)转化为特定二进制序列的过程。这个过程允许计算机...
中文编码是计算机处理中文文本的关键技术,涉及多种字符集和编码方式。本文将详细介绍几种主要的中文编码标准,...理解和掌握这些编码知识对于处理中文信息至关重要,尤其是在软件开发、网页制作、数据库管理等领域。
下面是常用编码方式的中英文对照表: 一、ASCII 编码 * 中文名称:ASCII 编码 * 英文名称:ASCII Code * 编码范围:0x00-0x7F * 特点:使用 7 位二进制数表示一个字符,总共可以表示 128 个字符。 * 应用场景:...
HS 编码知识点整理 HS 编码是国际通用的商品编码系统,用于分类和标识商品。在本文中,我们将对 HS 编码进行整理和解释,着重介绍常用的 HS 编码。 一、钢铁制品 * HS 编码 7306:钢管,包括不锈钢和其他材料的...
### 数字图像压缩原理及常用压缩编码方法 #### 一、引言 随着信息技术的快速发展,数字图像在各个领域中的应用越来越广泛。然而,原始数字图像的数据量巨大,这不仅给存储带来了极大的压力,还增加了数据传输的...
磁动力工作室提供的这份“常用红外遥控编码资料集”是对飞利浦RC-5和NEC两种常见编码标准的详细介绍,不仅涵盖了理论知识,还列举了多种实用的编码芯片,非常适合初学者入门学习以及专业人士参考使用。通过系统地...
分辨率是编码器的一个关键参数,它表示编码器每旋转360度输出的信号数量,常用的分辨率从每转5线到10000线不等。 在实际应用中,增量型编码器(旋转型)通过一个中心有轴的光电码盘,上有环形通暗的刻线,通过光电...
本文将深入探讨与“常用汉字字符编码”相关的知识点,涵盖标题、描述及部分内容中提及的核心概念。 #### 一、什么是字符编码? 字符编码是一种将文字(包括汉字)转换为数字表示的方法,使计算机能够存储、处理和...
本篇文章将深入探讨编码知识,特别是针对Windows 1251-1258、GB2312、GBK、BIG5以及ASCII这几种编码表。 首先,ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是最基础的字符...
### 关于字符编码的转换知识 #### 一、引言 字符编码是在计算机科学领域内一个重要的基础概念,它涉及到如何在计算机系统中存储、处理和传输文本信息。随着信息技术的发展,不同地区和文化背景下的用户对字符的...
在这个主题中,我们将深入探讨“常用汉字的Unicode编码”以及它在制作验证码时的应用。 Unicode编码,全称为“统一码”或“万国码”,由Unicode联盟制定,旨在解决早期多种字符编码方案导致的不兼容问题。Unicode...
在Java编程语言中,编码知识是开发者必备的基础之一。它涉及到字符集、字节顺序、字符串表示以及如何处理不同编码格式等问题。这篇文章将深入探讨Java中的编码相关知识点,以帮助你更好地理解和解决与编码相关的问题...
本文将根据给定的“Python编码规范(Google)”文件内容,深入解析其中的关键知识点,并提供具体的实践建议。 #### 二、分号 **知识点:** - **避免使用分号:** 根据Google的Python编码规范,不推荐在行尾使用分号...
计算机编码知识,尤其是字符编码,是计算机科学中的基础概念,它涉及到如何在计算机内部表示和处理文本。VB6.0,即Visual Basic 6.0,是微软开发的一种面向对象的编程语言,它同样需要理解字符编码以便正确处理文本...
### 每个web开发者都应该知道的URL编码知识 #### 简介 在Web开发领域,统一资源定位符(Uniform Resource Locator,简称URL)扮演着至关重要的角色。URL不仅用于标识网络上的资源位置,还涉及到如何正确地传输和...
H264编解码的一些常用知识,方便学习和记忆,如:在一个GOP中,P、B帧是由I帧预测得到的等等一些常识问题。
文本编码是计算机处理字符的...理解并掌握这些编码知识对于IT专业人士来说非常重要,尤其是在处理多语言网站、电子邮件、数据库存储或者软件本地化等方面。正确使用和转换编码可以避免乱码问题,保证信息的准确传递。
通过这些知识点,可以全面了解上海精浦提供的常用型编码器特价系列的技术参数和应用特点。这些编码器作为传感器类设备,在现代工业自动化和运动控制中占据重要地位,对保证设备精准运行、提高生产效率起到关键作用。