`
想起要学好java
  • 浏览: 8693 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

位字节汉字字符的关系

    博客分类:
  • java
 
阅读更多
经常忘记位、字节、字符的转换倍数,这里总结一下。
bit 也叫 位
byte 也叫字节
字符  就是一个字(分为英文字符和汉字)
 
它们之间的关系如下:
1 bit     = 1  二进制数据
1 byte  = 8  bit
1 字母 = 1  byte = 8 bit
1 汉字 = 2  byte = 16 bit
 
1. bit:位
    一个二进制数据0或1,是1bit;
2. byte:字节
    存储空间的基本计量单位,如:MySQL中定义 VARCHAR(45)  即是指 45个字节;
    1 byte = 8 bit
3. 一个英文字符占一个字节;
    1 字母 = 1 byte = 8 bit
4. 一个汉字占2个字节;
    1 汉字 = 2 byte = 16 bit
 
5. 标点符号
    A>.  汉字输入状态下,默认为全角输入方式;
    B>.  英文输入状态下,默认为半角输入方式;
    C>.  全角输入方式下,标点符号占2字节;
    D>.  半角输入方式下,标点符号占1字节;
分享到:
评论

相关推荐

    获得汉字字符串拼音首字母

    在IT领域,特别是编程与文本处理中,获取汉字字符串的拼音首字母是一个常见的需求,尤其在中文信息处理、搜索引擎优化、排序以及数据分类等场景下。本文将详细解析如何通过编码转换和映射表的方式,从汉字字符串中...

    字和字节和位的关系.pdf

    "字和字节和位的关系" 在计算机科学中,字、字节和位是三个基本概念,它们之间存在着紧密的关系。 位(bit) 位是计算机中数据储存的最小单位。一个二进制位只能表示0和1两种状态。两个二进制位可以表示四种状态...

    汉字字符编码(utf-8 unicode gb2312)

    汉字字符编码是计算机处理汉字时的关键技术,涉及到不同的编码标准,如UTF-8、Unicode和GB2312。这些编码方式各有特点,各有应用场景,理解它们有助于在处理中文字符时避免乱码问题。 首先,让我们来详细了解这些...

    GB 2312-1980 信息交换用汉字编码字符集 基本集.rar

    ### GB 2312-1980 信息交换用汉字编码字符集 基本集 #### 一、GB 2312-1980简介 GB 2312-1980是中华人民共和国国家技术监督局于1980年发布的信息交换用汉字编码字符集的基本集,它是中国最早的一套国家标准汉字...

    字-字节-字长-位区别与联系.doc

    八个二进制位构成一个字节(Byte),1 个字节可以储存 1 个英文字母或半个汉字。字节是存储空间的基本计量单位,计算机的内存和磁盘的容量都是以字节表示的。 字长(Word)是电脑技术中对 CPU 在单位时间内能一次...

    js判断字节数

    首先,我们要理解字符与字节的关系。在ASCII编码中,每个字符对应一个字节,但在Unicode编码(包括UTF-8)中,不同字符可能占用不同的字节数。UTF-8是最常用的Unicode变体,它根据字符的复杂性占用1至4个字节。 ...

    关于GBK和GB2312所有的汉字及字符

    本文将详细解析这两种编码格式的特点、区别以及与汉字和字符的关系。 首先,GB2312是国家标准《信息交换用汉字编码字符集·基本集》的简称,发布于1980年。它定义了7445个字符,其中包括6763个汉字(包括一级常用...

    GBK字符集(汉字完整版)

    GBK字符集不仅包含了GB2312的所有汉字和符号,还增加了大量的汉字,并对一些常用但未被GB2312收录的汉字进行了补充,使得GBK成为了更加全面的汉字编码方案。 #### 二、GBK与GB2312的关系 1. **兼容性**: GBK兼容GB...

    汉字编码原理与ASCII

    如果没有定义_UNICODE,那么英文字符将被当成1个字节来处理,而汉字字符的编码将采用GB2312编码规范来的;如果定义了_UNICODE,那么英文字符将被当成2个字节来处理,而汉字字符的编码将采用UNICODE编码来的。 汉字...

    汉字编码及其演进关系

    ### 汉字编码及其演进关系 #### 引言 随着信息技术的发展,汉字编码成为连接计算机技术与中文使用者之间的重要桥梁。本文旨在探讨汉字编码的发展历程及其在信息技术领域中的重要性,尤其聚焦于国内汉字编码标准的...

    Unicode的中文汉字和字符编码对应表

    2. **编码长度**:Unicode基本使用16位(两个字节)编码,对于超出BMP的字符可能需要32位(四个字节)。GBK始终使用两个字节编码。 3. **兼容性**:Unicode是国际标准,跨语言环境兼容性更好;GBK是中国内地的国家...

    易语言数字转化为汉字

    - 易语言提供了数字到汉字大写的映射表,开发者可以通过遍历整数的每一位,然后通过对应关系查找并拼接汉字。 - 对于非零数字,易语言提供了一种映射表或内建函数,可以直接将数字转换成汉字。 - 零的处理需要...

    汉字的字符集-big5 gb2312 unicode

    汉字字符集是计算机处理汉字的重要基础,涉及到不同的编码标准,如Big5、GB2312、GBK以及Unicode。这些字符集在不同的地区和应用场景中各有其独特的重要性。 首先,让我们了解一下Big5字符集。Big5,又称为大五码,...

    GBK1.0和GB2312的汉字

    本文将深入探讨GBK1.0和GB2312这两个重要的汉字字符集,以及它们在汉字编码中的作用。 GB2312,全称为《信息交换用汉字编码字符集·基本集》,是中国大陆在1980年代初期制定的一套汉字编码标准。该标准主要针对简体...

    VC++汉字转国标码(一个汉字变成2个16进制码)

    例如,可以使用`std::wstring`来存储汉字字符串,因为它是宽字符类型,能够处理多字节字符。然后,我们可以通过循环遍历字符串中的每个字符,对每个字符进行以下步骤: 1. **判断字符类型**:检查字符是否为汉字。...

    字符编码和字符集研究

    例如,英文字符集包含了所有的英文字母和符号,而汉字字符集则包含了所有汉字。字符集可以是某个语言的文字,如简体中文的GB2312或GBK,也可以是包含多种语言字符的Unicode。 字符编码则是字符集与二进制数字之间的...

    汉字转换16进制表达(源码)

    "汉字转换16进制表达(源码)"这个主题涉及到的就是如何将汉字字符转换为16进制表示,以及如何将16进制字符串还原为汉字。这种转换在编程中尤为实用,例如在网络通信、文件存储或者加密解密等领域。 首先,我们要...

    汉字中文十六进制显示转换

    在IT领域,尤其是在编程和数据处理中,有时候我们需要将汉字字符转换为十六进制表示,或者反过来,将十六进制编码还原为汉字。这在处理串口通信、文本编码、网络传输等场景时尤其常见。本文将深入探讨“汉字中文十六...

    2022全国计算机应用基础知识:汉字、字符编码.docx

    "2022全国计算机应用基础知识:汉字、字符编码" 计算机中的信息单位是指计算机中对信息表示的单位,有位、字、字长及字节等。其中,位是计算机中数据存储的最小单位,简称位,英文为bit,音译为比特,可用小写字母b...

    日文字库Sjis码表

    GBK编码是中国国家标准GB 18030的一部分,它是对GB 2312编码的扩展,能够支持更多的汉字和非汉字字符。GBK编码同样使用双字节编码方案,可以表示约2万多个汉字和其他符号。与SJIS不同,GBK主要用于中文环境下的文本...

Global site tag (gtag.js) - Google Analytics