`
孙健坤
  • 浏览: 42246 次
  • 性别: Icon_minigender_1
  • 来自: 长春
最近访客 更多访客>>
社区版块
存档分类
最新评论

位 字节 字符

 
阅读更多

位(bit 就是01,是计算机的专业术语,是数据存储的最小单位,计算机采用2进制系统来存储和处理数据,每个01都是一个位(bit),如二进制数0101就是4位,也叫4比特(bit)。

字节(Byte1个字节等于8位二进制数,是一个二进制数字序列,在计算机中作为一个数字单元, 是用来计算存储容量和传输容量的一种计量单位。

1个字节等于82进制数,82进制数共能组合出28个不同的序列,也就是256个不同的二进制数字序列。

比较通用的的ASCII码是使用一个字节来表达一个信息的:ASCII 码使用指定的 7 位或 8 位二进制数组合来表示 128 256 种可能的字符。标准 ASCII 码也叫基础ASCII码,使用 7 位二进制数来表示所有的大写和小写字母,数字 0 9、标点符号, 以及在美式英语中使用的特殊控制字符。其中:
  031127(33)是控制字符或通讯专用字符(其余为可显示字符),如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BS(退格)BEL(振铃)等;通讯专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;ASCII值为 8910 13 分别转换为退格、制表、换行和回车字符。它们并没有特定的图形显示,但会依不同的应用程序,而对文本显示有不同的影响。
  32126(95)是字符(32sp是空格),其中485709十个阿拉伯数字;
  659026个大写英文字母,97122号为26个小写英文字母,其余为一些标点符号、运算符号等。
  同时还要注意,在标准ASCII中,其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b71;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b71

  后128个称为扩展ASCII码,目前许多基于x86的系统都支持使用扩展(或ASCII。扩展 ASCII 码允许将每个字符的第 8 位用于确定附加的 128 个特殊符号字符、外来语字母和图形符号。

   
当然这只是一种编码方式,还有很多其他的编码方式并不是使用一个字节来表达的,像UNICODE码,就是使用好几个字节来进行编码的,所以他所能包含的信息量比较大,可以对汉字等非英语文字编码。
    
图像和视频,根据其后缀名不通也有不同的编码方式,存到硬盘上的都是01代码,须由专用的,支持对应编码方式的程序读取代码,根据编码方式对代码进行还原,形成多媒体信息。

字符(char 1个字符等于2个字节,计算机刚开始只支持英语,其他语言不能够在计算机上存储和显示。为了使计算机支持更多语言(例如汉语)就必须设计出一个比字节(Byte)更大的单位,比如计算机想要支持汉语就不能以字节为单位,因为一个字节最多只能表示256种变化,而汉字仅常用字就多达7000多个,总数更是高达90000多个,这还是不包含中文标点符号等特殊字符,所以字节的256种变化就明显不够用了,所以新的存储单位“字符”就应运而生了。一个字符包含两个字节,也就是16位,最多能组合出65536种变化来,虽然还不能包括所有汉字,但常用的汉字就完全能够包括了。

与字符一起产生的就是“字符编码”了,因为许多语言都使用字符来表示,所以难免会发生重复,比如:汉字“中”在中文操作系统中使用[0xD6,0xD0]来表示的,但别的语言也难免会用到这样的组合,所以在解析时你就必须告诉程序或者系统你是要用什么编码方式解析字符,只有你告诉了程序或系统编码方式为GBK,gb2312gb18030,程序或系统才能把字符按照汉字来解析,否则就会出现乱码了。

CPU位数指的是CPU一次能处理的最大位数。例如32位计算机的CPU一个机器周期内可以处理32位数据(就是3201)。

分享到:
评论

相关推荐

    计算字符串中的单双字节字符个数

    在ASCII编码中,每个字符只需要一个字节(8位)来表示,因此称为单字节字符。这包括英文字符、数字、标点符号等。然而,对于包含多种语言和复杂字符集的Unicode编码,一个字符可能需要两个字节或更多来表示,比如...

    如何处理错误ORA-29275:部分多字节字符

    在运行查询SELECT * FROM V$SESSION 会出现ORA-29275:部分多字节字符的错误,这是什么原因开始我不得其解,网上也没有介绍什么好办法。本文给出答案。

    多字节和宽字节字符相互转化

    该程序在VS2008上测试通过,代码可以实现多字节和宽字节字符之间的相互转换。

    Java字符流与字节流区别

    字符流处理的单元为 2 个字节的 Unicode 字符,分别操作字符、字符数组或字符串,而字节流处理单元为 1 个字节,操作字节和字节数组。 Java 内用 Unicode 编码存储字符,字符流处理类负责将外部的其他编码的字符流...

    C# 按照字节长度截取字符串

    在C#编程中,有时我们需要根据字节长度来截取字符串,这可能是因为要处理不同编码格式的数据,或者为了适应特定的传输限制。本篇将详细介绍如何在C#中按照字节长度截取字符串,并结合正则表达式进行操作。 首先,...

    Win32 下 Unicode-多字节字符串 转换工具

    在Windows编程环境中,Unicode和多字节字符串的转换是一个常见的需求。本文将深入探讨这个主题,特别是针对Win32 API的使用,以及如何利用提供的"StringEx.cpp"和"StringEx.h"文件来实现这一转换。 Unicode是一种...

    字节变成字符串

    字节变成字符串

    java 字符串转16进制 16进制转字符串 将两个ASCII字符合成一个字节;

    java 字符串转16进制 16进制转字符串 将两个ASCII字符合成一个字节; java 字符串转16进制 16进制转字符串 将两个ASCII字符合成一个字节; java 字符串转16进制 16进制转字符串 将两个ASCII字符合成一个字节; java ...

    单字节 多字节 双字节 相互转换

    * `wcstombs()`:将双字节字符串数组转换为多字节字符串 在实际应用中,需要根据实际情况选择合适的转换函数,以确保字符串的正确转换。 Unicode 和宽字符 在上面的讨论中,我们提到了 Unicode 和宽字符。 ...

    unicode字符和多字节字符的相互转换接口及测试工程

    Unicode字符集是一种广泛采用的标准,它包含了世界上几乎所有的字符,而多字节字符则是一种用于表示Unicode字符的编码方式。本项目着重于提供Unicode字符与多字节字符之间的转换接口,并通过实际测试工程验证其功能...

    字节与字符互转的工具

    字节与各种基本类型互转,十六进制字符串与字节数组互转,二进制字符串与字节数组互转等等

    MFC在unicode字符集下的多字节串口调试助手

    当项目设置为Unicode字符集时,`CString`默认存储Unicode字符串,而当项目设置为多字节字符集时,`CString`则处理多字节字符串。然而,在实际应用中,我们可能需要在两者之间进行转换。MFC提供了`ATL`库中的`AtlConv...

    VS2013 多字节字符集支持

    VS2013 编译MFC 使用多字节字符集时报错 error MSB8031: Building an MFC project for a non-Unicode character set is deprecated. 安装补丁解决。

    字符串按照指定的字节数来截取

    注意,由于字符可能由多个字节组成(如UTF-8编码中的多字节字符),因此截取字节时可能会截断字符。为了确保完整性,通常需要以字符边界进行截取,这可能需要借助于`codecs`库的`decode()`和`iterdecode()`等方法。 ...

    字符串变成字节

    字符串变成字节

    c#中的流,字节,字符,字符串的互相转化

    在C#编程中,数据传输和...此外,`Convert`类提供了通用的转换方法,如`Convert.ToInt32`、`Convert.ToChar`等,但在处理字节与字符之间的转换时,使用`Encoding`类的方法更为合适,因为它能更好地处理多字节字符编码。

    关于java按字节截取带有汉字的字符串的解法

    为了解决这个问题,我们需要理解Unicode编码以及如何在Java中正确处理多字节字符。下面我们将详细探讨这个问题,并提供一种有效的解决方案。 首先,我们需要知道汉字在计算机中通常是使用Unicode编码表示的,每个...

    vb6.0 字节数组和字符串的相互转换.rar

    在VB6.0编程环境中,字节数组和字符串之间的转换是常见的操作,尤其是在处理二进制数据和文本数据之间转换的场景。本教程将详细解释如何在VB6.0中进行这两种数据类型的转换,并通过实际示例进行演示。 1. 字符串转...

    java字节与字符

    IO流 输出、输入字节流,并且任意截取字符串的长度,

    unicode 字符集 与 多字节字符集 转换的代码

    unicode 字符集 与 多字节字符集转换/kekegeneral

Global site tag (gtag.js) - Google Analytics