大端模式与小端模式
一、概念及详解
在各种体系的计算机中通常采用的字节存储机制主要有两种: big-endian和little-endian,即大端模式和小端模式。
先回顾两个关键词,MSB和LSB:
MSB:Most Significant Bit ------- 最高有效位
LSB:Least Significant Bit ------- 最低有效位
大端模式(big-edian)
big-endian:MSB存放在最低端的地址上。
举例,双字节数0x1234以big-endian的方式存在起始地址0x00002000中:
| data |<-- address
| 0x12 |<-- 0x00002000
| 0x34 |<-- 0x00002001
在Big-Endian中,对于bit序列中的序号编排方式如下(以双字节数0x8B8A为例):
bit | 0 1 2 3 4 5 6 7 | 8 9 10 11 12 13 14 15
------MSB----------------------------------LSB
val | 1 0 0 0 1 0 1 1 | 1 0 0 0 1 0 1 0 |
+--------------------------------------------+
= 0x8 B 8 A
小端模式(little-endian)
little-endian:LSB存放在最低端的地址上。
举例,双字节数0x1234以little-endian的方式存在起始地址0x00002000中:
| data |<-- address
| 0x34 |<-- 0x00002000
| 0x12 |<-- 0x00002001
在Little-Endian中,对于bit序列中的序号编排和Big-Endian刚好相反,其方式如下(以双字节数0x8B8A为例):
bit | 15 14 13 12 11 10 9 8 | 7 6 5 4 3 2 1 0
------MSB-----------------------------------LSB
val | 1 0 0 0 1 0 1 1 | 1 0 0 0 1 0 1 0 |
+---------------------------------------------+
= 0x8 B 8 A
二、数组在大端小端情况下的存储:
以unsigned int value = 0x12345678为例,分别看看在两种字节序下其存储情况,我们可以用unsigned char buf[4]来表示value:
Big-Endian: 低地址存放高位,如下:
高地址
---------------
buf[3] (0x78) -- 低位
buf[2] (0x56)
buf[1] (0x34)
buf[0] (0x12) -- 高位
---------------
低地址
Little-Endian: 低地址存放低位,如下:
高地址
---------------
buf[3] (0x12) -- 高位
buf[2] (0x34)
buf[1] (0x56)
buf[0] (0x78) -- 低位
--------------
低地址
三、大端小端转换方法:
Big-Endian转换成Little-Endian如下:
#define BigtoLittle16(A) ((((uint16)(A) & 0xff00) >> 8) | \
(((uint16)(A) & 0x00ff) << 8))
#define BigtoLittle32(A) ((((uint32)(A) & 0xff000000) >> 24) | \
(((uint32)(A) & 0x00ff0000) >> 8) | \
(((uint32)(A) & 0x0000ff00) << 8) | \
(((uint32)(A) & 0x000000ff) << 24))
四、大端小端检测方法:
如何检查处理器是big-endian还是little-endian?
联合体union的存放顺序是所有成员都从低地址开始存放,利用该特性就可以轻松地获得了CPU对内存采用Little-endian还是Big-endian模式读写。
int checkCPUendian()
{
union
{
unsigned int a;
unsigned char b;
}c;
c.a = 1;
return (c.b == 1);
}
/*return 1 : little-endian, return 0:big-endian*/
网络字节顺序
1、字节内的比特位不受这种顺序的影响
比如一个字节 1000 0000 (或表示为十六进制 80H)不管是什么顺序其内存中的表示法都是这样。
2、大于1个字节的数据类型才有字节顺序问题
比如 Byte A,这个变量只有一个字节的长度,所以根据上一条没有字节顺序问题。所以字节顺序是“字节之间的相对顺序”的意思。
3、大于1个字节的数据类型的字节顺序有两种
比如 short B,这是一个两字节的数据类型,这时就有字节之间的相对顺序问题了。
网络字节顺序是“所见即所得”的顺序。而Intel类型的CPU的字节顺序与此相反。
比如上面的 short B=0102H(十六进制,每两位表示一个字节的宽度)。所见到的是“0102”,按一般数学常识,数轴从左到右的方向增加,即内存地址从左到右增加的话,在内存中这个 short B的字节顺序是:
01 02
这就是网络字节顺序。所见到的顺序和在内存中的顺序是一致的!
而相反的字节顺序就不同了,其在内存中的顺序为:02 01
假设通过抓包得到网络数据的两个字节流为:01 02
如果这表示两个 Byte类型的变量,那么自然不需要考虑字节顺序的问题。
如果这表示一个 short 变量,那么就需要考虑字节顺序问题。根据网络字节顺序“所见即所得”的规则,这个变量的值就是:0102
假设本地主机是Intel类型的,那么要表示这个变量,有点麻烦:
定义变量 short X,
字节流地址为:pt,按顺序读取内存是为
x=*((short*)pt);
那么X的内存顺序当然是 01 02
按非“所见即所得”的规则,这个内存顺序和看到的一样显然是不对的,所以要把这两个字节的位置调换。
调换的方法可以自己定义,但用已经有的API还是更为方便。
网络字节顺序与主机字节顺序
NBO与HBO 网络字节顺序NBO(Network Byte Order):按从高到低的顺序存储,在网络上使用统一的网络字节顺序,可以避免兼容性问题。主机字节顺序(HBO,Host Byte Order):不同的机器HBO不相同,与CPU设计有关计算机数据存储有两种字节优先顺序:高位字节优先和低位字节优先。Internet上数据以高位字节优先顺序在网络上传输,所以对于在内部是以低位字节优先方式存储数据的机器,在Internet上传输数据时就需要进行转换。
htonl()
简述:
将主机的无符号长整形数转换成网络字节顺序。
#include <winsock.h>
u_long PASCAL FAR htonl( u_long hostlong);
hostlong:主机字节顺序表达的32位数。
注释:
本函数将一个32位数从主机字节顺序转换成网络字节顺序。
返回值:
htonl()返回一个网络字节顺序的值。
inet_ntoa()
简述:
将网络地址转换成“.”点隔的字符串格式。
#include <winsock.h>
char FAR* PASCAL FAR inet_ntoa( struct in_addr in);
in:一个表示Internet主机地址的结构。
注释:
本函数将一个用in参数所表示的Internet地址结构转换成以“.” 间隔的诸如“a.b.c.d”的字符串形式。请注意inet_ntoa()返回的字符串存放在WINDOWS套接口实现所分配的内存中。应用程序不应假设该内存是如何分配的。在同一个线程的下一个WINDOWS套接口调用前,数据将保证是有效。
返回值:
若无错误发生,inet_ntoa()返回一个字符指针。否则的话,返回NULL。其中的数据应在下一个WINDOWS套接口调用前复制出来。
网络中传输的数据有的和本地字节存储顺序一致,而有的则截然不同,为了数据的一致性,就要把本地的数据转换成网络上使用的格式,然后发送出去,接收的时候也是一样的,经过转换然后才去使用这些数据,基本的库函数中提供了这样的可以进行字节转换的函数,如和htons( ) htonl( ) ntohs( ) ntohl( ),这里n表示network,h表示host,htons( ) htonl( )用于本地字节向网络字节转换的场合,s表示short,即对2字节操作,l表示long即对4字节操作。同样ntohs( )ntohl( )用于网络字节向本地格式转换的场合。
分享到:
相关推荐
这其中包括了网络字节顺序(Network Byte Order)与主机字节顺序(Host Byte Order)之间的转换问题。本文将详细介绍这两种字节顺序的概念、区别以及如何进行转换。 #### 一、字节顺序的基本概念 **字节顺序**指的...
### 为何存在大端与小端的区别? 存在这种区别主要是因为计算机系统设计的不同。尽管人们通常习惯于从左至右阅读数字(即大端顺序),但计算机内部处理时更倾向于从小位开始,这在某些运算中能够提高效率。此外,...
在计算机科学中,大端模式(Big-Endian)和小端模式(Little-Endian)是两种不同的字节存储...此外,一些库函数如`ntohs()`,`ntohl()`,`htons()`,`htonl()`用于在网络字节序(大端模式)和主机字节序之间进行转换。
例如,C语言的库函数`htonl()`(Host To Network Long)就用于将主机的字节序转换为网络字节序,对于32位整数来说,它会将小端法存储的整数转换为大端法。 上述提到的C程序展示了如何检查和转换字节序。程序首先...
常见的有两种字节序:Little Endian(小端字节序)和 Big Endian(大端字节序)。Little Endian 将低序字节存储在起始地址,而 Big Endian 将高序字节存储在起始地址。 Little Endian 最符合人的思维的字节序,因为...
你是否遇到过,内存中的数据顺序颠倒 你存入1234,实际存储的是3412. 字节存储顺序: little-endian小端,big-endian大端 教程 主机序,网络序 hton,ntoh
其中,`htons()`和`htonl()`将主机字节顺序转换为网络字节顺序,`ntohs()`和`ntohl()`则是反向操作。需要注意的是,这些函数只对网络字节序与主机字节序不同的平台有效。 - 自定义实现:对于不支持上述函数的环境...
主机字节序是自己的主机内部,内存中数据的处理方式,要么是大端,要么是小端,取决于处理器类型和操作系统类型,和编程语言无关,如何判断主机的主机字节序是大端还是小端,请参见网络编程:主机字节序和网络...
在C++中,可以使用以下四个函数来完成主机字节序与网络字节序之间的转换: - `htons(unsigned short hostShort)`:将主机字节序的16位整数转换为网络字节序。 - `htonl(unsigned long hostLong)`:将主机字节序的32...
这个程序可能是一个简单的C或C++代码示例,用于判断本地系统是采用大端字节序还是小端字节序,同时也可能涉及到TCP连接的监听,这通常是服务器端编程的一部分。 描述中的"tcp连接监听"指的是服务器端通过套接字...
其中,`htonl()`是一个网络字节序到主机字节序的转换函数,这里的网络字节序通常约定为大端模式。 3. **网络编程中的字节序问题**: 在网络通信中,通常使用TCP/IP协议栈,它规定数据在网络上传输时使用大端字节...
2. ntohl():这是Network to Host Long的缩写,它的作用是将网络字节顺序的32位无符号整数转换回主机字节顺序。在接收数据时,我们需要用到这个函数,比如: ```c uint32_t received_math = ntohl(buf.math); // ...
开发者可能在`AP.cpp`中展示了如何将大端字节序的数据转换为CPU的本地字节序(可能是小端),或者反之。这通常涉及使用位移、按位操作或标准库中的`ntoh*`(网络到主机)和`htons*`(主机到网络)函数。 总的来说,...
"Host byte order to network byte order.doc" 这份文档显然详细介绍了如何将主机字节顺序转换为网络字节顺序,这对于网络通信尤其重要。 **字节顺序详解** 1. **大端字节序(Big-Endian)**:在大端字节序中,...
主要有两种字节序:大端字节序(Big-Endian)和小端字节序(Little-Endian)。这个压缩包"网络字节序_werevj4_源码.rar"很可能包含了一组源代码,用于解释和处理网络字节序的相关问题。 大端字节序是指数据的最高...
字节序分为两种类型:大端字节序(Big-Endian)和小端字节序(Little-Endian)。理解这两种字节序对于进行跨平台的网络通信至关重要,因为不同的处理器架构可能使用不同的字节序。例如,PowerPC和SPARC通常使用大端...
在计算机科学中,数据在内存中的存储方式有两种主要模式,即大端(BigEndian)和小端(LittleEndian)。这两种模式决定了多字节数据(如整数或浮点数)在内存中的字节顺序。大端模式是指最高有效字节位于最低地址,...
网络复习题涵盖了计算机网络中的核心概念,包括套接字、线程、异构环境下的网络程序设计、字节顺序、IP地址与端口的作用、WinSock编程、UDP工作模型以及通信的阻塞与非阻塞模式。以下是对这些知识点的详细解释: 1....
由于不同硬件平台可能采用不同的字节顺序(大端或小端),网络字节顺序被定义为统一的标准。为确保数据在不同平台上的一致性,需要使用转换函数: - `htons()`:将主机字节顺序的无符号短整型转换为网络字节顺序。 -...