`
weiyuhu
  • 浏览: 235942 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

大端小端 -- 各系统及机器的信息表示

阅读更多
网络编程必备的知识点:大端和小端



因为现行的计算机都是以八位一个字节为存储单位,那么一个16位的整数,也就是C语言中的short,在内存中可能有两种存储顺序big-

endian和litte-endian.考虑一个short整数0x3132(0x32是低位,0x31是高位),把它赋值给一个short变量,那么它在内存中的存储可

能有如下两种情况:
大端字节(Big-endian):

short变量地址
       0x1000                  0x1001
___________________________________
|                 |
|         0x31    |       0x32
|________________ | ________________
高位字节在低位字节的前面,也就是高位在内存地址低的一端.可以这样记住(大端->高位->在前->正常的逻辑顺序)

小端字节(little-endian):

short变量地址
       0x1000                  0x1001
_____________________________________
|                 |
|         0x32    |       0x31
|________________ | __________________
低位字节在高位字节的前面,也就是低位在内存地址低的一端.可以这样记住(小端->低位->在前->与正常逻辑顺序相反)

可以做个实验
在windows上下如下程序
#include <stdio.h>
#include <assert.h>

void main( void )
{
        short test;
         FILE* fp;
       
         test = 0x3132;  //(31ASIIC码的’1’,32ASIIC码的’2’)
        if ((fp = fopen ("c:""test.txt", "wb")) == NULL)
               assert(0);
         fwrite(&test, sizeof(short), 1, fp);
         fclose(fp);
}

    然后在C盘下打开test.txt文件,可以看见内容是21,而test等于0x3132,可以明显的看出来x86的字节顺序是低位在前.如果我们
把这段同样的代码放到(big-endian)的机器上执行,那么打出来的文件就是12.这在本机中使用是没有问题的.但当你把这个文件从一
个big- endian机器复制到一个little-endian机器上时就出现问题了.

    如上述例子,我们在big-endian的机器上创建了这个test文件,把其复制到little-endian的机器上再用fread读到一个 short里
面,我们得到的就不再是0x3132而是0x3231了,这样读到的数据就是错误的,所以在两个字节顺序不一样的机器上传输数据时需要特别
小心字节顺序,理解了字节顺序在可以帮助我们写出移植行更高的代码.

正因为有字节顺序的差别,所以在网络传输的时候定义了所有字节顺序相关的数据都使用big-endian,BSD的代码中定义了四个宏来处
理:
#define ntohs(n)     //网络字节顺序到主机字节顺序 n代表net, h代表host, s代表short
#define htons(n)     //主机字节顺序到网络字节顺序 n代表net, h代表host, s代表short
#define ntohl(n)      //网络字节顺序到主机字节顺序 n代表net, h代表host, s代表 long
#define htonl(n)      //主机字节顺序到网络字节顺序 n代表net, h代表host, s代表 long

举例说明下这其中一个宏的实现:
#define sw16(x) "
     ((short)( "
         (((short)(x) & (short)0x00ffU) << | "
         (((short)(x) & (short)0xff00U) >> ))

这里实现的是一个交换两个字节顺序.其他几个宏类似.

我们改写一下上面的程序
#include <stdio.h>
#include <assert.h>

#define sw16(x) "
     ((short)( "
         (((short)(x) & (short)0x00ffU) << | "
         (((short)(x) & (short)0xff00U) >> ))

// 因为x86下面是低位在前,需要交换一下变成网络字节顺序
#define htons(x) sw16(x)

void main( void )
{
        short test;
         FILE* fp;
       
         test = htons(0x3132); //(31ASIIC码的’1’,32ASIIC码的’2’)
        if ((fp = fopen ("c:""test.txt", "wb")) == NULL)
               assert(0);
         fwrite(&test, sizeof(short), 1, fp);
         fclose(fp);
}


    如果在高字节在前的机器上,由于与网络字节顺序一致,所以我们什么都不干就可以了,只需要把#define htons(x) sw16(x)宏替

换为 #define htons(x) (x).
    一开始我在理解这个问题时,总在想为什么其他数据不用交换字节顺序?比如说我们write一块buffer到文件,最后终于想明白了,

因为都是unsigned char类型一个字节一个字节的写进去,这个顺序是固定的,不存在字节顺序的问题.

【用函数判断系统是Big Endian还是Little Endian】

bool IsBig_Endian()
//如果字节序为big-endian,返回true;
//反之为    little-endian,返回false
{
     unsigned short test = 0x1122;
    if(*( (unsigned char*) &test ) == 0x11)
       return TRUE;
else
    return FALSE;

}//IsBig_Endian()

【打印程序对象的字节表示】
// 可在不同平台与硬件架构的机器中测试运行这段代码,理解大端表示和小端表示的不同.
// 这段代码使用强制类型转换规避类型系统
#incluede <stdio.h>

// 假设每个字节都是非负整数
typedef unsigned char *byte_pointer;

void show_bytes(byte_pointer start, int len)
{
for(int i = 0; i < len; i++)
   printf(" %.2x", start[i]);
printf("\n");
}

void show_int(int x)
{
show_bytes((byte_pointer) &x, sizeof(int));
}

void show_float(float x)
{
show_bytes((byte_pointer) &x, sizeof(float));
}

// 在使用相同编码(如ASCII编码)的系统中,字符串字节表示得到的结果一般是相同的.所以文本数据比二进制数据具有更强的平台无关性
void show_string(char *x)
{
show_bytes((byte_pointer) x, strlen(x));
}

void show_pointer(void *x)
{
show_bytes((byte_pointer) &x, sizeof(void *));
}

void test_show_bytes(int val)
{
int ival = val;
float fval = (float)ival;
int *pval = &ival;

show_int(ival); // 各个机器因为大端表示和小端表示的不同,从而只是字节顺序不同
show_float(fval); // 各个机器因为大端表示和小端表示的不同,从而只是字节顺序不同
show_pointer(pval); // 指针值是与机器相关的(linux,sun使用4字节地址, 而alpha使用八字节地址)
}

---------------------------------------------
对于如数值12345在int型和float型时的编码表示
分享到:
评论

相关推荐

    iOS 大端格式和小段格式

    2. **操作系统与通信协议**:一般操作系统采用小端格式,而网络通信协议通常采用大端格式,这是为了确保不同平台间的数据兼容性。 3. **文件格式**:不同的文件格式也有自己的字节序约定。例如,AdobePS采用大端...

    大端(Big_Endian)与小端(Little_Endian)简介

    ### 大端与小端表示法详解 #### 一、概念定义 在计算机科学领域,大端(Big Endian)与小端(Little Endian)指的是数据(特别是多字节整数)在内存中存储时的字节顺序。这两种表示方法主要应用于不同类型的计算机...

    Big small end conversion(大端小端相互转化,将文本的十六进制数据,以二进制形式保存到点jpg文件中)

    这可能是从网络接收数据,或者是从某种不支持小端系统的设备读取数据。转换完成后,数据被保存为二进制文件,以".jpg"扩展名表示,这意味着这些数据可能包含图像信息。 "txt转bin文件"是指将原本以文本格式(如.txt...

    详解大端模式和小端模式

    大端模式和小端模式是计算机科学中的一种字节顺序表示方法,用于描述多字节数据在内存中的存储顺序。该概念最早由Danny Cohen提出,用于网络协议的字节顺序表示。 大端模式(Big-Endian)是指高位字节排放在内存的...

    天津理工大学中加专业计算机结构实验一:数据和程序的机器级表示实验报告(附截图)

    - 整数1111的机器表示为`35160000`(小端机器表示)。 - 整数-1111的机器表示为`cbe9ffff`。 - 浮点数56.85的机器表示为`66666342`。 - 浮点数-56.85的机器表示为`666663c2`。 3. **书面推导整数和浮点数的理论...

    软件工程--02数据的机器级表示.ppt

    存储排列指的是数据在内存中的顺序,可能是大端序(MSB First,高位字节先存)或小端序(LSB First,低位字节先存)。此外,纠/检错机制用于检测和纠正数据传输或存储过程中的错误。 在二进制编码中,不同的进位...

    3.信息的表示和处理(上)1

    例如,整数12345在不同机器上的字节表示可能为39 30 00 00(大端法)或00 00 30 39(小端法)。 总结来说,本部分内容介绍了计算机如何表示和存储信息,尤其是整数,以及虚拟地址空间的概念。字长决定了地址空间的...

    《计算机组成与系统结构》编程实验

    1. 设计一个程序来判断机器是大端模式还是小端模式。 2. 设计一个程序来检查内存变量(如结构体或数组)是否按边界对齐。 **实验报告要求**: - 提供源程序(文本文件)和执行结果。 - 回答以下问题: - 机器是...

    判断机器大小端的两种实现方法

    在小端系统中,整型的最低有效字节会存储在字符变量中,因此如果字符变量等于0x78,那么系统就是小端的。反之,如果是0x12,那么系统就是大端的。 以下是这种方法的示例代码: ```c #include int main(void) { ...

    深入理解计算机系统(英文版)

    - **寻址和字节顺序**:解释了如何在内存中定位数据以及不同字节顺序(如大端和小端)的概念。 - **字符串表示**:介绍字符串在内存中的存储方式。 - **代码表示**:讨论如何表示程序代码。 - **布尔代数与环**...

    操作系统lab1实验报告1

    在操作系统中,大端存储模式和小端存储模式都是常用的存储模式,但是在不同的系统中,存储模式可能不同。 在实验报告中,内核文件是大端存储模式,而 testELF 是小端存储模式,这是因为内核文件是可执行文件,而 ...

    第2章 数据的机器级表示复习要点1

    - **大端法和小端法**:决定了多字节数据在内存中的高低位存储位置,影响数据读取。 5. **数据的检错与纠错**: - **奇偶校验码**:通过增加一个校验位,使得整个数据的1的个数为奇数或偶数,可检测到单位错误但...

    深入理解计算机系统(高清淅英文版)

    - 字节顺序(小端模式与大端模式)及其选择依据。 - **2.2 整数表示**:探讨了无符号整数与补码表示法,以及它们之间的转换规则。 - **关键知识点**: - 无符号与有符号整数的区别。 - 补码运算的基本原则。 -...

    深入理解计算机系统-经典计算机教材

    - **地址和字节顺序**: 计算机系统如何确定字节的顺序,包括小端和大端两种主要格式。 - **字符串和代码表示**: 字符串和程序代码在计算机中是如何存储的。 - **布尔代数和环**: 布尔代数和环在位操作中的应用。 ...

    深入理解计算机系统(英文,computer systems a programmer's perspective)

    - **字节序**:介绍小端模式和大端模式的概念,这对于理解跨平台编程非常重要。 - **字符串表示**:如何在计算机内部存储和操作字符串。 - **代码表示**:程序代码在计算机中的存储方式。 - **布尔代数与环**:探讨...

    深入理解计算机系统第三版答案

    - 本题要求确定机器是大端还是小端模式。 - 一种解决方案是创建一个整数变量并设置其值为1,然后通过访问该变量的第一个字节来判断机器的字节顺序。 - 如果返回值为0,则表明机器是大端模式;如果返回值为1,则表明...

Global site tag (gtag.js) - Google Analytics