【关于Linux中判断大端小端的代码问题】__endian_test_char_ENDIANNESS_long_EndianTest_

当前位置: 技术问答>linux和unix

【关于Linux中判断大端小端的代码问题】

来源: 互联网发布时间：2017-03-08

本文导语: 本问题是通过比较两个用UNION联合体实现的大小端判断方案所产生的 /* * 注：提出此问题的假设 * 假设数组中的元素依次在大端、小端机器上都是从低字节向高字节依次存储 */ //======================================= 第一...

本问题是通过比较两个用UNION联合体实现的大小端判断方案所产生的
/*
* 注：提出此问题的假设
* 假设数组中的元素依次在大端、小端机器上都是从低字节向高字节依次存储
*/
//=======================================
第一个方案
//---------------------------------------------------------
union
{
int a;
char b;
}EndianTest;
EndianTest.a = 0x00000001;
if( EndianTest.b == 0x01 )
//是小端
else
//是大端
这个方案能够理解，将EndianTest.a直接赋值为1
若是小端机器，那么存储在内存中的数据就是0x01000000
若是大端机器，那么存储在内存中的数据就是0x00000001
这样只要取该数据在内存中低位1个字节，就能够判断出本机是小端还是大端。

//======================================
第二个方案(网上说是linux中的实现)
//----------------------------------------------------------
static union
{
char c[4];
unsigned long l;
}endian_test = { { 'l','?','?','b' } };
#define ENDIANNESS ((char)endian_test.l)
在本问题假设条件成立的情况下，
这个实现方案把数据一个字节一个字节地依次在内存里按低字节到高字节的顺序存放
首先是
endian_test.c[0] = 'l' //即内存低字节（假设为0x00000000）存的'l'
然后
endian_test.c[1] = '?' //即内存0x00000001存的'?'
其次
endian_test.c[2] = '?' //即内存0x00000002存的'?'
最后
endian_test.c[3] = 'b' //即内存0x00000003存的'b'

这样的话，不论大端或是小端，存进内存的16进制数都是 62 3f 3f 6c （'l''?''?''b'）没有区别
那么提取该内存的第一个字节就都相同了，为0x62，也即'l'，这样怎么能够
判别出大小端呢？

按照我的理解，判断大端小端的原理就在于数据存入内存时的顺序，然而Linux这段代码使数据存入的顺序没有任何变化，那不就等于没有起到判断的作用么？

【注：由于本人技术有限，实在琢磨不出其原因，所以还请各位高手多多指教。在我得知所以然之后，会将本博文转成正式的知识性文章，在此先谢谢大家】

问题出在最后一句。
我想你的意思是：已知c[4]和l是同一块内存，而c[4]不论是大端小端都是“l??b”，那么l所在的内存也就是这个顺序，这是没错的。
但是在从l到char的强制转换时，取的是“低字节”，而低字节在哪里呢？这就要看大端小端了。如果是大端，低字节就是b，反之为l。
所以最后一句应该改为“不论大端小端，都截取低字节，而低字节是谁，由大端小端决定。”



static union

{

 char c[4];

 unsigned long l;

}endian_test = { { 'l','?','?','b' } };

#define ENDIANNESS ((char)endian_test.l)



endian_test  初始化的时候是按照char数组初始化的。

所以在内存中endian_test的布局是



高地址

^     b

|     ?

|     ?

|     l

低地址



但是你取endian_test.l的时候，是按照long占的四个字节来取数据的

也就是如果是小端机器 取出来的是b??l

大端机器取出来的是l??b



然后再转换成char, 则去掉3个字节的高位

也就是小段是l 大端是b



完整的程序应该是：



static union

{

 char c[4];

 unsigned long l;

}endian_test = { { 'l','?','?','b' } };



#define ENDIANNESS ((char)endian_test.l)



if (ENDIANNESS == 'b')

{

    printf("bign");

}

else if(ENDIANNESS == 'l')

{

    printf("littlen");

}

else

{

    printf("errorn");

}

没错，在char*和其它类型进行自动转换的时候是有差别的，因为char*永远是一样的，而超过2个字节才能表示的数据存储方式是根据大小端确定的

建议看一下我的博文，若还不懂，再解释~
http://blog.csdn.net/dragonbooker/archive/2011/02/06/6173321.aspx

short s=1;
if( s == htons(s) ) 大端;
else 小端;

网络字节序是大端的。

你对大小端还没有弄明白。
大端方式将高位存放在低地址，小端方式将低位存放在低地址
提取低8bit值都是一样的，
但是long型的那个值却在大小端中是不一样的。所以可以通过l的值来判断是大还是小端。
你这个例子不完整。

回复 Bill_Hoo：
你好，刚看到你的回复，首先你应该明白联合体（union）数据类型的特性吧-----成员变量c和i公用一段内存，当系统我32位系统时，正好，unsigned long类型占4个字节，char为一个字节

我们假设从左到右内存地址依次增高，那么'l', '?', '?', 'b' 这四个字符在不同的系统将会这样放置：
'l', '?', '?', 'b' ------ 小端（little-endian）系统（低低模式，即低字节放在低地址）
'b','?', '?', 'l' ------ 大端（big-endian）系统（高低模式，即高字节放在低地址）

那么宏中的这条语句（（char)endian_test.l）很明显是取long变量的第一个字节，那么如果返回‘l’，说明是小端，如果返回 'b'。说明是大端。