C语言:大小端模式、判断大小端、大小端转换

目录

1. 什么是大端和小端

2.为什么会存在大小端的问题

3. 判断主机字节序 (主机大小端)

3.1 使用联合体 (union)

3.2 使用指针

3.3 强制转为 char 类型法

4. 大小端转换


1. 什么是大端和小端

对于一个存储空间大于 1 个字节的数据,在内存中有两种存储模式,

大端模式 (big-endian):数据的高字节在内存的低地址存放,数据的低字节在内存的高地址存放

小端模式 (little-endian):数据的高字节在内存的高地址存放,数据的低字节在内存的低地址存放

简单记忆:

大端模式:大高低

小端模式:小低低

比如,比如数字:0x12345678,大小端存储模式如下:

2.为什么会存在大小端的问题

        在 C 语言中,有占 1 个字节内存空间的 char 类型,占 2 个字节内存空间的 short int 类型,以及占 4 个字节内存空间的 int,double 类型和占 8 个字节内存空间的 double 类型等等,那么对于大于 1 个字节空间的数据类型的数据在内存中存储时,就必然产生一个数据在内存中应该将其低字节数据安排在内存的低地址还是高地址呢?,对这个问题做的不同选择,就形成了大小端问题。

3. 判断主机字节序 (主机大小端)

3.1 使用联合体 (union)

        联合体的每一个成员共用一个内存地址,修改其中一个成员的数据,可能会影响其它成员的数据的值。比如以下联合体,成本变量 i 和 c 的内存地址是相同的,它的内存分布示意图为

	union {
		int i;
		char c;
	}un;	// 匿名联合体

#include <stdio.h>

int is_little_endian() {
	union {
		int i;
		char c;
	}un;	// 匿名联合体
	un.i = 1;	

	return un.c;	// 小端:返回 1,说明数据的低字节在内存的低地址存放
					// 大端:返回 0,说明数据的低字节在内存的高地址存放
}

int main() {
	if (is_little_endian())
		printf("little-endian\n");
	else
		printf("big-endian\n");

	return 0;
}

3.2 使用指针

#include <stdio.h>

int is_little_endian() {
	int i = 1;

	// 等同于 char* p = (char*)&i; return *p;
	return *(char*)&i;	// 小端:返回 1,说明数据的低字节在内存的低地址存放
						// 大端:返回 0,说明数据的低字节在内存的高地址存放
}

int main() {
	if (is_little_endian())
		printf("little-endian\n");
	else
		printf("big-endian\n");

	return 0;
}

4. 大小端转换

        1. 编写大小端转化函数,并打印本机字节序下的数字:0x11223344,分别在小端模式和大端模式下是什么数据。

#include <stdio.h>

int is_little_endian();
int to_opposite_endian(int data);
int to_big_endian(int data);
int to_little_endian(int data);

int main() {
	int i = 0x11223344;
	printf("little_endian:	%x\n", to_little_endian(i));
	printf("big_endian:	%x\n", to_big_endian(i));

	return 0;
}

int is_little_endian() {
	int i = 1;

	return *(char*)&i;	// 小端:返回 1,大端:返回 0
}

// 大小端转换
int to_opposite_endian(int data) {
	int size = sizeof(data);
	int des = 0;		// 目标数据
	int mask = 0xff;	// 掩码
	int temp;

	for (int i = 0; i < size; i++) {
		des = des << 8;			// 左移8位
		temp = data & mask;		// 取值
		temp = temp >> i * 8;	// 移到低8位
		des |= temp;
		mask = mask << 8;		// 掩码左移8位,为下一次取数据用
	}

	return des;
}

int to_big_endian(int data) {
	if (!is_little_endian())	// 大端
		return data;

	return to_opposite_endian(data);
}

int to_little_endian(int data) {
	if (is_little_endian())	// 小端
		return data;

	return to_opposite_endian(data);
}

2. 在网络编程中,可以使用 htonl, htons, ntohl, ntohs 等函数

  • htonl(uint32_t hostlong) // host to network long,32位无符号整型的主机字节序转成网络字节序
  • htons(uint16_t hostshort) // host to network short,16位无符号短整型的主机字节序转成网络字节序
  • ntohl(uint32_t netlong) // network to host long,32位无符号整型的网络字节序转成主机字节顺序的
  • ntohs(uint16_t netshort) //16位无符号短整型的网络字节序转成主机字节序

网络字节序:大端模式(big-endian),即数据的高字节在内存的高地址存放,数据的低字节在内存的低地址存放。

### 将16进制小端字节序转换为大端字节序的方法 在 Python 中,可以通过 `int.to_bytes` 和 `int.from_bytes` 方法来实现不同字节序之间的转换。以下是具体方法: #### 转换逻辑 1. 首先将小端字节序的十六进制数据读取为整数。 2. 使用 `.to_bytes()` 方法将该整数重新编码为大端字节序。 此过程可以利用以下代码完成[^3]: ```python # 假设输入是一个小端格式的十六进制字符串 hex_string_little_endian = "f1e2d3c4" # 步骤 1: 将小端十六进制字符串解码为字节数组 (假设每两个字符代表一个字节) little_endian_bytes = bytes.fromhex(hex_string_little_endian) # 步骤 2: 将小端字节序解释为整数 integer_value = int.from_bytes(little_endian_bytes, byteorder='little') # 步骤 3: 将整数重新编码为大端字节序 big_endian_bytes = integer_value.to_bytes(length=len(little_endian_bytes), byteorder='big') print(big_endian_bytes.hex()) # 输出大端格式的十六进制字符串 ``` 以上代码片段展示了如何从小端字节序转换为大端字节序的过程。其中: - `bytes.fromhex()` 函数用于将十六进制字符串解析成字节数组。 - `int.from_bytes(bytearray, byteorder)` 将字节数组按指定字节序解读为整数。 - `int.to_bytes(length, byteorder)` 则将整数重新编码为目标字节序的字节数组。 #### 示例运行结果 对于输入 `"f1e2d3c4"` 的小端十六进制字符串,执行上述代码后输出的大端十六进制字符串将是 `c4d3e2f1`[^5]。 --- ### 注意事项 - 如果原始数据已经是字节数组而非字符串,则可以直接跳过第一步中的 `fromhex` 操作。 - 字节长度需保持一致,在调用 `to_bytes` 时传入合适的 `length` 参数以匹配原字节数组的长度。 ---
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值