常见 编码 GBK UTF-8 Unicode 简介

本文深入探讨了编码的基础概念,包括Unicode作为全球统一编码的解决方案,GBK和GB2312作为汉字编码的历史演变,以及UTF-8的变长特性。特别关注ASCII在中文环境中的应用和Unicode在编码转换中的核心地位。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

编码定义:

信息从一种格式转化到另一种格式的过程规范。

常见编码:

Unicode:(Union code)又称统一码,万国码,是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。

GBK: 全称,汉字内码扩展规范,存储汉字三个字节,GB3123的拓展。

GB2312: 全称,信息交换用的汉字字符集编码,GBK的未拓展版本。

UTF-8: 针对Unicode设计的可变长编码,存储一个汉字使用两个字节。

ASCII: 它是美国标准信息交换代码的缩写, 为英语通信所设计,在我们中国的话用处难受。

备注:目前业内常用与编码转换的中间商是Unicode。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值