utf8与utf8mb4区别简单介绍

本文解析了MySQL中utf8与utf8mb4编码的区别,utf8mb4是真正的UTF-8,支持4字节编码,能存储所有Unicode字符,包括Emoji和不常用汉字,而utf8仅支持3字节编码,无法存储部分宽字符。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

MySQL(5.5.3)之后增加了这个utf8mb4的编码,但是8.0版本以后默认都是utf8mb4.

  • MySQL的“utf8mb4”是真正的“UTF-8”,长度是4个字节。
  • MySQL的“utf8”是mysql自己的一种“专属的编码”,它的最大字符长度为 3 字节,只是“UTF-8”标准的一个子集

既然utf8能够存下大部分中文汉字,那为什么还要使用utf8mb4呢?

mysql支持的 utf8 编码最大字符长度为 3 字节,如果遇到 4 字节的宽字符就会插入异常了。三个字节的 UTF-8 最大能编码的 Unicode 字符是 0xffff,也就是 Unicode 中的基本多文种平面(BMP)。也就是说,任何不在基本多文本平面的 Unicode字符,都无法使用 Mysql 的 utf8 字符集存储。包括 Emoji 表情和很多不常用的汉字,以及任何新增的 Unicode 字符等。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值