MySQL(5.5.3)之后增加了这个utf8mb4的编码,但是8.0版本以后默认都是utf8mb4.
- MySQL的“utf8mb4”是真正的“UTF-8”,长度是4个字节。
- MySQL的“utf8”是mysql自己的一种“专属的编码”,它的最大字符长度为 3 字节,只是“UTF-8”标准的一个子集
既然utf8能够存下大部分中文汉字,那为什么还要使用utf8mb4呢?
mysql支持的 utf8 编码最大字符长度为 3 字节,如果遇到 4 字节的宽字符就会插入异常了。三个字节的 UTF-8 最大能编码的 Unicode 字符是 0xffff,也就是 Unicode 中的基本多文种平面(BMP)。也就是说,任何不在基本多文本平面的 Unicode字符,都无法使用 Mysql 的 utf8 字符集存储。包括 Emoji 表情和很多不常用的汉字,以及任何新增的 Unicode 字符等。