什么是编码?
计算机使用0和1来存储文本,比如字符“C”被存成“01000011”。
计算机显示"C"时经过2个步骤:
步骤1:读取“01000011” (2进制码),计算得到67。
步骤2:计算机在Unicode字符集中查找67,找到了“C”。
Unicode字符集是几乎所有网络都在使用的。Unicode字符集包含了上百万个字符。最简单的编码是UTF-32,每个字符使用32位。
UTF-8可以节省空间,在UTF-8中,字符“C”只需要8位,一些不常用的字符,比如“”需要32位。其他的字符可能使用16位或24位。