Unicode 是字符集(Charset),UTF-8 才是编码(Encoding)。
Unicode 只规定了字符和二进制的映射关系,没规定存储的编码方式,UTF-8 就是其中一种编码方式。
有关具体的区别,搜 “UTF-8 和 Unicode 的区别” 这个关键字就可以了。
常见字符集和编码:
-
Unicode 字符集:有 UTF-8、UTF-16、UTF-32 等多种编码;
-
ASCII 字符集:本身既是字符集、又是编码;
-
CB2312 字符集:只有 EUC-CN 这一种编码。
与恶龙缠斗过久,自身亦成为恶龙;凝视深渊过久,深渊将回以凝视…