.
UTF-8可以与之前的ASCII
码兼容,但是遇到比7bits更大的编码UTF-8是怎么处理的?
例如符号 ½,在UTF-8中的编码是101111101,使用了8bits这时候在UTF-8中就需要两个字节来存储。
当需要更高位的时候,则可以用下面的表格来推算他。
也就是当需要两个字节的时候,前面为两个11加一个零。需要三位的时候则1110。而子位前面都以10开头,剩下的位用来存储数据。
对于n字节的符号(n > 1),第一个字节的前n位都设为1,第n + 1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的 Unicode 码。
1 | let char = “\u{00bd}” |