当前位置: 技术问答>linux和unix
uft_8码中有占4字节的中文字符吗?
来源: 互联网 发布时间:2016-12-05
本文导语: 网上都说在uft_8码中 一个中文字符占3个字节,有占4字节的中文字符吗? 如果有 请举例,谢谢~~ | 看完所有的 Unicode 区块就不会有这个问题了~~ 西方大多数是拼音文字,所以我们的文字被他们叫...
网上都说在uft_8码中 一个中文字符占3个字节,有占4字节的中文字符吗?
如果有 请举例,谢谢~~
如果有 请举例,谢谢~~
|
看完所有的 Unicode 区块就不会有这个问题了~~
西方大多数是拼音文字,所以我们的文字被他们叫做“表意文字”~~
CJK 统一表意扩展 A:U+3400 - U+4DBF
CJK 统一表意字符:U+4E00 - U+9FFF
CJK 兼容表意字符:U+F900 - U+FAFF
CJK 统一表意扩展 B:U+20000 - U+2A6DF
CJK 兼容表意字符:U+2F800 - U+2FA1F
其中扩展 B 区里面的字你一辈子都不会见到几个,“CJK 兼容表意字符”里面的字通常在“CJK 统一表意字符”都有对应。
您可能感兴趣的文章:
本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。