当前位置: 技术问答>linux和unix
生僻汉字处理
来源: 互联网 发布时间:2016-11-18
本文导语: 生僻汉字如何处理? 如:傚 溦 在内存中如何存放? | 不一定,这得看编码格式,有些是变长格式,有些是固定长度的。 | 就要看生僻字有没有相应的编码。 UTF-8下,这个编码应该没有任何问...
生僻汉字如何处理?
如:傚 溦
在内存中如何存放?
如:傚 溦
在内存中如何存放?
|
不一定,这得看编码格式,有些是变长格式,有些是固定长度的。
|
就要看生僻字有没有相应的编码。
UTF-8下,这个编码应该没有任何问题,
在GBK下,有些生僻字是没有编码的,但是我用了那么久的GBK,暂时还没有发现没有编码的生僻字。
用这个地址可以查询编码:
http://bm.kdd.cc/index.asp
您查询的是GBK内码,傚82E5 溦9CD5
UTF-8下,这个编码应该没有任何问题,
在GBK下,有些生僻字是没有编码的,但是我用了那么久的GBK,暂时还没有发现没有编码的生僻字。
用这个地址可以查询编码:
http://bm.kdd.cc/index.asp
您查询的是GBK内码,傚82E5 溦9CD5
|
也是占两个字节吧