当前位置: 技术问答>linux和unix
Fedora 一个汉字占几个字节??
来源: 互联网 发布时间:2016-09-02
本文导语: 新手的悲哀啊! 一个汉字不是两个字节码? 为什么我用 cut -b -2 显示不出字出来 | 中文的unicode编码从4E00(一)[E4B880]开始,到9FA5(龥)[E9BEA5]结束,共20826个汉字.编码从15到16 bits,所以中文utf-8...
新手的悲哀啊!
一个汉字不是两个字节码?
为什么我用 cut -b -2 显示不出字出来
一个汉字不是两个字节码?
为什么我用 cut -b -2 显示不出字出来
|
中文的unicode编码从4E00(一)[E4B880]开始,到9FA5(龥)[E9BEA5]结束,共20826个汉字.编码从15到16 bits,所以中文utf-8的编码是3个byte.
|
的确是3个字节 UTF8是处理国际化语言的字符集 每个字符占3个字节 每个字母等占用1个字节
难道编码不一样 一个汉字占用的字节的规定不一样?
难道编码不一样 一个汉字占用的字节的规定不一样?
|
UTF-8编码,汉字可能占到3~4个字节,就是说有占3个字节的,也有占4个字节的
|
应该是3或者4个字节的
|
仅仅与编码相关,与系统不相关
|
好像是utf-7/utf-8有的字符用3个字节吧。
所以 utf-8的保存起来占用存储空间要多一些的
所以 utf-8的保存起来占用存储空间要多一些的
|
cut -b -3呢