当前位置: 技术问答>linux和unix
unix下utf-8如何能克服UCS-2的问题
来源: 互联网 发布时间:2016-06-25
本文导语: 在 Unix 下使用 UCS-2 (或 UCS-4) 会导致非常严重的问题. 用这些编码的字符串会包含一些特殊的字符, 比如 '' 或 '/', 它们在 文件名和其他 C 库函数参数里都有特别的含义. 另外, 大多数使用 ASCII 文件...
在 Unix 下使用 UCS-2 (或 UCS-4) 会导致非常严重的问题. 用这些编码的字符串会包含一些特殊的字符, 比如 '' 或 '/', 它们在 文件名和其他 C 库函数参数里都有特别的含义. 另外, 大多数使用 ASCII 文件的 UNIX 下的工具, 如果不进行重大修改是无法读取 16 位的字符的. 基于这些原因, 在文件名, 文本文件, 环境变量等地方, UCS-2 不适合作为 Unicode 的外部编码。
UTF-8 编码没有这些问题。
那么utf-8如何能克服这个缺点呢?譬如关于'/'的问题,我觉得utf-8也有这个同样的问题,因为 '/'在uft-8里的表示和UCS-2的表示是一样的?
UTF-8 编码没有这些问题。
那么utf-8如何能克服这个缺点呢?譬如关于'/'的问题,我觉得utf-8也有这个同样的问题,因为 '/'在uft-8里的表示和UCS-2的表示是一样的?
|
'/'作为路径中的字符确实有特殊含义,但作为了个字符串中的一个char没有任何问题啊。
|
不理解你说的话了,'/'在UTF-8中跟在ASCII中不是都一样的么?
|
UTF-8编码的'/'和ASCII里的'/'有啥不一样?不都是一个字节么?
|
没理解到楼主的意思。。