当前位置: 技术问答>linux和unix
gb2312编码问题
来源: 互联网 发布时间:2016-04-28
本文导语: 问一句,我在网上找到的GB2312编码表怎么好像有些跟实际的对不上? 我用gedit把一个unicode编码的文档转换成GB2312编码,发现其中原来中文的部分的编码变成了GB2312相应的编码,但是英文的和数字的却没有变,为什么...
问一句,我在网上找到的GB2312编码表怎么好像有些跟实际的对不上?
我用gedit把一个unicode编码的文档转换成GB2312编码,发现其中原来中文的部分的编码变成了GB2312相应的编码,但是英文的和数字的却没有变,为什么?
我在网上看到的GB2312编码表里面也有对英文字母和数字的编码阿,跟unicode的不一样。莫非是gedit的问题?
这是原文:
1234567890
走自己的路
abcdefg
这是uft-8编码:
0000000: 3132 3334 3536 3738 3930 0ae8 b5b0 e887 1234567890......
0000010: aae5 b7b1 e79a 84e8 b7af 0a61 6263 6465 ...........abcde
0000020: 6667 0a
fg.
这是gb2312编码:
0000000: 3132 3334 3536 3738 3930 0ad7 dfd7 d4bc 1234567890......
0000010: bab5 c4c2 b70a 6162 6364 6566 670a ......abcdefg.
网上找到的GB2312 编码表部分:
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A3A0 ! " # ¥ % & ' ( ) * + , - . /
A3B0 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
A3C0 @ A B C D E F G H I J K L M N O
A3D0 P Q R S T U V W X Y Z [ \ ] ^ _
A3E0 ` a b c d e f g h i j k l m n o
A3F0 p q r s t u v w x y z { | }  ̄
我用gedit把一个unicode编码的文档转换成GB2312编码,发现其中原来中文的部分的编码变成了GB2312相应的编码,但是英文的和数字的却没有变,为什么?
我在网上看到的GB2312编码表里面也有对英文字母和数字的编码阿,跟unicode的不一样。莫非是gedit的问题?
这是原文:
1234567890
走自己的路
abcdefg
这是uft-8编码:
0000000: 3132 3334 3536 3738 3930 0ae8 b5b0 e887 1234567890......
0000010: aae5 b7b1 e79a 84e8 b7af 0a61 6263 6465 ...........abcde
0000020: 6667 0a
fg.
这是gb2312编码:
0000000: 3132 3334 3536 3738 3930 0ad7 dfd7 d4bc 1234567890......
0000010: bab5 c4c2 b70a 6162 6364 6566 670a ......abcdefg.
网上找到的GB2312 编码表部分:
code +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
A3A0 ! " # ¥ % & ' ( ) * + , - . /
A3B0 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
A3C0 @ A B C D E F G H I J K L M N O
A3D0 P Q R S T U V W X Y Z [ \ ] ^ _
A3E0 ` a b c d e f g h i j k l m n o
A3F0 p q r s t u v w x y z { | }  ̄
|
是的 原先文档并不都是UNICODE编码。
忽略换行是否可行??