C#中字符串编码处理__2312_byte_范围_C#_c#_

当前位置: 编程技术>.net/c#/asp.net

C#中字符串编码处理

来源: 互联网发布时间：2014-10-16

本文导语: GB2312是简体中文系统的标准编码用“区” 跟“位”的概念表示称之为区位码区指代大的范围位相当于偏移量。每个汉字占两个字节高位字节”的范围是0xB0-0xF7，“低位字节”的范围是0xA1-0xFE。它的规律好像是按拼音a到z的顺...

GB2312是简体中文系统的标准编码用“区” 跟“位”的概念表示称之为区位码
区指代大的范围位相当于偏移量。
每个汉字占两个字节
高位字节”的范围是0xB0-0xF7，“低位字节”的范围是0xA1-0xFE。
它的规律好像是按拼音a到z的顺序排列的
“啊”字是GB2312之中的第一个汉字，它的区位码就是1601
为此我们现在用代码的方式输出一个汉字
c#下是little字节序 b0跑后面去了。

代码如下:

 ushort u = 0xa1b0;
 byte[] chs =BitConverter.GetBytes(u);
 Console.Write(Encoding.GetEncoding("GB2312").GetString(chs));

屏幕上输出的是汉字“啊”
但是注意并不代表写个循环从0xbA1 到0xf7fe就可以输出所有的汉字，这个很简单比如高位从1到9 低位从1到9 只有81种组合。
并不代表99-11就是结果这么二的问题晕。实际上通过这种方式汉字的个数总共是6768个,理解了区位码的概念后你就知道怎样去处理gb2312的汉字编码了。
下面我们就用这种方式来输出所有的汉字

代码如下:

//gb2312
 //B0-F7，低字节从A1-FE
 //byte hi = 0xB0;
 //byte lo = 0xA1;
 for (byte i = 0xB0; i 

您可能感兴趣的文章:

C# Split分隔字符串的应用(C#、split、分隔、字符串)

c#转义字符串中的所有正则特殊字符方法示例

c# 截断字符串的实现代码

C#中把字符串String转换为整型Int的小例子

c#完美截断字符串代码(中文+非中文)

在c#中把字符串转为变量名并获取变量值的小例子

C#中判断、验证字符串是否为日期格式的实现代码

C++ Strings(字符串) 成员 size():返回字符串中字符的数量

关于字符串的操作，我想得到字符串的长度，和他开始两位组成的新的字符串，例如：：

C++ Strings(字符串) 成员 c_str():将字符串以C字符数组的形式返回

C语言实现输入一个字符串后打印出该字符串中字符的所有排列

C++ Strings(字符串) 成员 find():在字符串中查找字符

如何使GDB显示完整的字符串变量，当字符串比较长时。

C++ Strings(字符串) 成员 end():返回一个迭代器，指向字符串的末尾。（最后一个字符的下一个位置）

php判断字符串在另一个字符串位置的方法

C++ Strings(字符串) 成员 empty():如果字符串为空，返回真

请教，有关16进制字符串形成2进制字符串的问题！

C++ Strings(字符串) 成员 length():返回字符串的长度

本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术，将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外，均为转载、整理或搜集自网络。欢迎任何形式的转载，转载请注明出处。