当前位置:  编程技术>c/c++/嵌入式

C++中汉字字符串的截取

    来源: 互联网  发布时间:2014-10-12

    本文导语:  1、 代码如下:const char *str = "test测试test";while(*str){//这里只需要判断第一个字节大于0x80就行了,前提是输入的是合法的GBK字符串//原因在于,如果第一个字节大于0x80,那么它必然和后面一个字节一起组成一个汉字//所以就没有必...

1、

代码如下:

const char *str = "test测试test";
while(*str)
{
//这里只需要判断第一个字节大于0x80就行了,前提是输入的是合法的GBK字符串
//原因在于,如果第一个字节大于0x80,那么它必然和后面一个字节一起组成一个汉字
//所以就没有必要再去判断后面一个字节了
//再强调一下,前提条件是输入合法的GBK字符串
if(*str > 0x80)
{
// 汉字,计数器++
str += 2;//是汉字自然就该直接+2了
}
else
{
str++;
}
}

2、

参看下面的字符串转换函数。

代码如下:

/**
* 用getBytes(encoding):返回字符串的一个byte数组
* 当b[0]为 63时,应该是转码错误
* A、不乱码的汉字字符串:
* 1、encoding用GB2312时,每byte是负数;
* 2、encoding用ISO8859_1时,b[i]全是63。

* B、乱码的汉字字符串:
* 1、encoding用ISO8859_1时,每byte也是负数;
* 2、encoding用GB2312时,b[i]大部分是63。
* C、英文字符串
* 1、encoding用ISO8859_1和GB2312时,每byte都大于0;
* 总结:给定一个字符串,用getBytes("iso8859_1")
* 1、如果b[i]有63,不用转码; A-2
* 2、如果b[i]全大于0,那么为英文字符串,不用转码; B-1
* 3、如果b[i]有小于0的,那么已经乱码,要转码。 C-1
*/
private static String toGb2312(String str) {
if (str == null) return null;
String retStr = str;
byte b[];
try {
b = str.getBytes("ISO8859_1");

for (int i = 0; i < b.length; i++) {
byte b1 = b[i];
if (b1 == 63)
break; //1
else if (b1 > 0)
continue;//2
else if (b1 < 0) { //不可能为0,0为字符串结束符
retStr = new String(b, "GB2312");
break;
}
}
} catch (UnsupportedEncodingException e) {
// e.printStackTrace();
}
return retStr;
}

3、

代码如下:

unsigned char *str = "test测试test";
int length;
int i;

length = strlen(str);
for (i = 0; i < length - 1; i++)
{
if ( *str >= 0x81 && *str = 0x40 && *(str + 1) >7&1 && name[i+1]>>7&1 )       //if ( name[i] < 0 && name[i+1] < 0 )

             i = i + 2 ;

         else

             i = i + 1 ;

     }

     i = i > len ? i-3 :i-1;

     strncpy( store , name , i+1 ); //截取前i+1位

     *(store+i+1)=0;

     strcpy( strTemp , name + i + 1 );

     strcpy( name , strTemp );

 }


    
 
 
 
本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • secureCRT下Linux终端汉字乱码解决方法
  • 请问:假如在表中某个字段存储了200个汉字,而我只想输出这200个汉字中的前10个汉字,怎样才能达到这个效果呢?
  • 中文汉字编码知识及各种中文编码对应的编码区间总结
  • 求救:JAVA 中汉字编码怎样变成 VC 下的汉字编码?
  • 急~~大字符集的汉字问题(普通汉字正常)
  • jni中汉字问题,如何把java中的汉字转化到c中去?
  • linux 繁体 汉字输入法 问题 linux 繁体 汉字输入法 问题
  • 我可以用gedit编辑汉字,但Word不能显示汉字???
  • 怎样把u9996u9875的汉字编码,转换为汉字输出!谢了
  • Redhat9安装语言是中文,X Window中汉字能正常显示,但是KDevelop中的汉字却是乱码?
  • 我的linux安装的是英文版的汉字全是乱码,怎么能让汉字正常显示?
  • 为什么通过jTextField输入的汉字变成了一个字符?我用jTextField.getText().length()返回的结果就是这样!6个汉字的长度只有6!!!
  • 谁能帮我一下100分:在PDA的WinCE平台上,用JAVA语言开发程序,为什么不能在label,button显示汉字呢?却能在textarea中显示汉字呢!!!
  • JSP汉字显示传送没问题,汉字和数字混合就会乱,谁能解决?
  • 汉字的问题:我用纯java把汉字从库里取出来显示,代码如下:String dbstr1= new String(ls.getBytes("ISO8859_1"),"gb2312"),可一部分字
  • Linux中汉字显示
  • mysql 中如何取得汉字字段的各汉字首字母
  • utf-8汉字编码
  • 高分求解! 怎样才能让 DOS 的启动菜单显示汉字?
  • 我的 redhat 9.0 装了openoffice.org 1.0 为什么汉字不显示?
  • 怎样实现汉字的拼音首字母查询!(在线等待)


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3