当前位置:  编程技术>其它

正则表达式中对各字符集编码范围的总结

    来源: 互联网  发布时间:2014-10-13

    本文导语:  这些字符集尤其是日文字符集的各种字、标点以及特殊符号的时候有所帮助。  UTF8 [x01-x7f]|[xc0-xdf][x80-xbf]|[xe0-xef][x80-xbf]{2}|[xf0-xff][x80-xbf]{3} UTF16 [x00-xd7][xe0-xff]|[xd8-xdf][x00-xff]{2} JIS [x20-x7e]|[x21-x5f]|[x21-x7e]{2} SJIS [x20-x7e]|[xa1-xdf]|([x81...

这些字符集尤其是日文字符集的各种字、标点以及特殊符号的时候有所帮助。 
UTF8
[x01-x7f]|[xc0-xdf][x80-xbf]|[xe0-xef][x80-xbf]{2}|[xf0-xff][x80-xbf]{3}
UTF16
[x00-xd7][xe0-xff]|[xd8-xdf][x00-xff]{2}
JIS
[x20-x7e]|[x21-x5f]|[x21-x7e]{2}
SJIS
[x20-x7e]|[xa1-xdf]|([x81-x9f]|[xe0-xef])([x40-x7e]|[x80-xfc])
EUC_JP        
[x20-x7e]|x81[xa1-xdf]|[xa1-xfe][xa1-xfe]|x8f[xa1-xfe]{2}
EUC_JP标点符号及特殊字符        
[xa1-xa2][xa0-xfe]
EUC_JP全角数字
xa3[xb0-xb9]
EUC_JP全角大写英文
xa3[xc1-xda]
EUC_JP全角小写英文     
xa3[xe1-xfa]
EUC_JP全角平假名
xa4[xa1-xf3]
EUC_JP全角片假名 [color=Red]2007-03-12 15:00更新[/color]
xa3[xb0-xb9]|xa3[xc1-xda]|xa5[xa1-xf6][xa3][xb0-xfa]|[xa1][xbc-xbe]|[xa1][xdd]
EUC_JP全角汉字 [color=Red]2007-03-12 15:06更新[/color]
[xb0-xcf][xa0-xd3]|[xd0-xf4][xa0-xfe]|[xB0-xF3][xA1-xFE]|[xF4][xA1-xA6]|[xA4][xA1-xF3]|[xA5][xA1-xF6]|[xA1][xBC-xBE]
Big5
[x01-x7f]|[x81-xfe]([x40-x7e]|[xa1-xfe])
GBK
[x01-x7f]|[x81-xfe][x40-xfe]
GB2312汉字
[xb0-xf7][xa0-xfe]
GB2312半角标点符号及特殊符号
xa1[xa2-xfe]
GB2312罗马数组及项目序号
xa2([xa1-xaa]|[xb1-xbf]|[xc0-xdf]|[xe0-xe2]|[xe5-xee]|[xf1-xfc])
GB2312全角标点及全角字母
xa3[xa1-xfe]
GB2312日文平假名
xa4[xa1-xf3]
GB2312日文片假名
xa5[xa1-xf6]
補充: 
GB18030
[x00-x7f]|[x81-xfe][x40-xfe]|[x81-xfe][x30-x39][x81-xfe][x30-x39]
[color=Red]2007-03-12 21:35 补充[/color] 
日文半角空格
x20
SJIS全角空格
(?:x81x81)
SJIS全角数字
(?:x82[x4f-x58])
SJIS全角大写英文
(?:x82[x60-x79])
SJIS全角小写英文
(?:x82[x81-x9a])
SJIS全角平假名
(?:x82[x9f-xf1])
SJIS全角平假名扩展
(?:x82[x9f-xf1]|x81[x4ax4bx54x55])
SJIS全角片假名
(?:x83[x40-x96])
SJIS全角片假名扩展
(?:x83[x40-x96]|x81[x45x5bx52x53])
EUC_JP全角空格
(?:xa1xa1)
EUC半角片假名
(?:x8e[xa6-xdf]) 

    
 
 

您可能感兴趣的文章:

  • Perl 正则表达式之角色化记忆
  • js正则表达式之RegExp对象之compile方法 编译正则表达式
  • Linux c++ boost库正则表达式用法
  • 正则表达式 表示 非指定字符串开头的正则
  • Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法
  • 正则表达式问题,使用正则表达式找出指定字符串并替换?
  • linux bash shell命令:文本搜索工具grep正则表达式元字符集(基本集)
  • 正则表达式概述 什么是正则表达式 .
  • JS 正则表达式的相关方法(正则学习笔记1)
  • jQuery中的正则表达式分析 正则基础
  • java 正则表达式基础,实例学习资料收集大全 原创
  • 哪些命令可以使用正则表达式
  • 常用正则表达式及评注-学习正则必备
  • (菜鸟飞飞)问个正则表达式的问题
  • 向大家推荐一个收集整理正则表达式的网站
  • 正则表达式的问题
  • 关于正则表达式匹配问题
  • Python 匹配任意字符(包括换行符)的正则表达式写法
  • php 正则 不包含某字符串的正则表达式
  • Java正则表达式 reb4j
  • 大虾,请问谁有正则表达式的资料?谢谢!
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • c#正则过滤图片标签 asp.net正则过滤的例子
  • 正则匹配后面非指定字符的正则 原创
  • java使用正则表达校验手机号码示例(手机号码正则)
  • PHP html标签正则替换并可自定义正则规则
  • python正则表达式去掉数字中的逗号(python正则匹配逗号)
  • 正则表达式口诀_学习正则的朋友值得一看
  • Javascript里的两种使用正则的方法
  • 常用正则 常用的C#正则表达式
  • 寻求正则表达试
  • 学习IP地址的正则表达式
  • asp.net正则表达式提取中文的代码示例
  • 正则表达式中使用变量赋值
  • 用正则表达式来表示中文
  • java正则表达式验证函数
  • linux下有什么函数可以处理正则表达式?
  • emacs里空行的正则表达式如何写?
  • 正则式 ^[^ ](.*[^ ])?$ 的含义
  • 正则式如何只匹配一个汉字?
  • 关于sed的正则表达式
  • 正则表达式小疑问


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3