`

正则匹配双字节文字

    博客分类:
  • js
阅读更多
String.prototype.lenB=function()
          {
              return this.replace(/[^\x00-\xff]/g,"##");
          }

在正则中\x指的是  十六进制!

但如果写成 \x0-\xf

js会自动纠错的

因为 一个字节是八个二进制位!所以他会默认为两位\x00-\xf0(大体上具体补成什么样,无法考证!因为 f0在window系统下不识别!)
ascii发展的现在已有128扩展到现在256
详见维基百科
http://zh.wikipedia.org/zh/ASCII

另外还有延伸的美国标准信息交换码
EASCII(Extended ASCII,延伸美国标准信息交换码)是将ASCII码由7位扩充为8位而成。EASCII的内码是由0到255共有256个字符组成。EASCII码比ASCII码扩充出来的符号包括表格符号、计算符号、希腊字母和特殊的拉丁符号。

ISO/IEC 8859是最常见的8位字符编码。除此之外,不同的操作系统都会有它的8位字符编码。

下列符号是ISO/IEC 8859-1所包含的符号,是在万维网和中使用的扩展ASCII字符集中最常见的的符号。


分享到:
评论

相关推荐

    中文正则表达式匹配问题之正则表达式中文匹配使用方法

    这篇文章主要讲如何使用正则匹配中文字符,中文正则表达式的匹配规则不像其他正则规则一样容易记住,下面一起看看这个中文正则表达式是怎么样的。 \w匹配的仅仅是中文,数字,字母,对于国人来讲,仅匹配中文时常会...

    收集一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~)

    2. 匹配双字节字符:这通常指的是所有Unicode字符,因为Unicode是一种双字节字符集,能够表示几乎所有国家的文字。正则表达式[^\x00-\xff]可以匹配非ASCII字符,它排除了0x00到0xff范围内的ASCII字符,从而包含了...

    常用正则表达式(常用的匹配)

    #### 匹配双字节字符 **正则表达式**: `[^\x00-\xff]` **评注**: ASCII字符通常占用一个字节的空间,而双字节字符则占用两个字节。此表达式可以匹配任何非ASCII字符,常用于计算字符串中的双字节字符数量,从而获取...

    最实用最全面的正则表达式

    #### 三、匹配双字节字符 **正则表达式**: `[^x00-xff]` - **应用场景**: 计算字符串长度时很有用,尤其是当需要区分ASCII字符与非ASCII字符时。 - **解释**: 此表达式匹配所有非ASCII字符,即从128到255的范围内的...

    正则表达式匹配字符大全

    `[^\x00-\xff]`:这个表达式用于匹配所有非 ASCII 字符,包括中文、日文、韩文等双字节字符。 3. **匹配空白行**: `\n\s*\r`:这个正则表达式用于匹配和删除空白行,`\n` 表示换行,`\s*` 匹配任意数量的空白...

    正则表达式匹配.doc

    28. **匹配双字节字符(包括汉字在内)**:“`[^\x00-\xff]`” - 解析:此表达式用于匹配双字节字符,如汉字等。 #### 四、总结 通过以上对正则表达式的介绍及其应用实例的分析,我们可以看出正则表达式在文本处理...

    匹配中文汉字的正则表达式介绍

    这个表达式的意思是匹配不在ASCII字符编码范围内的所有字符,ASCII编码范围是\x00到\xff,而Unicode编码的中文字符基本都是双字节字符,因此这个正则表达式可以用来匹配包括中文在内的双字节字符。 在实际应用中,...

    asp.net常用正则表达式

    `[^\x00-\xff]` 用于匹配非ASCII的双字节字符,包括但不限于汉字、日文、韩文等。在计算字符串长度或处理多语言内容时,这个表达式可以帮助区分单字节和双字节字符。 3. **匹配空白行**: `\n\s*\r` 可以用来匹配...

    100个常用正则表达式

    这个正则匹配以字母开头,后跟"://",然后是非空格的任何字符,用于基本的URL匹配。 8. 匹配合法的账户名:`^[a-zA-Z][a-zA-Z0-9_]{4,15}$` 账户名必须以字母开头,后跟最多15个字母、数字或下划线,常用于验证...

    常用正则表达式(包括中文匹配)

    - **用途**:匹配非ASCII范围内的双字节字符,通常用于识别中文等其他非英文字符。 - **应用场景**:文本分析、数据清洗等。 ##### 3. 获取字符串长度(考虑中文字符) - **JavaScript代码**: ```javascript ...

    常用正则表达式

    整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$ 只能输入数字:"^[0-9]*$"。 只能输入n位的数字:"^\d{n}$"。 只能输入至少n位的数字:"^\d{n,}$"。 只能输入m~n位的数字:。...匹配双字节字符(包括汉字在内):[^\x00-\xff]

    正则表达式大全.docx

    10. 匹配双字节字符(包括汉字在内):[^\x00-\xff] 用于匹配双字节字符,可以用来计算字符串的长度。 11. 匹配空白行的正则表达式:\n\s*\r 用于匹配空白行,可以用来删除空白行。 12. 匹配 HTML 标记的正则...

    常用正则表达式大全

    #### 二、匹配双字节字符 **正则表达式**:`[^x00-xff]` **评注**:双字节字符包括但不限于汉字和其他非ASCII字符。此表达式用于匹配所有非ASCII字符,可以用来计算字符串中双字节字符的数量,从而确定字符串的实际...

    正则表达式示例PDA

    **评注**: 这个表达式用于匹配任何双字节字符,例如中文、日文、韩文等非ASCII字符。可以用于统计字符串中的双字节字符数量。 #### 匹配空白行 **正则表达式**: `\n\s*\r` **评注**: 可以利用此表达式来查找或...

    开发过程最全的正则表达式匹配中英文、字母和数字

    对于需要匹配包括中文字符在内的双字节字符,可以使用[^x00-xff]。这里的x表示十六进制,该表达式匹配不在x00至xff范围内的字符。 9. 空白行匹配 匹配空白行的正则表达式ns*r可以用于识别并处理文档中的空白行。 ...

    正则表达式汇总

    `[^x00-xff]` 这个正则表达式用来匹配所有非单字节字符,包括许多非英文的双字节字符,如汉字、日文等。 3. **匹配空白行**: `ns*r` 或 `n[s| ]*r` 这两个正则表达式分别用于匹配包含一个或多个空格、制表符的行...

Global site tag (gtag.js) - Google Analytics