`
yhz61010
  • 浏览: 562494 次
  • 来自: -
博客专栏
63c13ecc-ef01-31cf-984e-de461c7dfde8
libgdx 游戏开发
浏览量:12273
社区版块
存档分类
最新评论

[转] 判断中文,日文(日语),韩文(韩语)的正则表达式

阅读更多
原文出处:
http://blog.csdn.net/a9529lty/article/details/2680007

经测试,中文和日语的正则还是挺准的。

1. GBK (GB2312/GB18030)
\x00-\xff  GBK双字节编码范围
\x20-\x7f  ASCII
\xa1-\xff  中文
\x80-\xff  中文

2. UTF-8 (Unicode)
\u4e00-\u9fa5 (中文)
\x3130-\x318F (韩文)
\xAC00-\xD7A3 (韩文)
\u0800-\u4e00 (日文)

ps: 韩文是大于[/u9fa5]的字符
分享到:
评论

相关推荐

    正则表达式大全 - 收集的最常用正则表达式

    双字节字符通常用于表示多语言字符,如中文、日文、韩文等。 3. 匹配空白行:`ns*r` - 此正则表达式匹配包含任意数量空格、制表符或其他空白字符的行。`n`匹配换行符,`s`匹配任何空白字符,`*`表示前面的元素可以...

    100个常用正则表达式

    这个正则表达式用来匹配Unicode范围内的中文字符,其范围是从4e00到9fa5,涵盖了大部分常用汉字。 2. 匹配双字节字符:`[^x00-xff]` 双字节字符通常指非ASCII字符,包括中文、日文、韩文等。这个表达式用来匹配...

    正则表达式调试工具_RegexDbg_GBK_and_Unicode.7z

    Unicode是一种通用编码,包含了世界上大多数语言的字符,包括繁体中文、日文、韩文等。 4. **匹配分析**:RegexDbg可以显示匹配的详细信息,如匹配的子串、捕获组以及量词的重复次数,有助于定位问题所在。 5. **...

    C#正则提取中文

    由于ASCII字符的范围是`\x00`到`\xff`,所以这个模式实际上匹配的是所有超出ASCII范围的字符,包括中文、日文、韩文等其他非拉丁语系的语言。 - `{1}`:确保至少匹配一个非ASCII字符。这是为了避免匹配空字符串。 - ...

    常用Javascript正则表达式汇总

    1. **匹配中文字符**:`[\u4e00-\u9fa5]` 这个正则表达式用于匹配Unicode范围内的中文字符,包括所有汉字。例如,如果你想在一个字符串中查找所有中文字符,可以使用这个表达式。 2. **匹配双字节字符**:`[^\x00-\...

    一般得正则表达式(包括整型 匹配非负整数、匹配正整数、匹配空行的正则表达式、 匹配双字节字符)

    双字节字符主要出现在Unicode编码中,特别是处理中文、日文、韩文等多字节字符集时。在JavaScript等语言中,可以使用正则表达式来匹配这些字符。例如: `\u0080-\uFFFF` 这个范围涵盖了基本多语种平面(BMP)内的...

    asp.net常用正则表达式

    `[^\x00-\xff]` 用于匹配非ASCII的双字节字符,包括但不限于汉字、日文、韩文等。在计算字符串长度或处理多语言内容时,这个表达式可以帮助区分单字节和双字节字符。 3. **匹配空白行**: `\n\s*\r` 可以用来匹配...

    常用正则表达式.doc

    双字节字符通常是指那些无法用单个字节表示的字符,比如中文、日文、韩文等。该表达式的含义是匹配除了`\x00`至`\xff`之间的所有ASCII字符之外的其他字符。这在计算字符串长度时很有帮助,因为双字节字符通常占用两...

    常用正则表达式大全

    这个正则表达式用于识别和匹配中文字符,范围是从Unicode的4E00到9FA5,涵盖了大部分常用汉字。在处理中文文本时,这个表达式非常有用。 2. 匹配双字节字符(包括汉字在内):[^x00-xff] 这个表达式用于匹配所有...

    常用正则表达式收集

    这个正则表达式用于匹配所有中文字符,范围是Unicode的汉字区,即从\u4e00到\u9fa5。这个表达式可以用来检查字符串中是否包含中文字符。 2. **匹配双字节字符**:`[^\x00-\xff]` 这个表达式用于匹配非ASCII字符,...

    匹配中文汉字的正则表达式介绍

    在中文文本处理中,正则表达式同样可以发挥重要的作用,特别是在匹配中文汉字时,我们需要使用特定的Unicode范围来确保能够准确匹配中文字符。 在介绍匹配中文汉字的正则表达式之前,需要了解一些基础知识点。...

    经典Javascript正则表达式

    `[^\x00-\xff]` 这个表达式用于匹配非ASCII字符,通常包括大部分非英文字符,如汉字、日文、韩文等。在计算字符串长度时,考虑到双字节字符和ASCII字符的长度差异,可以使用这个正则表达式进行替换后再计算长度。 ...

    常用的正则表达式

    双字节字符通常指的是非ASCII字符,包括汉字、日文、韩文等。这个正则表达式匹配任何不在ASCII范围(\x00到\xFF)内的字符。 3. 匹配空白行:`\n\s*` 这个表达式会匹配一个换行符(`\n`)后面跟随任意数量的空格...

    收集到的常用正则表达式

    2. **匹配双字节字符**:`[^x00-xff]` - 双字节字符通常指非ASCII字符,如中文、日文、韩文等。此表达式用于识别这些字符,常用于计算字符串的长度,考虑到非ASCII字符可能占用两个字节。 3. **匹配空白行**:`\n\s...

    JavaScript验证正则表达式大全

    这个正则表达式用于匹配非ASCII字符,通常包括中文、日文、韩文等多字节字符。 3. **匹配空白行**: ```javascript var regex = /\n\r?/g; ``` 这个正则表达式可以用来查找并删除字符串中的空白行。 4. **...

    正则表达式示例PDA

    **评注**: 这个表达式用于匹配任何双字节字符,例如中文、日文、韩文等非ASCII字符。可以用于统计字符串中的双字节字符数量。 #### 匹配空白行 **正则表达式**: `\n\s*\r` **评注**: 可以利用此表达式来查找或...

    正则表达式验证大全

    1. **匹配中文字符**:`[\u4e00-\u9fa5]` - 这个正则表达式用于匹配任何中文字符,范围是Unicode的汉字区域。 2. **匹配双字节字符**:`[^x00-xff]` - 这个表达式用于匹配非ASCII字符,通常包括中文、日文、韩文等...

    正则表达式

    `[^\x00-\xff]` 此正则表达式用来匹配任何非ASCII字符,包括大多数双字节字符,如汉字、日文、韩文等。 3. **计算字符串长度**: `String.prototype.len = function() { return this.replace(/[^\x00-\xff]/g, ...

    正则表达式 模式匹配 Javascript

    `[^\x00-\xff]` 该表达式用于匹配非ASCII字符,通常表示双字节字符,例如中文、日文、韩文等。 3. **计算字符串长度**: 使用`String.prototype.len`函数,通过替换非ASCII字符为两个字母,然后计算长度,可以...

    常用正则表达式常用正则表达式

    2. **匹配非ASCII字符**:`[\x00-\xff]` 这个正则表达式用于匹配所有ASCII范围外的字符,包括中文、日文、韩文等多语言字符。 3. **换行符匹配**:`\n|\r` 正则表达式用于匹配常见的换行符,包括Unix系统的`\n`和...

Global site tag (gtag.js) - Google Analytics