`
gmleegmlee
  • 浏览: 119727 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

用于检查中文及中文字符的正则表达式,实际包含了整个双字节区

阅读更多

 private static String            chineseCharRegEx  = ".*([\u2E80-\uFFFD]).*"; // 用于检查中文及中文字符的正则表达式,实际包含了整个双字节区

 public String getStrFromFile()
    {
        BufferedReader in = null;
        StringBuffer sb = new StringBuffer();
        try
        {
            in = new BufferedReader(new InputStreamReader(new FileInputStream(filePath)));
            String tmpStr = null;
            while((tmpStr = in.readLine()) != null)
            {
                if(!tmpStr.matches(chineseCharRegEx))
                {
                    sb.append(tmpStr);
                    sb.append('\n');
                }
            }
            in.close();
        }
        catch(Exception e)
        {
            e.printStackTrace();
            logger.error("", e);
        }
        return sb.toString();
    }
分享到:
评论

相关推荐

    易语言正则表达式匹配中文

    在Unicode编码中,中文字符通常位于`U+4E00`到`U+9FFF`之间,也包括一些扩展区的汉字。因此,一个简单的匹配所有中文字符的正则表达式可以写作`\u4e00-\u9fff`。这个表达式告诉易语言,我们要查找的模式是任何在这个...

    正则表达式大全 - 收集的最常用正则表达式

    1. 匹配中文字符:`[u4e00-u9fa5]` - 这个正则表达式用于匹配所有中文字符,包括简体和繁体。它基于Unicode范围,u4e00到u9fa5涵盖了大部分常用汉字。 2. 匹配双字节字符:`[^x00-xff]` - 用于匹配包括汉字在内的...

    正则表达式大全.docx

    8. Unicode汉字范围:`/^[u4e00-u9fa5],{0,}$/` 和匹配中文字符的正则表达式:`[\u4e00-\u9fa5]` - 这两个正则表达式用于检测字符串中是否包含中文字符。 9. 匹配双字节字符:`[^\x00-\xff]` - 用于识别多字节字符...

    一般得正则表达式(包括整型 匹配非负整数、匹配正整数、匹配空行的正则表达式、 匹配双字节字符)

    正则表达式是一种强大的文本处理工具,用于在字符串中查找、替换或提取符合特定模式的文本。在IT行业中,正则表达式广泛应用于数据验证、文本分析、日志处理等多个领域。下面我们将深入探讨标题和描述中提到的几个...

    匹配中文字符的正则表达式

    为了统计包含中文字符的字符串的实际长度,我们需要将每个中文字符替换为两个或更多的字符(因为一个中文字符通常占用多个字节)。例如,下面的JavaScript函数可以实现这一功能: ```javascript String.prototype....

    正则表达式列举 代码 项目中直接使用

    正则表达式是一种强大的文本处理工具,用于模式匹配、搜索、替换等操作,在软件开发、数据处理、网络爬虫等领域有着广泛的应用。在项目中直接使用正则表达式可以极大地提高代码的效率和可读性。以下是对给定文件中的...

    正则表达式用法大全

    - **匹配双字节字符(包括汉字在内)**:使用表达式 `[^\x00-\xff]` 来匹配双字节字符,例如用于计算字符串的长度。 - **匹配空行的正则表达式**:使用 `\n[\s|]*\r` 来匹配空行。 - **匹配 HTML 标记的正则表达式**...

    正则表达式统计汉字

    因此,可以使用正则表达式 `[^\x{4e00}-\x{9fa5}]` 来匹配非汉字字符,并使用 `preg_replace()` 函数去除这些非汉字字符,从而只保留字符串中的汉字部分。 ```php $newStr = preg_replace('/[^\x{4e00}-\x{9fa5}]/u...

    Python正则表达式基础

    前者从字符串的开始位置匹配正则表达式,后者在整个字符串中查找匹配。此外,还需要了解贪婪与非贪婪匹配的概念。在某些情况下,一个正则表达式可能有多个匹配选项,贪婪匹配总是尽可能多地匹配字符,而非贪婪匹配则...

    C#正则提取中文

    正则表达式`[^\x00-\xff]`被用来匹配非ASCII字符,即通常用于表示中文字符的部分Unicode范围。 #### 正则表达式详解 - `[^\x00-\xff]`:这个模式匹配任何不在ASCII范围内的字符。由于ASCII字符的范围是`\x00`到`\...

    匹配中文汉字的正则表达式介绍

    匹配双字节字符(包括汉字在内):[^\x00-\xff] 注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) PS:关于正则,本站还提供了2款非常简便实用的正则表达式工具供大家参考使用: JavaScript正则...

    报表工具FineReport正则表达式定义规则

    接下来,通过一系列具体的示例来更深入地理解正则表达式的实际应用场景: 1. **检查手机号是否合法**:`^1(3\d|5[36789])\d{8}$` - 说明:手机号共11位,第一位为1,第二位为3或者5。当第二位为5的时候,第三位...

    超经典正则表达式测试工具

    正则表达式是一种强大的文本处理工具,用于匹配、查找、替换和分析字符串模式。在IT行业中,掌握正则表达式是提升工作效率的关键技能之一。"超经典正则表达式测试工具"提供了对正则表达式的全方位测试和学习环境,...

    100个常用正则表达式

    这个正则表达式用于检查字符串是否全由汉字组成。 20. 验证Email地址和Internet URL: - `^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$` 用于Email地址 - `^http://([w-]+.)+[w-]+(/[w-./?=%&]*)?$` 用于Internet URL...

    常用Javascript正则表达式汇总

    1. **匹配中文字符**:`[\u4e00-\u9fa5]` 这个正则表达式用于匹配Unicode范围内的中文字符,包括所有汉字。例如,如果你想在一个字符串中查找所有中文字符,可以使用这个表达式。 2. **匹配双字节字符**:`[^\x00-\...

    所有常用的正则表达式

    匹配双字节字符(包括汉字在内):[^x00-xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 匹配空白行的正则表达式:ns*r 评注:可以用来删除空白行 匹配HTML标记的正则表达式:(S*?)...

    java中常用的匹配正则表达式实例大全.doc

    **评注**:此表达式可用于检测并匹配所有双字节字符,包括但不限于汉字。它常用于计算字符串的长度,其中每个双字节字符计为2,ASCII字符计为1。 #### 3. 匹配空白行的正则表达式 正则表达式:`\n\s*\r` **评注**:...

    正则表达式在程序开发中的应用

    在实际开发过程中,正则表达式常用于验证用户输入的有效性、清洗数据、提取特定格式的信息等场景。 #### 二、正则表达式的常用语法 1. **匹配数字:** - `^[0-9]*$`:匹配任何长度的数字串。 - `^\d{n}$`:匹配...

    常用正则表达式(经验积累)

    匹配双字节字符(包括汉字) **正则表达式**: `[^\x00-\xff]` - **用途**: 用于匹配所有非单字节字符(即除了ASCII字符外的所有字符)。 - **应用场景**: 可以用于识别非ASCII字符,如中文、日文等。 #### 3. 匹配...

Global site tag (gtag.js) - Google Analytics