private static String chineseCharRegEx = ".*([\u2E80-\uFFFD]).*"; // 用于检查中文及中文字符的正则表达式,实际包含了整个双字节区
public String getStrFromFile()
{
BufferedReader in = null;
StringBuffer sb = new StringBuffer();
try
{
in = new BufferedReader(new InputStreamReader(new FileInputStream(filePath)));
String tmpStr = null;
while((tmpStr = in.readLine()) != null)
{
if(!tmpStr.matches(chineseCharRegEx))
{
sb.append(tmpStr);
sb.append('\n');
}
}
in.close();
}
catch(Exception e)
{
e.printStackTrace();
logger.error("", e);
}
return sb.toString();
}
分享到:
相关推荐
在Unicode编码中,中文字符通常位于`U+4E00`到`U+9FFF`之间,也包括一些扩展区的汉字。因此,一个简单的匹配所有中文字符的正则表达式可以写作`\u4e00-\u9fff`。这个表达式告诉易语言,我们要查找的模式是任何在这个...
1. 匹配中文字符:`[u4e00-u9fa5]` - 这个正则表达式用于匹配所有中文字符,包括简体和繁体。它基于Unicode范围,u4e00到u9fa5涵盖了大部分常用汉字。 2. 匹配双字节字符:`[^x00-xff]` - 用于匹配包括汉字在内的...
8. Unicode汉字范围:`/^[u4e00-u9fa5],{0,}$/` 和匹配中文字符的正则表达式:`[\u4e00-\u9fa5]` - 这两个正则表达式用于检测字符串中是否包含中文字符。 9. 匹配双字节字符:`[^\x00-\xff]` - 用于识别多字节字符...
正则表达式是一种强大的文本处理工具,用于在字符串中查找、替换或提取符合特定模式的文本。在IT行业中,正则表达式广泛应用于数据验证、文本分析、日志处理等多个领域。下面我们将深入探讨标题和描述中提到的几个...
为了统计包含中文字符的字符串的实际长度,我们需要将每个中文字符替换为两个或更多的字符(因为一个中文字符通常占用多个字节)。例如,下面的JavaScript函数可以实现这一功能: ```javascript String.prototype....
正则表达式是一种强大的文本处理工具,用于模式匹配、搜索、替换等操作,在软件开发、数据处理、网络爬虫等领域有着广泛的应用。在项目中直接使用正则表达式可以极大地提高代码的效率和可读性。以下是对给定文件中的...
- **匹配双字节字符(包括汉字在内)**:使用表达式 `[^\x00-\xff]` 来匹配双字节字符,例如用于计算字符串的长度。 - **匹配空行的正则表达式**:使用 `\n[\s|]*\r` 来匹配空行。 - **匹配 HTML 标记的正则表达式**...
因此,可以使用正则表达式 `[^\x{4e00}-\x{9fa5}]` 来匹配非汉字字符,并使用 `preg_replace()` 函数去除这些非汉字字符,从而只保留字符串中的汉字部分。 ```php $newStr = preg_replace('/[^\x{4e00}-\x{9fa5}]/u...
前者从字符串的开始位置匹配正则表达式,后者在整个字符串中查找匹配。此外,还需要了解贪婪与非贪婪匹配的概念。在某些情况下,一个正则表达式可能有多个匹配选项,贪婪匹配总是尽可能多地匹配字符,而非贪婪匹配则...
正则表达式`[^\x00-\xff]`被用来匹配非ASCII字符,即通常用于表示中文字符的部分Unicode范围。 #### 正则表达式详解 - `[^\x00-\xff]`:这个模式匹配任何不在ASCII范围内的字符。由于ASCII字符的范围是`\x00`到`\...
匹配双字节字符(包括汉字在内):[^\x00-\xff] 注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) PS:关于正则,本站还提供了2款非常简便实用的正则表达式工具供大家参考使用: JavaScript正则...
接下来,通过一系列具体的示例来更深入地理解正则表达式的实际应用场景: 1. **检查手机号是否合法**:`^1(3\d|5[36789])\d{8}$` - 说明:手机号共11位,第一位为1,第二位为3或者5。当第二位为5的时候,第三位...
正则表达式是一种强大的文本处理工具,用于匹配、查找、替换和分析字符串模式。在IT行业中,掌握正则表达式是提升工作效率的关键技能之一。"超经典正则表达式测试工具"提供了对正则表达式的全方位测试和学习环境,...
这个正则表达式用于检查字符串是否全由汉字组成。 20. 验证Email地址和Internet URL: - `^w+[-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$` 用于Email地址 - `^http://([w-]+.)+[w-]+(/[w-./?=%&]*)?$` 用于Internet URL...
1. **匹配中文字符**:`[\u4e00-\u9fa5]` 这个正则表达式用于匹配Unicode范围内的中文字符,包括所有汉字。例如,如果你想在一个字符串中查找所有中文字符,可以使用这个表达式。 2. **匹配双字节字符**:`[^\x00-\...
匹配双字节字符(包括汉字在内):[^x00-xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 匹配空白行的正则表达式:ns*r 评注:可以用来删除空白行 匹配HTML标记的正则表达式:(S*?)...
**评注**:此表达式可用于检测并匹配所有双字节字符,包括但不限于汉字。它常用于计算字符串的长度,其中每个双字节字符计为2,ASCII字符计为1。 #### 3. 匹配空白行的正则表达式 正则表达式:`\n\s*\r` **评注**:...
在实际开发过程中,正则表达式常用于验证用户输入的有效性、清洗数据、提取特定格式的信息等场景。 #### 二、正则表达式的常用语法 1. **匹配数字:** - `^[0-9]*$`:匹配任何长度的数字串。 - `^\d{n}$`:匹配...
匹配双字节字符(包括汉字) **正则表达式**: `[^\x00-\xff]` - **用途**: 用于匹配所有非单字节字符(即除了ASCII字符外的所有字符)。 - **应用场景**: 可以用于识别非ASCII字符,如中文、日文等。 #### 3. 匹配...