`
grez
  • 浏览: 5510 次
最近访客 更多访客>>
社区版块
存档分类
最新评论

正则表达式学习 5 匹配Unicode字符和其他字符

阅读更多
\u00e9 匹配é 
也可以使用八进制\351来匹配é
 
使用ack
ack '\pL' schiller.txt 可以查看属性为L(所有字母)的字符
ack '\p{Ll}' schiller.txt  小写字母高亮
 
字符属性
C     其他字符
Cc   控制字符
Cf    格式字符
Cn   未分配字符
Co   专用字符
Cs   替代字符
L     字母
Ll    小写字母
Lm  修饰字母
Lo   其他字母
Lt    标题大写字母
Lu   大写字母
L&   Ll,Lu或者Lt
M    标记符号
Mc  空格标记
Me  环绕标记
Mn  非空格标记
N     数字
Nd   十进制数字
Nl    字母数字
No   其他数字
P    标点符号
Pc   连接标点符
Pd   破折号
Pe   结束标点符
Pf    最终标点符
Pi    起始标点符
Po   其他标点符
Ps   开始标点符
S    符号
Sc   货币符号
Sk   修饰符号
Sm  数学符号
So   其他符号
Z     分隔符
Zl    行分符号
Zp   段落分隔符
Zs   空格分隔符
 
 
在正则表达式中可以用\cx来制定一个控制符
书中例子 perl -n -e 'print if /\c@/' ascii.txt  可以看到
0. Null 因为空字符不能被显示
 
还可以用\0 来查找空字符 用\cG 来查找报警字符
 
 
总结
\uxxxx  Unicode 四位
\xxx     Unicode  两位
\x{xxxx}   Unicode四位
\x{xx}    Unicode  两位
\ooo    八进制
\cx     控制字符
\0    空字符
\a    报警符
\e    转义符
[\b]    退格符
0
0
分享到:
评论

相关推荐

    正则表达式不包涵特殊字符(除了 指定字符 以外)

    在探讨如何利用正则表达式来判断一个字符串除指定字符外不包含其他特殊字符之前,我们首先需要了解正则表达式的基本概念以及本场景中的具体需求。 ### 正则表达式简介 正则表达式是一种强大的文本处理工具,能够...

    易语言正则表达式匹配中文

    同时,确保在编写正则表达式时避免无限循环和贪婪匹配,以免导致程序卡死。 综上所述,易语言正则表达式匹配中文涉及了字符串处理、字符编码、正则表达式语法等多个方面。通过学习和掌握这些知识点,开发者可以有效...

    PB实现的正则表达式

    在IT领域,正则表达式(Regular Expression,简称regex)是一种强大的文本处理工具,它能够进行复杂的模式匹配、查找、替换等操作。在本话题中,我们将探讨如何使用PowerBuilder 11.5这一经典的开发环境来实现正则...

    一般得正则表达式(包括整型 匹配非负整数、匹配正整数、匹配空行的正则表达式、 匹配双字节字符)

    例如,在JavaScript中,必须使用`/pattern/gmi`这样的形式来定义正则表达式,并且`i`标志用于忽略大小写,`g`标志用于全局匹配,`m`标志用于多行模式,以便`^`和`$`可以匹配每一行的开始和结束。 对于标签中的`int`...

    C语言正则表达式库

    C语言正则表达式库是用于在C编程环境中处理和匹配正则表达式的软件库。这个库名为PCRE(Perl Compatible Regular Expressions),正如其名,它与Perl语言中的正则表达式语法高度兼容,提供了丰富的功能和强大的匹配...

    正则表达式大全 - 收集的最常用正则表达式

    1. 匹配中文字符:`[u4e00-u9fa5]` - 这个正则表达式用于匹配所有中文字符,包括简体和繁体。它基于Unicode范围,u4e00到u9fa5涵盖了大部分常用汉字。 2. 匹配双字节字符:`[^x00-xff]` - 用于匹配包括汉字在内的...

    正则表达式之 Unicode 匹配特殊字符

    在ES6中,正则表达式引入了“u”修饰符,它允许正则表达式以Unicode模式处理字符串,意味着支持Unicode字符匹配。然而,ES6的“u”修饰符在某些JavaScript引擎中,如早期版本的V8(Chrome和Node.js使用的JavaScript...

    正则表达式(Deelx版)|正则表达式(Deelx版)支持库

    正则表达式(Deelx版)是一种强大的文本处理工具,它允许程序员和用户通过预定义的模式来匹配、查找、替换或者分析字符串。Deelx版是专门为提高正则表达式性能和功能而设计的一个支持库,适用于各种编程语言和应用场景...

    正则表达式的匹配规则

    1. 字符匹配:正则表达式可以直接匹配单个字符,例如"a"匹配字母'a'。 2. 位置匹配:"^"表示行首,"$"表示行尾。"\b"匹配单词边界,"\B"匹配非单词边界。 3. 量词:"+"表示匹配一次或多次,"*"表示匹配零次或多次,...

    java正则表达式匹配全角空格

    本文介绍了如何使用Java中的`split()`方法和正则表达式来处理包含全角空格和半角空格的字符串。通过合理运用正则表达式和Java内置方法,我们可以有效地解决这类问题。希望本文能够对你有所帮助!

    使用正则表达式检测字符串中重复出现的词

    在IT领域,正则表达式(Regular Expression)是一种强大的文本处理工具,用于匹配、查找、替换等操作。在本示例中,我们将讨论如何利用正则表达式来检测字符串中重复出现的词。这个功能在数据清洗、文本分析、日志...

    正则表达式大全.docx

    正则表达式是一种强大的文本处理工具,用于在字符串中进行模式匹配和搜索替换操作。它由特殊字符(称为“元字符”)和普通字符组成,能够灵活地定义要查找的模式。以下是一些常见的正则表达式模式及其用途: 1. ...

    Oracle中的正则表达式

    正则表达式是一种强大的字符串模式匹配语言,可以用来在字符串中搜索、验证、提取和替换文本。Oracle中的正则表达式函数提供了强大的字符串处理功能,能够大大提高数据库应用程序的效率和可读性。 正则表达式的基本...

    正则表达式生成工具,正则表达式生成工具

    3. **语法提示**:提供正则表达式语法的详细提示和参考,帮助用户理解和学习正则表达式中的各种符号和结构,如点号(.)、星号(*)、加号(+)、问号(?)、括号(())、管道符(|)等。 4. **测试集**:允许用户...

    C#字符串和正则表达式参考手册.pdf

    正则表达式是用于匹配和分析文本的强大工具,它提供了一种模式匹配语言。在.NET中,Regex类是处理正则表达式的关键,它使得.NET开发人员可以利用正则表达式的功能。本书的后半部分集中于正则表达式的讲解,包括它的...

    Java 正则表达式判断字符串是否包含中文

    通过本文的学习,我们不仅了解了如何使用 Java 的正则表达式来判断一个字符串中是否包含中文字符,还深入了解了 Java 中正则表达式的相关 API 和基本原理。这对于从事 Java 开发的技术人员来说是非常实用且必要的...

    Python正则表达式基础

    正则表达式的基础包括字符匹配和重复匹配。字符匹配是最直接的,大部分字符和字母直接匹配自身。但在正则表达式中,存在一些特殊的字符称为元字符,它们不匹配自身,而是有特殊的意义。例如,方括号[ ]内定义了一个...

    正则表达式只可以输入只允许输入中文、数字、字母、下划线

    题目要求使用正则表达式来匹配只包含中文、数字、字母以及下划线的字符串。这里涉及到的具体知识点包括: 1. **中文字符的匹配**:在Unicode编码中,中文字符通常位于`\u4e00`到`\u9fa5`之间。因此,要匹配一个中文...

Global site tag (gtag.js) - Google Analytics