最近项目中要处理文本,因此就用了gun的正则表达式,它是posix风格的..我们一般使用的都是perl风格的,所以一开始使用可能会有一些不习惯.详细的区别可以在wiki上看到:
http://en.wikipedia.org/wiki/Regular_expression
头文件是regex.h可以在里面看到他所提供的接口.这里主要是3个函数和一个结构体:
引用
int regcomp (regex_t *compiled, const char *pattern, int cflags)
int regexec (regex_t *compiled, char *string, size_t nmatch, regmatch_t matchptr [], int eflags)
void regfree (regex_t *compiled)
typedef struct {
regoff_t rm_so;
regoff_t rm_eo;
} regmatch_t;
regcomp会将参数pattern编译为compiled,也就是讲字符串编译为正则表达式.
而参数cflags可以是下面1种或者几种的组合:
REG_EXTENDED
使用 扩展的 posix Regular Expressions.
REG_ICASE
忽略大小写
REG_NOSUB
不存储匹配结果,只返回是否匹配成功.
REG_NEWLINE
可以匹配换行.
regexec执行匹配.compiled为刚才编译好的正则表达式,string为将要匹配的字符串,nmatch为后面的结构体数组的长度(regmatch_t).matchptr为regmatch_t的一个数组(也就是存储着像perl里面的$0,$1这些的位置,也就是).而eflag参数则可以是下面中的1个或多个.
REG_NOTBOL
会讲^作为一个一般字符来匹配,而不是一行的开始
REG_NOTEOL
会讲$作为一个一般字符来匹配,而不是一行的结束
regfree每次用完之后需要释放这个正则表达式.compiled为需要释放的正则表达式.
regmatch_t 中的rm_so为匹配字符的开始位置,rm_eo为结束位置.
说了这么多,其实使用很简单的:
引用
POSIX Regexp Compilation: Using regcomp to prepare to match.
Flags for POSIX Regexps: Syntax variations for regcomp.
Matching POSIX Regexps: Using regexec to match the compiled pattern that you get from regcomp.
Regexp Subexpressions: Finding which parts of the string were matched.
Subexpression Complications: Find points of which parts were matched.
Regexp Cleanup: Freeing storage; reporting errors.
然后看个例子吧:
#include <stdio.h>
#include <regex.h>
#include <string>
int main(int argc, char** argv)
{
char* pattern="abc([0-9]+)";
int z=0;
char *s_tmp="Abc1234";
regex_t reg;
regmatch_t pm[3];
z = regcomp( & reg, pattern, REG_EXTENDED|REG_ICASE);
z = regexec( & reg, s_tmp, 3, pm, 0);
if (z != 0) {
//也就是不匹配
return 2;
}
std::string s=s_tmp;
std::string result0=s.substr(pm[0].rm_so, pm[0].rm_eo-pm[0].rm_so);
std::string result1=s.substr(pm[1].rm_so, pm[1].rm_eo-pm[1].rm_so);
printf("[%s]\n", result0.c_str());
printf("[%s]\n", result1.c_str());
regfree( & reg);
return 0;
}
很简单一个例子, 将会打印出Abc1234gh和1234.这里因为有括号,因此pm[0]存储着第0组的位置,pm[1]存储第1组的位置.
也谈谈自己的体会吧,那就是真不好用,不管是提供的接口还是posix风格的正则.而且据说是效率比较低下.因此如果有机会下次准备试试boost得正则或者pcre了..
分享到:
相关推荐
在C语言环境中,GUN(GNU)提供了一个官方的正则表达式库,这使得C程序员可以方便地在他们的应用程序中利用正则表达式的强大功能。本篇文章将详细探讨GUN C的正则表达式库,包括其核心组件`regex.c`和`regex.h`,...
此外,还应避免使用复杂的表达式。 **7.2.2 Makefile中的实用程序** 一些常见的实用程序,如`install`和`clean`命令,应该在所有Makefile中都可用。 **7.2.3 指定命令的变量** Makefile中经常需要定义一些变量来...
gunregex0_13.tar.gz是源码,看网上介绍说vs里面使用会报错,可能是linux下...还有一个regex-2.7-bin.zip这个是库文件,本人在vc上测试可以使用,就是使用这个库时,正则表达式有些需要注意的地方,具体看POSIX正则规范
《GUN C库函数手册》是一本非常实用的资源,为C语言编程者提供了详尽的GUN C库函数参考。GUN C库,也称为GNU libc或glibc,是Linux和其他类UNIX操作系统中广泛使用的C标准库。它不仅包含了C语言的标准库,还额外提供...
它支持用户自定义函数和 动态正则表达式等先进功能,是linux/unix下的一个强大编程工具。它在命令行中使用,但更多是作为脚本来使用。awk的处理文本和数据的方式是这 样的,它逐行扫描文件,从第一行到最后一行,...
它支持用户自定义函数和 动态正则表达式等先进功能,是linux/unix下的一个强大编程工具。它在命令行中使用,但更多是作为脚本来使用。awk的处理文本和数据的方式是这 样的,它逐行扫描文件,从第一行到最后一行,...
《GNU C 库参照手册》是C编程领域中的一份重要参考资料,主要涵盖了GNU C库的详尽功能和使用方法。这份手册对于开发者,尤其是深入研究C语言和系统级编程的人员来说,具有极高的学习价值。GNU C库,通常简称为glibc...
### gun c 与 ASCII 的重要区别:初探 Linux 内存管理 在深入探讨 Linux 内存管理前,我们先澄清一点,标题中的“gun c”实际上是指 GNU C 编译器(GCC),而非枪支(gun)或任何与之相关的主题。本文将围绕 GNU C ...
C语言函数库手册 本文档中描述的GNU C库定义了所有的库函数 由ISO C标准规定,以及具体的POSIX和附加功能 UNIX操作系统的其他衍生工具和特定于GNU系统的扩展。 本手册的目的是告诉您如何使用GNU库的工具。 我们已经...
GUNC编译工具链 主要是gcc优化选项,以及一些调试的简介 也可以去iask下载
9. **模式匹配**:介绍正则表达式的使用,如`regex`函数族,用于文本模式的匹配和搜索。 10. **输入/输出概述**:概述了I/O系统的基本概念,包括流的概念和I/O缓冲。 11. **流式输入/输出**:详细阐述了标准输入/...
http://www.gnu.org/software/libc/manual/html_node/index.html 这是C语言的老家,Clib库文件的说明,使用,清晰明了。 大家喜欢,留个言。我继续分享
期待模式用于匹配进程的输出,可以是字符串、正则表达式或时间限制。例如,`expect "password:"`表示等待进程输出包含"password:"的行,然后进行下一步操作。 5. **发送输入(Send Command)**: 一旦期待模式...
《GNU C 库》是C编程领域中一本重要的参考手册,它详尽地阐述了C语言标准库(也称为GNU C Library)的功能和用法。这本书对于任何想要深入理解和高效利用C语言进行系统级编程的开发者来说都是必不可少的资源。 在...
5. **正则表达式**:Bash支持在命令行中使用正则表达式进行文件匹配或字符串操作。 6. **文件描述符**:除了默认的0、1、2外,用户还可以自定义文件描述符,实现更灵活的I/O操作。 7. **shell内置命令**:如`cd`...
在这个"DMA.zip_Tricore_gun_gun_c_tricore_tricore_dma"压缩包中,包含了针对TriCore的DMA调试源代码,这对于我们理解和优化DMA操作至关重要。 GUN,全称GNU工具链,是一组开源的开发工具,包括编译器、链接器、...
- **版本信息**:本手册是针对 GNU C 库 2.20 版本的参考文档。 - **作者信息**:由 Sandra Loosemore 编写,并得到了 Richard M. Stallman、Roland McGrath、Andrew Oram 和 Ulrich Drepper 的协助。 ### 2. 版权...
状态规格 Team Fortress 2客户端插件,可增强游戏观赏性 变更日志 ...增加了通过正则表达式过滤控制台的功能 定制材料添加了重新加载设置命令 定制模型添加了重新加载设置命令 自定义纹理添加了重新加载设
"The.GNU.C.Library.pdf"则涵盖了GNU C Library,也称为glibc,它是Linux和其他类UNIX系统上广泛使用的C语言标准库。glibc提供了大量的函数接口,用于输入/输出、内存管理、线程控制、网络通信等。理解glibc对于...