`
wjm251
  • 浏览: 111080 次
  • 性别: Icon_minigender_1
  • 来自: 沈阳
社区版块
存档分类
最新评论

py正则表达式记录

阅读更多
#-*- encoding: gb2312 -*-
import re
这个例子是从py邮件列表里头看到的
a="ab c   12   45  6       8   xy z   1  5 67  890  ab z"
#把数字靠在一起,其他不变
print re.sub(r'(?<=\d)\s+(?=\d)', '', a)

#后向断言(顺序肯定环视)
print re.search("aaa(?=bbb)","aaabbb").group()

#后向否定断言(顺序否定环视)
print re.search("aaa(?!bbb)","aaattt").group()

#前向断言(逆序肯定环视)
print re.search("(?<=bbb)aaa","bbbaaa").group()

#前向否定断言(逆序否定环视)
print re.search("(?<!bbb)aaa","taaa").group()
分享到:
评论

相关推荐

    Python-Regex-01:使用Python的正则表达式教程

    Python正则表达式01 该存储库包含一个简单的Python程序,该程序显示了Python中正则表达式的用法。 为了具有一些有意义的正则表达式,使用了一个包含从澳大利亚气象局(BOM)获得的气象信息的数据文件。 使用Python的...

    python实现统计汉字/英文单词数的正则表达式

    思路 •使用正则式 “(?x) (?: [\w-]+ | [\x80-\xff]{3} )”获得utf-8文档中的英文单词和汉字的列表。 •使用dictionary来记录每个单词/汉字出现的频率,如果出现过则+1,如果没出现则置1。 •将dictionary按照...

    Markdown索引和Pcre正则表达式兼容的全文本,适用于高级笔记记录者。-JavaScript开发

    Markdown索引和Pcre正则表达式兼容的全文本,适用于高级笔记记录者。 Note-CLI Markdown索引和Pcre正则表达式兼容的全文本搜索,适用于高级笔记记录者。 快速入门#索引文件./note-cli.js --index-数据库notes.db....

    python统计字符串中中英文、空格、数字、标点个数

    初始化四个变量,分别用于记录英文字符、中文字符、数字和标点符号的数量。然后,遍历字符串的每一个字符,根据上述方法的结果更新对应计数器。 ```python def count_chars(s): english_count = 0 chinese_count...

    基于Python的django 正则 个人笔记

    【Python的正则表达式】 Python的正则表达式(Regular Expression)是处理字符串的强大工具,广泛用于数据挖掘、文本处理、验证输入等场景。它允许我们通过模式匹配来查找、替换或者分割字符串。在Python中,re模块...

    第2次课1

    在本课程中,我们将深入探讨如何使用编译原理来创建一个基于正则表达式的 LaTeX 编译器。首先,我们来了解 LaTeX 的基础知识。 LaTeX,由 Leslie Lamport 开发,是 TeX 排版系统的一个扩展,尤其适用于科技和数学类...

    Python网络爬虫集合-PythonApps.zip

    虽然强大,但使用时需要谨慎,因为复杂的正则表达式可能导致性能下降。 4. **Scrapy框架**:Scrapy是Python的一个高级爬虫框架,提供了结构化的爬取流程,包括中间件、下载器、爬虫组件等,可以处理更复杂的爬虫...

    python读取C语言头文件,参考博客,有测试记录、使用说明

    3. **应用正则表达式**:编写正则表达式,例如匹配宏定义(`#define\s+MACRO_NAME\s+VALUE`)、类型定义(`typedef\s+[\w\s*]+\s+TYPE_NAME;`)和函数声明(`\(?\w+\)?\s+\w+\s*\((.*?)\)\s*(const|void)?;`)。 4. ...

    内容特征搜索代码.py

    3. 正则表达式的应用:正则表达式是一种强大的文本处理工具,它允许用户通过构建规则来搜索、匹配和操作字符串。在内容特征搜索中,正则表达式可以帮助程序灵活地匹配各种复杂的文本模式。 4. 自然语言处理:在处理...

    文件名敏感词检测代码.py

    通过设计合适的正则表达式模式,程序能够灵活识别各种形式的敏感词,包括不同的拼写变体、简写或含有特殊字符的情况。 此外,敏感词检测程序需要具备一定的容错能力,以应对某些故意规避检测的行为,如通过插入空格...

    tixcraft_text.zip

    如果“tixcraft_text.py”涉及到文本的高级搜索和替换,那么正则表达式可能会被广泛应用。例如,使用re.findall()可以找到所有匹配特定模式的子串。 三、文件和IO操作 在Python中,我们可以使用内置的open()函数...

    找出最长的句子(最长的单词)

    如果不想使用`nltk`,也可以使用正则表达式进行简单的句子分割,但这种方法可能无法处理一些复杂的情况,如省略号、引号内的句子等。使用正则表达式分割的代码如下: ```python import re sentences = re.split(r'...

    爬mm图的软件(python)

    Python的`re`模块提供了正则表达式的功能。 6. **图片下载**:获取到图片URL后,我们可以使用`requests`库的`get`方法配合`io`和`os`模块来下载图片,并保存到本地文件系统。 7. **异常处理**:网络爬虫可能会遇到...

    Magoji:共享的Discord机器人

    1. **环境搭建**:安装Python运行环境,以及`discord.py`和其他必要的库,如`re`库用于正则表达式操作。 2. **登录Discord**:使用Discord官方提供的Bot Token,通过`discord.py`库建立连接,让机器人加入到指定的...

    网易新闻.zip

    在这个项目中,可能使用了如BeautifulSoup、requests、re(正则表达式)、pandas等Python库。requests库负责发起HTTP请求,获取网页源代码;BeautifulSoup则用于解析HTML或XML文档,提取所需数据;正则表达式可以...

    Douban.rar

    在压缩包"Douban.rar"中,可能包含的文件有爬虫脚本(Python代码文件,如douban_crawler.py)、爬取结果(如CSV或JSON文件,记录电影名称和图片链接),以及下载的电影宣传图片。通过解压并查看这些文件,我们可以更...

    GitMAD:在Github上监视,警报和发现敏感信息和数据泄漏

    在历史记录中搜索一组可配置的正则表达式。 GitMAD还可以分解历史记录文件的每一行,并在Shannon熵中搜索匹配项。 有两个可配置文件: regex_matches.py 这是放置关键字和正则表达式以在存储库的内容中进

    词法分析器

    正则表达式用于定义每种词汇项的模式,而状态机则根据输入字符和当前状态来决定如何转换到下一个状态,直至识别出一个完整的词汇项。在词法分析过程中,词法分析器会生成一个token流,这个流由每个识别出的词汇项...

    Python文件去除注释的方法

    - **re.compile(pattern)**:编译一个正则表达式模式,返回一个正则表达式对象。 - **re.search(pattern, string)**:扫描整个字符串并返回第一个成功的匹配。 - **re.match(pattern, string)**:尝试从字符串的起始...

    日志时间格式统一代码.py

    然后通过正则表达式匹配并解析日志中的时间字符串,接着使用`datetime.strptime`方法将解析出的时间对象格式化为目标格式。最后,我们通过调用这个函数,并传入一个示例日志条目和正则表达式,得到了一个时间格式...

Global site tag (gtag.js) - Google Analytics