`
wjm251
  • 浏览: 110056 次
  • 性别: Icon_minigender_1
  • 来自: 沈阳
社区版块
存档分类
最新评论

py正则表达式记录

阅读更多
#-*- encoding: gb2312 -*-
import re
这个例子是从py邮件列表里头看到的
a="ab c   12   45  6       8   xy z   1  5 67  890  ab z"
#把数字靠在一起,其他不变
print re.sub(r'(?<=\d)\s+(?=\d)', '', a)

#后向断言(顺序肯定环视)
print re.search("aaa(?=bbb)","aaabbb").group()

#后向否定断言(顺序否定环视)
print re.search("aaa(?!bbb)","aaattt").group()

#前向断言(逆序肯定环视)
print re.search("(?<=bbb)aaa","bbbaaa").group()

#前向否定断言(逆序否定环视)
print re.search("(?<!bbb)aaa","taaa").group()
分享到:
评论

相关推荐

    Python-Regex-01:使用Python的正则表达式教程

    Python正则表达式01 该存储库包含一个简单的Python程序,该程序显示了Python中正则表达式的用法。 为了具有一些有意义的正则表达式,使用了一个包含从澳大利亚气象局(BOM)获得的气象信息的数据文件。 使用Python的...

    python实现统计汉字/英文单词数的正则表达式

    思路 •使用正则式 “(?x) (?: [\w-]+ | [\x80-\xff]{3} )”获得utf-8文档中的英文单词和汉字的列表。 •使用dictionary来记录每个单词/汉字出现的频率,如果出现过则+1,如果没出现则置1。 •将dictionary按照...

    Markdown索引和Pcre正则表达式兼容的全文本,适用于高级笔记记录者。-JavaScript开发

    Markdown索引和Pcre正则表达式兼容的全文本,适用于高级笔记记录者。 Note-CLI Markdown索引和Pcre正则表达式兼容的全文本搜索,适用于高级笔记记录者。 快速入门#索引文件./note-cli.js --index-数据库notes.db....

    python统计字符串中中英文、空格、数字、标点个数

    初始化四个变量,分别用于记录英文字符、中文字符、数字和标点符号的数量。然后,遍历字符串的每一个字符,根据上述方法的结果更新对应计数器。 ```python def count_chars(s): english_count = 0 chinese_count...

    基于Python的django 正则 个人笔记

    【Python的正则表达式】 Python的正则表达式(Regular Expression)是处理字符串的强大工具,广泛用于数据挖掘、文本处理、验证输入等场景。它允许我们通过模式匹配来查找、替换或者分割字符串。在Python中,re模块...

    第2次课1

    在本课程中,我们将深入探讨如何使用编译原理来创建一个基于正则表达式的 LaTeX 编译器。首先,我们来了解 LaTeX 的基础知识。 LaTeX,由 Leslie Lamport 开发,是 TeX 排版系统的一个扩展,尤其适用于科技和数学类...

    Python网络爬虫集合-PythonApps.zip

    虽然强大,但使用时需要谨慎,因为复杂的正则表达式可能导致性能下降。 4. **Scrapy框架**:Scrapy是Python的一个高级爬虫框架,提供了结构化的爬取流程,包括中间件、下载器、爬虫组件等,可以处理更复杂的爬虫...

    python读取C语言头文件,参考博客,有测试记录、使用说明

    3. **应用正则表达式**:编写正则表达式,例如匹配宏定义(`#define\s+MACRO_NAME\s+VALUE`)、类型定义(`typedef\s+[\w\s*]+\s+TYPE_NAME;`)和函数声明(`\(?\w+\)?\s+\w+\s*\((.*?)\)\s*(const|void)?;`)。 4. ...

    tixcraft_text.zip

    如果“tixcraft_text.py”涉及到文本的高级搜索和替换,那么正则表达式可能会被广泛应用。例如,使用re.findall()可以找到所有匹配特定模式的子串。 三、文件和IO操作 在Python中,我们可以使用内置的open()函数...

    找出最长的句子(最长的单词)

    如果不想使用`nltk`,也可以使用正则表达式进行简单的句子分割,但这种方法可能无法处理一些复杂的情况,如省略号、引号内的句子等。使用正则表达式分割的代码如下: ```python import re sentences = re.split(r'...

    爬mm图的软件(python)

    Python的`re`模块提供了正则表达式的功能。 6. **图片下载**:获取到图片URL后,我们可以使用`requests`库的`get`方法配合`io`和`os`模块来下载图片,并保存到本地文件系统。 7. **异常处理**:网络爬虫可能会遇到...

    Magoji:共享的Discord机器人

    1. **环境搭建**:安装Python运行环境,以及`discord.py`和其他必要的库,如`re`库用于正则表达式操作。 2. **登录Discord**:使用Discord官方提供的Bot Token,通过`discord.py`库建立连接,让机器人加入到指定的...

    网易新闻.zip

    在这个项目中,可能使用了如BeautifulSoup、requests、re(正则表达式)、pandas等Python库。requests库负责发起HTTP请求,获取网页源代码;BeautifulSoup则用于解析HTML或XML文档,提取所需数据;正则表达式可以...

    Douban.rar

    在压缩包"Douban.rar"中,可能包含的文件有爬虫脚本(Python代码文件,如douban_crawler.py)、爬取结果(如CSV或JSON文件,记录电影名称和图片链接),以及下载的电影宣传图片。通过解压并查看这些文件,我们可以更...

    GitMAD:在Github上监视,警报和发现敏感信息和数据泄漏

    在历史记录中搜索一组可配置的正则表达式。 GitMAD还可以分解历史记录文件的每一行,并在Shannon熵中搜索匹配项。 有两个可配置文件: regex_matches.py 这是放置关键字和正则表达式以在存储库的内容中进

    词法分析器

    正则表达式用于定义每种词汇项的模式,而状态机则根据输入字符和当前状态来决定如何转换到下一个状态,直至识别出一个完整的词汇项。在词法分析过程中,词法分析器会生成一个token流,这个流由每个识别出的词汇项...

    Python文件去除注释的方法

    - **re.compile(pattern)**:编译一个正则表达式模式,返回一个正则表达式对象。 - **re.search(pattern, string)**:扫描整个字符串并返回第一个成功的匹配。 - **re.match(pattern, string)**:尝试从字符串的起始...

    python爬取今日头条视频

    这通常涉及到CSS选择器或正则表达式的使用。 4. **处理数据**: 提取出的视频链接可能是相对路径,需要转换为绝对路径;同时,可能需要过滤掉广告或其他非目标数据。 5. **下载视频**: 对每个有效视频链接,发送新...

    Replacer替换工具

    - **利用正则表达式**:如果需要更复杂的匹配规则,可以使用正则表达式,如`\bword\b`匹配单词"word",而不会匹配"wording"。 - **备份文件**:在进行大规模替换前,建议先备份文件,以防万一。 - **分步操作**:...

    人工智能-项目实践-多线程-python多线程爬虫爬取电影天堂资源.zip

    4. **正则表达式(Regex)**:在某些情况下,我们可能需要使用正则表达式来进一步匹配和提取特定模式的数据。`re`库提供了正则表达式的操作功能。 5. **多线程**:Python的`threading`库允许我们创建多线程程序,以...

Global site tag (gtag.js) - Google Analytics