`
zhanglm
  • 浏览: 76028 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

python的re的一些常用的东西

阅读更多

1.

import re
a='abdcdddasdsad'
m=re.match(r"s",a)
print m                    #None
m=re.search(r"s",a)
print m                     #<_sre.SRE_Match object at 0x2b9f0eea9cc8>

 只要看代码就明白了

search是去字符串中查找,match是匹配整个字符串

 

2.

 

def get_data( url, page_index ):
    content = urllib2.urlopen( url % page_index ).read()
    for m  in re.finditer( r"·<a href=\"(.+?)\">.+?</a>", content ):
        try:
            loc = m.group( 1 ).strip().split( "?" )[0]
            loc = re.sub( r"d-(\d+?)-1-(\d+?)-(\d+?)\.htm", "s-\g<1>-0-\g<2>-\g<3>.htm", loc, flags = re.IGNORECASE )
            xml_content.append( template % {"loc":loc, "date":d.isoformat()} )
        except:
            pass
 

 

 

re.finditer遍历整个字符串中所有匹配,返回MatchObject的迭代器

re.sub用于字符串替换,\g<数字>表示第几个参数

 

分享到:
评论

相关推荐

    python正则re模块详解.pdf

    Python 正则 re 模块详解 正则表达式(或 RE)是一种小型的、高度专业化的编程语言,它内嵌在 Python 中,并通过 re 模块实现。使用这个小型语言,你可以为想要匹配的相应字符串集指定规则,该字符串集可能包含英文...

    第一课python正则re模块详解.pdf

    Python 正则表达式 re 模块详解 正则表达式(或 RE)是一种小型的、高度专业化的编程语言,它提供 Perl 风格的正则表达式模式。Python 1.5 版本起增加了 re 模块,它提供 Perl 风格的正则表达式模式。在 Python 中...

    Python从入门到精通

    这些类型可以满足大多数编程需求,但是Python还提供了一些其他的类型,例如布尔类型、集合类型、 frozeSet类型等。 在Python中,变量的类型可以根据需要进行改变,这是Python的动态类型化特性的体现。例如: ``` ...

    Python基础入门知识之正则表达式学习 正则表达式30分钟入门教程 共21页.pdf

    同时,可以利用Python的`re`模块进行实时测试,以增强对正则表达式的掌握。 三、正则表达式到底是什么东西? 正则表达式(Regular Expression)是一种模式,用于匹配字符串中符合特定规则的子串。它可以用来验证...

    python3版 40行代码的人脸识别实践

    python3 版本的40行代码的人脸识别实践,运行文件夹中test.py原文地址在这里https://blog.csdn.net/xingchenbingbuyu/article/details/68482838,是python2版本的我改成python3版本,把里面需要到官网下载的东西也...

    Python基础教程之正则表达式基本语法以及re模块

    正则是个很牛逼的东西,python中当然也不会缺少。 所以今天的Python就跟大家一起讨论一下python中的re模块。 re模块包含对正则表达式的支持。 通配符 .表示匹配任何字符: ‘.ython’可以匹配’python’和’...

    python 使用re.search()筛选后 选取部分结果的方法

    使用group()方法 b = 'hello good fine' re.search(r'^hello\s(.*)\sfine',b)....以上这篇python 使用re.search()筛选后 选取部分结果的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多

    初识python正则表达式和re模块

    正则表达式和re模块 介绍:按照一定的规则,从某个字符串中匹配出想要的数据。这个规则就是正则表达式 match只能从开始匹配 search从全部匹配 正则表达式规则: 表达式 作用 . 匹配任意的字符,不能匹配到换行符...

    2. python基础数据类型详解.pdf

    元字符是正则表达式的灵魂,元字符中的内容太多了,在这里我们只介绍一些常用的。 元字符包括: 1. 字符组字符组很简单,用[]括起来。在[]中出现的内容会被匹配。例如:[abc] 匹配a或b或c。 2. 简单元字符: * . ...

    python基础教程

    ### Python基础教程知识点总结 #### Python第1课:安装 - **知识点**: - Python的版本选择(如Python 3.x版本)。 - 安装Python的步骤,包括官方下载页面...#### python模块的常用安装方式 - **知识点**: - 使用...

    Python::lemon:Python基础,Pygame游戏编程,Python算法与面试题,常用的Python Web框架,爬虫,数据可视化,机器学习。一共七个Python大方向!

    笔者以一个初学者的立场,用笔记,分享等形式来给大家总结一些东西。总之,Python为基础,让我们向全栈出发!(如果此处有任何问题,欢迎发起问题,如果本文帮助了你,欢迎 :star: ) :love_letter:这里有什么?我...

    Python实现解析Bit Torrent种子文件内容的方法

    有很多种子文件,有时候记不清里面都是什么东西,又不想一个一个的拖放到迅雷或BT软件里头看, 上网查了一下Python的脚本,自己也稍微修改了一下,代码如下,粘贴到文本编辑器中: 保存成py后缀的,直接运行 import...

    Python中的闭包总结

    前几天又有人在我的这篇文章 python项目练习一:即时标记 下留言,关于其中一个闭包和re.sub的使用不太清楚。我在自己的博客上搜索了下,发现没有写过闭包相关的东西,所以决定总结一下,完善博客上Python的内容。 1...

    使用Python编写简单网络爬虫抓取视频下载资源

    我第一次接触爬虫这东西是在今年的5月份...因为其强大的字符串处理能力,以及urllib2,cookielib,re,threading这些模块的存在,用Python来写爬虫就简直易于反掌了。简单到什么程度呢。我当时跟某同学说,我写电影来了

    Python爬虫之网页图片抓取的方法

    这段时间一直在学习Python的东西,以前就听说Python爬虫多厉害,正好现在学到这里,跟着小甲鱼的Python视频写了一个爬虫程序,能实现简单的网页图片下载。 二、代码 __author__ = JentZhang import urllib.request ...

    automatetxtbk:使用“使用python自动处理无聊的东西”教科书时进行练习和编程

    标题中的"automatetxtbk"是一个项目或者工具的名称,显然与Python编程有关,而"使用'使用python自动处理无聊的东西'教科书时进行练习和编程"的描述表明,这个项目是基于一本名为《使用Python自动处理无聊的东西》的...

    AutomateTheBoringStuff:Al Sweigart学习“用Python自动化无聊的东西”时编写的Python代码。 也将尝试重现PowerShell中的所有练习

    《用Python自动化无聊的东西》是Al Sweigart编写的一本非常实用的Python编程教程,它旨在教读者如何利用Python来解决日常工作中繁琐、重复的任务,从而提高效率。这本书的实践性强,涵盖了各种实用的编程技巧和工具...

    Automate-The-Boring-Stuff:Al Sweigart的“用Python自动化无聊的东西”的项目

    以上是"用Python自动化无聊的东西"项目中涵盖的一些关键知识点,通过学习和实践,读者将能够掌握Python的基本技能,并有能力解决实际问题,实现日常工作的自动化。书中每个项目都是精心设计的,旨在逐步引导读者深入...

    python3使用flask编写注册post接口的方法

    使用python3的Flask库写了一个接口,封装了很多东西,仅供参考即可! 代码如下: #!/usr/bin/python3 # -*- coding: utf-8 -*- import re from flask import request from flask_restful import Resource import ...

Global site tag (gtag.js) - Google Analytics