- 浏览: 458504 次
- 性别:
- 来自: 广州
文章分类
- 全部博客 (538)
- C/C++ Primer (69)
- Objective-C Primer (102)
- Python Primer (19)
- JavaScript Primer (1)
- Java Primer (37)
- PHP Primer (17)
- 泛 Linux (37)
- Shell Script (21)
- APUE (21)
- UNP__1&2 (19)
- NetWork (7)
- Oracle周边 (38)
- Mysql里边 (6)
- Windows技 (9)
- 简单算法 & 数据结构 (14)
- 设计模式 (6)
- GTK历程 (12)
- 工具使用 (25)
- 杂事 (23)
- 一些概念 (17)
- Web方面 (10)
- myCodeTools (9)
- ^未 竟$ (13)
- 硬件通信 (2)
- Games (1)
最新评论
xpath解析html,使用正则不好...
http://www.cnblogs.com/sevenyuan/archive/2010/12/06/1898075.html
re.compile 返回一个正则对象
re.split 分割字符
re.match
re.search
re.findall 查找全部
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
http://www.cnblogs.com/deerchao/archive/2006/08/24/zhengzhe30fengzhongjiaocheng.html
http://www.cnblogs.com/sevenyuan/archive/2010/12/06/1898075.html
re.compile 返回一个正则对象
re.split 分割字符
re.match
re.search
re.findall 查找全部
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
http://www.cnblogs.com/deerchao/archive/2006/08/24/zhengzhe30fengzhongjiaocheng.html
发表评论
-
webpy_Cookbook
2013-05-06 22:31 614http://webpy.org/cookbook/index ... -
webpy_CGI 伏笔
2013-05-06 10:18 1137http://webpy.org/install.zh-cn ... -
app PNG
2013-03-22 11:53 918#--- # iPIN - iPhone PNG Images ... -
Django
2013-03-03 20:04 995https://docs.djangoproject.com/ ... -
bpython IDE
2013-02-27 11:51 689http://bpython-interpreter.org/ ... -
install webpy
2012-07-20 20:58 605http://webpy.org/install.zh-cn ... -
python__zip
2012-06-14 10:26 671前几天用了下zip,要压缩个目录,下面那坨代码也是copy回 ... -
Python__列表
2011-02-12 14:23 632http://gmingzhe.blog.51cto.com/ ... -
Python__参数:传值or引用?
2011-02-12 14:20 621http://blog.csdn.net/winterTTr/ ... -
Python__递归遍历文件
2011-02-12 12:54 838http://zhangjunhd.blog.51cto.co ... -
Python__升级
2011-02-12 10:57 931http://www.activestate.com/ 出处 ... -
Python__模块
2011-02-11 15:48 778什么是模块:sys、time等模块,已经被封装起来,我们经常在 ... -
Python__函数
2011-02-11 15:18 718最基本函数 #!/usr/bin/python de ... -
Python__时间
2011-02-11 15:15 594当前时间 遍历时间 时间截 -
常用模块介绍
2010-07-22 15:48 640http://blog.csdn.net/Xiao_Qiang ... -
python编码相关
2010-07-22 09:54 996http://blog.csdn.net/lwl_ls/arc ... -
Python函数库列表
2010-07-21 21:05 1303copy:http://blog.ez2learn.com ... -
python__init
2010-05-27 10:22 613http://blog.sina.com.cn/s/artic ...
相关推荐
Python 09、正则表达式 1-1_PYTHON_RE_Day01_AM.mp4
Python 09、正则表达式 1-2_PYTHON_RE_Day01_PM.mp4
在Python中,正则表达式的操作主要通过内置的`re`模块来实现。 正则表达式是一种特殊的字符序列,用于在文本中查找、替换或匹配特定模式。它们可以用来验证输入、提取特定格式的数据,甚至可以用来解析复杂的文本...
在Python爬虫中,常用到的库包括requests用于HTTP请求,BeautifulSoup或lxml进行HTML解析,可能还会使用re正则表达式进行数据提取,以及pandas用于数据清洗和分析。如果涉及到反爬虫策略,可能还会使用到User-Agent...
10. **正则表达式**:Python的re模块提供了正则表达式的支持,可以用来进行复杂文本匹配和搜索。 11. **网络编程**:Python可以通过socket库实现网络通信,可以创建服务器和客户端应用,处理TCP/IP、UDP等协议。 ...
10. **正则表达式**:Python的re模块支持正则表达式,用于文本匹配和处理。 11. **Web开发**:Python的Django和Flask框架广泛应用于Web开发,提供了MVC架构、路由、模板和数据库集成等功能。 12. **数据分析与科学...
12. **正则表达式**:Python的re模块提供了强大的文本匹配功能,是处理文本数据的重要工具。 13. **单元测试与持续集成**:了解如何使用unittest或pytest进行单元测试,以及如何设置持续集成以确保代码质量。 14. ...
Python中的re模块是专门用来进行正则表达式匹配的库。正则表达式是一种文本模式匹配工具,它描述了一种字符串匹配的规则,通常用于搜索、替换或提取字符串中符合某种模式的文本。 在Python中使用re模块,首先需要...
8. **正则表达式**:Python的re模块提供了正则表达式的支持,用于文本匹配和处理。 9. **网络编程**:Python有强大的socket库,可以进行TCP/IP通信,实现服务器端和客户端的编程。 10. **Web开发框架**:Python有...
`re`正则表达式库用于复杂的数据匹配和清洗;而`asyncio`和`aiohttp`则用于实现异步爬虫,提高爬取效率。 在"spider.zip"中,"increasepy7"可能指的是一个优化爬虫性能的策略,可能是通过增加并发量或优化请求间隔...
9. **正则表达式**:使用re模块进行文本匹配和搜索。 10. **标准库和第三方库**:Python有丰富的标准库,如os、sys、math等,还有许多第三方库如Numpy、Pandas、Matplotlib用于科学计算和数据可视化,Django和Flask...
5. 正则表达式(re模块):在爬取过程中,我们可能需要使用正则表达式来匹配和提取特定格式的文件名。正则表达式可以帮助我们准确地定位和提取目标字符串。 6. 数据存储:抓取到的数据通常需要保存到文件或数据库中...
这个名字中的“rescape”可能源于“re”(正则表达式)和“escape”(转义)的组合,暗示了该库可能包含了与字符串操作相关的功能。然而,这只是一个推测,实际功能可能更为广泛。 首先,让我们了解一下`.whl`文件。这...
10. **Python标准库的使用**:学习并熟悉Python内置的标准库,如os、sys、time、re、json等,它们提供了丰富的功能,能大大提高开发效率。 11. **实战项目**:在这一阶段,可能还会涉及到实际项目练习,如数据分析...
3. **正则表达式**:对于某些网站,视频链接可能隐藏在JavaScript代码或不规则格式中,这时需要使用正则表达式(re模块)来匹配和提取。 4. **异步处理**:为了提高效率,可以使用异步库如asyncio配合aiohttp来并发...
5. **标准库与第三方库**:探讨Python内置的模块,如os、sys、re(正则表达式)、json等,并介绍如何使用pip安装和管理第三方库,如NumPy、Pandas、Matplotlib等用于科学计算和数据可视化。 6. **高级话题**:可能...
常用的Python爬虫库有`requests`用于发送HTTP请求,`BeautifulSoup`或`lxml`用于解析HTML文档,`re`用于正则表达式匹配,以及`os`和`sys`用于文件操作等。 2. **爬虫python**:Python爬虫通常涉及网络请求、HTML...