- 浏览: 2653435 次
- 来自: 杭州
文章分类
- 全部博客 (1188)
- webwork (4)
- 网摘 (18)
- java (103)
- hibernate (1)
- Linux (85)
- 职业发展 (1)
- activeMQ (2)
- netty (14)
- svn (1)
- webx3 (12)
- mysql (81)
- css (1)
- HTML (6)
- apache (3)
- 测试 (2)
- javascript (1)
- 储存 (1)
- jvm (5)
- code (13)
- 多线程 (12)
- Spring (18)
- webxs (2)
- python (119)
- duitang (0)
- mongo (3)
- nosql (4)
- tomcat (4)
- memcached (20)
- 算法 (28)
- django (28)
- shell (1)
- 工作总结 (5)
- solr (42)
- beansdb (6)
- nginx (3)
- 性能 (30)
- 数据推荐 (1)
- maven (8)
- tonado (1)
- uwsgi (5)
- hessian (4)
- ibatis (3)
- Security (2)
- HTPP (1)
- gevent (6)
- 读书笔记 (1)
- Maxent (2)
- mogo (0)
- thread (3)
- 架构 (5)
- NIO (5)
- 正则 (1)
- lucene (5)
- feed (4)
- redis (17)
- TCP (6)
- test (0)
- python,code (1)
- PIL (3)
- guava (2)
- jython (4)
- httpclient (2)
- cache (3)
- signal (1)
- dubbo (7)
- HTTP (4)
- json (3)
- java socket (1)
- io (2)
- socket (22)
- hash (2)
- Cassandra (1)
- 分布式文件系统 (5)
- Dynamo (2)
- gc (8)
- scp (1)
- rsync (1)
- mecached (0)
- mongoDB (29)
- Thrift (1)
- scribe (2)
- 服务化 (3)
- 问题 (83)
- mat (1)
- classloader (2)
- javaBean (1)
- 文档集合 (27)
- 消息队列 (3)
- nginx,文档集合 (1)
- dboss (12)
- libevent (1)
- 读书 (0)
- 数学 (3)
- 流程 (0)
- HBase (34)
- 自动化测试 (1)
- ubuntu (2)
- 并发 (1)
- sping (1)
- 图形 (1)
- freemarker (1)
- jdbc (3)
- dbcp (0)
- sharding (1)
- 性能测试 (1)
- 设计模式 (2)
- unicode (1)
- OceanBase (3)
- jmagick (1)
- gunicorn (1)
- url (1)
- form (1)
- 安全 (2)
- nlp (8)
- libmemcached (1)
- 规则引擎 (1)
- awk (2)
- 服务器 (1)
- snmpd (1)
- btrace (1)
- 代码 (1)
- cygwin (1)
- mahout (3)
- 电子书 (1)
- 机器学习 (5)
- 数据挖掘 (1)
- nltk (6)
- pool (1)
- log4j (2)
- 总结 (11)
- c++ (1)
- java源代码 (1)
- ocr (1)
- 基础算法 (3)
- SA (1)
- 笔记 (1)
- ml (4)
- zokeeper (0)
- jms (1)
- zookeeper (5)
- zkclient (1)
- hadoop (13)
- mq (2)
- git (9)
- 问题,io (1)
- storm (11)
- zk (1)
- 性能优化 (2)
- example (1)
- tmux (1)
- 环境 (2)
- kyro (1)
- 日志系统 (3)
- hdfs (2)
- python_socket (2)
- date (2)
- elasticsearch (1)
- jetty (1)
- 树 (1)
- 汽车 (1)
- mdrill (1)
- 车 (1)
- 日志 (1)
- web (1)
- 编译原理 (1)
- 信息检索 (1)
- 性能,linux (1)
- spam (1)
- 序列化 (1)
- fabric (2)
- guice (1)
- disruptor (1)
- executor (1)
- logback (2)
- 开源 (1)
- 设计 (1)
- 监控 (3)
- english (1)
- 问题记录 (1)
- Bitmap (1)
- 云计算 (1)
- 问题排查 (1)
- highchat (1)
- mac (3)
- docker (1)
- jdk (1)
- 表达式 (1)
- 网络 (1)
- 时间管理 (1)
- 时间序列 (1)
- OLAP (1)
- Big Table (0)
- sql (1)
- kafka (1)
- md5 (1)
- springboot (1)
- spring security (1)
- Spring Boot (3)
- mybatis (1)
- java8 (1)
- 分布式事务 (1)
- 限流 (1)
- Shadowsocks (0)
- 2018 (1)
- 服务治理 (1)
- 设计原则 (1)
- log (0)
- perftools (1)
最新评论
-
siphlina:
课程——基于Python数据分析与机器学习案例实战教程分享网盘 ...
Python机器学习库 -
san_yun:
leibnitz 写道hi,我想知道,无论在92还是94版本, ...
hbase的行锁与多版本并发控制(MVCC) -
leibnitz:
hi,我想知道,无论在92还是94版本,更新时(如Puts)都 ...
hbase的行锁与多版本并发控制(MVCC) -
107x:
不错,谢谢!
Latent Semantic Analysis(LSA/ LSI)算法简介 -
107x:
不错,谢谢!
Python机器学习库
python 编写正则使用RE Modules
手机号码验证
输出 <_sre.SRE_Match object at 0xb720e528>
返回的这个对象是 MatchObject ,包含的方法有group()等: http://docs.python.org/release/2.2.3/lib/match-objects.html
除了使用search方法还有findAll方法,相关文档可以参考:
http://lukejin.iteye.com/blog/608206
http://epydoc.sourceforge.net/stdlib/index.html
手机号码验证
import re m = re.compile("^\d{7,13}$") print m.match("18181818") print m.match("1515")
k= re.compile(u"^(www*|m*)") print k.search("wwww.f.duitang.com.log").group()
#!/usr/bin/python import re str = '1screen12@dsfdsfdsf3" sdf' #pattern = re.compile('screen.*') 之前写错了 pattern = re.compile('scree\w*\"') #这才是正确的 result = pattern.search(str) print result;
import re list = [] f = open("log","r") post = re.compile("[POST|GET] /[a-zA-Z0-9/?&]*") hc = re.compile("HTTP/1.1\" \d*") ma = re.compile("192.168.172.\d+:7199 [0-9.]*") for read in f.readlines(): match = post.search(read) if match: g = str(match.group()).replace("T","") list.append(g) match = hc.search(read) if match: g = str(match.group()).replace("HTTP/1.1\"","") list.append(g) match = ma.search(read) if match: g = str(match.group())[18:] list.append(g) list.append("\n") print " ".join(list)
输出 <_sre.SRE_Match object at 0xb720e528>
返回的这个对象是 MatchObject ,包含的方法有group()等: http://docs.python.org/release/2.2.3/lib/match-objects.html
除了使用search方法还有findAll方法,相关文档可以参考:
http://lukejin.iteye.com/blog/608206
http://epydoc.sourceforge.net/stdlib/index.html
发表评论
-
python读取图片exif信息
2014-11-06 10:53 2400f = open("/home/admin/tlo ... -
Python程序的执行原理
2014-04-14 15:44 17231. 过程概述 Python先把代码(.py文件)编译成字 ... -
如何创建一个短链服务
2013-12-26 16:23 0参考: http://stackoverflow.com ... -
python 解析命令参数(argument)组件argparse
2013-12-11 17:35 1400参考: http://youngsterxyf.githu ... -
pyhon命令行工具optparse
2013-11-10 16:27 1028使用python optparse 可以创建命令行工具,下面 ... -
Python在豆瓣的应用
2013-10-21 10:46 1194Python在豆瓣的应用,hongqiangning分享 ... -
用python爬虫抓站的一些技巧总结
2013-10-10 14:12 1681学用python也有3个多月了,用得最多的还是各类爬虫 ... -
python小技巧
2013-10-10 11:50 7321. 声明长度256的数组 a=[0]*256 ... -
使用tesseract-ocr破解网站验证码
2013-10-09 10:25 1212原文:使用tesseract-ocr破解网站验证码 ... -
和豆瓣CMGS交流
2013-06-20 17:36 5838蒋云鹏: 在?CMGS: 在蒋 ... -
python乱码问题('ascii' codec can't encode character u'\u4e2d' in position 0)
2013-05-20 19:03 4245>>> k = u'中' >> ... -
python shell 交互模式
2013-04-28 22:17 1628python 通过code模块可以很容易的进入交互模式: ... -
jython和gunicorn性能测试对比
2013-04-13 13:03 1294helloworld,笔记本上: gunicorn ... -
python的mysql客户端-MySQLdb
2013-04-04 10:13 1158平时的主要编程语言是Java,开发时也主要用Mysql,经常 ... -
Python几种并发实现方案的性能比较
2013-03-18 21:14 2956原文:http://www.elias.cn/P ... -
python汉字和Unicode码(utf-8)之间的转换(Pack/Unpack)
2013-03-18 21:13 1642保证你要转换的字符串编码为UTF8,如果不是,请iconv ... -
python反序列化的坑
2013-01-06 18:06 1278今天遇到python一个坑,调用memcached的get_m ... -
sqlalchemy connection pool.py 源代码
2012-12-29 22:58 2236把 sqlalchemy pool源代码copy下来,有空看看 ... -
SQLAlchemy简单介绍
2012-12-28 22:41 0文档参考:http://docs.sqlalchemy.org ... -
pymysql简单使用
2012-12-28 12:38 2118import pymysql conn = pymysq ...
相关推荐
Python正则表达式是Python编程语言中的一个强大工具,它用于处理字符串,执行模式匹配和文本提取。在Python中,正则表达式主要用于处理文本数据,例如从日志文件中提取特定信息,验证用户输入,或者从网页内容中抓取...
在实际应用中,根据需要匹配邮箱的准确性和范围,可能需要编写更加复杂和健壮的正则表达式。 为了确保正则表达式能够正确执行,代码中使用了__author__变量来声明作者信息,这是为了表明代码的归属和便于后续维护。...
在本主题中,我们将探讨如何使用纯Python类和函数语法来编写正则表达式,并讨论如何进行更有效的测试。 一、Python中的正则表达式模块 Python的`re`模块提供了对正则表达式的支持。通过这个模块,我们可以创建正则...
总的来说,Python的正则表达式库`re`在处理诸如筛选信用卡号这样的任务时非常强大,它允许我们编写简洁且高效的代码来满足各种复杂的文本匹配需求。通过学习和熟练掌握正则表达式,开发者可以大大提高其在文本处理...
对于初学者来说,编写正则表达式可能会有一定难度,因此,使用在线正则表达式测试工具可以帮助调试和验证正则表达式的正确性和效率。 由于文档是通过OCR技术扫描识别的,可能会有文字识别错误,这需要读者结合上...
在Python中,正则表达式模式被编译成字节码,由C语言编写的匹配引擎执行。虽然正则表达式非常强大,但并非所有字符串处理任务都适合使用正则表达式,有时候使用Python代码进行处理会更加清晰和易于理解,尤其是在...
Python正则表达式,也称为Regular Expression,在编程领域中是一种强大的文本处理工具,它能用于查找、替换或者提取符合特定模式的字符串。Python内置了`re`模块来支持正则表达式操作,使得在Python中使用正则表达式...
1. **在线编辑**:用户可以直接在网页上编写正则表达式,无需安装任何软件,方便快捷。 2. **实时反馈**:输入正则表达式后,Pyregex会立即对预设的文本进行匹配,并展示匹配结果,帮助用户快速理解正则表达式的匹配...
本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分。正则表达式是用于处理字符串的...
Python正则表达式是Python编程语言中的一个强大工具,它用于处理字符串,特别是搜索、匹配、替换等操作。...记得在学习过程中多实践,通过编写代码加深理解和记忆,相信你很快就能熟练运用Python正则表达式这一利器。
在高级应用中,对于给定的正则表达式,应当注意引擎如何执行并编写以提高字节码运行的效率。正则表达式语言较小,因此并不是所有的字符串处理任务都可以使用它完成。有些任务虽然能用正则表达式完成,但可能非常复杂...
编写正则表达式时需要注意反斜杠的使用。在大多数编程语言中,反斜杠是转义字符,用于表示特殊字符。例如,在正则表达式中匹配一个反斜杠本身需要使用四个反斜杠"\\\\",因为在编程语言中,反斜杠本身也需要被转义。...
使用正则表达式编写一些逻辑验证非常方便,例如电子邮件地址格式的验 证。正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符)操作 的一种逻辑公式,就是用事先定义好的一些特定字符、及...
- 正则表达式通常会被编译成字节码,并由C语言编写的匹配引擎执行。 - 在复杂的正则表达式中,注意避免过于贪婪的匹配以及不必要的重复计算。 - 对于性能敏感的应用,可以考虑预编译正则表达式。 - **调试与测试...
文章末尾推荐了两款在线正则表达式工具,帮助读者在编写正则表达式时进行测试和验证。这些工具对于初学者或希望快速验证正则表达式的正确性非常有帮助。 6. 进阶学习资源: 文中还提到了一系列有关Python学习的...
本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程
### 正则表达式在Python爬虫中的应用 #### 一、引言 在Python编程中,正则表达式(Regular Expression,简称regex或regexp)是一种强大的文本处理工具,广泛应用于字符串搜索、替换等场景。对于从事网络爬虫开发的...
总结来说,“cpp-python正则表达式引擎的一个轻量级分支”是一个小巧、高效且易于集成的正则表达式库,它的语法与Python正则引擎兼容,使用C99编写,通过CMake构建,无额外依赖,适合C++开发者快速实现正则表达式...
### Python正则表达式详解 #### 一、正则表达式概述 正则表达式(Regular Expression)是一种在计算机科学领域广泛使用的模式...同时,熟练掌握正则表达式的构造规则也是非常重要的,这有助于提高编写效率和准确度。
在python中,通过内嵌集成re模块,程序媛们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。 比如下面的例子,就是用来从一段文字里查找一个单词,如下: 示例...