`
yuhai.china
  • 浏览: 161683 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

python中的正则表达式应用

阅读更多
   f=open('wuqu.html','r')
   content=f.read()
   m=re.findall('<tr>[\w|\W]*?</tr>', content)
   print len(m)
   if m is None:return
   for i in range(1,len(m)):
       c=m[i]
       d=re.findall('<a[\w|\W]*?</a>', c)
       if d is None:continue
       if not len(d) == 4:continue
       name= re.search(">(.*?)<",d[0]).group(1) #name
       classify= re.search(">(.*?)<",d[1]).group(1) #classify
       url=re.search('"/(.*?)"',d[3]).group(1) #url
       us=url.split("=")
       type=us[len(us)-1]
       print type
       handle=get_curl()
       rv,mid,type=curl_fetch(handle,url)
       store(mid,name,url,classify,type)
   handle.close()
分享到:
评论

相关推荐

    第11.25节 Python正则表达式编译re.compile及正则对象使用.rar

    总结,`re.compile()`是Python正则表达式的重要工具,它使得我们可以预先编译正则表达式模式,提高程序的效率和可读性。通过创建正则表达式对象,我们可以灵活地执行多种正则操作,如查找、替换和分割字符串,从而在...

    [Python]网络爬虫(七):Python中的正则表达式教程.pdf

    6. Python正则表达式的示例 - 编译正则表达式:`pattern = ***pile(r'hello')` - 匹配字符串:`match1 = pattern.match('helloworld!')` - 提取匹配信息:`match1.group()` - 使用标志位编译:`pattern = ***...

    Python正则表达式基础

    Python正则表达式基础是学习如何在Python中应用正则表达式的入门指南。正则表达式,或称为REs、regexes、regexpatterns,是能够嵌入到Python中的一个精细、高度专业化的程序语言。通过re模块,程序员得以使用这一...

    python正则表达式匹配不包含某几个字符的字符串方法

    本文将分享如何使用Python正则表达式来匹配不包含特定字符集的字符串。 首先,我们来看一个基本的正则表达式匹配例子。假设我们要从一个字符串中找出所有以“https?”开头,后面跟着“://”,然后再以“.jpg”、“....

    python正则表达式_深入浅出

    ### Python正则表达式详解 #### 一、概述 Python中的正则表达式(re)模块提供了与Perl类似的正则表达式功能。无论是正则表达式本身还是被搜索的字符串,都可以是Unicode字符,这意味着该模块能够很好地处理各种字符...

    python正则学习_python正则_pagedbm_python_正则表达式_

    在本教程中,我们将深入探讨Python正则表达式的概念、语法以及实际应用。 首先,我们需要了解正则表达式的基本概念。正则表达式是由特殊字符(元字符)和普通字符组成的字符串,它们定义了一个模式,用于在文本中...

    python 正则表达式 详解(英文)

    Python正则表达式是专门用于在字符串中匹配字符组合的一个强大的工具,它使用一种特殊的语法来表示搜索模式。正则表达式不仅在Python中有着广泛的应用,在UNIX世界中也扮演了重要的角色。本文档主要介绍Python中与...

    python之常用正则表达式.pdf

    正则表达式是一种强大的文本处理工具,在Python编程中广泛应用于文本搜索、替换等操作。它能够帮助开发者快速定位、提取或者替换文本中的特定模式。本文将重点介绍Python中常用的正则表达式及其应用场景。 #### ...

    清华大学精品Python学习PPT课件-第5章 Python正则表达式.pptx

    总的来说,掌握Python中的字符串处理和正则表达式是任何Python开发者必备的技能,无论是在数据处理、文本分析还是网络爬虫等领域都有广泛应用。通过清华大学的精品课程,学习者可以系统地学习并掌握这些重要的编程...

    Python实现正则表达式匹配任意的邮箱方法

    在实际应用中,根据需要匹配邮箱的准确性和范围,可能需要编写更加复杂和健壮的正则表达式。 为了确保正则表达式能够正确执行,代码中使用了__author__变量来声明作者信息,这是为了表明代码的归属和便于后续维护。...

    Python正则表达式操作指南%2B-%2BUbuntu中文.pdf

    ### Python正则表达式操作指南知识点详解 #### 1. 简介 - **re模块**: Python自1.5版本起引入了`re`模块,该模块支持Perl风格的正则表达式模式。与之前的`regex`模块提供的Emacs风格相比,`re`模块更加功能强大且...

    Shell与Python正则表达式参考

    在Python中,正则表达式通过`re`模块来实现,提供了更丰富的功能和灵活性。 在Shell中,正则表达式使用特殊的字符来表示特定的字符集或模式。以下是一些常用的Shell正则表达式字符及其含义: 1. `[[:alnum:]]`:...

    正则式工具(自动生成正则表达式)

    4. **代码生成**:对于多种编程语言,如Java、Python、JavaScript等,工具可以生成对应的代码片段,方便将正则表达式集成到项目中。 5. **学习资源**:为了帮助用户深入理解正则式,工具可能还包含教程、参考资料和...

    Python正则表达式操作指南.pdf

    #### 一、Python正则表达式的引入与应用场景 - **Python正则表达式概述**: - **定义**:正则表达式(Regular Expression, RE)是一种用于匹配字符串中字符组合的工具,可以用于搜索、替换或提取文本中的模式。 - ...

    Python基础入门知识之正则表达式学习 正则表达式30分钟入门教程 共21页.pdf

    本教程的目标是让读者快速理解正则表达式的概念,学会基本的语法结构,并能应用到实际的Python代码中,进行字符串匹配和处理。 二、如何使用本教程 建议读者跟随教程的步骤,逐步实践每个例子,加深理解和记忆。...

    精通正则表达式(第三版)简体中文版

    - **Perl兼容正则表达式(PCRE)**:Perl语言的正则表达式实现,被广泛应用于PHP、Python等多种编程语言中。 - **Java中的正则表达式**:Java提供了java.util.regex包来支持正则表达式的使用。 - **JavaScript中的正则...

    Python正则表达式最全汇总手册应用实例中文PDF最新版本

    《Python正则表达式最全汇总手册+应用实例》是一份关于Python正则表达式的速查手册,包含了多种正则表达式的模式和应用实例。主要包括了校验数字的表达式,校验字符的表达式,特殊需求表达式,特殊字符和其他正则...

    python正则表达式详解笔记,python正则表达式教学.doc

    ### Python正则表达式详解 #### 一、正则表达式概述 正则表达式(Regular Expression)是一种在计算机科学领域广泛使用的模式匹配工具。它主要用于处理文本数据,包括搜索、替换以及提取文本中的特定模式。许多...

Global site tag (gtag.js) - Google Analytics