`

python 面向对象入门 - 之 正则表达式

阅读更多
该博文涵盖了如下内容:
1.正则表达式 re
2.url库 urllib
3.debug 方法
4.面向对象封装方法

#encoding=utf-8
'''
 python learn regular express
 url : http://docs.python.org/library/re.html
 parse html url : http://www.boddie.org.uk/python/HTML.html
 author : liuzheng
''' 
import re
import urllib

#分析javaeye blog 频道
class ParseHTML:
    '''
    parse html for infomation
    parse javeeye page
    '''

    def __init__(self,url):
        self.url = url
        pass
    
    
    #analyses html 
    def parse(self):
        sock = urllib.urlopen(self.url) 
        html = sock.read()
        self.__puts(html)
        pass
    
    #打印html 匹配数据
    def __puts(self,html):
        b =  re.compile(r"<a href='([\w./:\\]+?)'[\s]*title=([^<>]+?)[\s]*target=([^<>]+?)>([^<>]+?)</a>",re.I)
        m = re.findall(b,html)
        #这里有encode 问题?,不知道,大家是否可以帮忙解答
        print  m
        
        
if __name__ == '__main__':
     url = "http://www.iteye.com/blogs"
     p = ParseHTML(url)
     p.parse()

 
if __debug__:
     print "debuging is %s" %  __debug__
     print "regular" + "* "  * 30
     #math
     str = "800-820-8800"
     m = re.match(r"(\d{3})-(\d{3})-(\d{4})", str)
     print "result : " ,m.groups()

     #split
     print "split : %s" % re.split('\W', 'Words, words, words.')

     #findall
     text = "He was carefully disguised but captured quickly by police."
     print "findall  :%s" % re.findall(r"\w+ly",text)

     #sub
     text = "hello world!"
     print "sub:%s" % re.sub(r"\s+","--",text)
分享到:
评论

相关推荐

    精通正则表达式~~~

    程序式处理和面向对象式处理... 95 查找和替换... 98 其他语言中的查找和替换... 100 注意事项和处理方式:小结... 101 字符串,字符编码和匹配模式... 101 作为正则表达式的字符串... 101 字符编码... 105 ...

    Python基础入门教程 由浅入深讲解清晰 第4章 字符串与正则表达式 (共55页).ppt

    【Python基础入门教程】第四章主要讲解了字符串与正则表达式这两个重要的概念。字符串是Python编程中的基本数据类型之一,而正则表达式则是文本处理中的强大工具。 ### 字符串 #### 字符串编码 字符串编码涉及到...

    零基础学习python及爬虫

    example-11.py 正则表达式-贪婪模式和懒惰模式 example-12.py 简单爬虫的编写(urllib学习) example-13.py 超时设置 example-14.py 自动模拟HTTP请求与百度信息自动搜索爬虫实战 example-15.py 自动模拟HTTP请求之...

    python零基础入门-Crossin的编程教室

    - **面向对象编程**: - 学习类和对象的概念,理解封装、继承和多态性。 - 创建类、定义属性和方法,实例化对象。 - **模块与包管理**: - 模块是包含函数和变量的文件,可以被其他脚本导入使用。 - 包是组织多...

    Python编程零基础入门

    10-1正则表达式与python 10-2特殊的符号 10-3re模块 11-1Time模块的使用 11-2Log模块的使用 2-1Python变量赋值及数据类型 2-2Python数值及方法 2-3Python字符串及方法 2-4Python列表和元组 2-5Python字典和集合 3-1...

    python全套学习内容,包括python基础语法教程、字符串处理、函数、列表操作、文件处理、字典、面向对象、正则表达式等。

    以上只是Python学习内容的一部分,更深入的学习还包括异常处理、文件操作、类和对象(面向对象编程)、模块和包的使用、函数式编程、装饰器、生成器、上下文管理器以及更多的标准库和第三方库的使用。对于Python初级...

    Python基础教程(crossin全60课).pdf

    - 面向对象编程基础:介绍类、对象、继承等面向对象的基本概念。 - 正则表达式:提供正则表达式的基本使用方法和技巧。 - Python模块的安装方式:介绍如何安装第三方模块。 - 元组的创建和使用:了解元组这一不可变...

    华为出品-Python基础入门教程-可爱的Python 共86页.ppt

    Python是一种广泛应用于各种领域的高级编程语言,具有强大的解释性、交互性和面向对象的特性。自诞生以来,Python不断发展壮大,其技术前景广阔。Python的易学性、简洁的语法以及丰富的标准库使得它成为初学者和专业...

    Python编程入门 Python基础入门教程-注释详细 讲解清晰 共28页.pptx

    6. 丰富的库:Python 标准库非常庞大,包括正则表达式、文档生成、单元测试、线程、数据库、网页浏览器等。 Python 下载与安装 Python 可以在 Unix 衍生系统和 Windows 平台上安装。在 Unix 衍生系统中,可以在...

    Python-100-Days-master.zip

    4. **面向对象编程**:Python是一门面向对象的语言,理解类和对象的概念、继承、封装和多态是进阶的关键。此外,还会学习如何设计和实现模块化的代码。 5. **文件操作**:学习读写文件、处理异常、文件遍历等,这...

    python入门--王纯业python笔记

    - **特点**:Python支持多种编程范式,包括面向对象、命令式、函数式等,并且拥有强大的标准库。 ##### §1.2 数据类型 - **整数(integer)**:表示整数值的数据类型。 - **浮点数(float)**:用于表示小数或实数值的...

    Python3完全零基础入门精讲超清教程.txt

    课程目标:绝对零基础Python3.x 入门,掌握Python语言常数据类型与操作、语句语法、流程控制、函数定义、模块管理,类与面向对象编程,错误与异常处理,文件读写等知识;为以后Python各方向领域编程打下坚实基础。...

    python学习笔记与简明教程

    ### Python学习笔记与简明教程知识点汇总 #### Python 第1课:安装 - **知识点**: - Python 安装包的选择... - 示例代码演示正则表达式的入门应用。 #### WhyPython?为什么用Python作为编程入门语言? - **知识点...

    Python3完全零基础入门精讲 全套视频教程 下载地址.txt

    01-计算机基础常识.mp4 02-Python语言概览、安装与运行.mp4 03-Python 变量、数据类型及存储....24-正则表达式.mp4 25-系统编程.mp4 26-python并行编程.mp4 。。。。 https://pan.baidu.com/s/1z2IRohbDlU--ekR7s-im5g

    python-3.9.1-docs-pdf-a4.zip

    同时,文档会涵盖类与对象,这是Python面向对象编程的核心,包括类的定义、对象的创建、继承、封装和多态等概念。 文档还详细阐述了Python的函数式编程特性,如高阶函数、map、filter和reduce等,以及lambda表达式...

    python学习必备资源-快速上手python

    5. **廖雪峰的python3**:廖雪峰的教程是Python学习者的热门资源,他的网站提供了清晰、易懂的Python教程,包括Python3的新特性、面向对象编程、模块化编程、异常处理、标准库的使用等。 6. **笨办法学Python**:这...

    python入门教程(非常详细),从零基础入门到精通,看完这一篇就够了.pdf

    本文档提供了 Python 编程语言的详细入门教程,从零基础到精通,涵盖了 Python 的各个方面,包括语法、数据类型、函数、模块、面向对象、异常处理、网络编程和并发编程等。 第一章:Python 介绍 * Python 由来和...

    老王Python基础+进阶+项目篇(高清无密)

    进阶篇12-面向对象周末习题讲解 进阶篇13-模块第一节 进阶篇14-模块第二节-常用模块讲解 进阶篇15-异常处理1.1 进阶篇16-异常处理1.2 进阶篇17-异常处理1.3 进阶篇18-周末异常习题探讨 进阶篇19-多线程1.1 进阶篇20-...

    你的Python入门好帮手:一份包含了Python基础学习需要的知识框架 + 爬虫基础 + numpy基础

    Python是一种多范式编程语言,既适合面向对象编程,也适合函数式编程和过程式编程。它语法简洁明了,易于上手,因此成为许多人入门编程的首选语言。以下是对Python入门的一些补充说明: 1. Python基础知识 - 变量、数据...

    【python入门必背】python入门基础知识点合集、python基础知识背记手册

    第8章 Python中使用正则表达式 第9章 函数 第10章 面向对象程序设计 第11章 模块 第12章 异常处理及程序调试 第13章 文件及目录操作 第14章 操作数据库 第15章 GUI界面编程 第16章 Pygame游戏编程 第17章 网络爬虫...

Global site tag (gtag.js) - Google Analytics