该博文涵盖了如下内容:
1.正则表达式 re
2.url库 urllib
3.debug 方法
4.面向对象封装方法
#encoding=utf-8
'''
python learn regular express
url : http://docs.python.org/library/re.html
parse html url : http://www.boddie.org.uk/python/HTML.html
author : liuzheng
'''
import re
import urllib
#分析javaeye blog 频道
class ParseHTML:
'''
parse html for infomation
parse javeeye page
'''
def __init__(self,url):
self.url = url
pass
#analyses html
def parse(self):
sock = urllib.urlopen(self.url)
html = sock.read()
self.__puts(html)
pass
#打印html 匹配数据
def __puts(self,html):
b = re.compile(r"<a href='([\w./:\\]+?)'[\s]*title=([^<>]+?)[\s]*target=([^<>]+?)>([^<>]+?)</a>",re.I)
m = re.findall(b,html)
#这里有encode 问题?,不知道,大家是否可以帮忙解答
print m
if __name__ == '__main__':
url = "http://www.iteye.com/blogs"
p = ParseHTML(url)
p.parse()
if __debug__:
print "debuging is %s" % __debug__
print "regular" + "* " * 30
#math
str = "800-820-8800"
m = re.match(r"(\d{3})-(\d{3})-(\d{4})", str)
print "result : " ,m.groups()
#split
print "split : %s" % re.split('\W', 'Words, words, words.')
#findall
text = "He was carefully disguised but captured quickly by police."
print "findall :%s" % re.findall(r"\w+ly",text)
#sub
text = "hello world!"
print "sub:%s" % re.sub(r"\s+","--",text)
分享到:
相关推荐
程序式处理和面向对象式处理... 95 查找和替换... 98 其他语言中的查找和替换... 100 注意事项和处理方式:小结... 101 字符串,字符编码和匹配模式... 101 作为正则表达式的字符串... 101 字符编码... 105 ...
【Python基础入门教程】第四章主要讲解了字符串与正则表达式这两个重要的概念。字符串是Python编程中的基本数据类型之一,而正则表达式则是文本处理中的强大工具。 ### 字符串 #### 字符串编码 字符串编码涉及到...
example-11.py 正则表达式-贪婪模式和懒惰模式 example-12.py 简单爬虫的编写(urllib学习) example-13.py 超时设置 example-14.py 自动模拟HTTP请求与百度信息自动搜索爬虫实战 example-15.py 自动模拟HTTP请求之...
- **面向对象编程**: - 学习类和对象的概念,理解封装、继承和多态性。 - 创建类、定义属性和方法,实例化对象。 - **模块与包管理**: - 模块是包含函数和变量的文件,可以被其他脚本导入使用。 - 包是组织多...
10-1正则表达式与python 10-2特殊的符号 10-3re模块 11-1Time模块的使用 11-2Log模块的使用 2-1Python变量赋值及数据类型 2-2Python数值及方法 2-3Python字符串及方法 2-4Python列表和元组 2-5Python字典和集合 3-1...
以上只是Python学习内容的一部分,更深入的学习还包括异常处理、文件操作、类和对象(面向对象编程)、模块和包的使用、函数式编程、装饰器、生成器、上下文管理器以及更多的标准库和第三方库的使用。对于Python初级...
- 面向对象编程基础:介绍类、对象、继承等面向对象的基本概念。 - 正则表达式:提供正则表达式的基本使用方法和技巧。 - Python模块的安装方式:介绍如何安装第三方模块。 - 元组的创建和使用:了解元组这一不可变...
Python是一种广泛应用于各种领域的高级编程语言,具有强大的解释性、交互性和面向对象的特性。自诞生以来,Python不断发展壮大,其技术前景广阔。Python的易学性、简洁的语法以及丰富的标准库使得它成为初学者和专业...
6. 丰富的库:Python 标准库非常庞大,包括正则表达式、文档生成、单元测试、线程、数据库、网页浏览器等。 Python 下载与安装 Python 可以在 Unix 衍生系统和 Windows 平台上安装。在 Unix 衍生系统中,可以在...
4. **面向对象编程**:Python是一门面向对象的语言,理解类和对象的概念、继承、封装和多态是进阶的关键。此外,还会学习如何设计和实现模块化的代码。 5. **文件操作**:学习读写文件、处理异常、文件遍历等,这...
- **特点**:Python支持多种编程范式,包括面向对象、命令式、函数式等,并且拥有强大的标准库。 ##### §1.2 数据类型 - **整数(integer)**:表示整数值的数据类型。 - **浮点数(float)**:用于表示小数或实数值的...
课程目标:绝对零基础Python3.x 入门,掌握Python语言常数据类型与操作、语句语法、流程控制、函数定义、模块管理,类与面向对象编程,错误与异常处理,文件读写等知识;为以后Python各方向领域编程打下坚实基础。...
### Python学习笔记与简明教程知识点汇总 #### Python 第1课:安装 - **知识点**: - Python 安装包的选择... - 示例代码演示正则表达式的入门应用。 #### WhyPython?为什么用Python作为编程入门语言? - **知识点...
01-计算机基础常识.mp4 02-Python语言概览、安装与运行.mp4 03-Python 变量、数据类型及存储....24-正则表达式.mp4 25-系统编程.mp4 26-python并行编程.mp4 。。。。 https://pan.baidu.com/s/1z2IRohbDlU--ekR7s-im5g
同时,文档会涵盖类与对象,这是Python面向对象编程的核心,包括类的定义、对象的创建、继承、封装和多态等概念。 文档还详细阐述了Python的函数式编程特性,如高阶函数、map、filter和reduce等,以及lambda表达式...
5. **廖雪峰的python3**:廖雪峰的教程是Python学习者的热门资源,他的网站提供了清晰、易懂的Python教程,包括Python3的新特性、面向对象编程、模块化编程、异常处理、标准库的使用等。 6. **笨办法学Python**:这...
本文档提供了 Python 编程语言的详细入门教程,从零基础到精通,涵盖了 Python 的各个方面,包括语法、数据类型、函数、模块、面向对象、异常处理、网络编程和并发编程等。 第一章:Python 介绍 * Python 由来和...
进阶篇12-面向对象周末习题讲解 进阶篇13-模块第一节 进阶篇14-模块第二节-常用模块讲解 进阶篇15-异常处理1.1 进阶篇16-异常处理1.2 进阶篇17-异常处理1.3 进阶篇18-周末异常习题探讨 进阶篇19-多线程1.1 进阶篇20-...
Python是一种多范式编程语言,既适合面向对象编程,也适合函数式编程和过程式编程。它语法简洁明了,易于上手,因此成为许多人入门编程的首选语言。以下是对Python入门的一些补充说明: 1. Python基础知识 - 变量、数据...
第8章 Python中使用正则表达式 第9章 函数 第10章 面向对象程序设计 第11章 模块 第12章 异常处理及程序调试 第13章 文件及目录操作 第14章 操作数据库 第15章 GUI界面编程 第16章 Pygame游戏编程 第17章 网络爬虫...