`
zjjzmw1
  • 浏览: 1364806 次
  • 性别: Icon_minigender_1
  • 来自: 开封
社区版块
存档分类
最新评论

python 爬虫

    博客分类:
  • iOS
阅读更多

import urllib2

import re

response = urllib2.urlopen('http://www.baidu.com/')

 

text = 'JGood is<title>sdfa</title>  a handsome <title> boy, </title>he is cool, clever, and so on...'

text2 = text.replace('y','')

#m = re.search(r'<title>(.*)<\/title>',response.read())

#m = re.match(r'.*<title>(.*)<\/title>.*',response.read())

#m = re.match(r'.*<title>(.*)<\/title>.*',text2)

m = re.search(r'<title>(.*)<\/title>',text2)

 

 

print m.group(1).decode('utf-8','ignore')

 

 

 

 

#m = re.finditer(r'<title>(.*)</title>',text)

#m = re.finditer(r'<title>([^<title>]*)</title>',text)     ///匹配不能包含<title>中任意字符的一个。

 

 

m = re.finditer(r'<title>((.(?!<title>))*.)</title>',text)     ///匹配不是<title>的字符串。

分享到:
评论

相关推荐

    Python爬虫框架Scrapy教程 完整版PDF

    《Python爬虫框架Scrapy教程》主要是针对学习python爬虫的课程,又基础的python爬虫框架scrapy开始,一步步学习到最后完整的爬虫完成,现在python爬虫应用的非常广泛,本文档详细介绍了scrapy爬虫和其他爬虫技术的...

    Python爬虫JS逆向进阶课程-课程网盘链接提取码下载 .txt

    这门课程是Python爬虫JS逆向进阶课程,将教授学员如何使用Python爬虫技术和JS逆向技术获取网站数据。学习者将学习如何分析网站的JS代码,破解反爬虫机制,以及如何使用Selenium和PhantomJS等工具进行模拟登录和数据...

    电影天堂上的Python爬虫源码.zip

    电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python爬虫源码.zip电影天堂上的Python...

    python爬虫课件+代码.zip

    Python爬虫技术是一种用于自动化网络数据获取的编程技术,它在大数据分析、网站维护、市场研究等领域具有广泛应用。本课程由“路飞学城樵夫”老师指导,通过实际操作帮助学习者掌握Python爬虫的基本原理和实战技巧。...

    python爬虫从入门到精通(模块)

    这份文档旨在帮助想要学习Python爬虫的初学者,从入门到精通逐步提升自己的技能。以下是我们将要涵盖的主题: ## 入门篇 1. Python爬虫简介 2. Requests库的使用 3. Beautiful Soup库的使用 4. 爬虫实战:爬取百度...

    Python爬虫教学视频-最全的Python爬虫视频教程全集

    本Python爬虫教学视频,全集共51天课程,整套课程以Python语言为核心,通过各种经典案例的讲解,很好的演示了python爬虫如何抓取数据的全过程,非常值得Python爬虫工程师和想掌握python爬虫技术的同学借鉴学习。...

    简单的python爬虫,代码完整

    在IT行业中,Python爬虫是获取网络数据的重要工具,尤其对于数据挖掘、网站分析和自动化任务有着不可忽视的作用。本资源提供了一个完整的Python2.7版本的简单网络爬虫代码,旨在帮助学习者理解和实践爬虫的基本原理...

    Python爬虫

    Python爬虫是编程领域中一个重要的知识点,尤其在数据挖掘和信息分析中广泛应用。本项目主要涉及了Python语言、网络爬虫技术、HTML解析库BeautifulSoup以及数据库管理系统MySQL。 首先,Python作为一门强大的脚本...

    python爬虫代码源码.rar

    python爬虫程序可用于收集数据。这也是最直接和最常用的方法。由于爬虫程序是一个程序,程序运行得非常快,不会因为重复的事情而感到疲倦,因此使用爬虫程序获取大量数据变得非常简单和快速。 由于99%以上的网站是...

    python爬虫:Python 爬虫知识大全

    python爬虫:Python 爬虫知识大全; python爬虫:Python 爬虫知识大全; python爬虫:Python 爬虫知识大全; python爬虫:Python 爬虫知识大全; python爬虫:Python 爬虫知识大全; python爬虫:Python 爬虫知识...

    python爬虫数据可视化分析

    Python爬虫数据可视化分析大作业,python爬取猫眼评论数据,并做可视化分析。 python爬虫数据可视化分析大作业 python爬虫,并将数据进行可视化分析,数据可视化包含饼图、柱状图、漏斗图、词云、另附源代码和报告书...

    "玩转Python爬虫——入门与实践"课程源码

    在“玩转Python爬虫——入门与实践”这门课程中,你将深入学习到Python爬虫的基础知识和实战技巧。Python爬虫是数据采集的重要工具,尤其在大数据时代,爬虫技术对于获取网络上的非结构化信息具有举足轻重的作用。本...

    python爬虫.pdf

    Python爬虫技术详解 Python爬虫是指使用Python语言编写的网络爬虫程序,它可以自动地从互联网上抓取数据,并对其进行处理和分析。Python爬虫技术广泛应用于数据挖掘、机器学习、自然语言处理等领域。 Requests库...

    Python爬虫开发与项目实战.pdf

    因为在提供的内容中,没有包含实际的技术知识、概念解释、操作指南或者与Python爬虫开发相关的任何实际内容,而是重复了一段关于加入一个Python编程学习交流群的信息,并没有详细说明《Python爬虫开发与项目实战.pdf...

    python爬虫20个案例

    讲诉python爬虫的20个案例 。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

    2024年的必考python爬虫面试题10个.zip

    python爬虫内容概要: 本套面试题涵盖了Python爬虫的基本原理、反爬虫策略、常用库(如BeautifulSoup、Scrapy、Selenium)的使用、代理IP的应用、Ajax爬取、多线程/多进程提高效率、分布式爬虫的实现等核心技术点。...

    爬虫代码实例源码大全+Python 爬虫Scrapy课件源码.zip

    "爬虫代码实例源码大全(纯源码不带视频的实例)"这部分是学习Python爬虫的重要资料。源码实例通常包括了各种常见的爬虫应用场景,如爬取网页HTML内容、解析JSON或XML数据、处理JavaScript加载的内容、登录验证、...

    python爬虫详解.pdf

    Python爬虫详解 1. 爬虫的基本概念 网络爬虫是一种自动化程序,它遵循特定的规则遍历互联网,抓取网页上的信息。爬虫的名称多种多样,如蚂蚁、自动索引、模拟程序或蠕虫。随着互联网的快速发展,网络成为了海量信息...

    81个Python爬虫源代码+九款开源爬虫工具.doc

    Python爬虫技术是数据获取和分析领域的重要工具,尤其在互联网信息海量的今天,爬虫可以帮助我们自动化地从网站上抓取大量数据。以下是一些关于Python爬虫的知识点,以及提到的一些开源爬虫工具: 1. **Python爬虫...

    黑马程序员2018python爬虫课件完整版

    Python爬虫技术是数据获取和信息挖掘的重要工具,尤其在大数据时代,它的价值不言而喻。黑马程序员作为知名的IT教育机构,其2018年的Python爬虫课程旨在教授学员如何有效地抓取和处理网络上的信息。在这个完整的课程...

Global site tag (gtag.js) - Google Analytics