python爬虫入门(解析) - - ITeye博客

`

永夜-极光

浏览: 253103 次
性别:
来自: 深圳

最近访客更多访客>>

amo

u012363178

shenyouhai

zjamson

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

朱辉辉33：楼主讲的好
实习收获
朱辉辉33：楼主讲得好
数据结构哈希表(hash)总结

python爬虫入门(解析)

博客分类：

python

阅读更多

根据上一篇的转载进行的总结:

python爬虫的主要步骤

1.访问网站,获取html数据

2.读取html数据,解析数据,取出你想要的值

解析数据使用beautifulsoup

解析数据的步骤详解:

1. 用beautifulsoup将html数据解析成一个对象

soup = BeautifulSoup(html_text, "html.parser")  # 创建BeautifulSoup对象

2.通过soup对象,获取标签内容

myHead=soup.head #获取第一个<head>标签

myBody=soup.body #获取第一个<body>标签

myBody=soup.b #获取第一个<b>标签

myPara= day.find_all('p') # 获取所有p标签

3.通过标签对象,获取文本

text=myPara.string

4.div嵌套div,不好定位,就用find_all获取

data = body.find_all('div', {'class': 'weather_li_left'})
print(data)

5.获取标签下的所有 <li> 标签,并且输出子标签的文本

child=parent.find_all('li')
for text in child:
    print(text.string)

分享到：

正则表达式 | (转载)python爬虫入门

2017-10-23 20:30
浏览 499
评论(0)
分类:非技术
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Python爬虫入门教程：超级简单的Python爬虫教程.pdf: ### Python爬虫入门教程知识点详解 #### 一、理解网页结构在进行Python爬虫开发之前，首先要了解网页的基本构成。网页通常包含三个主要部分：HTML（超文本标记语言）、CSS（层叠样式表）以及JavaScript（一种常用...

Python爬虫入门：如何爬取招聘网站并进行分析: Python爬虫入门知识点详细解析：一、Python爬虫概念与应用网络爬虫是按照一定的规则，自动抓取互联网信息的程序或脚本。它可以模拟用户浏览网页的行为，对网页内容进行提取、保存。Python爬虫由于其代码简洁、库...

Python 爬虫入门的教程之Beautiful Soup解析: Python 爬虫入门教程之 Beautiful Soup 解析本教程主要讲解 Python 爬虫入门知识，通过 Beautiful Soup 解析网页，抓取中国旅游网首页信息，了解网页结构，使用 requests 库抓取网站数据，并进行数据清洗和组织。 ...

"玩转Python爬虫——入门与实践"课程源码: 在“玩转Python爬虫——入门与实践”这门课程中，你将深入学习到Python爬虫的基础知识和实战技巧。Python爬虫是数据采集的重要工具，尤其在大数据时代，爬虫技术对于获取网络上的非结构化信息具有举足轻重的作用。本...

Python爬虫入门教程 90-100 凌晨5点的CSDN自动签到器，用Python爬虫干点闲事.zip: 综上所述，通过本教程，你不仅能学会编写Python爬虫，还能掌握网络请求、HTML解析、定时任务等多方面技能，为今后的Python编程之路打下坚实基础。而"demo.py"文件很可能是实现这一功能的示例代码，通过阅读和学习，...

Python爬虫入门教程：超级简单的Python爬虫教程.zip: 总的来说，这本“Python爬虫入门教程：超级简单的Python爬虫教程”将涵盖Python基础知识、HTTP请求、HTML解析、反爬虫策略和数据存储等多个方面，旨在帮助初学者快速掌握Python爬虫的基本技能。通过学习，你不仅可以...

Python爬虫入门：基础知识解析.pptx: 总的来说，Python爬虫是一门综合性的技能，涵盖了网络通信、数据解析、数据处理等多个领域。掌握这些基础知识和技巧，将有助于在大数据时代有效地获取和利用网络信息，为企业决策提供强有力的支持。

Python爬虫入门教程：超级简单的Python爬虫教程: Python爬虫入门教程以实战为导向，通过学习网页结构、使用requests库抓取数据、解析HTML以及数据清洗，让初学者快速掌握基础的爬虫技能。理解这些基本概念后，你可以继续深入学习更复杂的爬虫技术，如处理JavaScript...

Python爬虫入门.zip: 【Python爬虫入门】在信息技术日新月异的今天，数据已经成为了一种重要的资源。Python作为一种简洁且功能强大的编程语言，因其丰富的库支持和易读性，成为了爬虫开发的首选工具。本资料包“Python爬虫入门.zip”...

python 爬虫入门实例.zip: Python爬虫，简而言之，就是使用Python编程语言来编写的网络爬虫程序。网络爬虫是一种自动化程序，能够在互联网上自动抓取并提取所需的信息。Python作为一种功能强大且易于学习的编程语言，特别适合用来编写爬虫。...

Python爬虫入门教程(超级简单)完整版PDF最新版本: 这是一篇详细介绍 Python 爬虫入门的教程，从实战出发，适合初学者。读者只需在阅读过程紧跟文章思路，理清相应的实现代码，30 分钟即可学会编写简单的 Python 爬虫。这篇 Python 爬虫教程主要讲解以下 5 部分内容...

Python爬虫入门与实战中文完整版pdf最新版本: 《Python爬虫入门与实战中文完整版pdf最新版本》是一本面向初学者的教程书籍，它以实战为导向，通过具体的示例和详细的代码分析，帮助读者快速掌握Python爬虫技术的基础知识和应用技能。该书的内容涵盖了从零开始...

Python爬虫框架Scrapy教程完整版PDF: 《Python爬虫框架Scrapy教程》主要是针对学习python爬虫的课程，又基础的python爬虫框架scrapy开始，一步步学习到最后完整的爬虫完成，现在python爬虫应用的非常广泛，本文档详细介绍了scrapy爬虫和其他爬虫技术的...

Python爬虫入门教程.docx: Python爬虫入门教程是一份面向初学者的指导文档，旨在通过简单案例教授如何开始学习Python爬虫。文档内容涵盖了网络爬虫的基本概念、Python编程基础知识、HTML语言以及网络爬虫的基本原理和实践操作。以下是根据文档...

Python 爬虫入门与实战: 这是一篇详细介绍 Python 爬虫入门的教程，从实战出发，适合初学者。读者只需在阅读过程紧跟文章思路，理清相应的实现代码，30 分钟即可学会编写简单的 Python 爬虫。这篇 Python 爬虫教程主要讲解以下 5 部分内容...

教程课件-Python爬虫入门教程.docx: Python爬虫入门教程注重于为初学者构建扎实的基础，让他们能够理解爬虫的工作原理，并通过实际案例来掌握使用Python进行网络数据抓取和解析的技能。对于希望深入学习的同学，教程还指明了进一步学习的方向和资源。

python爬虫课件+代码.zip: 总之，"python爬虫课件+代码.zip"提供的学习资源涵盖了Python爬虫的基础到进阶，包括请求与响应处理、HTML解析、数据提取、数据存储等多个方面，结合实际代码操作，有助于你快速上手并掌握爬虫技术。在跟随路飞学城...

爬虫快速入门.pdf: 下面将详细介绍爬虫快速入门中的关键知识点。首先，了解爬虫的基础概念。网络爬虫（Web Crawler），有时也称为网页蜘蛛（Spider）、网络机器人（Bot），在某些社区中更常见的称呼是网页追逐者。它是一种遵循特定...

Python爬虫框架Scrapy教程《PDF文档》: 《Python爬虫框架Scrapy教程》主要是针对学习python爬虫的课程，又基础的python爬虫框架scrapy开始，一步步学习到最后完整的爬虫完成，现在python爬虫应用的非常广泛，本文档详细介绍了scrapy爬虫和其他爬虫技术的...

Global site tag (gtag.js) - Google Analytics