`

python爬虫入门(解析)

 
阅读更多

 根据上一篇的转载进行的总结:

 

python爬虫的主要步骤

1.访问网站,获取html数据

2.读取html数据,解析数据,取出你想要的值

   解析数据使用beautifulsoup

 

解析数据的步骤详解:

1. 用beautifulsoup将html数据解析成一个对象

    

soup = BeautifulSoup(html_text, "html.parser")  # 创建BeautifulSoup对象

 

2.通过soup对象,获取标签内容

    myHead=soup.head    #获取第一个<head>标签

    myBody=soup.body     #获取第一个<body>标签

    myBody=soup.b           #获取第一个<b>标签

 

    myPara= day.find_all('p')      # 获取所有p标签

 

3.通过标签对象,获取文本

   text=myPara.string

 

4.div嵌套div,不好定位,就用find_all获取

 

data = body.find_all('div', {'class': 'weather_li_left'})
print(data)

 

 5.获取标签下的所有 <li> 标签,并且输出子标签的文本

     

child=parent.find_all('li')
for text in child:
    print(text.string)

 

 

 

 

 

 

 

分享到:
评论

相关推荐

    Python爬虫入门教程:超级简单的Python爬虫教程.pdf

    ### Python爬虫入门教程知识点详解 #### 一、理解网页结构 在进行Python爬虫开发之前,首先要了解网页的基本构成。网页通常包含三个主要部分:HTML(超文本标记语言)、CSS(层叠样式表)以及JavaScript(一种常用...

    Python爬虫入门:如何爬取招聘网站并进行分析

    Python爬虫入门知识点详细解析: 一、Python爬虫概念与应用 网络爬虫是按照一定的规则,自动抓取互联网信息的程序或脚本。它可以模拟用户浏览网页的行为,对网页内容进行提取、保存。Python爬虫由于其代码简洁、库...

    Python爬虫入门到实战 (二花) PDF版

    总的来说,Python爬虫的入门到实战是一个逐步深入的过程,需要从基础语法开始,逐步学习网络请求、网页解析、数据提取等技能,并在实际的项目中不断实践和提高。通过学习和应用Python爬虫技术,可以有效地从互联网上...

    Python 爬虫入门的教程之Beautiful Soup解析

    Python 爬虫入门教程之 Beautiful Soup 解析 本教程主要讲解 Python 爬虫入门知识,通过 Beautiful Soup 解析网页,抓取中国旅游网首页信息,了解网页结构,使用 requests 库抓取网站数据,并进行数据清洗和组织。 ...

    "玩转Python爬虫——入门与实践"课程源码

    在“玩转Python爬虫——入门与实践”这门课程中,你将深入学习到Python爬虫的基础知识和实战技巧。Python爬虫是数据采集的重要工具,尤其在大数据时代,爬虫技术对于获取网络上的非结构化信息具有举足轻重的作用。本...

    Python爬虫入门教程 90-100 凌晨5点的CSDN自动签到器,用Python爬虫干点闲事.zip

    综上所述,通过本教程,你不仅能学会编写Python爬虫,还能掌握网络请求、HTML解析、定时任务等多方面技能,为今后的Python编程之路打下坚实基础。而"demo.py"文件很可能是实现这一功能的示例代码,通过阅读和学习,...

    Python爬虫入门到精通

    ### Python爬虫入门到精通知识点概览 #### 一、Python爬虫概述 - **定义与应用领域**:网络爬虫(Web Crawler),又称网页蜘蛛、网络机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。在数据...

    Python爬虫入门教程:超级简单的Python爬虫教程.zip

    总的来说,这本“Python爬虫入门教程:超级简单的Python爬虫教程”将涵盖Python基础知识、HTTP请求、HTML解析、反爬虫策略和数据存储等多个方面,旨在帮助初学者快速掌握Python爬虫的基本技能。通过学习,你不仅可以...

    Python爬虫入门:基础知识解析.pptx

    总的来说,Python爬虫是一门综合性的技能,涵盖了网络通信、数据解析、数据处理等多个领域。掌握这些基础知识和技巧,将有助于在大数据时代有效地获取和利用网络信息,为企业决策提供强有力的支持。

    Python爬虫入门教程:超级简单的Python爬虫教程

    Python爬虫入门教程以实战为导向,通过学习网页结构、使用requests库抓取数据、解析HTML以及数据清洗,让初学者快速掌握基础的爬虫技能。理解这些基本概念后,你可以继续深入学习更复杂的爬虫技术,如处理JavaScript...

    Python爬虫入门.zip

    【Python爬虫入门】 在信息技术日新月异的今天,数据已经成为了一种重要的资源。Python作为一种简洁且功能强大的编程语言,因其丰富的库支持和易读性,成为了爬虫开发的首选工具。本资料包“Python爬虫入门.zip”...

    python 爬虫入门实例.zip

    Python爬虫,简而言之,就是使用Python编程语言来编写的网络爬虫程序。网络爬虫是一种自动化程序,能够在互联网上自动抓取并提取所需的信息。Python作为一种功能强大且易于学习的编程语言,特别适合用来编写爬虫。...

    Python爬虫框架Scrapy教程 完整版PDF

    《Python爬虫框架Scrapy教程》主要是针对学习python爬虫的课程,又基础的python爬虫框架scrapy开始,一步步学习到最后完整的爬虫完成,现在python爬虫应用的非常广泛,本文档详细介绍了scrapy爬虫和其他爬虫技术的...

    Python 爬虫入门与实战

    这是一篇详细介绍 Python 爬虫入门的教程,从实战出发,适合初学者。读者只需在阅读过程紧跟文章思路,理清相应的实现代码,30 分钟即可学会编写简单的 Python 爬虫。 这篇 Python 爬虫教程主要讲解以下 5 部分内容...

    Python爬虫入门教程.docx

    ### Python爬虫入门教程知识点详解 #### 一、网络爬虫基本概念 网络爬虫,又称网络蜘蛛或网络机器人,是一种自动抓取互联网信息的程序。其主要工作流程包括: 1. **根据URL获取HTML数据**:即通过指定的URL地址...

    python爬虫课件+代码.zip

    总之,"python爬虫课件+代码.zip"提供的学习资源涵盖了Python爬虫的基础到进阶,包括请求与响应处理、HTML解析、数据提取、数据存储等多个方面,结合实际代码操作,有助于你快速上手并掌握爬虫技术。在跟随路飞学城...

    Python爬虫入门必会

    总结起来,Python爬虫入门需要掌握基础的HTTP/HTTPS协议知识,理解反爬机制及对策,熟悉requests库的使用,以及学会使用BeautifulSoup和XPath进行数据解析。通过实践和学习,你可以构建起自己的Python爬虫系统,高效...

    python爬虫可以做什么?python爬虫入门教程有哪些?.docx

    - **《Python爬虫入门》系列教程**:适合完全没有编程基础的新手。主要内容包括: - **综述**:介绍爬虫的基本概念及其应用场景。 - **爬虫基础了解**:讲解网络请求的基本知识,如HTTP协议、URL结构等。 - **...

Global site tag (gtag.js) - Google Analytics