`
xly1981
  • 浏览: 146599 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

BeautifulSoup获取股票信息

阅读更多
获取全量股票ID
import urllib.request
import requests
from bs4 import BeautifulSoup

def getAllstockId():
    url = "https://hq.gucheng.com/gpdmylb.html"
    page_info = requests.get(url)
    page_info.encoding = 'utf-8'

    soup = BeautifulSoup(page_info.text, 'html.parser')  # 文档对象
    # print(soup.text)
    list = []
    for k in soup.find_all('section', class_='stockTable'):
        # print(titlestr)
        for b in k.find_all('a'):
            titlestr = b.text.split('(')[1].split(')')[0]
            list.append(titlestr)
    return list


获取股票明细加写表
import urllib.request
import requests
from bs4 import BeautifulSoup


def getgaoguanInfo(params):
    url = "http://stock.jrj.com.cn/share,"+params+",ggry.shtml"
    page_info = requests.get(url)
    page_info.encoding = 'gbk'

    soup = BeautifulSoup(page_info.text, 'html.parser')   #文档对象
    title = soup.find("title")
    titlestr = title.text.split('(')[0]
    list = []
    with open('d:/a.txt', 'a') as f:
        for k in soup.find_all('table',class_='tab1'):
            for j in k.find_all('tr'):
                l = titlestr+'|'+params
                k = 0
                for t in j.find_all('td'):
                    k=k+1
                    if k == 8 :
                        l = l
                    else:
                        l = l+"|"+t.text
                    list.append(l)
                if len(l)>20:
                    f.writelines(l+'\n')
    f.close()


循环调用

from webcrawler.spilder import getgaoguanInfo
from webcrawler.getstockid import getAllstockId


list = getAllstockId();

for k in list:
    print(k)
    getgaoguanInfo(k)
分享到:
评论

相关推荐

    获取东方财富股票的详细信息(python爬虫)

    接着,编写Python代码来获取股票信息。首先,我们需要构造目标URL,通常是股票代码加上特定的API路径。例如,获取股票"600519"(贵州茅台)的详细信息,URL可能是`...

    获取新浪股票信息的代码

    在IT行业中,获取实时股票信息是一项常见的需求,特别是在金融数据分析、投资决策支持和大屏展示等领域。本示例主要关注如何通过编程方式从新浪财经获取股票数据。新浪作为国内知名的财经信息提供平台,提供了丰富的...

    获取股票信息

    在IT行业中,获取股票信息是一项常见的任务,尤其对于金融数据分析和投资决策支持至关重要。本教程将专注于使用Python编程语言从新浪财经接口获取实时和历史的股票数据。新浪提供了丰富的股票API,可以方便地通过...

    基于Python爬虫的股票信息爬取保存到文件

    这个设计使用了Python语言,特别是Python的爬虫技术,展示了如何从股票信息网站获取实时或历史数据,并将这些数据整理为结构化的表格格式,以便于分析和进一步处理。 首先,Python爬虫是通过编写特定的代码来模拟...

    Python项目开发实战_网络爬虫批量采集股票数据保存到Excel中_编程案例实例课程教程.pdf

    对于每个股票代码,可以编写第二个脚本来爬取具体的数据,这可能涉及到访问每个股票详情页面并解析页面内容,提取如开盘价、收盘价、成交量等股票信息。这些信息同样可以使用正则表达式或更复杂的HTML解析库如...

    Python 读取通信达股票数据

    接下来,`getstockdata.py`可能是一个脚本,用于从通信达或者其他数据源获取股票数据。这可能涉及到网络请求和数据解析。Python的`requests`库可以用来发送HTTP请求获取数据,而`BeautifulSoup`或者`xml.etree....

    Xpath、BeautifulSoup、JsonPath三种解析方式

    实战练习可以尝试从淘票票网站抓取股票信息。 2. BeautifulSoup BeautifulSoup是Python的一个HTML解析库,提供简单易用的接口来解析HTML和XML文档。 - 安装:`pip install bs4` - 创建对象:服务器响应文件 `soup ...

    Python从雪球爬取股票信息爬虫,获取A股总市值、总资产、总利润、市净率、净资产收益率

    在Python编程领域,数据爬取是一项重要的技能,尤其在金融数据分析中,获取实时或历史的股票信息对于投资决策至关重要。本教程将详细讲解如何利用Python从雪球网站(Xueqiu.com)爬取A股市场的关键数据,如总市值、...

    Beautiful_Soup_中文文档

    它使得从网页中提取信息变得简单,无论是获取新闻文章、天气预报还是股票报价,都可以通过BeautifulSoup来简化这个过程。 除此之外,BeautifulSoup还提供了高级主题,如使用正则表达式处理糟糕的数据,这允许开发者...

    股票列表的HTML代码和爬取结果.rar

    这里,`股票信息.txt`很可能就是这样的数据集合,其中每行代表一只股票的关键信息。可以使用Python的内置`csv`库或第三方库如`pandas`来读写这种数据。 在实际应用中,还需要注意反爬策略,比如设置合理的延时避免...

    金融界网站股票信息爬取,输入日期,对金融界页面股票股票进行爬取并存储进数据库

    例如,向金融界网站发送GET请求,获取指定日期的股票信息页面。代码可能如下: ```python import requests url = "http://stock.jrj.com.cn/tzzs/zdtwdj/zdforce.shtml" params = {"date": "2022-01-01"} # ...

    股票爬虫,股票爬虫及数据分析,Python

    7. **数据可视化**:使用matplotlib或seaborn库将分析结果可视化,更直观地展示股票走势、波动性等信息。例如,可以绘制折线图展示股价变化,柱状图显示涨跌频率,箱型图反映数据分布等。 8. **实时数据爬取**:...

    Python 爬取股票数据源码实现方案

    在Python编程语言中,爬取股票数据是一种常见的任务,尤其对于数据分析、投资研究以及金融建模的从业者来说,这是获取实时或历史股票信息的重要手段。本实现方案将深入探讨如何利用Python来爬取股票数据,并提供相关...

    完整版精品Python网络爬虫教程 数据采集 信息提取课程 12-实例4-股票数据定向Scrapy爬虫(共23页).pptx

    在课程中,我们将结合实际案例,学习如何使用BeautifulSoup来解析股票信息。 在掌握了基础技能后,我们将进入实战项目阶段,包括中国大学排名爬虫、淘宝商品信息定向爬虫以及股票数据定向爬虫。其中,股票数据定向...

    新浪网股票数据抓取以及存储

    新浪网作为知名的财经信息平台,提供了丰富的股票信息,包括股票代码、价格、成交量等。我们可以使用Python的requests库来发送HTTP请求,获取网页HTML内容,再用BeautifulSoup等解析库解析HTML,提取所需数据。 接...

    python开发股票爬虫

    本项目旨在利用Python语言实现一个能够自动爬取股票信息并将其存储到MySQL数据库中的系统。 首先,我们需要了解Python中的网络爬虫框架。其中最常用的是BeautifulSoup和Scrapy。BeautifulSoup适合简单的网页解析,...

    requests爬取股票业绩报告

    在金融商贸领域,数据的重要性不言而喻,特别是在股票投资中,及时获取并分析公司的业绩报告是决策的关键。本主题将深入探讨如何使用Python的requests库来爬取股票的业绩报告,以帮助投资者做出明智的选择。 首先,...

    雪球股票信息超级爬虫.zip

    雪球股票信息超级爬虫是一种专门用于从雪球网站抓取股票数据的自动化工具。爬虫在信息技术领域,特别是数据分析和大数据处理中扮演着至关重要的角色。它允许开发者高效地收集大量网页信息,如股票价格、交易量、用户...

    py123_Excel股票_EXCELWIND_python爬股票ROE_python_万得信息爬取_

    雪球网是一个投资者社区,包含丰富的股票信息。Python的`requests`库可以用来发送HTTP请求,`BeautifulSoup`或`PyQuery`等库用于解析HTML文档,提取所需数据,如股票代码、价格、ROE等。 "分析其ROE等指标"意味着...

    YiJing.rar_python 股票_python股票_stock python_股票_股票爬取

    3. **HTML解析**:股票信息通常嵌在网页的HTML代码中,使用`BeautifulSoup`或`lxml`能解析并提取所需数据。例如,找到特定的HTML标签,如`<td>`或`<div>`,根据class或id属性来定位股票代码、价格、成交量等信息。 ...

Global site tag (gtag.js) - Google Analytics