`
zhouxianglh
  • 浏览: 267551 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

python获取网站图片

阅读更多
# zhouxianglh 2013.05.03 python3.3
import urllib.request
from html.parser import HTMLParser
import re
import os
import shutil
import time

url = "http://www.douban.com/"
filePath = "D:\\temp"

# 读也HTML
urlContent = urllib.request.urlopen(url);
data = str(urlContent.read())
# 初始化文件目录
if  os.path.isdir(filePath):
#     os.removedirs(filePath)
    shutil.rmtree(filePath)
elif os.path.isfile(filePath):
    os.remove(filePath)
os.makedirs(filePath)
# 生成唯一文件名
intFlag = 0
def getTimeStr():
    global intFlag
    intFlag = intFlag + 1
    return time.strftime("%H%M%S") + str(intFlag)
# 解析HTML
# HTMLParser方式解析,这里HTMLParser类似于抽象类
class MyHtmlParser(HTMLParser):
    def handle_starttag(self, tag, attrs):
        '获取 img标签'
        if tag == "img" :
            for imageUrl in attrs:
                '获取src属性'
                if imageUrl[0] == 'src':
                    imageUrl = imageUrl[1]
                    imageUrl = re.sub("[\\\\']", "", imageUrl)
                    iamgeUrlArr = imageUrl.split("/")
                    imgFilePath = iamgeUrlArr[len(iamgeUrlArr) - 1]
                    try:
                        imgData = urllib.request.urlopen(imageUrl).read()
                        imgFilePath = filePath + os.sep + imgFilePath + getTimeStr() + ".jpg"
                        imageFile = open(imgFilePath, "wb")
                        imageFile.write(imgData)
                        imageFile.close()
                        print("下载文件", imageUrl, "成功,另存路径:" + imgFilePath)
                    except  :
                        print("****下载文件 ", imageUrl, " 出错:")
parser = MyHtmlParser()
# 解析HTML
parser.feed(data)
print("获取图片操作完成")

 

分享到:
评论

相关推荐

    python获取远程图片大小和尺寸的方法

    本文主要介绍如何使用Python获取远程图片的大小和尺寸,这里将涉及到的关键知识点包括Python的urllib2模块、cStringIO模块以及Pillow库(之前称为PIL库)。 首先,Python的urllib2模块是处理HTTP请求的工具包,它...

    python3读取cad.docx

    4. 读取 CAD 文件:使用 pyautocad 库读取 CAD 文件,获取文件中的尺寸、位置和其他信息。 5. 处理读取到的数据:使用 Python 语言处理读取到的数据,例如,比较尺寸、位置和其他信息。 三、 Python 读取 CAD 文件...

    文件夹下所有图片的读取以及显示(python程序)

    然后,我们可以使用 `matplotlib.image` 模块来读取图片。例如: ```python image = mpimg.imread(Image_i) ``` 这将读取图片 `Image_i` 并将其存储在 `image` 变量中。 最后,我们可以使用 `plt.imshow` 函数来...

    Python读取YUV文件,并显示的方法

    opencv可以读取的图片类型比较多,但大多是比较常见的类型,比如”.jpg”和”.png”,但它不能直接读取YUV格式的文件,需要通过python读取YUV文件,并进行相应的转换后,才能被opencv读取,并进行后续相应的处理. ...

    python获取图片颜色信息的方法

    在Python中获取图片颜色信息主要依赖于PIL(Python Imaging Library,现在称为Pillow)模块。这个库提供了一种方法来操作和处理图像数据,包括获取像素的颜色信息。获取图片颜色信息的过程分为几个步骤,本文将详细...

    python3 网站图片爬虫

    Python3 网站图片爬虫是一种利用编程技术抓取并下载互联网上的图片资源到本地计算机的方法。在Python中,实现这一目标主要依赖于几个关键的库和概念,包括requests、BeautifulSoup、re正则表达式以及文件操作等。...

    python从网络读取图片并直接进行处理的方法

    ### Python从网络读取图片并直接进行处理的方法 在Python编程中,经常需要处理各种多媒体文件,其中图像处理是一项常见的需求。特别是在Web开发领域,有时我们需要直接从网络上获取图片并立即对其进行处理,例如...

    Python操作MySQL数据进行图片存取操作

    然后,我们编写一个函数img_read_store,该函数用于读取图片,并将图片存储到数据库中。在函数中,我们首先建立数据库的连接,并获取游标对象。然后,我们遍历图片文件名,使用二进制的方式打开图片文件,并将读取的...

    python使用PIL库读取图片的像素值

    Python 使用 PIL 库读取图片的像素值 本文主要介绍了如何使用 Python 的 PIL 库读取图片的像素值,以便在游戏开发中删除不需要的透明像素。通过使用 PIL 库,我们可以获取图片的像素值,然后遍历整个图片像素,找出...

    python对图片或者文本实现批量重命名

    python对图片或者文本实现批量重命名,文本数据或者图片数据都可以。代码简单易懂。

    使用python将ppt导出成图片

    1、双击安装python, 安装完成后将C:\Python27;C:\Python27\Scripts;添加到环境变量; 2、安装setuptools,解压setuptools-27.2.0.tar.gz后运行python setup.py install; 3、安装pywin32-220.win-amd64-py2.7.exe; ...

    python实时获取微信聊天信息源码

    用于实时获取微信聊天信息,支持最新版微信PC客户端3.7以上版本. 基于Python3.6及以上版本

    利用python对图片进行无损压缩

    2. **打开图片**:使用`Image.open()`函数读取图片文件。 ```python image = Image.open("原始图片路径") ``` 3. **查看图片信息**:在压缩之前,我们可以查看图片的尺寸、模式等信息。 ```python print(image....

    python开发 自用 图片去重工具

    在这个项目中,开发者可能使用了Python的图像处理库,如PIL(Python Imaging Library)或OpenCV,这些库提供了读取、处理和比较图像的能力。通过计算两张图片的哈希值或者使用结构相似度指数(SSIM)等方法来判断...

    python 批量处理图片程序

    本程序的目的是实现对文件夹内所有图片的自动处理,包括读取图片信息并将其保存到Excel表格,以及对图片进行重命名。下面我们将深入探讨这个主题。 首先,我们需要了解Python中用于处理图片的基础库,如PIL(Python...

    Python爬虫获取网络图片.zip

    在本主题"Python爬虫获取网络图片"中,我们将深入探讨如何使用Python编程语言来下载网络上的图片资源。以下是对这个话题的详细阐述: 1. **Python基础知识**:首先,你需要对Python编程有一定的了解,包括变量、...

    浅谈Python3识别判断图片主要颜色并和颜色库进行对比的方法

    这个过程中,主要利用了PIL库的Image模块来读取图片并进行裁剪、转换等操作。代码中提到的`rgb_to_hsv`函数用于将RGB颜色转换为HSV颜色,而`getcolors`函数则用于统计图像中各个颜色的频次。 第二种方案则使用了...

    Python实现PDF图片文件压缩

    1. **读取PDF**:使用PyPDF2库打开PDF文件,获取每个页面的信息。 2. **提取图片**:利用PDFMiner或其他解析工具解析PDF,找出包含图像的数据块。 3. **解码图像**:将PDF中的图像数据解码为PIL可以识别的格式。 4. ...

    使用python 对验证码图片进行降噪处理

    # 打开文件夹中的图片 image=Image.open('./Img/'+str(i)+'.jpg') # 灰度图 lim=image.convert('L') # 灰度阈值设为165,低于这个值的点全部填白色 threshold=165 table=[] for j in range(256): if j<

    python爬虫获取某网站图片

    使用python语言批量获取某一图片网站的图片,程序功能包括html页面获取、正则表达式匹配、图片下载等。

Global site tag (gtag.js) - Google Analytics