源码如下 :保存成utf-8 bd.py 文件
代码如下:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import sys
import urllib ,urllib2
import re
def baidu(w):
url= "http://www.baidu.com/s?"
values = {
"w":w.encode('gbk','ignore')
}
data = urllib.urlencode(values)
newurl = url + data
response = urllib2.urlopen(newurl)
the_page = response.read().decode('gbk','ignore')
return the_page
def ana(data,mysite):
o = re.compile("href=\"(.+?)\"")
f = o.findall(data)
line = 1
for ff in f:
if not re.search("baidu",ff) and not re.search("^s\?",ff) and re.search("^http:\/\/",ff):
if re.search(mysite,ff):
print "* " ,line ,ff
else:
print line ,ff
line += 1
if __name__ == "__main__":
mysite = sys.argv[2]
data = baidu(sys.argv[1].decode('utf-8'))
ana(data,mysite)
用法 python bd.py "关键字" 我的域名部分 :
例:
代码如下:
python bd.py "vbs" "jb51.net"
分享到:
相关推荐
3. **数据库设计**:系统需要存储关键词、对应的排名数据以及时间戳等信息,可能需要设计一个关系型数据库(如MySQL)或者NoSQL数据库(如MongoDB)来存储这些数据,便于后续查询和分析。 4. **数据抓取策略**:...
Python开发者可以使用各种开发工具,包括IDLE(Python自带的一个简单IDE)、PyCharm、VSCode、Sublime Text等,这些工具提供了代码高亮、自动补全、调试、版本控制等特性,帮助开发者更高效地编写和维护代码。...
基于python开发的检测网站死链程序 设计一个系统,自动完成对于手机搜狐(http://m.sohu.com/ )系统可靠性的检测。具体要求: 定时递归检测所有m.sohu.com域名的页面以及这些页面上的链接的可达性,即有没有出现不...
这个程序的主要功能是遍历指定的文件路径下所有的Word文档,对每个文档进行内容扫描,找出包含用户输入的一个或多个关键字的文档。这种批量搜索能力对于需要在大量文档中快速定位特定信息的用户来说非常有用,比如在...
Python 是一个功能强大且灵活的编程语言,具有许多有用的关键字。这些关键字是 Python 语言的基础,理解这些关键字是编写高效代码的关键。本文将详细介绍 Python 中的关键字,包括 False、True、class、finally、is...
Python 中有 33 个关键字,这些关键字是 Python 程序的基础组成部分,了解这些关键字的用法是 Python 编程的基础。 1. False:布尔类型 Python 中的 False 是布尔类型的其中一个值,表示假或否定。它与 True 相对...
《Python3程序开发指南》是一本深受欢迎的Python编程教程,其第二版更是结合了丰富的实例和课后习题,帮助读者深入理解Python语言的核心概念和技术。这些源代码提供了实践操作的机会,无论是在Windows还是Linux操作...
深入学习Python 程序开发
在 Python 编程语言中,pass 关键字是一个特殊的占位符,它可以在代码中使用,以避免在开发过程中出现错误。下面我们将详细介绍 pass 关键字的使用和应用。 一、pass 关键字的作用 pass 关键字的主要作用是占位,...
8.5_必须参数与关键字参数|Python函数|Python3.8入门_&_进阶_&_原生爬虫实战完全解读
python程序设计PPT(浙江大学python课件)对应慕课该课程PPT。 包含9章内容: python语言介绍; 语句; 字符串,列表,元组; 集合,字典; 函数,命名空间和作用域; 文件读写操作; Web应用; 网络爬虫;等
例如,第一个程序题要求读取文件内容,通过特定规则(字母向前移动一位)加密后写入新文件。第二个程序题需要设计一个Circle类,包含半径属性和计算周长、面积的方法。这些题目旨在考察Python的基础知识和实际应用...
Tesseract OCR是一个常用的开源OCR引擎,它可以被Python通过 pytesseract 库调用。这个项目可能就是使用类似的方法来识别图像中的文字,从而实现关键字查找。 4. **关键字查找**:关键字查找通常涉及到文本处理和...
ABAQUS PYTHON二次开发攻略
《Python程序设计与算法基础教程(第二版)》是一本深入浅出的教材,由江红和余青松两位专家撰写。该书详尽地涵盖了Python编程语言的基础知识,包括语法、算法和实际操作,旨在帮助初学者快速掌握Python编程。书中...
本书《Python 3程序开发指南(第二版)中文版电子书》由著名Python程序员Mark Summerfield所著,旨在向读者展示如何充分利用Python 3的特性来编写高效和实用的代码。本书详细涵盖了Python语言的多个方面,包括但不...
tf-idf作为文档关键字提取的常用算法,python将tf-idf封装了对象,可直接使用
在Python编程语言中,关键字参数是函数调用时的一个强大特性,它允许我们通过参数名来指定传递给函数的值,而不是依赖于参数的位置。这种特性使得代码更易读,也更灵活,尤其在处理多个参数或者参数含义不明显的情况...