阅读更多

4顶
0踩

编程语言
如何使用Python和Google找到数以千计的Email地址

注:本文只是用来学习和探讨Python的技术实现,不推荐用做spam,否则后果自负。

下面就是实际代码,写的很精巧:

#!/usr/bin/python

import sys
import re
import string
import httplib
import urllib2
import re

def StripTags(text):
    finished = 0
    while not finished:
        finished = 1
        start = text.find("<")
        if start >= 0:
            stop = text[start:].find(”>”)
            if stop >= 0:
                text = text[:start] + text[start+stop+1:]
                finished = 0
    return text

if len(sys.argv) != 2:
        print “\nrsx.py : Find hundreds of e-mail adresses on Google.\n”
        print “\nUsage : ./rsx.py
\n”
        print “\nexemple: ./rsx.py gmail.com \n”
        sys.exit(1)

domain_name=sys.argv[1]
d={}
page_counter = 0
try:
    while page_counter <400:
        results = ‘http://groups.google.com/groups?q=’+str(domain_name)+’&hl=en&lr=&ie=UTF-8&start=’ + repr(page_counter) + ‘&sa=N’
        request = urllib2.Request(results)
        request.add_header(’User-Agent’,'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)’)
        opener = urllib2.build_opener()
        text = opener.open(request).read()
        emails = (re.findall(’([\w\.\-]+@’+domain_name+’)',StripTags(text)))
        for email in emails:
            d[email]=1
            uniq_emails=d.keys()
        page_counter = page_counter +10
except IOError:
    print “No result found!”+”"
page_counter_web=0
try:
    print “\n\n+++++++++++++++++++++++++++++++++++++++++++++++++++++”+”"
    print “+ Results:”+”"
    print “+++++++++++++++++++++++++++++++++++++++++++++++++++++\n\n”+”"

    while page_counter_web >400 :
        results_web = ‘http://www.google.com/search?q=%40′+str(domain_name)+’&hl=en&lr=&ie=UTF-8&start=’ + repr(page_counter_web) + ‘&sa=N’
        request_web = urllib2.Request(results_web)
        request_web.add_header(’User-Agent’,'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)’)
        opener_web = urllib2.build_opener()
        text = opener_web.open(request_web).read()
        emails_web = (re.findall(’([\w\.\-]+@’+domain_name+’)',StripTags(text)))
        for email_web in emails_web:
            d[email_web]=1
            uniq_emails_web=d.keys()
        page_counter_web = page_counter_web +10

except IOError:
    print “No results found!”+”"
for uniq_emails_web in d.keys():
    print uniq_emails_web+”"


代码编写好了,你可以这样运行,假设你给文件取名为:rsx.py

python rsx.py gmail.com
来自: catswhocode.com
4
0
评论 共 3 条 请登录后发表评论
3 楼 chen_gengjia 2011-03-07 17:09
request = urllib2.Request(results)  这句根本不能执行成功

直接用python模块去向google发出请求,会陷入重定向循环,不会给你返回搜索数据的!一般要用它的API才行
2 楼 xiaoaiwhc 2010-07-09 13:09
用了正则表达式?
1 楼 hellas 2008-06-30 14:03
一看就知道是python初学者写的程序,StripTags函数完全可以更简单的:
def StripTags(text):
    return re.sub(r'<[^>]*>', '', text)

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • 【外挂分析】SystemCheats外挂分析报告

    【外挂分析】SystemCheats外挂分析报告

  • 针对灰产外挂的分析与研究

    分析外挂样本一般的步骤 对外挂样本进行简单的信息分析。 分析还原外挂样本具体功能实现方式。 分析外挂样本的反检测功能。 1. 对外挂样本进行简单的信息分析 查看文件属性,灰产及外挂的标配语言 “易语言” 通过Exeinfo Pe查壳工具进行对外挂样本查壳,看看发现是没加壳的应用程序。(心里突然咯噔了下,收费的外挂竟然都不做点保护,不对自己的程序负责,就直接把程序在市场上裸奔了) 2.分析还原外挂样本具体功能实现方式 2.1 网络验证功能 外挂一

  • 游戏安全02:手游外挂简单分类和实现原理介绍

    文章目录一、外挂分类1)辅助版(需要依赖客户端,不能独自生效),根据作用范围分为:(1)专用插件:so、dylib(2)通用工具:内存修改器、变速器、按键精灵、模拟器、抓包工具2)破解版:脱机挂、受损客户端二、外挂实现原理1)辅助版本外挂实现原理(基于游戏客户端动态修改游戏数据类型)(1)专用插件(2)通用工具2)破解版外挂实现原理(预先静态修改后的独立游戏客户端,可以分为:逆向分析游戏协议、对游戏客户端修改后实现的游戏破解版,可以根据修改后的客户端数据的不同分为逻辑代码和数据资源)(1)逻辑代码(2)数据

  • 让人头疼的吃鸡外挂,一起来逆向分析一波

    最近在浏览某网络论坛,看到一款刺激战场的吃鸡外挂软件下载量很高,出于对游戏外挂样本的敏感及逆向的专注,就从论坛上下载一个样本,并进行对该游戏外挂样本,深度功能分析及还原破解的逆向实践,主要从外挂样本的功能表现,样本的基础属性、样本的实现功能、样本的验证功能破解进行实践。 基本属性 (分析这些未知的软件切记得在虚拟机环境下进行) 启动游戏辅助样本后,从表面上来看功能确实很强大,透视、距离、显血、自瞄这些都是玩家想用游戏辅助的一个痛点。但这游戏辅助功能都有实现吗?有这么强大了吗? 结合Exeinfo

  • 对一游戏外挂浅浅的分析

    前言:夜阑静,已是凌晨2:11分,明天还要实习,但这几天在研究一个网页游戏的辅助,也分享下自己的一些笔记和心得,虽然我是个大菜鸟。 真的是很遗憾,今天花了6,7个小时分析,基本上每一行都写了注释,后来分析了另外一个程序,注释和断点都清除了。下次一定要保存好!大家凑合着看吧T T 1.查壳 PEID--ASPack 2.12 -> Alexey Solodovnikov

  • 一个外挂的简单分析

    上周末突然有个外挂,逃过了反挂检测,竟然是全图外挂, 通过IDA分析发现 一个virtualQuery函数,   于是在od中加载,算了一下该函数相对模块首地址的位置断下该函数,相对基址的偏移为0xB55E,于是断下   发现只要打勾,反复循环间隔500ms 都会走此函数,于是判断改地址是 外挂修改游戏的信息的函数   继续推测: 通过windbg:来断下改地址,通

  • 编写外挂完全攻略

    一、先说一下写一个外挂需要什么条件  1、熟练的C语言知识  目前的外挂大部分都是用BC或者是vc写的,拥有熟练的C语言知识是写外挂的基本条件  2、具有很强的汇编基础 一般游戏都不可能有原代码的,必须*反汇编或者跟踪的办 法来探索其中的机理 ,所以有强的汇编基础也是必不可少的条件

  • 一文带你了解对游戏外挂的逆向分析的详细步骤。

    游戏外挂样本逆向详细步骤.

  • 手游辅助制作原理和学习思路

    手游辅助制作原理和学习思路随着网络游戏不断发展 越来越多的人从事手游开发,现在的游戏公司为了能更好的有市场,不断提高游戏质量和服务,手游辅助由此诞生。很多人都想做手游辅助,其中的原理大家都知道。1.目前手游辅助比网络游戏少,有市场卖价2.它是一项新的技术,比较有兴趣学习`手游辅助制作学习思路第一步:手游使用工具择取首先我告诉大家如何学会手游辅助,根据手游辅助制作方法描述,手游属于静态互联网游戏,它...

  • 手游外挂入侵(一)某助手加速器实现原理探究

    - 简介下载ghzs商店,搜索相应游戏即可下载,下载后安装运行,游戏中就会多出一个加速工具助手。实现过程探究打开游戏包查看发现dex中加入了com.gh.XXX相关的类,应该是将Dex重打包,加入了他们的SDK代码,然后他们SDK会加载cydia substrate框架的inline hook动态库和根据游戏定制的加速器动态库。原理分析① Inline hook libmono.so中的两个方法

  • 全面的学习 游戏外挂 编程开发 视频教程+源代码

     有游戏分析,CALL基址分析,封包分析,外挂制作 ,逆向调试,过驱动保护等课程课程大网如下  详情见:郁金香外挂教学网:http://bbs.yjxsoft.net   VC++外挂教程大纲(另有delphi版 大致相同) 程安排,暂定,有可能会实时修改 开发环境:VC++6.0 分析工具

  • 常见游戏外挂分类及原理概述

    外挂基本概念要理解外挂,首先需要理解网络游戏的数据流。这里所说的数据流定义为游戏本地客户端与游戏后台服务器之间的数据流通。一个数据的产生需要玩家做出对应的操作,然后经过网络传输同步到服务器后台,服务器后台再处理过后再通过网络反馈给玩家。在此基础上,可以将广义上的外挂定义为:非法窜改游戏数据流的方式。非法指的是没有法律许可,而窜改的方式包括增,删,查,改。狭义上的外挂就是针对数据链路上的节点的修改。比如窜改客户端的“内挂”,窜改网络数据的“脱机挂”,窜改游戏后台服务器的“私服”。内存挂实现原理内挂的目标即..

  • SnappyCam 技术分析

    ------------------------------------------------- 把自己在【知乎】上的回答先贴过来,有空再完善。 -------------------------------------------------- 经过一天的分析,SnappyCam是用了videoDataOutput输出视频,然后保存Frame,拍照的声音是snappyCam自己播放的(可...

  • 网络安全技术分析

    2019独角兽企业重金招聘Python工程师标准&gt;&gt;&gt; ...

  • 外汇技术分析的三个误区

    在外汇交易中关于技术分析的书籍可谓琳琅满目,既有畅销的国外书籍和教材,也有国内投资者自己编撰总结的经验。归根结底,这种现象反映了人们的一种集体潜意识,即认为外汇技术分析在投资中的地位是相当重要的。   在外汇交易中技术分析...

Global site tag (gtag.js) - Google Analytics