`
nickdine
  • 浏览: 45848 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

分析页面 提取email地址 程序

阅读更多
下载一个论坛的帖子 存有很多email地址 类似那种 给email 散书的那种帖子就可以 到d盘
比如  http://topic.csdn.net/t/20020908/19/1006665.html
emailPage.html


package i.tommy.test.Test;

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class emailGetTest
{

	public static void main(String[] args)
	{
 		try
		{
			BufferedReader reader = new BufferedReader(new  FileReader("D:\\emailPage.htm"));
		    String line = "";
		    while ((line = reader.readLine()) != null)
			{
				  parseLine(line);
			}
		} catch (FileNotFoundException e)
		{
			e.printStackTrace();
		} catch (IOException e)
		{
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}

	private static void parseLine(String line)
	{
		Pattern pattern=Pattern.compile("[\\w[._]]+@[\\w[._]]+\\.[\\w]+");
		Matcher m=pattern.matcher(line);
		while (m.find())
		{
			System.out.println(m.group());
		}
	}
}



结果

yue621@sohu.com
wr_van@163.com
clingsii@sina.com
mcl525@163.com
wgzd5@xinhuanet.com
windfly523@sina.com
p4nt1um@sohu.com
eshower@sina.com
ntqgh@sohu.com
cncaoyna@hotmail.com
handsome1234@263.net
tllove@263.net
wangrui666cn@yahoo.com.cn
sdx_none@163.com
lcl101@163.com
eureka0891@163.com
xdyanzg@chinaren.com
iamathere@yahoo.com
liye_2000_0@sina.com
bigsnow2000@163.com
imani@163.com
pdy77@163.com
ccch@vip.sina.com
petwen@21cn.com
vvyjp@163.com
wzmb_wll@163.com
jb81613@hotmail.com
oliver@cqeway.com
jyd119@163.com
xufengxufeng@etang.com
lc_peng@yeah.net
happyboy221@china.com.cn
wwf_hl@cmmail.com
kbsoft@etang.com
bush@tclking.com
hdd618@hotmail.com
bo_oy@163.com
marsbaty@163.com
unluckybaby@hotmail.com
godofbruce@yahoo.com.cn
gujoy@spaceon.com
791537@163.com
mnetease@163.net
ccwangtao@sohu.com
gemway@btamail.net.cn
huzigege@163.net
wenky2@163.com
martin@whidc.com
ybjhyr@163.com
ybjhyr@163.com
ybjhyr@163.com
byle82@163.com
haojuliu@sina.com
zou_chao@cctk.net
yuyes@163.com
taojiebin@21cn.com
lwh1999@hotmail.com
luosha1980@hotmail.com
19799197zp@163.com
seairll@163.com
xu_siyu@21cn.com
mildv7@163.com
youso@sohu.com
vcsdk@163.com
rolandluo@163.net
hua315@163.com
zhou.lian@chinatmn.com
wolfsky1994@yahoo.com.cn
hillhero789@sina.com
clingsii@sina.com
radiowyg@yahoo.com.cn
ccwangtao@sohu.com
huangfaye@sina.com
feng.ww@163.com
yuds@vip.sina.com
liuhuashun@163.com
baijie606@163.com
sea@163.com
stu99@163.net
zaowei21@163.com
jawsy@yeah.net
jjsunbin2000@sina.com
youyuandirizi@sina.com
hotwang@963.net
angel_mine@163.com
fagn2000@sina.com
gsp396@2163.com
tccb@eyou.com
linux007@21cn.com
dalcon@vip.sina.com
athenaym@sina.com
yangjunzheng@163.net
zke21@yahoo.com.cn

哥下一步是不是要发垃圾邮件了?? 呵呵
分享到:
评论

相关推荐

    小程序-提取页面Email

    【小程序-提取页面Email】是一种实用的自动化工具,主要用于从网页中批量提取电子邮件地址。这个小工具由开发者自编,其主要功能是通过输入一个URL(种子链接)作为起点,程序会递归地访问该链接下的所有页面,查找...

    网页Email提取Asp程序源码

    网页Email提取Asp程序源码是一种用于从网页内容中抓取和提取电子邮件地址的Web应用程序。这个程序的核心功能是利用ASP(Active Server Pages)技术,分析HTML文档,识别并收集其中的电子邮件地址。在互联网营销、...

    小程序(在网页上找Email地址)

    根据给定的小程序标题“小程序(在网页上找Email地址)”及描述“这个程序的作用是在任何一个网页上面得到源码,并且找到Email地址”,我们可以总结出以下相关知识点: ## 小程序功能概述 该小程序主要功能是抓取...

    一键提取页面信箱,在线批量获取网页中邮件地址

    "一键提取页面信箱,在线批量获取网页中邮件地址"的技术是通过特定的程序或工具实现的,旨在自动化地从网页内容中识别并收集邮箱地址。本文将详细介绍这一主题,包括其工作原理、应用方法以及相关的asp源码。 首先...

    雨石Email地址搜索器

    《雨石Email地址搜索器》是一款基于易语言开发的实用工具,主要用于从互联网上抓取并提取Email地址。这款软件的出现,为那些需要大量Email数据进行市场推广、客户沟通或者数据分析的用户提供了便利。易语言是中国...

    Silverlight应用程序中如何获取ASP.NET页面参数

    接着,在Silverlight应用程序的启动事件`Application_Startup`中,我们可以从`StartupEventArgs`的`InitParams`属性中提取这些参数,并将它们赋值给用户控件的属性: ```csharp private void Application_Startup...

    NIH抓取Email

    这是Perl中的基本字符串操作,用于从HTML文本中提取Email地址。 4. **数据存储**:抓取到的Email地址可以被存储在文件(如“txt”文件)中,或者数据库或其他持久化存储中。 5. **错误处理**:处理可能出现的网络...

    extrator email

    标题中的"extrator email"指的是一个电子邮件提取工具,这类程序设计用于从网页或其他数据源中自动搜索并收集电子邮件地址。这种工具通常被网络营销人员、数据分析员或者任何需要大量有效电子邮件地址的人使用。电子...

    使用正则表达式抓取页面Email

    这个程序首先将HTML内容转换成纯文本,然后用正则表达式匹配出所有可能的电子邮件地址,并打印出来。需要注意的是,这种方法并不能保证100%准确,因为有些网页可能会使用JavaScript动态生成邮件地址,或者通过其他...

    Email正则效验效验

    这里首先通过`getElementById`获取页面上id为"email"的元素,然后读取该元素的值,并传递给`cheakEmail`函数进行验证。如果验证失败,则弹出提示信息。 #### 六、注意事项 虽然上述正则表达式能够覆盖大部分常见的...

    龙飞EMAIL搜集器

    《龙飞EMAIL搜集器》是一款专门用于从互联网上搜集电子邮件地址的工具,其核心功能是通过用户提供的任意网址,高效地遍历网页并提取出其中的邮箱信息。这款软件采用了多线程技术,大大提升了数据抓取的速度,使得在...

    极速Email搜索精灵3.1

    "极速Email搜索精灵3.1"通过爬虫技术,自动遍历这些页面,识别并提取出其中的邮箱地址。爬虫技术是搜索引擎的重要组成部分,它能够按照预设的规则自动抓取网页内容,而在这个应用中,它被用来获取特定的目标数据——...

    emailextractor:Chrome扩展程序,用于提取电子邮件地址

    要提取它们,必须满足页面上数据格式的特定条件: 数据必须驻留在表中。 每个表格行必须在其中一个单元格中包含一个电子邮件地址。 每个表格行必须包含一个带有选中复选框的单元格。 =)保罗,我知道了!指令npm ...

    php获取邮箱email好友

    // 跳转到授权页面 header('Location: ' . filter_var($client->createAuthUrl(), FILTER_SANITIZE_URL)); exit; } if ($client->isAccessTokenExpired()) { // 更新访问令牌 $refreshToken = $client->...

    电子邮件提取器「Email Extractor」-crx插件

    该工具将启动一个机器人,该机器人将访问请求的页面并提取在这些网页上找到的所有电子邮件地址 **自动保存:此功能将在您访问的所有页面上找到的所有电子邮件ID存储在云中。该插件从源代码中获取电子邮件ID,并且与...

    Email收集工具V3.4 绿色英文版eMailExtractor

    《Email收集工具V3.4 绿色英文版eMailExtractor》是一款专为电子邮件地址抓取而设计的应用程序,主要用于从互联网上的各种网页和资源中提取电子邮件地址。它以其高效、便捷的特性,在网络营销和邮件营销领域中颇受...

    web-email-extractor:.NET控制台应用程序,用于从通过CSV文件提供的一组网站的标记中提取所有唯一的电子邮件地址

    该应用程序扫描主页和直接子页面的所有标记,并通过使用正则表达式来标识电子邮件地址。 动机 作为自由开发人员,我一直需要新的潜在客户。 产生线索的一种方法是冷引线。 为此,我使用Google来确定相关企业的列表...

    Email Hunter-crx插件

    语言:English,русс...功能:-从访问的页面提取电子邮件-自动搜索-将收集到的电子邮件导出到文本文件并复制到剪贴板隐私权政策:https://docs.google.com/document/d/18F_ZZZlML8cE846l4gfPB81JUeLLMLTLtPZt5OsN2YA

    网页验证码提取工具

    一个用delphi写的 网页验证码提取工具,本工具是针对《赶集网(www.ganji.com)》的信息发布页面的验证码而写的,此演示版不能从网页里直接提取验证码,如有需要请与作者联系。QQ:309867165,email:xcplates@163....

    Get Email-crx插件

    当用户访问一个页面时,"Get Email-crx"会分析页面的HTML源代码,查找符合电子邮件地址格式的字符串(一般遵循标准的`username@example.com`结构)。它可能利用正则表达式或者更复杂的解析算法来定位和验证这些地址...

Global site tag (gtag.js) - Google Analytics