`

[简单教程]java下扫号器的制作

阅读更多

帮人做的,后来因为一个dll经常崩溃的问题他不要~~那白做就白做了吧 把过程分享一下

 

流程不难:

导入一堆账号密码文件(这边用了txt 其实用数据库好点 可以做些标识) 然后模拟网页登陆 登录成功后获取需要的数据并保存.

 

这边需要的工具:

  • httpcomponents:用于网络连接
  • java4Less:用于验证码识别
  • jsoup:用于提取网页内数据

java4Less的介绍在上一篇文章中有:

http://fair-jm.iteye.com/blog/1914076

 

 

流程:

 

获取表单详情

这个比较简单。登陆,一般就是提交表单登陆,我们只要获得到表单的数据和提交地址就可以提交。

这里有两个常用的方式:

1,用浏览器的开发者工具

2,用wireshark抓包 分析

一般第二种比较好用,因为能抓到所有的数据,易于分析。

但这边以1用chrome为例:

打开表单提交的地址(这边以http://passport.cdcgames.net/account/login.aspx 为例了)

打开chrome的开发者工具 选中network页

乱填点数据,然后提交

查看数据:



以上是表达提交的详情了

内容很简单 以上需要注意的内容也标明了 还有一个状态码也需要注意 特别是302的状态码(要获取头中的Location进行再次跳转才可以)

 

用现有的用户名-密码文件不断刷就可以了。验证码用java4Less解决。

 

判断是否登录成功就判断返回的字段就好了,这个网站比较简单,登录成功状态码是302,得到之后再发一次请求就可以获取到了。

 

这边要注意一个问题:需要在客户端保存状态,也就是HttpClient的cookiestore要被保存。 

在获取验证码和登录成功后,如果用了新的HttpClient对象 那么一定要把旧的对象的cookiestore给他,不然就会失败(浏览器实现了这些细节,所以不需要担心登陆之后跳转显示未登录的情况(但其实我在用一些状态极差的网络中常常遇到这样的情况....))。

 

涉及到在不同的网页获取的话也只要设计一下cookiestore就行了,这样就不会出现未登录的提示。

 

连接的工具类:

把连接的工具类发一下 不难:

package test.cc.util;

//省略导包

/**
 * http的操作类
 * 
 * @author cc(fair_jm)
 * http://fair-jm.iteye.com
 */
public class HttpUtil {

	private String path = "";
	private String action = "";

	private CookieStore cookieStore = null;

	public HttpResponse sendGetTo(Map<String, String> map, String encoding)
			throws Exception {
		StringBuffer sb = new StringBuffer();
		for (Map.Entry<String, String> entry : map.entrySet()) {
			BasicNameValuePair bv = new BasicNameValuePair(entry.getKey(),
					entry.getValue());
			sb.append(entry.getKey());
			sb.append("=");
			sb.append(entry.getValue());
			sb.append("&");
		}
		if (sb.length() > 0) {
			sb.substring(0, sb.length() - 1);
		}
		HttpGet get = new HttpGet(path + action + "?" + sb.toString());
		
		DefaultHttpClient client = new DefaultHttpClient();
		if (cookieStore != null) {
			client.setCookieStore(cookieStore);
		}
		HttpResponse response = client.execute(get);
		cookieStore = client.getCookieStore();
		 
		return response;

	}

	/**
	 * 
	 * @param map
	 *            传入的键值对 key=value的形式
	 * @param encoding
	 *            传入的编码
	 * @throws Exception
	 */
	public HttpResponse sendPostTo(Map<String, String> map, String encoding)
			throws Exception {

		List<NameValuePair> list = new ArrayList<NameValuePair>();

		for (Map.Entry<String, String> entry : map.entrySet()) {
			BasicNameValuePair bv = new BasicNameValuePair(entry.getKey(),
					entry.getValue());
			list.add(bv);
		}

		UrlEncodedFormEntity entity = new UrlEncodedFormEntity(list, encoding);

		HttpPost post = new HttpPost(path + action);
		System.out.println(path + action);
		post.setEntity(entity);

		
		DefaultHttpClient client = new DefaultHttpClient();

		if (cookieStore != null) {
			client.setCookieStore(cookieStore);
		}
		HttpResponse response = client.execute(post);
		cookieStore = client.getCookieStore();
		

		
		return response;
	}

	/**
	 * 
	 * @param map
	 *            传入的键值对
	 * @throws Exception
	 */
	public HttpResponse sendPostTo(Map<String, String> map) throws Exception {
		return this.sendPostTo(map, "utf-8");
	}

	public HttpResponse sendGetTo(Map<String, String> map) throws Exception {
		return this.sendGetTo(map, "utf-8");
	}

	/**
	 * 
	 * @param stream
	 * @return 输入流的内容
	 * @throws IOException
	 */
	private static String streamToString(InputStream stream, String encoding)
			throws IOException {
		ByteArrayOutputStream ba = new ByteArrayOutputStream();
		byte[] bytes = new byte[512];
		int len = 0;
		while ((len = stream.read(bytes)) != -1) {
			ba.write(bytes, 0, len);
		}
		return new String(ba.toByteArray(), encoding);
	}

	public String getPath() {
		return path;
	}

	public void setPath(String path) {
		this.path = path;
	}

	public void setAction(String action) {
		this.action = action;
	}

	public String getAction() {
		return action;
	}

	public CookieStore getCookieStore() {
		return cookieStore;
	}

	public void setCookieStore(CookieStore cookieStore) {
		this.cookieStore = cookieStore;
	}

	public void clearCookieStore() {
		this.cookieStore = null;
	}
	
}

 以及获取数据中的其中的一段:

		while (true) {
			po.clearCookieStore();
			po.setPath("http://passport.cdcgames.net/account/login.aspx"); // 这边填地址
			hr = po.sendGetTo(new HashMap<String, String>());
			String data1=null;
			int hrCode=hr.getStatusLine().getStatusCode();
			if(hrCode==200){
				data1=streamToString(hr.getEntity().getContent(),"utf-8");
			}else{
//				System.out.println("连接失败,状态码:"+hrCode);
				mes.setError(true);
				mes.setErrorCode("连接失败,状态码:"+hrCode);
				return mes;
			}
			// <input type="hidden" name="__VIEWSTATE" id="__VIEWSTATE" value=""
			// />
			Pattern rex = Pattern.compile("value=\"(.*)\"");
			Matcher matcher = rex.matcher(data1);
			// System.out.println(data1);
//			System.out
//					.println("______________________________+++++++++++______________________");
			String code = null;
			if (matcher.find()) {
				code = matcher.group(1);
//				System.out.println(code);
			}

			DefaultHttpClient client = new DefaultHttpClient();
			client.setCookieStore(po.getCookieStore());
			HttpGet get = new HttpGet(
					"http://passport.cdcgames.net/VerifyCode.aspx");
			HttpResponse res = client.execute(get);
			String verify = OCRTestMine.getVerifyText(res.getEntity()
					.getContent());

			po.setPath("http://passport.cdcgames.net/account/login.aspx");

			HashMap<String, String> has = new HashMap<String, String>();
			has.put("__EVENTTARGET", "LB_Login");
			has.put("__EVENTARGUMENT", "");
			has.put("__VIEWSTATE", code);
			has.put("TB_userid", userTrueName);
			has.put("TB_password", userPass);
			has.put("TB_rand", verify);
			hr2 = po.sendPostTo(has);
			String data2="";
			int hr2Code=hr2.getStatusLine().getStatusCode();
			
			if(hr2Code==302){
				break; //302表示登陆成功执行跳转
			}else{
				if(hr2Code==200){
					data2=streamToString(hr2.getEntity().getContent(), "utf-8");
				}else{
//					System.out.println("连接出错,状态码:"+hr2Code);
					mes.setError(true);
					mes.setErrorCode("连接出错,状态码:"+hr2Code);
					return mes;
				}
			}
//			System.out
//					.println("______________________________+++++++++++______________________");

			boolean verifyFail = false;
			boolean passAndNameFail = false;
			verifyFail = data2.indexOf("验证码不正确") != -1;
			passAndNameFail = data2.indexOf("账号或密码错误") != -1;
			
//			System.out.println("验证码不正确:"
//					+ (verifyFail = data2.indexOf("验证码不正确") != -1));
//			System.out.println("账户或密码错误:"
//					+ (passAndNameFail = data2.indexOf("账号或密码错误") != -1));
			if (verifyFail) {
				if (failTime < 5) {
					failTime++;
					continue;
				} else {
//					System.out.println("验证码错误5次,退出");
					mes.setVerifyError(true);
					mes.setErrorCode("验证码错误5次,退出");
					return mes;
				}
			}
			if (passAndNameFail) {
//				System.out.println("账户或密码错误");
			    mes.setPassError(true);
			    return mes;
			}

			break;
		}

 

 

数据获取:

获取数据的话用jsoup完成,主要观察包含数据的html元素是否有id(因为有id获取最方便)

过程就不多说 毕竟用jsoup完成的话是很轻松的事

 

 

  • 大小: 41.9 KB
0
1
分享到:
评论

相关推荐

    android:仪表盘(简单易实现)

    本教程将探讨如何在Android应用中实现一个简洁而易操作的仪表盘。我们的目标是减轻编程负担,将更多复杂的设计工作交给美工,从而使代码更加精简。 首先,我们需要了解仪表盘的基本元素。一个典型的仪表盘包括指针...

    二维码的扫描和制作

    1. **在线生成器**: 制作二维码最简单的方法是使用在线二维码生成器,如草料二维码、微信小程序等。只需输入要编码的信息(如网址、文本、联系信息等),系统会自动生成对应的二维码图片。 2. **编程实现**: 对于...

    微信小程序游戏飞翔的小鸟

    【微信小程序游戏飞翔的小鸟】是一款基于微信小程序平台开发的简单休闲游戏,它利用HTML5的Canvas技术来绘制游戏画面,结合Java后端提供服务,为玩家带来有趣的互动体验。这款小游戏是微信小程序开发的经典案例,...

    Matlab环境下决策分类树的构建、优化与应用

    内容概要:本文详细介绍了如何利用Matlab构建、优化和应用决策分类树。首先,讲解了数据准备阶段,将数据与程序分离,确保灵活性。接着,通过具体实例展示了如何使用Matlab内置函数如fitctree快速构建决策树模型,并通过可视化工具直观呈现决策树结构。针对可能出现的过拟合问题,提出了基于成本复杂度的剪枝方法,以提高模型的泛化能力。此外,还分享了一些实用技巧,如处理连续特征、保存模型、并行计算等,帮助用户更好地理解和应用决策树。 适合人群:具有一定编程基础的数据分析师、机器学习爱好者及科研工作者。 使用场景及目标:适用于需要进行数据分类任务的场景,特别是当需要解释性强的模型时。主要目标是教会读者如何在Matlab环境中高效地构建和优化决策分类树,从而应用于实际项目中。 其他说明:文中不仅提供了完整的代码示例,还强调了代码模块化的重要性,便于后续维护和扩展。同时,对于初学者来说,建议从简单的鸢尾花数据集开始练习,逐步掌握决策树的各项技能。

    《营销调研》第7章-探索性调研数据采集.pptx

    《营销调研》第7章-探索性调研数据采集.pptx

    Assignment1_search_final(1).ipynb

    Assignment1_search_final(1).ipynb

    美团外卖优惠券小程序 美团优惠券微信小程序 自带流量主模式 带教程.zip

    美团优惠券小程序带举牌小人带菜谱+流量主模式,挺多外卖小程序的,但是都没有搭建教程 搭建: 1、下载源码,去微信公众平台注册自己的账号 2、解压到桌面 3、打开微信开发者工具添加小程序-把解压的源码添加进去-appid改成自己小程序的 4、在pages/index/index.js文件搜流量主广告改成自己的广告ID 5、到微信公众平台登陆自己的小程序-开发管理-开发设置-服务器域名修改成

    《计算机录入技术》第十八章-常用外文输入法.pptx

    《计算机录入技术》第十八章-常用外文输入法.pptx

    基于Andorid的跨屏拖动应用设计.zip

    基于Andorid的跨屏拖动应用设计实现源码,主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者,也可作为课程设计、期末大作业。

    《网站建设与维护》项目4-在线购物商城用户管理功能.pptx

    《网站建设与维护》项目4-在线购物商城用户管理功能.pptx

    区块链_房屋转租系统_去中心化存储_数据防篡改_智能合约_S_1744435730.zip

    区块链_房屋转租系统_去中心化存储_数据防篡改_智能合约_S_1744435730

    《计算机应用基础实训指导》实训五-Word-2010的文字编辑操作.pptx

    《计算机应用基础实训指导》实训五-Word-2010的文字编辑操作.pptx

    《移动通信(第4版)》第5章-组网技术.ppt

    《移动通信(第4版)》第5章-组网技术.ppt

    ABB机器人基础.pdf

    ABB机器人基础.pdf

    《综合布线施工技术》第9章-综合布线实训指导.ppt

    《综合布线施工技术》第9章-综合布线实训指导.ppt

    最新修复版万能镜像系统源码-最终版站群利器持续更新升级

    很不错的一套站群系统源码,后台配置采集节点,输入目标站地址即可全自动智能转换自动全站采集!支持 https、支持 POST 获取、支持搜索、支持 cookie、支持代理、支持破解防盗链、支持破解防采集 全自动分析,内外链接自动转换、图片地址、css、js,自动分析 CSS 内的图片使得页面风格不丢失: 广告标签,方便在规则里直接替换广告代码 支持自定义标签,标签可自定义内容、自由截取、内容正则截取。可以放在模板里,也可以在规则里替换 支持自定义模板,可使用标签 diy 个性模板,真正做到内容上移花接木 调试模式,可观察采集性能,便于发现和解决各种错误 多条采集规则一键切换,支持导入导出 内置强大替换和过滤功能,标签过滤、站内外过滤、字符串替换、等等 IP 屏蔽功能,屏蔽想要屏蔽 IP 地址让它无法访问 ****高级功能*****· url 过滤功能,可过滤屏蔽不采集指定链接· 伪原创,近义词替换有利于 seo· 伪静态,url 伪静态化,有利于 seo· 自动缓存自动更新,可设置缓存时间达到自动更新,css 缓存· 支持演示有阿三源码简繁体互转· 代理 IP、伪造 IP、随机 IP、伪造 user-agent、伪造 referer 来路、自定义 cookie,以便应对防采集措施· url 地址加密转换,个性化 url,让你的 url 地址与众不同· 关键词内链功能· 还有更多功能等你发现…… 程序使用非常简单,仅需在后台输入一个域名即可建站,不限子域名,站群利器,无授权,无绑定限制,使用后台功能可对页面进行自定义修改,在程序后台开启生 成功能,只要访问页面就会生成一个本地文件。当用户再次访问的时候就直接访问网站本地的页面,所以目标站点无法访问了也没关系,我们的站点依然可以访问, 支持伪静态、伪原创、生成静态文件、自定义替换、广告管理、友情链接管理、自动下载 CSS 内的图。

    《Approaching(Almost)any machine learning problem》中文版第11章

    【自然语言处理】文本分类方法综述:从基础模型到深度学习的情感分析系统设计

    基于Andorid的下拉浏览应用设计.zip

    基于Andorid的下拉浏览应用设计实现源码,主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者,也可作为课程设计、期末大作业。

    P2插电式混合动力系统Simulink模型:基于逻辑门限值控制策略的混动汽车仿真

    内容概要:本文详细介绍了一个原创的P2插电式混合动力系统Simulink模型,该模型基于逻辑门限值控制策略,涵盖了多个关键模块如工况输入、驾驶员模型、发动机模型、电机模型、制动能量回收模型、转矩分配模型、运行模式切换模型、档位切换模型以及纵向动力学模型。模型支持多种标准工况(WLTC、UDDS、EUDC、NEDC)和自定义工况,并展示了丰富的仿真结果,包括发动机和电机转矩变化、工作模式切换、档位变化、电池SOC变化、燃油消耗量、速度跟随和最大爬坡度等。此外,文章还深入探讨了逻辑门限值控制策略的具体实现及其效果,提供了详细的代码示例和技术细节。 适合人群:汽车工程专业学生、研究人员、混动汽车开发者及爱好者。 使用场景及目标:①用于教学和科研,帮助理解和掌握P2混动系统的原理和控制策略;②作为开发工具,辅助设计和优化混动汽车控制系统;③提供仿真平台,评估不同工况下的混动系统性能。 其他说明:文中不仅介绍了模型的整体架构和各模块的功能,还分享了许多实用的调试技巧和优化方法,使读者能够更好地理解和应用该模型。

    电力系统分布式调度中ADMM算法的MATLAB实现及其应用

    内容概要:本文详细介绍了基于ADMM(交替方向乘子法)算法在电力系统分布式调度中的应用,特别是并行(Jacobi)和串行(Gauss-Seidel)两种不同更新模式的实现。文中通过MATLAB代码展示了这两种模式的具体实现方法,并比较了它们的优劣。并行模式适用于多核计算环境,能够充分利用硬件资源,尽管迭代次数较多,但总体计算时间较短;串行模式则由于“接力式”更新机制,通常收敛更快,但在计算资源有限的情况下可能会形成瓶颈。此外,文章还讨论了惩罚系数rho的自适应调整策略以及在电-气耦合系统优化中的应用实例。 适合人群:从事电力系统优化、分布式计算研究的专业人士,尤其是有一定MATLAB编程基础的研究人员和技术人员。 使用场景及目标:①理解和实现ADMM算法在电力系统分布式调度中的应用;②评估并行和串行模式在不同应用场景下的性能表现;③掌握惩罚系数rho的自适应调整技巧,提高算法收敛速度和稳定性。 其他说明:文章提供了详细的MATLAB代码示例,帮助读者更好地理解和实践ADMM算法。同时,强调了在实际工程应用中需要注意的关键技术和优化策略。

Global site tag (gtag.js) - Google Analytics