`

自动投票——种种

阅读更多

最近闲余时间做了一些功能——主角本来是php的curl extension的,后来因为投票的网站突然加上了验证码,而我实在不会用php写识别部分,就换到了groovy的httpbuilder上了,一样好用,尤其是开了多线程,效率不错,用jconsole监视下,还可以。

 

下面描述下过程并贴点代码:

 

很多投票时根据IP和投票间隔时间做限制的,所以——

 

1. 弄到一些代理的ip/port/schema——这个推荐在http://www.5uproxy.net找。

  用URL获取html源码正则匹配取得。

 

2. 找到最终投票的URL和表单参数,需要post的,需要一些token或额外字段的,弄好。

 

3. 如果需要验证码的,简单点的推荐去看http://fireinwind.iteye.com/blog/766260,我稍微修改了下,代码如下

 

 

import java.awt.Color;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

import javax.imageio.ImageIO;

public class ImagePreProcess {

	public static int isWhite(int colorInt) {
		Color color = new Color(colorInt);
		if (color.getRed() + color.getGreen() + color.getBlue() > 320) {
			return 1;
		}
		return 0;
	}

	public static int isBlack(int colorInt) {
		Color color = new Color(colorInt);
		if (color.getRed() + color.getGreen() + color.getBlue() <= 100) {
			return 1;
		}
		return 0;
	}

	public static BufferedImage removeBackgroud(InputStream is)
			throws Exception {
		BufferedImage img = ImageIO.read(is);
		int width = img.getWidth();
		int height = img.getHeight();
		for (int x = 0; x < width; ++x) {
			for (int y = 0; y < height; ++y) {
				if (isWhite(img.getRGB(x, y)) == 1) {
					img.setRGB(x, y, Color.WHITE.getRGB());
				} else {
					img.setRGB(x, y, Color.BLACK.getRGB());
				}
			}
		}
		return img;
	}

	public static List<BufferedImage> splitImage(BufferedImage img)
			throws Exception {
		List<BufferedImage> subImgs = new ArrayList<BufferedImage>();
		subImgs.add(img.getSubimage(6, 4, 9, 12));
		subImgs.add(img.getSubimage(19, 4, 9, 12));
		subImgs.add(img.getSubimage(32, 4, 9, 12));
		subImgs.add(img.getSubimage(45, 4, 9, 12));
		return subImgs;
	}

	public static Map<BufferedImage, String> loadTrainData() throws Exception {
		Map<BufferedImage, String> map = new HashMap<BufferedImage, String>();
		File dir = new File("num");
		File[] files = dir.listFiles();
		for (File file : files) {
			map.put(ImageIO.read(file), file.name[0]);
		}
		return map;
	}

	public static String getSingleCharOcr(BufferedImage img,
			Map<BufferedImage, String> map) {
		String result = "";
		int width = img.getWidth();
		int height = img.getHeight();
		int min = width * height;
		for (BufferedImage bi : map.keySet()) {
			int count = 0;
			Label1: for (int x = 0; x < width; ++x) {
				for (int y = 0; y < height; ++y) {
					if (isWhite(img.getRGB(x, y)) != isWhite(bi.getRGB(x, y))) {
						count++;
						if (count >= min)
							break Label1;
					}
				}
			}
			if (count < min) {
				min = count;
				result = map.get(bi);
			}
		}
		return result;
	}

	public static String getAllOcr(InputStream is) {
		try {
			BufferedImage img = removeBackgroud(is);
			List<BufferedImage> listImg = splitImage(img);
			
			Map<BufferedImage, String> map = loadTrainData();
			String result = "";
			for (BufferedImage bi : listImg) {
				result += getSingleCharOcr(bi, map);
			}
			return result;
		}catch (ex) {
		    ex.printStackTrace();
			return ''
		}finally {
		    is.close();
		}
	}

	/** 
	 * @param args 
	 * @throws Exception 
	 */
	public static void main(String[] args) throws Exception {
		String ff = "**.jpeg";
		String text = getAllOcr(new FileInputStream(ff));
		System.out.println(text);
	}
}

 

 其中splitImage方法里,的像素级别的参数,一定在Photoshop或类似软件里看好了;

 而且还要准备元图片(jpg)——就是如果是0-9数字类的,就需要10个数字单独的图以和splitImage后的BufferImage做像素级别的模糊匹配度计算。这样就能稍微解决下简单的图片数字识别了——

 

4. 下面就是Groovy的HttpBuilder做http模拟操作了——至于Groovy的HttpBuilder,看下官方的例子,很容易,你懂的。。。

 

 

@Grab(group='org.codehaus.groovy.modules.http-builder', module='http-builder', version='0.5.0-RC2' )
import groovyx.net.http.*
import static groovyx.net.http.ContentType.*
import static groovyx.net.http.Method.*


def postVote(String line){
	if(!line)
		return

	File logOkFile = new File("./log/ok.resp.txt")
	File logErrorFile = new File("./log/error.resp.txt")

	final String domain = '****'
	def http = new HTTPBuilder(domain)

	String[] arr = line.split(':')
	http.setProxy(arr[0], Integer.parseInt(arr[1]), 'http')

	String vc = '' // 验证码
	try {
		http.request( GET ) { req  ->
			req.getParams().setParameter("http.socket.timeout", new Integer(10000))

			uri.path = 'get_verifycode_url.do'

			headers.'User-Agent' = 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Mozilla/4.0(Compatible Mozilla/4.0(Compatible-EmbeddedWB 14.59 http://bsalsa.com/ EmbeddedWB- 14.59  from: http://bsalsa.com/ ; Mozilla/4.0(Compatible Mozilla/4.0EmbeddedWB- 14.59  from: http://bsalsa.com/ ; IEShow Toolbar; IEShow stock01ToolBar)'
			response.success = { resp, reader ->
				ByteArrayOutputStream bbos = new ByteArrayOutputStream()
				bbos << reader
				byte[] bb = bbos.toByteArray()
				
				InputStream is = new ByteArrayInputStream(bb)
				vc = ImagePreProcess.getAllOcr(is)
			}
		}

		if(vc){ // 如果取得了验证码则进行投票
			http.request( POST, HTML ) {
				uri.path = 'target_vote.do'
				uri.query = [param1:'val1']

				headers.'User-Agent' = 'Mozilla/5.0 Ubuntu/8.10 Firefox/3.0.4'
				response.success = { resp, reader ->
					logOkFile.append new Date().toString() + ' - ' + reader.text
				}

				response.failure = { resp ->
					logErrorFile.append "Unexpected error: ${resp.statusLine.statusCode} : ${resp.statusLine.reasonPhrase}"
				}
			}
		}
	}catch (ConnectException ex) {
		logErrorFile.append 'Connect failed! ' + line
	}catch (SocketTimeoutException ex) {
		logErrorFile.append 'Connect timeout! ' + line
	}
}

int lineCount = 0
new File("./ip_ll2.txt").eachLine{line -> // 代理ip列表
	lineCount++
	if(lineCount >= 150 && lineCount < 200){ // 控制使用范围,即开启线程数量
		Thread.start('post_thread_' + lineCount){
			Random r = new Random()
			20.times{tt ->
				postVote(line)
				sleep(1000 * r.nextInt(20))
			}	
			
			println 'End thread for ' + lineCount
		}
	}
}
 

 

分享到:
评论

相关推荐

    自动投票工具2014自动投票软件v1.0绿色版

    自动投票工具2014是一款简单易用自动投票软件,该软件能够采用真实独立的IP,并且按照活动网站的要求来正规投票,更加安全、快速,让用户的使用更加放心。而且该软件完全模拟手工操作快速投票,用户只要运行软件即可...

    免费图片投票系统——tpphp

    【免费图片投票系统——tpphp】是一款基于PHP语言开发的轻量级应用,专为举办各类图片投票活动设计。该系统旨在简化安装和调试流程,让非专业开发者也能轻松搭建起自己的在线投票平台。在了解这个系统之前,我们需要...

    易语言网页自动投票

    本资源"易语言网页自动投票"是一个基于易语言编写的程序,用于实现网页上的自动投票功能。这个源码可以帮助我们理解易语言在处理网络请求、模拟用户操作以及自动化流程控制等方面的运用。 首先,我们需要了解易语言...

    在线论坛投票系统——可禁止/防止用户重复投票

    在没有这种机制的情况下,一些用户可能会滥用他们的投票权利,通过创建多个账户或者使用自动化工具多次投票,从而操纵投票结果。这不仅违反了公平原则,也可能导致论坛社区的决策偏离真实公众意见。 实现防止重复...

    自动投票(c#源码)

    在IT行业中,自动投票系统是一种常见的应用场景,例如在各种在线评选、竞赛或者调查中。本文将深入探讨基于C#编程语言实现的自动投票系统的核心知识点,以及如何利用这些源码来理解和开发类似功能。 首先,我们要...

    全自动投票

    本款投票软件和其他自动投票软件的优势是:完全免费,设置简单,无需繁琐的参数,只需截取一段投票信息即可自动投票。 智能高效:全自动投票,投票软件能自动拨号换ip 极速体验:投票速度快,正常情况下一台电脑可达...

    OutdoVote通用自动投票软件

    1、全自动投票,无需人工干预; 2、投票速度快,如果没有IP限制,一般情况下1~2秒一票; 3、不限使用电脑数量,也可在一台电脑上运行多个投票软件(通用投票软件一台电脑只能运行一个); 4、软件运行时,可最小化到...

    投票网——数据库详细设计.doc

    投票网的数据库详细设计涉及到四个核心表格,分别是用户信息表(userInfo)、发起投票信息表(SurveyInfo)、投票过的问题表(chkInfo)以及投票问题分类表(Class)。这些表格共同构建了一个完整的投票系统数据架构...

    吐血推荐!vote投票器 超小绿色自动投票autovote

    vote投票器 超小绿色自动投票autovote" 这个标题首先向我们展示了一个名为"vote投票器"的软件产品,该产品具备自动投票的功能,并且被强调为"超小绿色"。这里的"超小"指的是软件的体积小巧,占用存储空间少,而"绿色...

    易语言自动投票源码.rar

    "易语言自动投票源码.rar"是一个压缩包,其中包含了使用易语言编写的自动投票程序的源代码。这个源码可能被用来了解自动投票系统的实现原理,或者是供学习者研究和参考。 首先,我们来讨论一下易语言。易语言的核心...

    自动投票工具V0.01 绿色免费版.rar

    通用免费全自动投票软件,一款强大的投票工具,帮助你获取更多选票,使用方法如下: 投票设置---》对于需要更换IP的投票需要使用这个选项,填入你的ADSL账号,密码即可,如果是内网的话可能无法使用. 模拟投票---...

    易语言源码易语言自动投票源码.rar

    易语言源码易语言自动投票源码.rar 易语言源码易语言自动投票源码.rar 易语言源码易语言自动投票源码.rar 易语言源码易语言自动投票源码.rar 易语言源码易语言自动投票源码.rar 易语言源码易语言自动投票源码....

    网络自动投票器

    【网络自动投票器】 在当前数字化时代,网络投票已经成为一种常见的互动方式,广泛应用于各种线上活动,如最受欢迎的明星评选、企业奖项、公众调查等。然而,随着网络投票的普及,也催生了一种名为“网络自动投票器...

    全自动投票软件 v2.1 绿色版.rar

    全自动投票软件v2.1是一款高效实用的网络投票工具,专为用户设计,提供便捷的投票服务。这个绿色版软件无需安装,用户只需解压后即可直接运行,大大简化了使用流程。它支持两种常见的HTTP请求类型:GET和POST,这...

    C#自动投票机支持多种模式

    本项目聚焦于一个特定的应用场景,即“C#自动投票机”,它旨在提高投票活动的效率和自动化程度。根据提供的标题和描述,我们可以深入探讨以下几个关键知识点: 1. **投票计时清零功能**: 这个功能意味着系统可以...

    超好用自动投票软件 v9.0.zip

    超好用自动投票软件更新说明: 更新优化了部分内核,提高了软件的效率   超好用自动投票软件和其他自动投票软件的优势是:完全免费,设置简单,无需繁琐的参数,只需截取一段投票信息即可自动投票。   智能...

    自动投票小工具源代码

    web 控件操作例程,使用的技术包括: 浏览器视图的使用 网页form及input按钮的读写以及自动提交form 定时器的使用 图形数字识别 ...可以自己修改不同的投票对象为他进行自动投票 最后编译环境是vs2008

    LayUI+WeUI+asp.net MVC+MySQL——Web投票管理系统+移动端投票系统.zip

    管理系统是一种通过计算机技术实现的用于组织、监控和控制各种活动的软件系统。这些系统通常被设计用来提高效率、减少错误、加强安全性,同时提供数据和信息支持。以下是一些常见类型的管理系统: ...

    C语言课程设计——投票系统开发

    这就要求本程序要能够录入20位候选人的名单,包括起编号和姓名,然后程序可以接受用户的投票,并且自动作出票数统计并输出最后的票数由高到低的排序结果。 二、分析与设计 1.程序的基本功能: (1)查看十佳运动员的...

    518tt投票软件 v20.1.zip

    518tt投票软件和其他自动投票软件的优势是:完全免费,设置简单,无需繁琐的参数,只需截取一段投票信息即可自动投票。 518tt投票软件功能: 智能高效:全自动投票,投票软件能自动拨号换ip 极速体验:投票速度快,...

Global site tag (gtag.js) - Google Analytics