`
kankan1218
  • 浏览: 276731 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论

Mechanize 模块 可以提交form,实现登录功能

    博客分类:
  • perl
阅读更多
Mechanize 模块 可以提交form,实现登录功能 :
#!/usr/bin/perl
BEGIN {

	# Set our common library path.
	unshift @INC, './lib';
}

require HTTP::Request;
require HTTP::Response;
require HTTP::Headers;
require HTTP::Cookies;
require LWP;
use WWW::Mechanize;
use Data::Dumper;
use Encode;

#my $ua = LWP::UserAgent->new;
#
#$ua->agent(
#'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2.11) Gecko/20101012 Firefox/3.6.11 GTB7.1 ( .NET CLR 3.5.30729)'
#);
#my $login_response = $ua->post(
#	'http://www.zeel.jp/outlet/item.jsp?GOODS_NO=88636&dispNo=010010001035',
#	'Cookie' => 'JSESSIONID=E0A35234BD47293353BA5B87541C8BA9',
#);
#
#if ($login_response->is_success){
#	print decode ('Shift_JIS',Dumper $login_response);
#} else {
#	print 456;
#}

my $mech = WWW::Mechanize->new(
	agent =>
	  'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2.11) Gecko/20101012 Firefox/3.6.11 GTB7.1 ( .NET CLR 3.5.30729)',
	cookie_jar => {}
);
print 11;
$mech->get('http://www.zeel.jp/select/');

$mech->dump_forms( );
$mech->dump_links(undef,1);


print 22;

$mech->form_number(1);
$mech->field( ID  => 'kankan' );
$mech->field( PWD => 'kankan' );
$mech->click("Submit");

print "After Login Cookie: ";
print $mech->cookie_jar->as_string();
print "\n";

my $searchURL = 'http://www.zeel.jp/outlet/item.jsp?GOODS_NO=88636&dispNo=010010001035';
my $res = $mech->get($searchURL);
print "After Search Cookie: ";
print $mech->cookie_jar->as_string();
print "\n";
print decode('Shift_JIS',$res->content);
分享到:
评论

相关推荐

    Python使用Mechanize模块编写爬虫的要点解析

    综上所述,使用Python的Mechanize模块,配合BeautifulSoup和正则表达式,可以实现高效且灵活的网页抓取。通过模拟浏览器行为,处理表单、登录、认证以及设置代理,Mechanize为Web爬虫开发者提供了强大的工具集。在...

    在Python中使用mechanize模块模拟浏览器功能

    mechanize模块是一个强大的工具,它提供了模拟浏览器的功能,包括处理表单提交、跟踪cookies和设置代理等。下面我们将详细探讨mechanize模块的使用方法。 首先,引入必要的库: ```python import mechanize import ...

    Mechanize相关资料

    8. **处理登录和会话**:对于需要登录才能访问的网站,Mechanize可以轻松地处理登录过程,保存登录状态,以便后续请求。 9. **异常处理**:当遇到错误如404(未找到)或500(服务器内部错误)时,Mechanize会抛出...

    Ruby-Mechanize一个让自动化web交互变得容易的ruby库

    如果你希望深入了解Mechanize的内部实现或对其进行定制,可以研究这些源代码。通过阅读和学习源代码,你可以发现更多关于如何构建这样的自动化库的技巧和最佳实践。 总之,Ruby-Mechanize是一个强大而灵活的工具,...

    ruby mechanize安装需要的gem包

    Ruby Mechanize 是一个非常...总之,Ruby Mechanize 是一个强大且功能丰富的库,用于 web 自动化和爬虫。正确安装其依赖的 gem 包是使用它的前提,而理解如何管理 Gem 和处理潜在问题对于顺利使用 Mechanize 至关重要。

    multi-mechanize-master

    它提供了一个简单的API,可以模拟浏览器的各种动作,如打开网页、跟随链接、提交表单等。`mechanize.Browser`类是其核心,创建一个实例后,可以通过调用相应方法来模拟用户在浏览器上的操作。例如,`browser.open...

    mechanize-源码.rar

    通过使用mechanize,开发者可以编写程序自动执行一系列Web交互,比如登录网站、搜索信息、甚至执行复杂的用户操作流程。这在数据爬取、自动化测试和模拟用户行为的场景中尤为有用。 在源代码中,我们可以看到...

    mechanize-2.7.3.gem

    ruby mechanize包,mechanize-2.7.3.gem

    ruby mechanize 2.7.2 gem 包

    ruby mechanize 2.7.2 gem 包

    python mechanize 0.2.5

    Mechanize库模仿浏览器的行为,允许开发者以编程方式与网页交互,如填写表单、点击链接、处理登录和其他交互任务。这个库基于Urllib和Robotexclusionrulesparser,并提供了更高级的接口来处理复杂的Web任务。 在...

    Mechanize是一个ruby库,可以轻松实现自动的Web交互。-Ruby开发

    Mechanize自动存储和发送Cookie,遵循重定向,并可以遵循链接和提交表单。 可以填写和提交表单字段。 机械化还可以将您曾经访问过的站点作为历史记录进行跟踪。 依赖项¶↑ruby 1.9.2或更高版本的nokogiri支持:¶↑...

    Python库 | mechanize-0.3.2-py2-none-any.whl

    总之,mechanize是Python开发者实现自动化网页交互和爬虫任务的一个强大工具,尤其适用于处理需要登录、表单提交等交互的场景。通过下载并安装mechanize-0.3.2-py2-none-any.whl文件,开发者可以快速地将此库集成到...

    mechanize:Mechanize是一个ruby库,可以轻松实现自动的Web交互

    Mechanize自动存储和发送Cookie,遵循重定向,并可以遵循链接和提交表单。 可以填写和提交表单字段。 机械化还可以将您曾经访问过的站点作为历史记录进行跟踪。依存关系Ruby> = 2.5 宝石: addressable domain_name...

    mechanize-js:Mechanize是一个Javascript库,可实现自动Web交互

    Mechanize自动存储和发送Cookie,跟随重定向,跟随链接并提交表单。 可以填写和提交表单字段。 机械化还可以将您曾经访问过的站点作为历史记录进行跟踪。入门在根文件夹中,您可以运行get_page示例: node examples...

    Ruby中的Mechanize的使用教程

    Ruby中实现网页抓取,一般用的是mechanize,使用非常简单。 安装 代码如下: sudo gem install mechanize 抓取网页 代码如下: require ‘rubygems’ require ‘mechanize’ agent = Mechanize.new page = agent.get...

    常用的python模块功能和下载地址.pdf

    Python 模块功能大全 Python 是一种广泛使用的高级编程语言,拥有庞大的标准库和第三方库-collection,提供了许多实用的功能模块。下面是常用的 Python 模块功能和下载地址整理: 数据库连接 * adodb:数据库连接...

    mechanize4j源程序及所有依赖的jar

    在编程领域,爬虫是用于自动抓取网页信息的工具,而mechanize4j则是这类工具的一个实现。该库模仿了Python的mechanize库,使得Java开发者也能轻松进行网页抓取和模拟浏览器行为。 **mechanize4j的核心功能**: 1. ...

    python第三方库-mechanize

    用python成为顶级黑客,第三方库必备,mechanize网络爬虫

Global site tag (gtag.js) - Google Analytics