0 0

jobo爬虫自动登录怎么用?30

我已经允许cookie
在jobo.xml中
  <StartReferer>http://www.matuschek.net/jobo.html</StartReferer>
  <IgnoreRobotsTxt>false</IgnoreRobotsTxt>
  <SleepTime>5</SleepTime>
  <MaxDepth>99999</MaxDepth>
  <WalkToOtherHosts>false</WalkToOtherHosts>
  <Bandwidth>0</Bandwidth>
  <!-- <MaxDocumentAge>30</MaxDocumentAge> -->
  <AllowWholeHost>true</AllowWholeHost>
  <AllowWholeDomain>false</AllowWholeDomain>
  <AllowCaching>true</AllowCaching>  
  <FlexibleHostCheck>false</FlexibleHostCheck>

  <!-- Proxy configuration <Proxy>proxy.myprovider.com:80</Proxy>  -->


  <!-- robot is allowed to visit these URLs more then once -->
  <!-- (useful for forms with different parameter sets     -->
  <!-- <VisitMany>http://bbs.91d2.cn</VisitMany> -->


  <!-- form handler -->
  <FormHandler url="http://www.matuschek.net/login.html">
   <FormField name="jumpurl" value="http://www.matuschek.net/jobo.html"/>
   <FormField name="step" value="2"/>
   <FormField name="lgt" value="0"/>
   <FormField name="pwuser" value="xxxxx"/>
   <FormField name="pwpwd" value="*****"/>
   <FormField name="question" value="0"/>
   <FormField name="answer" value=""/>
   <FormField name="hideid" value="0"/>
   <FormField name="cktime" value="2592000"/>
  </FormHandler>
 </Robot>

 <DownloadRuleSet>
   <DownloadRule allow="true" mimeType="*/*"/>
 </DownloadRuleSet>

 <URLCheck>
   <RegExpRule allow="true" pattern="\.html$" />
   <RegExpRule allow="true" pattern="\.php$" />
 </URLCheck>

 <LocalizeLinks>false</LocalizeLinks>
 <StoreCGI>true</StoreCGI>

运行后日志中没有我想要的cookie,wireshark中没有关于(http://www.matuschek.net/login.html)的记录

问题补充:别说没人会啊,非要我去看源码自己解决?分不够可以再加
2012年12月13日 16:17

2个答案 按时间排序 按投票排序

0 0

应该是有些显示,有些不显示,比如我测试有时候是有的
Cookie request header: fe_typo_user=631c12e3b093c6e3c0f343c74ad97703

我使用Wireshark也能抓到包,是不是你指定Interface 指定的不对

2012年12月13日 19:25
0 0


 <FormField name="pwuser" value="xxxxx"/>  
  <FormField name="pwpwd" value="*****"/>  


name 的参数好像填错了。

2012年12月13日 17:09

相关推荐

    jobo爬虫程序

    "Jobo爬虫程序"是一个专门用于网络数据抓取的工具,它可以帮助用户从互联网上自动收集和整理信息。在IT行业中,爬虫程序扮演着重要角色,它们被广泛应用于数据分析、市场研究、搜索引擎优化等多个领域。Jobo爬虫可能...

    jobo Web站点下载工具

    与其它下载工具相比较它的主要优势是能够自动填充form(如:自动登录)和使用cookies来处理session。JoBo还有灵活的下载规则(如:通过网页的URL,大小,MIME类型等)来限制下载。 压缩包中包含: jobo.zip jobo-libs....

    Java网络爬虫程序

    Java网络爬虫程序是一种利用Java编程语言开发的自动化工具,用于从互联网上抓取大量信息。这个特定的项目提供了一个完整的实现,具有较强的实用性,可以作为开发者构建自定义爬虫的参考。 首先,我们来看看标签:...

    开源爬虫介绍及下载链接

    9. **JoBo**: 与其他下载工具不同,JoBo能自动填充表单和处理cookies,适合需要登录和处理session的网站下载。 10. **snoics-reptile**: 一个纯Java开发的网站镜像工具,能够抓取整个网站的内容,包括各种文件类型...

    Sosoo 1.0网络爬虫程序.doc

    Sosoo 1.0 网络爬虫程序是一款设计用于定制化的 Web 爬虫工具,由王建华(rimen/jerry)编写,旨在帮助编程人员基于 Sosoo 平台构建自己的蜘蛛程序。该程序的核心是 `Roboter` 类,它作为一个线程类代表一个网络爬虫...

    WebQQ.zip_jobo 1236数据_webqq

    2. JavaScript和CSS文件:这些文件用于构建前端界面,可能使用了Ext库。 3. HTML模板:定义了用户界面的布局和结构。 4. 图片资源:包括logo、图标和其他视觉元素。 5. 数据库脚本或配置文件:可能包含jobo_1236数据...

    Adobe PDF 预设 1.joboptions.jobo.joboptions

    Adobe PDF 预设 1.joboptions.jobo.joboptions

    @jobo.ro-crx插件

    总的来说,【@jobo.ro-crx】插件是为罗马尼亚语使用者设计的一款浏览器扩展,旨在提升他们在工作场景下的Chrome浏览器使用体验。用户在使用时应注意其功能、权限和来源,以确保既能充分利用插件带来的便利,又能保障...

    @ jobo.ro「@jobo.ro」-crx插件

    Google Chrome扩展程序,可以在jobo.ro上轻松发布。 扩展了浏览器的Google Chrome浏览器维护许可范围,并使用了可想象的工作场所。 支持语言:română

    JSON中文版.pdf

    3. **使用JSON解析器**:对于非JavaScript环境,可以使用相应的JSON库来解析JSON数据。 4. **在Web页面上显示响应的数据**:将解析后的数据动态插入到HTML文档中,更新页面内容。 #### 五、示例:使用JSON与PHP 在...

    尊宝客房智能控制系统设计方案加布线示.doc

    6. **JOBO-RCU系统原理方框图**:展示系统工作流程和控制逻辑。 7. **标准RCU控制箱技术参数**:详细列出设备的技术规格。 **系统功能配置** 1. **标准间设备配置**:包括微电脑主机、开关面板、服务信息显示面板...

    PHP+MySQL八大动态Web应用实战.pdf

    作者Jobo Bacon是开源社区的活跃人物,有着丰富的写作和项目开发背景。 本书的核心内容涵盖了八个实际的Web应用程序开发案例,通过这些案例,读者可以学习到如何使用PHP和MySQL来构建动态网站。以下是每个章节的...

    PHP+MySQL八大动态Web应用实战 光盘part2

     Jobo Bacon就职于Canonical,任Ubuntu的社区管理者,是开源社区的一位常设发言人(established speaker)、作者和正式成员(regular contributor) 。作为作者,Bacon与人合作创作了《Linux Desktop Hacks》和...

    PHP+MySQL八大动态Web应用实战 光盘part1

    作者简介 Jobo Bacon就职于Canonical,任Ubuntu的社区管理者,是开源社区的一位常设发言人(established speaker)、作者和正式成员(regular contributor) 。作为作者,Bacon与人合作创作了《Linux Desktop Hacks...

    Keljob-crx插件

    Le Joboùvous voulez 新的扩展名:Keljob倒入镀Chrome液,然后再倒入新的槽口。 法国经验丰富的首要工作场所以及提议者,以及3万名年长者,年长者和年长者。 临时办公室,警报,纪念堂纪念活动,行动...和助理候选...

    Giga Vu Pro Evolution SDK-开源

    Giga Vu Pro Evolution SDK 是Jobo AG公司针对其专业图像存储设备Giga Vu Pro Evolution推出的一款软件开发工具包。这个SDK对于开发者来说是一份宝贵的资源,它提供了与硬件交互的接口,使得程序员能够创建自定义...

    学生成绩管理分析系统-Java语言实现

    1. 开发环境:Eclipse或IntelliJ IDEA等IDE,提供代码提示、自动格式化和调试等功能,提高开发效率。 2. 版本控制:使用Git进行版本管理,便于团队协作和代码回溯。 3. 测试:JUnit用于单元测试,确保每个功能模块...

    percona xtrbackup

    5. 恢复:当需要恢复数据时,使用`xtrabackup --apply-log-only`应用日志,然后用`xtrabackup --recover`进行恢复操作。 Percona XtraBackup还支持并行备份和网络压缩,可以提高备份速度和节省网络带宽。此外,它...

    percona mysql

    1. **XtraDB 存储引擎**:Percona Server 使用 XtraDB 作为默认存储引擎,这是 InnoDB 的一个优化版本,提供了更好的并发性能和可扩展性,特别是在高负载环境下。 2. **透明页压缩**:Percona Server 支持对数据页...

Global site tag (gtag.js) - Google Analytics