问答首页→
0
票
0
回答
311 浏览
heritrix绕过去登录验证[已解决]3
heritrix爬虫的时候,比如公司的项目都是带用户登陆的,heritrix怎么实现绕过去登录那? 目前的想法是: 1.模拟登录,传递cookie的方式。 2.开个后门,在爬的时候不进行验证。 第一种方式需要修改源码,比较费劲。第二种方式需要修改原有的项目,也不太理想。 不知道大侠们有没有好的思路或者实现方式? 问题补充另外,heritrix1.14版本中的order.xml可以配置登录的信息, ...
2013年5月24日 09:05
0
票
1
回答
185 浏览
爬虫的选取[已解决]5
大四学生一枚 最近在做毕业设计 需要使用爬虫爬中国教育在线 摘取论文关键信息,用java实现。不知道用什么爬虫 Crawler? heritrix? 由于技术很差 求大神给建议 给比较。跪谢 Orz Orz Orz Orz
2013年5月07日 16:30
0
票
1
回答
223 浏览
Heritrix,WebSPHINX,JSpider,Encog技术选型[已解决]15
最近公司要做搜索项目,需要爬虫技术爬网页,有用过相关技术的亲吗? 我看到晚上基本都是Heritrix,WebSPHINX,JSpider,Encog,但是没找到相关的比较,麻烦大神们分享下经验啊!
2013年1月09日 11:04
0
票
0
回答
222 浏览
Heritrix,WebSPHINX,JSpider,Encog等技术选型[已解决]5
最近公司要做漫画项目,需要爬虫技术爬网页,有用过相关技术的亲吗? 我看到晚上基本都是Heritrix,WebSPHINX,JSpider,Encog,但是没找到相关的比较,麻烦大神们分享下经验啊!
2013年1月08日 15:04
oznyang 评论了 关于oznyang发布的i18nTool工具的使用
huayang912 评论了 easyui datagrid 弹出窗口空白的解决方法
haihuichen 评论了 mybatis联teradata 查询时返回结果集为空,同样的代码在mysql下就可以返回结果集
haihuichen 评论了 mybatis联teradata 查询时返回结果集为空,同样的代码在mysql下就可以返回结果集
26762685 评论了 SOS!session串号现象
elbert 评论了 Java怎么实现打印机监控
sandy8508 评论了 Java String.format性能如何
feng_tai_jun 评论了 JSP里加return就会无法编译说Unreachable code
xiaojunjava 评论了 JAVA 连接打印机 打印作业属性设置无效果问题
xiaominzi 评论了 java.security.InvalidAlgorithmParameterException: Prime size must be multiple