`

JE的内容不允许爬虫抓取?

    博客分类:
  • JAVA
阅读更多

今天想把自己的博客给抓取下来,结果发现JE的内容是不允许抓取的,会出现以下内容:

<body>
    <div style="padding:50px 0 0 300px">
      <h1>您的访问请求被拒绝</h1>
    </div>
    <div class="clearfix">
      <div class="left" style="padding-left:120px">
        <img src="/images/filenotfound.jpg" width="128" height="128" />
      </div>
      <div class="left" style="width:700px;padding:30px 0 0 30px">
        <p>您可能使用了网络爬虫抓取JavaEye网站页面!</p>
        <p>JavaEye网站不允许您使用网络爬虫对JavaEye进行恶意的网页抓取,请您立刻停止该抓取行为!</p>
        <p>如果您的网络爬虫不属于恶意抓取行为,希望JavaEye网站允许你进行网页抓取,请和JavaEye管理员联系,取得授权: webmaster AT javaeye DOT com</p>
        <p>如果您确实使用浏览器访问,但是被错误的识别为网络爬虫,请将您浏览器发送的“User Agent”信息告知我们,帮助我们解决错误: webmaster AT javaeye DOT com</p>
      </div>
    </div>
    <div style="padding:20px 0 0 500px">
      <a href="http://www.iteye.com"><img src='/images/logo_small.gif' border='0'></a>
    </div>
  </body>

 

错误提示里面有一句:

如果您确实使用浏览器访问,但是被错误的识别为网络爬虫,请将您浏览器发送的“User Agent”信息告知我们,帮助我们解决错误

 

呵呵,这句话有点玄机哦,结果还是被我抓下来了,哈哈哈。

 

2
1
分享到:
评论
8 楼 Jeremy__Pan 2014-10-19  
怎么爬下来的。可以给个思路的吗?
7 楼 jacobcookie 2012-10-20  
楼主这个怎么解决哈,求解,3Q.
6 楼 D04540214 2009-08-17  
JE屏蔽的正常的蜘蛛,经过稍微变异的蜘蛛就无能为力了。上次发现一个网站很强悍把我们公司的IP都给屏蔽了,导致我们不能够抓取。
5 楼 iammonster 2009-05-21  
javaclover  我不知道你是如何弄的,不知道它的技术是如何防止的,所以不敢确定能不能解决你的问题。
xwkp2008  说的对,设置HTTP请求头的信息就可以了
不想自己写协议的话,就用这个吧:apache的 commons-httpclient-3.1 ,我现在用的。
4 楼 xwkp2008 2009-05-21  
需要模拟http header 信息把
3 楼 javaclover 2009-05-21  
iammonster 写道

javaclover 写道&amp;nbsp; 我在雅虎搜有的我的博客,显示的也是这个提示!!&amp;nbsp; 呵呵 我解决了哦,现在可以抓JE的

怎么让雅虎也收录我的博客啊;请教了
2 楼 iammonster 2009-05-21  
javaclover 写道

&nbsp; 我在雅虎搜有的我的博客,显示的也是这个提示!!&nbsp;


呵呵 我解决了哦,现在可以抓JE的
1 楼 javaclover 2009-05-21  
  我在雅虎搜有的我的博客,显示的也是这个提示!! 

相关推荐

    丝印HX-JE芯片资料

    根据提供的文件信息,以下是对“丝印HX-JE芯片资料”的详细知识点阐述: 标题“丝印HX-JE芯片资料”指出了我们讨论的焦点是关于一款特定的芯片,而“丝印”这个词通常用在半导体制造工艺中,涉及在芯片表面印刷用于...

    MELSERVO-JE系列样本.pdf

    从部分内容可以看出,MELSERVO-JE系列伺服电机控制器具有以下技术特性: 1. 优越的基本性能和先进的易用性:产品设计注重提供易于操作的界面和便捷的配置过程,减少了用户操作的复杂性,使得设备的伺服化进程更为...

    je-5.0.73-API文档-中文版.zip

    赠送jar包:je-5.0.73.jar; 赠送原API文档:je-5.0.73-javadoc.jar; 赠送源代码:je-5.0.73-sources.jar; 赠送Maven依赖信息文件:je-5.0.73.pom; 包含翻译后的API文档:je-5.0.73-javadoc-API文档-中文(简体)版...

    enshu JE60S 培训资料

    另外,文件中也提到了关于著作权和知识产权的注意事项,强调了对于手册内容的版权归属以及未经许可不允许复制或修改。这也表明了该手册可能包含了专业的技术内容和机密信息,培训人员在使用时需要格外注意。 还需...

    三菱MR-JE-C伺服电机FB功能块(适用Q系列PLC) 流水线项目,16个MR-JE-C电机,为了加快编程速度,特意做的一个F

    流水线项目,16个MR-JE-C电机,为了加快编程速度,特意做的一个FB功能块,内部采用局部变量+全局缓冲区的方式进行编程,多次调用不冲突! 适用于Q系列PLC和MR-JE-C的运动控制。 FB功能块包含回原位、PV速度模式、PP...

    Berkeley DB je3.3版

    在3.3版中,Berkeley DB je提供了灵活的备份和恢复机制,允许在不影响正常服务的情况下进行数据备份,并能在系统故障后迅速恢复数据,保障业务连续性。 6. **数据复制** 数据复制功能使Berkeley DB je可以实现多...

    三菱伺服JE-C通过cclink ie field basic网络控制,轨迹位置模式、轨迹速度模式、原点复位模式的控制

    该功能是通过MR-JE-C系列伺服采用CC-Link IE Field Basic网络实现位置控制,该网络不使用专用ASIC而只需安装软件来实现循环通信的标准Ethernet基础的协议,可以TCP/IP通信并存,以构筑高自由度的系统。 通过简单...

    je-analysis.jar

    "je-analysis.jar" 是一个Java Archive (JAR) 文件,它是Java编程语言中用于封装多个类文件和其他资源的容器。这种格式通常用于分发可执行的Java应用程序或库。在这个特定的情况下,"je-analysis-1.5.3.jar" 版本...

    je-analysis-1.5.1

    "je-analysis-1.5.1"是一款专用于中文分词的开源工具,它在中文信息处理领域扮演着重要的角色。这款工具集成了高效的分词算法,为开发者提供了便捷的接口,使得在Java环境中进行文本分析变得更加简单。"JE分词器"是...

    je-analysis-1.5.3、lucene-core-2.4.1分词组件

    Je-Analysis可以作为Lucene的分词插件,提供对中文文本的预处理服务,使得Lucene能更好地理解和索引中文内容。 使用"je-analysis-1.5.3"和"lucene-core-2.4.1"的组合,开发者可以构建出强大的文本搜索解决方案。在...

    JE分词 1.4+1.5

    "JE分词 1.4+1.5"是一个针对中文文本处理的工具,主要用于将汉字字符串分割成有意义的词语,这是自然语言处理中的关键步骤。这个版本的JE分词在之前的基础上进行了多方面的改进和增强,使得其在处理中文文本时更为...

    MR-JE-_A伺服放大器技术资料集(定位模式篇)_三菱伺服器说明书_

    定位模式是MR-JE-A伺服放大器的核心功能之一,允许设备根据预设的位置、速度和加速度曲线进行精确的定位操作。在这一模式下,伺服系统可以执行多点定位、连续轨迹控制、插补运动等多种复杂任务,适用于各种自动化...

    MR-JE伺服样本

    MR-JE伺服系列的选型内容包括标准规格、电源规格、额定输出、指令接口、控制模式以及配套设备等,能够满足不同用户的需求。伺服电机方面,MR-JE系列提供小容量、低惯性以及中容量、中惯性的选项,涵盖不同规格的电机...

    je-5.0.73-API文档-中英对照版.zip

    赠送jar包:je-5.0.73.jar; 赠送原API文档:je-5.0.73-javadoc.jar; 赠送源代码:je-5.0.73-sources.jar; 赠送Maven依赖信息文件:je-5.0.73.pom; 包含翻译后的API文档:je-5.0.73-javadoc-API文档-中文(简体)-...

    je-analysis-1.5.3

    《深入解析je-analysis-1.5.3:Java Lucene中的中文全文检索与分词组件》 在现代信息处理领域,全文检索与精准的文本分析是至关重要的技术。Je-analysis,作为一款基于Java的开源全文检索框架Lucene的中文分词组件...

    三菱伺服MR-JE使用手册

    ### 三菱伺服MR-JE使用手册关键知识点解析 #### 一、概述 三菱伺服MR-JE系列是一款高性能的交流伺服系统,适用于各种自动化控制领域。本手册旨在提供关于该系列产品安装、配置、维护等方面的技术指导,确保用户能够...

    BerkeleyDB-JE je-6.0.11

    Oracle BerkeleyDB-JE je-6.0.11

    三菱JE伺服使用手册

    ### 三菱JE伺服使用手册知识点总结 #### 一、安全注意事项概述 在开始任何与三菱JE伺服相关的操作之前,必须严格遵循本章节介绍的安全注意事项。这些注意事项被分类为“危险”与“注意”两个级别,旨在确保用户的...

    三菱MR-JE-A伺服说明书

    4. **广泛适用性**:MR-JE系列伺服的应用不仅仅局限于机床和工业机械,还可以用于其他需要平滑控制的场合。 5. **用户友好性**:自动调整功能的存在,大大简化了伺服系统的调试过程,使得非专业用户也能快速上手。 6...

Global site tag (gtag.js) - Google Analytics