`
wbj0110
  • 浏览: 1610784 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

Google Search Appliance 抓取时间表

阅读更多

在指定要抓取的网址并配置了用于抓取的服务器之后,可以通过抓取并编制索引 >  抓取时间表页选择抓取模式,对于预定抓取模式,可以指定抓取您的服务器的次数。

抓取模式

Search Appliance 具有以下抓取模式:

  • 持续抓取。 如果您想让抓取工具自动查找更新内容并编制索引,请选择该模式
  • 预定抓取。 如果您想精确控制所有抓取的时间和持续时间,请选择该模式。 当出现以下情况时,预定抓取就会结束
    • 已经超过您指定的时间限制
    • 抓取工具达到了您的许可指定的文档限制
    • 抓取工具达到了“抓取并编制索引 > 主机负载计划”页上“抓取网址数量上限”下设置的限制
    • 抓取工具已经抓取了所有可获得网址

这两种抓取模式都会使用“抓取网址”页上配置的相同网址。

要选择抓取模式

  1. 点击持续抓取或预定抓取模式的单选按钮
  2. 点击保存抓取模式按钮

保存选择后,网页底部会显示所选抓取模式的相关信息:或是抓取时间表,或是持续抓取的抓取频度调节。 要了解有关配置预定抓取的更多信息,请参阅抓取时间表部分。

抓取时间表

抓取时间表允许您将抓取与发生在您的服务器上的其他任何系统活动(例如常规系统备份)结合起来。

您可以创建抓取时间表,也可以将抓取限制为指定的持续时间(以小时和分钟表示)。 如果您设置抓取时间限制,抓取工具会运行指定的小时数和分钟数,或者运行到抓取了所有网址时为止。 例如,如果您设置了两个小时的时间限制,并将开始时间安排为凌晨 2 点,那么除非抓取工具不到 2 个小时就完成抓取,否则它就会在凌晨 2 点到 4 点之间抓取您的服务器。

预定抓取:

  1. 要选择日期,请在开始抓取下拉列表中进行选择
  2. 要选择您希望开始抓取的时间,请在起始小时下拉列表中选择小时,并在起始分钟下拉列表中选择分钟
  3. 要限制抓取的持续时间,请在下拉列表中选择持续时间。 您可以选择最长为 24 小时 45 分钟的时间长度
  4. 点击保存抓取时间表按钮

点击添加更多的行按钮,可以创建更多的预定抓取。 这一操作会向时间表中增加更多行,用于添加额外的条目。

 

从上面可以知道,Google的几种抓取方式,一种是漫游器, 主要针对的是所有网站,它会一直运行,主要是用来收集网址。另外就是针对某一网站的限时抓取,所以怎么让搜索引擎在一定时间内索引到一定的页面就是SEO要做的内链的构建。同时搜索引擎一半在凌晨2点到4点之间大量抓取网页也是为了减轻目标服务器的压力。

分享到:
评论

相关推荐

    Installing the Google Search Appliance.pdf

    Google搜索设备(Google Search Appliance)是一款由Google提供的企业级搜索解决方案,用于优化组织内部文档、网站内容的搜索体验。安装该设备通常分为两个主要阶段:网络连接与软件配置。 #### 二、预安装检查清单...

    c#做的按特别关键字抓取google信息的软件

    “google”标签表明该程序与Google搜索引擎API交互,如使用Google Custom Search JSON API或Google Search Appliance等。使用这些API时,开发者需要遵循Google的使用条款,包括速率限制和合规性要求。 在压缩包子...

    ccs-container:基于Apache Solr的Cisco Config Search Appliance

    ccs容器基于Apache Solr的Cisco Config Search Appliance(Docker Image)概述ccs-container是一个即用型Docker映像,用于索引和搜索基于Cisco的企业(或家庭)网络的配置。 它提供了以下用户界面: 这是什么意思,...

    GSJSON:用于 Google Search Appliance (GSA) 的 JSON 样式表

    Google Search Appliance - JSON 前端 XSLT 中的这个 JSON 生成器专门用于匹配 GSP 格式 XML,该格式生成为许多搜索实现的通用格式。 JSON 将所有内容包装在一个主节点“GSP”中,然后通过将这些(如果存在)包装在...

    Google Search Appliance Java API-开源

    一个Java库,作为Google Search Appliance的搜索协议XML API的包装。 XML API可从以下网址公开获得:http://code.google.com/gsa_apis/xml_reference.html此项目的主页和教程位于:http://gsa-japi.sf.net

    gsa-jsonp-proxy:Google Search Appliance (GSA) JSONP 代理

    Google Apps 脚本 - GSA(Google Search Appliance)代理 在您的帐户中创建一个新脚本 新建一个脚本文件,复制里面的gsa-json-proxy.js的内容。 使用您的设置 GSA_URL 运行“测试”功能以启用权限 发布为 Web 应用...

    java4gsa:用于搜索Google Search Appliance(GSA)的开源Java API

    Java4GSA是一款开源的Java API,专门设计用于与Google Search Appliance(GSA)进行交互。这款API为开发者提供了一种便捷的方式,通过编程来访问和利用GSA的功能,从而在企业内部实现高效、定制化的搜索解决方案。...

    vCenter Server Appliance 6.7 BT下载

    vCenter Server Appliance 6.7 全系列

    usm-appliance-用户文档.pdf

    1. **USM Appliance概述**: - USM Appliance是AlienVault USM设备系统的用户文档,面向负责网络安全监控及安全威胁识别和解决的人员。 - 文档介绍USM设备WebUI,用于执行网络安全任务。 2. **准备工作和要求**:...

    Veritas NetBackup 5250 Appliance.pdf

    Veritas NetBackup 5250 Appliance

    vCenter Server Appliance6.5实施手册

    ### vCenter Server Appliance 6.5 实施手册知识点概览 #### 一、环境配置与准备工作 **硬件环境:** - **服务器型号:** HP ML350 G6 × 2 - **软件版本:** - **ESXi:** VMware-VMvisor-Installer-6.0.0.update02...

    gsa:Ruby库,用于与Google Search Appliance一起使用

    GSA Ruby宝石通过单行进纸,搜索和刻面,快速,轻松地利用GSA索引功能。安装 gem install gsa默认端口默认端口设置为安全端口19902 要将端口更改为http,请将feed扩展名设置为以下... 15 , brand : 'BazBrand' }] 2.)

    VMware-vCenter-Server-Appliance-6.5及HA配置手册

    VMware vCenter Server Appliance(VCSA)是VMware推出的虚拟化管理工具,它将传统VMware vCenter Server软件部署在了一个预先配置好的虚拟机中,提供了一种更简便快捷的方式来管理VMware vSphere环境。vCenter ...

    VMware-vCenter-Server-Appliance-6.5.0.14000-7515524.txt

    VMware-vCenter-Server-Appliance-6.5.0.14000-7515524-updaterepo

    McAfee Email and Web Security Appliance解决方案

    借助价格合理且易于管理的解决方案——McAfee Email and Web Security Appliance,可以保护您的企业免遭垃圾邮件、病毒、间谍软件、恶意网站的侵扰,同时还能防止不当的网上浏览行为。它是代替单点电子邮件和Web安全...

    kiwi, KIWI—Appliance生成器下一代.zip

    "kiwi, KIWI—Appliance生成器下一代.zip"是一个与开源软件相关的压缩包,包含的是kiwi项目的源代码。kiwi是一个强大的工具,专用于生成操作系统映像和设备生成器,它属于下一代的KIWI系统。这个工具旨在简化和自动...

Global site tag (gtag.js) - Google Analytics