`
leonardleonard
  • 浏览: 801407 次
社区版块
存档分类
最新评论

给网站管理员的建议:创建可利用的、可抓取的网站

阅读更多
转载自谷歌中文网站管理员博客 发表者 T.V. Raman,研究学者 原文:Webmaster tips for creating accessible, crawlable sites 发表于:2008年4月14日 上午10:47
Raman and Hubbell at home
Hubbell和我正在我们位于加州的家中度假。欢迎您随时 阅读在此之前我为网站管理员们写的关于可用性的博客, 以及我为谷歌官方博客所写的其他文章
对于Accessible search,网站管理员们最经常问的一个问题就是:我怎样才能提高我的网站在Accessible Search上的排名?同时,网站管理员们还会问一个与之类似、但更为宽泛的问题:怎样才能提高我的网站在Google搜索上的排名?
我很高兴地告诉大家,这里有一个一举两得的办法:您可以建立和完善一些关键的网站特性,比如网站导航,这样它就能为所有用户服务,其中自然也包括谷歌机器人。下面是一些小建议,您可以参考。
确保所有重要的内容都能正常访问 为了使用户获取到内容,必须确保这些内容是可以访问的。用户及搜索引擎机器人都是借助超文本链接获取页面内容的,所以关键的第一步是确保您网站上的所有内容都可经由纯HTML超文本链接访问到,并避免网站的关键部分被JavaScriptFlash等技术隐藏起来。 纯超文本链接是指通过HTML锚元素<a>生成的链接。下一步,我们要确保所有超文本链接指向的目标,即<a>元素,都是真实的URL,而不是一个空的、真正的链接行为已经被转到点击触发控制器上的链接。 简而言之,要避免下列超文本链接的形式: <a href="#" onclick="javascript:void(...)">Product Catalog</a> 我们推荐更简单的链接,如: <a href="http://www.example.com/product-catalog.html">Product Catalog</a> 确保内容的可读性 只有具有可阅读性,网站内容才能发挥作用。请确保您网站上所有的重要内容都以HTML文件的形式呈现,并且在无须评估页面脚本的前提下就可以获取。对于谷歌机器人和绝大多数不知情的用户而言,Flash动画背后隐藏的内容和由可执行性JavaScript在浏览器端所产生的文本仍然是无法读取的。 确保内容按照适于阅读的顺序提供给读者 在获取可读内容后,用户希望能够按照合乎逻辑的阅读顺序跟进内容。如果您网站中的大部分内容采取了复杂的多栏布局设计,不妨退回去考虑一下您如何才能实现预期的效果。例如,使用深层嵌套的HTML表格会使人们难以将相关的文本按照合乎逻辑的顺序联系起来。 在HTML内使用CSS以及合乎逻辑、有组织的<div>元素,可以取得同样的效果。同时作为一个额外的收获,您会发现您的网站运行得更加快捷高效。
补充所有的视觉内容――不必担心重复! 让所有人都可以获得您的信息并不意味着让您把网站"降格"成为最简单的文本格式。最大限度地重复您的信息是很重要的,因为只有这样才能确保页面内容最大限度地帮助所有用户。这里有几个简单的小建议:
  • 确保在图片缺失的情况下,用户仍然可以获得那些通过图片传播的内容。这不仅要在相关的图片上添加适当的ALT属性,还要确保图片周围的文字能够详细地介绍背景,让读者了解为什么这张图片会出现在这里;同时详细给出您期望人们看到这个图片后所得出的结论。简言之,如果您想确保每个人都知道此图片表现的是一座桥梁,那么您最好把该图片周围的文字也以拱形排列。
  • 添加相关的摘要和标题,让读者在钻研细节之前可以获得高屋建瓴的信息概述。
  • 在数据展示之类的视觉形象旁边添加详细的文字总结。
采纳上述建议可以大大提高用户登陆页面的质量。同时,作为一个额外的收获,您还很有可能惊喜地发现您的网站得到了更好地索引!
分享到:
评论

相关推荐

    分享下页面关键字抓取components.arrow.com站点代码

    - **效率与负载**:频繁地抓取网站数据可能会对目标网站造成负载,应当合理控制抓取频率,必要时与网站管理员沟通。 - **技术更新**:网站的结构和反爬虫技术会不断更新,抓取脚本可能需要定期维护和更新以适应目标...

    蜘蛛程序,google抓取,简单

    搜索引擎优化(SEO)也因此变得重要,网站管理员会根据爬虫的工作原理来调整网站结构和内容,以提高在搜索结果中的排名。 压缩包内的文件名列表看似是程序组件或库文件,这可能是一个完整的网络爬虫工具包或相关...

    heritrix抓取指南

    同时,遵循网站的robots.txt规则,尊重网站的抓取政策,以保持合法和可持续的数据采集。 通过Heritrix的高效抓取能力,我们可以获取大量淘宝商城空调商品的详细信息,包括但不限于商品名称、价格、评价等,这些数据...

    php 源码音乐电子书、可抓取数据

    从描述来看,该平台可能还具备数据抓取功能,允许用户或管理员从其他音乐资源站点获取内容,丰富平台的音乐库。 **PHP源码详解:** PHP(Hypertext Preprocessor)是一种广泛使用的开源脚本语言,特别适合于Web开发...

    sysexp.zip 抓取所有屏幕能看到的文字

    Nirsoft是一家知名的软件开发公司,他们专注于创建小型实用工具,主要服务于系统管理员和高级用户。因此,“sysexp.zip nirsoft”表明这个工具出自Nirsoft,通常他们的软件都是免费且便携式的,易于使用且功能强大。...

    ASP源码—网博士ASP全静态企业网站管理系统.zip

    1. **内容发布**:允许管理员便捷地添加、编辑和删除网站内容,如产品介绍、新闻动态等。 2. **用户管理**:支持用户注册、登录,可以对用户权限进行设置,如访客、会员和管理员等不同级别的访问权限。 3. **数据...

    网络数据包抓取

    这一过程通常需要管理员权限,因为涉及到对网络流量的直接访问。在Windows操作系统上,我们可以使用如Wireshark这样的开源工具进行数据包捕获,但若想自定义实现,C#提供了丰富的库和API,如.NET Framework中的...

    .net Winform 抓取本地网卡HTTP数据

    6. **权限和安全性**:在Windows系统中,程序可能需要管理员权限才能访问网络接口。此外,要注意捕获的数据可能包含敏感信息,因此在设计时要考虑数据保护和隐私问题。 7. **异常处理**:在编程过程中,需要充分...

    Winform实现网络数据包抓取软件

    标题中的“Winform实现网络数据包抓取软件”是指利用Windows Forms(Winform)这一.NET框架下的用户界面开发工具,创建了一个能够捕获并解析网络数据包的应用程序。这种软件通常被称为网络嗅探器或数据包分析器,...

    提取 sitemap 中的链接,利用百度、必应、谷歌 API 自动 推送至搜索引擎,提升网站收录速度

    本文将详细介绍如何通过提取 sitemap 中的链接并利用百度、必应和谷歌的 API 自动推送至这些搜索引擎,从而加速网站收录。 首先,我们需要了解什么是 sitemap。sitemap 是一种 XML 文件,它列出了网站的所有重要...

    帝国网站管理系统教程

    2. **安装流程**:下载最新版本的帝国CMS,上传至服务器,通过浏览器访问安装程序,进行数据库配置、管理员账号创建等步骤。 3. **配置优化**:根据服务器环境调整PHP和MySQL配置,确保系统的稳定运行和高效性能。 ...

    asp.net 网站内容管理系统

    内置的广告管理功能使得管理员可以方便地添加、管理和跟踪网站上的广告展示,支持各种广告格式,如图片、文本、视频等,并能设置显示规则,如时间、频率、位置等。 5. **投票功能**: 投票功能让网站能够收集用户...

    C# 抓取TCP UDP网络数据包.zip

    例如,可能需要安装Pcap.NET库,或者在运行时需要管理员权限来访问网络接口。 总的来说,这个压缩包提供了学习和实践C#网络数据包抓取的一个起点,对于开发者来说,这不仅可以加深对TCP和UDP协议的理解,还可以提升...

    网站地图生成器

    网站地图生成器是一款专门为网站管理员和SEO专家设计的实用工具,它的主要功能是自动化地创建XML或HTML格式的网站地图,帮助搜索引擎更好地理解和索引网站内容。一个有效的网站地图对于提高网站的可见性和搜索引擎...

    mimikatz(windows 明文密码抓取工具)

    3. **LSA秘密获取**:Local Security Authority(LSA)秘密存储了系统的重要安全信息,如域管理员密码哈希。mimikatz能读取这些秘密,进一步威胁到整个网络的安全。 4. **DPAPI(Data Protection API)解密**:...

    关于大型网站的优化建议.docx

    - **Google分析和管理员工具**:安装并定期检查Google Analytics和Google Search Console,获取网站性能数据和优化建议。 - **URL标准化**:确保所有页面有统一且唯一的URL,避免重复内容问题。 2. **关键词研究*...

    基于PHP的DZphp论坛万能抓取程序源码.zip

    是一款基于PHP和MySQL的社区论坛软件,以其强大的功能和易用性受到许多网站管理员的青睐。开发者可以利用其API或通过分析其结构来获取数据。 3. **论坛数据抓取**: 数据抓取,也称为网络爬虫,是一种自动化获取...

    经典图片文章抓取软件 - SEO工具

    搜索引擎倾向于给予原创、高质量的内容更高的排名,因此对于网站管理员和SEO专业人员来说,确保网站上的文章具有独特性和价值是至关重要的。这款工具正是为了解决这一问题,通过抓取图书或其他来源的图片信息,将...

    Python-一个安全工具用于抓取许多网络主机的截图

    这样的功能对于网络管理员、渗透测试者以及进行安全审计的人员来说非常有用,因为它能帮助他们可视化远程系统的状态,而无需直接访问每台设备。 首先,理解工具的工作原理至关重要。这个工具通常会结合DNS枚举技术...

    提取 sitemap 中的链接,利用百度、必应、谷歌 API 自动推送至搜索引擎,提升网站收录速度

    6. **Google Search Console**:谷歌的 Google Search Console 是一个必不可少的工具,它允许管理员监控和维护网站在谷歌搜索中的表现。同样,它提供了 URL 提交功能,包括单个 URL 和 Sitemap 的提交,有助于加快...

Global site tag (gtag.js) - Google Analytics