`
feng19
  • 浏览: 4791 次
  • 来自: ...
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

google对flash的索引

阅读更多

  闲来没事,又一直想搞个社科类下载站。就用joomla 快速搭这个社科下载 ,手头只有著名的万册图书,包装包装,先用上,实不足为知者道。

  弄了一半,就上google webmaster 提交sitemap。不久抓取成功,本以为索引进搜索引擎,不过1、2天的事。认为理所当然,也就放一边了。今天上去一看,切!索引数目为零,这都过了4、5天了。

  马上想到我的资源太旧了,不足以引起google兴趣。但是描述文字是在书里随机抽取的,google不可能见过呀,怎么把这些文字视为无效呢。极有可能是google图书搜索已经把这些书的内容全部索引了,导致这些网页文字成废物。就以被亵渎的鲁迅 这本书为样本,上google 图书搜索 搜索一看,没有呀,根本没有预览的。

  那问题在哪?难道是别的网站已将这些书转化成网页了,不会吧。google一下被亵渎的鲁迅,一下就看到豆丁网 ,我知道坏事了。豆丁网是scribd 的中国克隆版,用flash来提供在线文档的,google又可对flash索引,那这书的内容google还不早知道,从而将社科下载上的网页视为copy。

  从这个网页快照 ,可见一斑,书的第一页作为flash流的描述,但我抽取页面是随机的。还是以被亵渎的鲁迅为例,再多google几次,发现此书1-7页(下载 一个看看就知道)的内容都作为豆丁网这个flash的描述,你搜索这七页任何一句,都可见答案在豆丁网这个flash上,此书8页以后的就搜不到了。看来文档在线化,还是有搞头的,起码,在原创内容上就可批量转换。

  在社科下载上,被亵渎的鲁迅用书的第11页来描述,google没见过,却不索引,不解的狠。并且,其他电子书,在抽取 网页描述 时,我也是在书的10页以后才开始,这些个内容,google也弃之如草芥,实是郁闷。

  哪位达人大哥知道答案,望不吝赐教。

1
0
分享到:
评论

相关推荐

    flash地图开发api

    `library.swf`可能包含了预编译的Flash组件或者地图库,而`catalog.xml`则可能是用来索引这些组件或资源的。至于`locale`文件夹,通常包含不同语言的本地化资源,使得应用能够适应不同地区的用户。 综上所述,Flash...

    SEO站长flash工具

    3. **网站索引分析**:分析搜索引擎对网站的索引情况,包括内页索引、首页索引等,帮助识别可能的索引问题。 4. **链接分析**:检查网站的内外链质量,包括入站链接的数量和质量,以及出站链接的影响,这在链接建设...

    seo优化如何处理JavaScript和Flash

    SEO(搜索引擎优化)是提升网站在搜索引擎中自然排名的关键策略,而JavaScript和Flash在SEO中的处理方式至关重要,因为它们可能影响搜索引擎对网站内容的理解和抓取。本文将深入探讨JavaScript和Flash在SEO优化中的...

    百度谷歌等大型网站收录网页提交入口地址.docx

    这包括提取页面上的文本内容,对中文文本进行分词处理,去除停用词(如“的”、“和”等常见无实际意义的词汇),消除页面中的噪声(如导航栏、广告等非主要内容),建立正向索引(记录每个单词在哪些页面出现)和倒...

    Google搜索终极教程

    4. **搜索不到网页的原因**:Google可能未索引新网站,或者索引了但未在搜索结果中显示。这可能是因为网站不够成熟、内容质量低、缺乏外部链接,或者可能违反了Google的Webmaster指南。 5. **网站设计与Google收录*...

    seo工具 flash站长必备

    总的来说,"seo工具 flash站长必备" 提供的工具集成了多种SEO关键功能,旨在帮助站长提升网站的搜索引擎表现,跟踪关键词表现,分析竞争对手,并进行必要的技术优化。通过充分利用这些工具,站长可以更有效地管理和...

    提高网站在Google中的排名——面向搜索引擎的网站设计.docx

    17. JavaScript 脚本/图片/Flash 等非文本形式的使用:网站设计时需要避免使用 JavaScript 脚本/图片/Flash 等非文本形式,以免影响搜索引擎的索引。 18.站点结构设计:网站设计时需要考虑站点结构设计,例如页面及...

    曹鹏SEO视频教程-50.flash.rar

    在这个“曹鹏SEO视频教程-50.flash.rar”中,我们可以期待学习到如何利用SEO提升网站在搜索引擎如百度、谷歌等的排名,吸引更多的潜在用户。 【搜索引擎的工作原理】 搜索引擎的主要任务是抓取网页、索引内容并...

    谷歌kml/kmz文件转ArcGIS shapefile文件保留属性

    Shapefile则是ArcGIS常用的数据存储格式,它由一系列配套文件组成,包括.shp(几何数据)、.dbf(属性数据)、.shx(索引数据)等。 压缩包内的`kml2shp.py`文件很可能是一个Python脚本,利用了像GDAL/OGR这样的库...

    SWFObject v1.5简介

    SWFObject的设计理念在于提供一种简洁有效的方法来嵌入Flash内容,同时保持对旧版浏览器的支持和搜索引擎的友好性。通过这种方式,开发者可以在不影响用户体验的情况下,为网页添加动态多媒体内容。 #### 结论 ...

    seo之Google排名策略.docx

    3. 关键词标签:对Google的影响已经不大,可以适当使用,但不要过度堆砌。 4. 其他标签:如理解清楚,可以适当使用,否则建议避免,以免适得其反。 最后,大型网站的排名维护策略主要是持续监控和微调。由于大型...

    美国人教你这样用Google

    **索引搜索(indexof)**:在Google搜索框中输入`indexof/`后接想要查找的文件类型(例如:`inurl:lib`,`indexof/cnki`,`indexof/ppt`,`indexof/mp3`,`indexof/swf`),可以绕过网站限制,直接访问到存储这些...

    sIFR-2.0.7.zip

    sIFR(可伸缩Inman Flash替换)是一种前端网页设计技术,主要用于改善网页上的文本渲染效果,尤其是在那些不支持高质量Web字体或者浏览器对CSS3 @font-face规则支持不足的场合。sIFR 2.0.7是该技术的一个特定版本,...

    百度谷歌排名的秘密

    - **Flash网页**:难以被搜索引擎抓取。 - **不可见的导航**:不利于搜索引擎抓取。 - **代码混乱**:影响抓取效率。 - **动态网页**:某些情况下难以被索引。 - **Session IDs**:动态URL参数可能导致重复内容问题...

    搜索引擎蜘蛛ip打包包含:360,bing,百度,谷歌,神马,搜狗,头条,网站白名单ip

    例如,使用清晰的HTML结构,避免使用JavaScript或Flash来呈现关键内容,确保网站有良好的响应速度,以及提供站点地图等,都能提升搜索引擎对网站的友好度。 最后,需要注意的是,虽然这些IP地址可以提供一定的帮助...

    搜索引擎基本工作原理.pdf

    抓取过程中,搜索引擎会去除重复内容、进行分词处理、分析网页类型,并对网页进行关键词提取,构建索引库。 处理网页阶段,搜索引擎会对抓取的数据进行一系列预处理,包括关键词提取、建立索引、去重、分词(对于...

    互联网教学资源的收集、筛选、及应用——Alexa搜索引擎的.pptx

    全文搜索引擎,如Google,通过索引网页内容来提供搜索结果;目录索引类搜索引擎,如Yahoo,依赖人工分类和整理的网站目录;元搜索引擎则整合多个搜索引擎的结果,提供给用户一站式搜索体验。 Google作为全文搜索...

    怎样让百度谷歌搜狗搜到你的网站.doc

    提交后,百度通常需要一个月左右的时间来更新其索引,而Google的收录速度可能更快,如果网站有实质性内容,它可能会主动抓取。一旦被搜索引擎收录,你的网站就有可能出现在用户的搜索结果中。 如果你的网站已经更新...

    如何让百度、Google收录你的网站_如何向百度提交网站.txt

    避免使用过多的框架或Flash元素,因为这些可能会影响搜索引擎的爬取效果。 3. **网站速度**:加载速度快的网站更容易受到搜索引擎青睐。优化图片大小、减少HTTP请求等方式可以有效提升网站速度。 4. **移动友好**:...

    曹鹏SEO视频教程-06.google 搜索技巧.rar

    SEO不仅是技术性的操作,还包括对用户需求的理解和满足,确保网站内容高质量且易于索引。优化过程涉及了网页设计、用户体验、内容质量等多个层面,目标是提高网站的相关性和权威性,最终让搜索引擎认为这个网站对...

Global site tag (gtag.js) - Google Analytics