闲来没事,又一直想搞个社科类下载站。就用joomla
快速搭这个社科下载
,手头只有著名的万册图书,包装包装,先用上,实不足为知者道。
弄了一半,就上google webmaster
提交sitemap。不久抓取成功,本以为索引进搜索引擎,不过1、2天的事。认为理所当然,也就放一边了。今天上去一看,切!索引数目为零,这都过了4、5天了。
马上想到我的资源太旧了,不足以引起google兴趣。但是描述文字是在书里随机抽取的,google不可能见过呀,怎么把这些文字视为无效呢。极有可能是google图书搜索已经把这些书的内容全部索引了,导致这些网页文字成废物。就以被亵渎的鲁迅
这本书为样本,上google
图书搜索
搜索一看,没有呀,根本没有预览的。
那问题在哪?难道是别的网站已将这些书转化成网页了,不会吧。google一下被亵渎的鲁迅,一下就看到豆丁网
,我知道坏事了。豆丁网是scribd
的中国克隆版,用flash来提供在线文档的,google又可对flash索引,那这书的内容google还不早知道,从而将社科下载上的网页视为copy。
从这个网页快照
,可见一斑,书的第一页作为flash流的描述,但我抽取页面是随机的。还是以被亵渎的鲁迅为例,再多google几次,发现此书1-7页(下载
一个看看就知道)的内容都作为豆丁网这个flash的描述,你搜索这七页任何一句,都可见答案在豆丁网这个flash上,此书8页以后的就搜不到了。看来文档在线化,还是有搞头的,起码,在原创内容上就可批量转换。
在社科下载上,被亵渎的鲁迅用书的第11页来描述,google没见过,却不索引,不解的狠。并且,其他电子书,在抽取
网页描述
时,我也是在书的10页以后才开始,这些个内容,google也弃之如草芥,实是郁闷。
哪位达人大哥知道答案,望不吝赐教。
分享到:
相关推荐
`library.swf`可能包含了预编译的Flash组件或者地图库,而`catalog.xml`则可能是用来索引这些组件或资源的。至于`locale`文件夹,通常包含不同语言的本地化资源,使得应用能够适应不同地区的用户。 综上所述,Flash...
3. **网站索引分析**:分析搜索引擎对网站的索引情况,包括内页索引、首页索引等,帮助识别可能的索引问题。 4. **链接分析**:检查网站的内外链质量,包括入站链接的数量和质量,以及出站链接的影响,这在链接建设...
SEO(搜索引擎优化)是提升网站在搜索引擎中自然排名的关键策略,而JavaScript和Flash在SEO中的处理方式至关重要,因为它们可能影响搜索引擎对网站内容的理解和抓取。本文将深入探讨JavaScript和Flash在SEO优化中的...
这包括提取页面上的文本内容,对中文文本进行分词处理,去除停用词(如“的”、“和”等常见无实际意义的词汇),消除页面中的噪声(如导航栏、广告等非主要内容),建立正向索引(记录每个单词在哪些页面出现)和倒...
4. **搜索不到网页的原因**:Google可能未索引新网站,或者索引了但未在搜索结果中显示。这可能是因为网站不够成熟、内容质量低、缺乏外部链接,或者可能违反了Google的Webmaster指南。 5. **网站设计与Google收录*...
总的来说,"seo工具 flash站长必备" 提供的工具集成了多种SEO关键功能,旨在帮助站长提升网站的搜索引擎表现,跟踪关键词表现,分析竞争对手,并进行必要的技术优化。通过充分利用这些工具,站长可以更有效地管理和...
17. JavaScript 脚本/图片/Flash 等非文本形式的使用:网站设计时需要避免使用 JavaScript 脚本/图片/Flash 等非文本形式,以免影响搜索引擎的索引。 18.站点结构设计:网站设计时需要考虑站点结构设计,例如页面及...
在这个“曹鹏SEO视频教程-50.flash.rar”中,我们可以期待学习到如何利用SEO提升网站在搜索引擎如百度、谷歌等的排名,吸引更多的潜在用户。 【搜索引擎的工作原理】 搜索引擎的主要任务是抓取网页、索引内容并...
Shapefile则是ArcGIS常用的数据存储格式,它由一系列配套文件组成,包括.shp(几何数据)、.dbf(属性数据)、.shx(索引数据)等。 压缩包内的`kml2shp.py`文件很可能是一个Python脚本,利用了像GDAL/OGR这样的库...
SWFObject的设计理念在于提供一种简洁有效的方法来嵌入Flash内容,同时保持对旧版浏览器的支持和搜索引擎的友好性。通过这种方式,开发者可以在不影响用户体验的情况下,为网页添加动态多媒体内容。 #### 结论 ...
3. 关键词标签:对Google的影响已经不大,可以适当使用,但不要过度堆砌。 4. 其他标签:如理解清楚,可以适当使用,否则建议避免,以免适得其反。 最后,大型网站的排名维护策略主要是持续监控和微调。由于大型...
**索引搜索(indexof)**:在Google搜索框中输入`indexof/`后接想要查找的文件类型(例如:`inurl:lib`,`indexof/cnki`,`indexof/ppt`,`indexof/mp3`,`indexof/swf`),可以绕过网站限制,直接访问到存储这些...
sIFR(可伸缩Inman Flash替换)是一种前端网页设计技术,主要用于改善网页上的文本渲染效果,尤其是在那些不支持高质量Web字体或者浏览器对CSS3 @font-face规则支持不足的场合。sIFR 2.0.7是该技术的一个特定版本,...
- **Flash网页**:难以被搜索引擎抓取。 - **不可见的导航**:不利于搜索引擎抓取。 - **代码混乱**:影响抓取效率。 - **动态网页**:某些情况下难以被索引。 - **Session IDs**:动态URL参数可能导致重复内容问题...
例如,使用清晰的HTML结构,避免使用JavaScript或Flash来呈现关键内容,确保网站有良好的响应速度,以及提供站点地图等,都能提升搜索引擎对网站的友好度。 最后,需要注意的是,虽然这些IP地址可以提供一定的帮助...
抓取过程中,搜索引擎会去除重复内容、进行分词处理、分析网页类型,并对网页进行关键词提取,构建索引库。 处理网页阶段,搜索引擎会对抓取的数据进行一系列预处理,包括关键词提取、建立索引、去重、分词(对于...
全文搜索引擎,如Google,通过索引网页内容来提供搜索结果;目录索引类搜索引擎,如Yahoo,依赖人工分类和整理的网站目录;元搜索引擎则整合多个搜索引擎的结果,提供给用户一站式搜索体验。 Google作为全文搜索...
提交后,百度通常需要一个月左右的时间来更新其索引,而Google的收录速度可能更快,如果网站有实质性内容,它可能会主动抓取。一旦被搜索引擎收录,你的网站就有可能出现在用户的搜索结果中。 如果你的网站已经更新...
避免使用过多的框架或Flash元素,因为这些可能会影响搜索引擎的爬取效果。 3. **网站速度**:加载速度快的网站更容易受到搜索引擎青睐。优化图片大小、减少HTTP请求等方式可以有效提升网站速度。 4. **移动友好**:...
SEO不仅是技术性的操作,还包括对用户需求的理解和满足,确保网站内容高质量且易于索引。优化过程涉及了网页设计、用户体验、内容质量等多个层面,目标是提高网站的相关性和权威性,最终让搜索引擎认为这个网站对...