论坛首页 Java企业应用论坛

一个优化百度和谷歌搜索结果的搜索网站是如何写出来的(原创)?

浏览 28146 次
精华帖 (4) :: 良好帖 (1) :: 新手帖 (0) :: 隐藏帖 (4)
作者 正文
   发表时间:2010-03-24  

     昨天看到这个帖子的时候才一个回复,没想到一天不到这么多回复,我也说说我的看法。
声明一下:我对搜索引擎不知道,只知道用,对SEO不了解,我只是一个普普通通的群众。
下面是我的看法,欢迎讨论。补充一句:在中国想做,差的不止是车库。

================================================================

引用

    1、搜索结果没有分类展示。因为同一个搜索关键词,对应的结果有多种,可能是网站,也可能是指相关资料的下载,还可能是对关键词描述的网页;百度和谷歌都是把这三种结果混在一起排序,顾客要花时间根据自己的意愿寻找了。打个比方,如搜索tomcat,百度的搜索结果第一条是tomcat的介绍,谷歌的第一条是tomcat网站首页;如果使用百度的顾客想要的是tomcat网站,使用谷歌的想要的是tomcat介绍,还有可能是要tomcat的下载,那么顾客不得不花时间往下寻找自己的结果。而在沃搜(www.ausou.net),搜索结果是按照网页描述、网站和下载分类展示的;顾客可以很快定位自己想要的结果。


lz分了网页描述,网站,下载三个分类,我不知道别人是怎么使用搜索的
例如我直接在搜索框输入java,大概我是想找到所有关于java的信息
如果我想下载tomcat,我会输入 tomcat下载,
如果我想搜索tomcat的网站,我会输入tomcat.com 或者tomcat网站,tomcat官方网站等

我以前也想过类似的,但是也只是想想,没能力做出来,即使我做出来了,google和baidu只需要稍微的修改一下就可以达到这个效果,一点竞争力也没有,就是浪费时间嘛,我的想法是这样,现在我的分辨率是1280x1024,当我使用google的时候,搜索结果所占的屏幕一半不到,大概只有570像素,右边空白这么多,完全可以用来显示图片,视频,新闻这些,至于分辨率有很多种,程序可以自己判断嘛,网民可以设置是否在右边显示相关的图片,视频,新闻搜索结果。

================================================================

引用
    2、搜索结果没有按照正文对关键词描述的丰富程度排序。这种情况是针对网页描述类的搜索。打个比方,比如搜索tomcat配置,一般顾客想要的都是详细介绍tomcat如何配置的;但是谷歌和百度的搜索结果是:靠前排列的结果可能只说了一点,系统且详细介绍的靠在后面。这样顾客不得不花时间一个一个链接点开查看,寻找自己的想要的结果。而沃搜(www.ausou.net)基于这种搜索理念:网页描述性搜索结果,其对关键词描述的越系统、越详细(就是网页描述丰富程度),此网页的正文字数也就越多,其搜索排序应该靠前。当然这里的网页正文含义是指剔除网页中的广告等垃圾文字的。沃搜(www.ausou.net)对描述性搜索结果就是按照网页正文对关键词描述丰富程度排序的;


Google的排序是按照网站,网页的PR来排序的,如果按照网页对关键词描述的程度排序,那么作#弊现象可能会很严重,我的搜索习惯就是在专业的网站里面找结果,我的偏好设置是每页显示50条结果,一般我会选择最前面的20条左右,然后筛选,筛选的条件就是看网址,例如我搜索“tomcat配置”相关的内容,如果结果里面有javaeye,csdn,我聚会点进去,如果例如是knowsky那种,我就不会点进去,不会一个一个链接点开看,你的按照字数描述排序,相信lz使用过google百宝箱,有何看法?

================================================================

引用
    3、有些搜索结果无法访问或者访问速度过慢也排在前面;沃搜(www.ausou.net)对于这样的搜索结果会给予提示,并排在最后面;


现在google.cn不能访问了,google.cn和rising还推出了安全链接,如果一个结果无法访问,搜索引擎在更新的时候会把它从结果中移除吧,至于访问速度,你真的想要判断?例如你的搜索服务器是双线的,在搜索结果里面有一个链接,现在你服务器的的判断结果是访问速度打开需要1s,那个网站是联通的宽带,但是有一位网民是电信的宽带,他访问那个链接,打开网站需要2s,现在有一位电信的网民,打开网站需要4s,数据只是为了举例说明,而且南北有差异,国外国内有差异,我想很难做,用服务器的访问速度标准判断客户端的访问速度,效果不好
================================================================

引用
    4、百度和谷歌的各自搜索结果和相关搜索关键词没有整合,当然不只是百度和谷歌,可能还有其他大型的搜索网站结果;沃搜(www.ausou.net)可以通过配置整合基础搜索网站的搜索结果和相关搜索关键词;


我想他们不可能整合吧,自己开了一家餐厅客人点了一盘“泡椒肉丝”,老板拿出一张单子说,客官你是要百度客栈的泡椒肉丝呢,还是要本店的泡椒肉丝,除非你是帮人订餐的,不知道这个比喻对不对。不论是google引入百度的结果还是百度引入google的结果,侵权的吧,如果不是合作
================================================================

引用

    5、搜索结果中包含太多无关的广告,混淆视听。我不反对搜索结果中有广告,但是彼此相关性要大点吧?
    问题就说这几点吧,下面就谈针对这些搜索结果的问题,沃搜(www.ausou.net)如何解决及解决思路。
    要对百度和谷歌等大型搜索结果进行优化,首先要取得这些基础的搜索结果。然后提出搜索结果链接,然后及时访问每个目标链接, 获取每个目标链接的内容后,进行内容分析;分析完之后就是搜索结果的分类、搜索结果的再包装和搜索结果的排序;最好是 搜索结果的输出。


至于广告,百度的竞价排名就不说了。很多广告大概都要归于seo的功劳。机器做事总是有人可以找到它的规律,然后让后让它变得friendly。

 

0 请登录后投票
   发表时间:2010-03-24  
搜索google的时候怎么会有乱码啊
0 请登录后投票
   发表时间:2010-03-24  
楼主能够把自己的想法花功夫付出实践,并且分享处理。我非常佩服。
我觉得没必要非得一下子把楼主的作品直接去和Google他们去比较,
毕竟要走的道路还很漫长。
我目前的感觉就是Firefox不支持,只能出来两个优先的结果,而后续的内容无法出现。
0 请登录后投票
   发表时间:2010-03-24  
用lucene做的吧
0 请登录后投票
   发表时间:2010-03-24  
访问试了一下,就是有点慢。不错!
0 请登录后投票
   发表时间:2010-03-24  
niubility
0 请登录后投票
   发表时间:2010-03-24  
LZ 加油,baidu google 不都是一步步 来的嘛!
0 请登录后投票
   发表时间:2010-03-24  
就在大家抱怨为什么中国没有google的时候,或许大家鼓励一下,10年后中国的google也就产生了!LZ加油
0 请登录后投票
   发表时间:2010-03-24  
aoliwen521 写道
楼主能够把自己的想法花功夫付出实践,并且分享处理。我非常佩服。
我觉得没必要非得一下子把楼主的作品直接去和Google他们去比较,
毕竟要走的道路还很漫长。
我目前的感觉就是Firefox不支持,只能出来两个优先的结果,而后续的内容无法出现。

firefox不支持,是Js的问题,我暂时没有考虑,因为自己一直用ie。不过这个很容易改的。
0 请登录后投票
   发表时间:2010-03-25  
慢,慢,太慢了,慢得跟吃屎一样。
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics