论坛首页 Java企业应用论坛

一个优化百度和谷歌搜索结果的搜索网站是如何写出来的(原创)?

浏览 28150 次
精华帖 (4) :: 良好帖 (1) :: 新手帖 (0) :: 隐藏帖 (4)
作者 正文
   发表时间:2010-03-23   最后修改:2010-09-04
   经过半年的时间,终于将我的个人搜索网站(沃搜:www.ausou.net)写好,并正式上线运营。在此,想和大家分享其中的思路和经验,也算个总结吧!
    想写一个对百度和谷歌搜索结果优化的网站,源于我对其搜索结果的不满。也就像很多山寨的搜索网站一样,想给客户更好的结果和体验,不过我的搜索网站走的更远,自己的创意更多而已。
    首先我提出问题,即我对百度和谷歌搜索结果不满的地方:
    1、搜索结果没有分类展示。因为同一个搜索关键词,对应的结果有多种,可能是网站,也可能是指相关资料的下载,还可能是对关键词描述的网页;百度和谷歌都是把这三种结果混在一起排序,顾客要花时间根据自己的意愿寻找了。打个比方,如搜索tomcat,百度的搜索结果第一条是tomcat的介绍,谷歌的第一条是tomcat网站首页;如果使用百度的顾客想要的是tomcat网站,使用谷歌的想要的是tomcat介绍,还有可能是要tomcat的下载,那么顾客不得不花时间往下寻找自己的结果。而在沃搜(www.ausou.net),搜索结果是按照网页描述、网站和下载分类展示的;顾客可以很快定位自己想要的结果。
    2、搜索结果没有按照正文对关键词描述的丰富程度排序。这种情况是针对网页描述类的搜索。打个比方,比如搜索tomcat配置,一般顾客想要的都是详细介绍tomcat如何配置的;但是谷歌和百度的搜索结果是:靠前排列的结果可能只说了一点,系统且详细介绍的靠在后面。这样顾客不得不花时间一个一个链接点开查看,寻找自己的想要的结果。而沃搜(www.ausou.net)基于这种搜索理念:网页描述性搜索结果,其对关键词描述的越系统、越详细(就是网页描述丰富程度),此网页的正文字数也就越多,其搜索排序应该靠前。当然这里的网页正文含义是指剔除网页中的广告等垃圾文字的。沃搜(www.ausou.net)对描述性搜索结果就是按照网页正文对关键词描述丰富程度排序的;
    3、有些搜索结果无法访问或者访问速度过慢也排在前面;沃搜(www.ausou.net)对于这样的搜索结果会给予提示,并排在最后面;
    4、百度和谷歌的各自搜索结果和相关搜索关键词没有整合,当然不只是百度和谷歌,可能还有其他大型的搜索网站结果;沃搜(www.ausou.net)可以通过配置整合基础搜索网站的搜索结果和相关搜索关键词;
    5、搜索结果中包含太多无关的广告,混淆视听。我不反对搜索结果中有广告,但是彼此相关性要大点吧?
    问题就说这几点吧,下面就谈针对这些搜索结果的问题,沃搜(www.ausou.net)如何解决及解决思路。
    要对百度和谷歌等大型搜索结果进行优化,首先要取得这些基础的搜索结果。然后提出搜索结果链接,然后及时访问每个目标链接, 获取每个目标链接的内容后,进行内容分析;分析完之后就是搜索结果的分类、搜索结果的再包装和搜索结果的排序;最好是 搜索结果的输出。
    以上就是一个优化百度和谷歌搜索结果的总体思路,至于详细的实现和核心算法,接下来我会继续发帖介绍。当然,这要看大家是否关注这方面的内容,是否有需求了解这方面的内容。今天就写到这里为止吧。
    后记:对这方面议题敢兴趣的各位可以用邮件tming31@yahoo.com.cn或者qq:277615290讨论联系。
    (后加的:可以参考http://nunaleon2003.iteye.com/blog/624484(与百度和谷歌的搜索结果对比)
   沃搜的使用方法:http://nunaleon2003.iteye.com/blog/622551)
   发表时间:2010-03-23  
好吧,按照你的说明,我登陆了你的网站,用这篇文章的名字“一个优化百度和谷歌搜索结果的搜索网站是如何写出来的(原创)?”去搜索,结果是什么你自己去看吧,顺便说下我还是喜欢用google
0 请登录后投票
   发表时间:2010-03-23  
超级不喜欢百度
0 请登录后投票
   发表时间:2010-03-23  
搜索效果十分不理想,而且反映速度相当慢,估计是计算没做好
0 请登录后投票
   发表时间:2010-03-23  
改变用户习惯是很困难的事情,如果做到了,那么钱途是无可限量的,祝福LZ
0 请登录后投票
   发表时间:2010-03-23  
有想法是值得推崇的。但是需要再接再厉哦。搜索的结果好慢。
0 请登录后投票
   发表时间:2010-03-23  
相当不错了,就是速度可以优化,估计是服务才开始,需要更多的信息收集
1 请登录后投票
   发表时间:2010-03-23   最后修改:2010-03-23
nunaleon2003 写道
   经过半年的时间,终于将我的个人搜索网站(沃搜:www.ausou.net)写好,并正式上线运营。在此,想和大家分享其中的思路和经验,也算个总结吧!
    想写一个对百度和谷歌搜索结果优化的网站,源于我对其搜索结果的不满。也就像很多山寨的搜索网站一样,想给客户更好的结果和体验,不过我的搜索网站走的更远,自己的创意更多而已。
    首先我提出问题,即我对百度和谷歌搜索结果不满的地方:
    1、搜索结果没有分类展示。因为同一个搜索关键词,对应的结果有多种,可能是网站,也可能是指相关资料的下载,还可能是对关键词描述的网页;百度和谷歌都是把这三种结果混在一起排序,顾客要花时间根据自己的意愿寻找了。打个比方,如搜索tomcat,百度的搜索结果第一条是tomcat的介绍,谷歌的第一条是tomcat网站首页;如果使用百度的顾客想要的是tomcat网站,使用谷歌的想要的是tomcat介绍,还有可能是要tomcat的下载,那么顾客不得不花时间往下寻找自己的结果。而在沃搜(www.ausou.net),搜索结果是按照网页描述、网站和下载分类展示的;顾客可以很快定位自己想要的结果。
    2、搜索结果没有按照正文对关键词描述的丰富程度排序。这种情况是针对网页描述类的搜索。打个比方,比如搜索tomcat配置,一般顾客想要的都是详细介绍tomcat如何配置的;但是谷歌和百度的搜索结果是:靠前排列的结果可能只说了一点,系统且详细介绍的靠在后面。这样顾客不得不花时间一个一个链接点开查看,寻找自己的想要的结果。而沃搜(www.ausou.net)基于这种搜索理念:网页描述性搜索结果,其对关键词描述的越系统、越详细(就是网页描述丰富程度),此网页的正文字数也就越多,其搜索排序应该靠前。当然这里的网页正文含义是指剔除网页中的广告等垃圾文字的。沃搜(www.ausou.net)对描述性搜索结果就是按照网页正文对关键词描述丰富程度排序的;
    3、有些搜索结果无法访问或者访问速度过慢也排在前面;沃搜(www.ausou.net)对于这样的搜索结果会给予提示,并排在最后面;
    4、百度和谷歌的各自搜索结果和相关搜索关键词没有整合,当然不只是百度和谷歌,可能还有其他大型的搜索网站结果;沃搜(www.ausou.net)可以通过配置整合基础搜索网站的搜索结果和相关搜索关键词;
    5、搜索结果中包含太多无关的广告,混淆视听。我不反对搜索结果中有广告,但是彼此相关性要大点吧?
    问题就说这几点吧,下面就谈针对这些搜索结果的问题,沃搜(www.ausou.net)如何解决及解决思路。
    要对百度和谷歌等大型搜索结果进行优化,首先要取得这些基础的搜索结果。然后提出搜索结果链接,然后及时访问每个目标链接, 获取每个目标链接的内容后,进行内容分析;分析完之后就是搜索结果的分类、搜索结果的再包装和搜索结果的排序;最好是 搜索结果的输出。
    以上就是一个优化百度和谷歌搜索结果的总体思路,至于详细的实现和核心算法,接下来我会继续发帖介绍。当然,这要看大家是否关注这方面的内容,是否有需求了解这方面的内容。今天就写到这里为止吧。
    后记:对这方面议题敢兴趣的各位可以用邮件tming31@yahoo.com.cn或者qq:277615290讨论联系。




oh.........
0 请登录后投票
   发表时间:2010-03-23  
晕,上去看过,效果不太理想~~~
“将我的个人搜索网站”,“想写一个对百度和谷歌搜索结果优化的网站,源于我对其搜索结果的不满。”  太搞笑了~~~~


你不清楚,写一个搜索引擎要什么分词分晰,中文分晰分析,
0 请登录后投票
   发表时间:2010-03-23  
  我很赞同楼主的这种创新思维,个人能够写出这样能用的东东已经不错了
请问是不是用到urlconnection解析百度,google的搜索返回结果,用程序算法进行人工排序和甄别?
PS:楼上的你大可以提出自己的观点,但是不要鄙视别人的观点,有本事自己写一个这样值得分享的东西让共享一下。
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics