`
nunaleon2003
  • 浏览: 8655 次
  • 性别: Icon_minigender_1
  • 来自: 北京
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

一个优化百度和谷歌搜索结果的搜索网站是如何写出来的(原创)?

阅读更多
   经过半年的时间,终于将我的个人搜索网站(沃搜:www.ausou.net)写好,并正式上线运营。在此,想和大家分享其中的思路和经验,也算个总结吧!
    想写一个对百度和谷歌搜索结果优化的网站,源于我对其搜索结果的不满。也就像很多山寨的搜索网站一样,想给客户更好的结果和体验,不过我的搜索网站走的更远,自己的创意更多而已。
    首先我提出问题,即我对百度和谷歌搜索结果不满的地方:
    1、搜索结果没有分类展示。因为同一个搜索关键词,对应的结果有多种,可能是网站,也可能是指相关资料的下载,还可能是对关键词描述的网页;百度和谷歌都是把这三种结果混在一起排序,顾客要花时间根据自己的意愿寻找了。打个比方,如搜索tomcat,百度的搜索结果第一条是tomcat的介绍,谷歌的第一条是tomcat网站首页;如果使用百度的顾客想要的是tomcat网站,使用谷歌的想要的是tomcat介绍,还有可能是要tomcat的下载,那么顾客不得不花时间往下寻找自己的结果。而在沃搜(www.ausou.net),搜索结果是按照网页描述、网站和下载分类展示的;顾客可以很快定位自己想要的结果。
    2、搜索结果没有按照正文对关键词描述的丰富程度排序。这种情况是针对网页描述类的搜索。打个比方,比如搜索tomcat配置,一般顾客想要的都是详细介绍tomcat如何配置的;但是谷歌和百度的搜索结果是:靠前排列的结果可能只说了一点,系统且详细介绍的靠在后面。这样顾客不得不花时间一个一个链接点开查看,寻找自己的想要的结果。而沃搜(www.ausou.net)基于这种搜索理念:网页描述性搜索结果,其对关键词描述的越系统、越详细(就是网页描述丰富程度),此网页的正文字数也就越多,其搜索排序应该靠前。当然这里的网页正文含义是指剔除网页中的广告等垃圾文字的。沃搜(www.ausou.net)对描述性搜索结果就是按照网页正文对关键词描述丰富程度排序的;
    3、有些搜索结果无法访问或者访问速度过慢也排在前面;沃搜(www.ausou.net)对于这样的搜索结果会给予提示,并排在最后面;
    4、百度和谷歌的各自搜索结果和相关搜索关键词没有整合,当然不只是百度和谷歌,可能还有其他大型的搜索网站结果;沃搜(www.ausou.net)可以通过配置整合基础搜索网站的搜索结果和相关搜索关键词;
    5、搜索结果中包含太多无关的广告,混淆视听。我不反对搜索结果中有广告,但是彼此相关性要大点吧?
    问题就说这几点吧,下面就谈针对这些搜索结果的问题,沃搜(www.ausou.net)如何解决及解决思路。
    要对百度和谷歌等大型搜索结果进行优化,首先要取得这些基础的搜索结果。然后提出搜索结果链接,然后及时访问每个目标链接, 获取每个目标链接的内容后,进行内容分析;分析完之后就是搜索结果的分类、搜索结果的再包装和搜索结果的排序;最好是 搜索结果的输出。
    以上就是一个优化百度和谷歌搜索结果的总体思路,至于详细的实现和核心算法,接下来我会继续发帖介绍。当然,这要看大家是否关注这方面的内容,是否有需求了解这方面的内容。今天就写到这里为止吧。
    后记:对这方面议题敢兴趣的各位可以用邮件tming31@yahoo.com.cn或者qq:277615290讨论联系。
    (后加的:可以参考http://nunaleon2003.iteye.com/blog/624484(与百度和谷歌的搜索结果对比)
   沃搜的使用方法:http://nunaleon2003.iteye.com/blog/622551)
分享到:
评论
68 楼 hypercube1024 2010-03-31  
不知所云,看不出优势何处,根本找不到我想要的结果
67 楼 dream_mjs 2010-03-27  
想法还是可以的,但是就用户体验而言,是相当地糟糕,
第一,用户搜索一个东西的目的,是否如你以上所说那么简单?
第二,速度方面还是相当糟糕的,如果每次用户搜索一个东西,你都需要去获取google,baidu的结果,接着再去分析内容提取结果,但是响应速度问题有考虑吗?
当然你可以先进行信息收集,但是用户搜索的东西是千变万化的,这成本还是一个问题。

就技术研究而言,理念是不错的;但就实际应用场景而言,我不敢苟同
66 楼 nunaleon2003 2010-03-26  
evabibi 写道
找到楼主想要的了

来自百度百科:
http://baike.baidu.com/view/455808.htm

·搜魅网(someta)
  集合了百度、google、搜狗、雅虎多家主流搜索引擎的结果,提供网页、资讯、网址导航等聚合查询。另外,搜魅网突破了元搜索引擎没有自己的蜘蛛的瓶颈,提供了网站查询的功能。
  ·比比猫(Bbmao)
  独创国际领先的聚类和去重技术。搜索结果汇集各大搜索引擎结果,搜索结果智能分类整理,去掉重复搜索结果,并拥有直接搜寻文档和强大网络收藏夹等多元功能。对于记者、教授、高管等知性、高端且惜时如金的人群比较适用,支持中英文搜索。
  ·全博元搜索(QOOPOO)
  聚合搜索的力量,已经运行多年,2006年格林斯潘曾接触这家公司,后劲比较强劲。
  ·Xooda 元搜索引擎
  支持本地搜索,一次输入,返回多个搜索引擎结果,并对结果进行重新的优化排序。
  ·佐意综合搜索(Chinazss)
  集主流搜索引擎为一体,分类详细,强大的搜索功能。让搜索变得更方便



你去用用把,看结果如何?呵呵
65 楼 evabibi 2010-03-26  
找到楼主想要的了

来自百度百科:
http://baike.baidu.com/view/455808.htm

·搜魅网(someta)
  集合了百度、google、搜狗、雅虎多家主流搜索引擎的结果,提供网页、资讯、网址导航等聚合查询。另外,搜魅网突破了元搜索引擎没有自己的蜘蛛的瓶颈,提供了网站查询的功能。
  ·比比猫(Bbmao)
  独创国际领先的聚类和去重技术。搜索结果汇集各大搜索引擎结果,搜索结果智能分类整理,去掉重复搜索结果,并拥有直接搜寻文档和强大网络收藏夹等多元功能。对于记者、教授、高管等知性、高端且惜时如金的人群比较适用,支持中英文搜索。
  ·全博元搜索(QOOPOO)
  聚合搜索的力量,已经运行多年,2006年格林斯潘曾接触这家公司,后劲比较强劲。
  ·Xooda 元搜索引擎
  支持本地搜索,一次输入,返回多个搜索引擎结果,并对结果进行重新的优化排序。
  ·佐意综合搜索(Chinazss)
  集主流搜索引擎为一体,分类详细,强大的搜索功能。让搜索变得更方便


64 楼 xtps225 2010-03-26  
用心是好的,还要慢慢来啊!!!
63 楼 jiafu0773 2010-03-25  
passtheball 写道
慢,慢,太慢了,慢得跟吃屎一样。


最后一句话....不说了,哥知道你吃得很happy...
62 楼 select*from爱 2010-03-25  
楼主在bai,google.,bing和你自己的搜索依次搜索 sehuke
看看结果,谈谈感想
61 楼 bashenmail 2010-03-25  
nunaleon2003 写道
   经过半年的时间,终于将我的个人搜索网站(沃搜:www.ausou.net)写好,并正式上线运营。在此,想和大家分享其中的思路和经验,也算个总结吧!
    想写一个对百度和谷歌搜索结果优化的网站,源于我对其搜索结果的不满。也就像很多山寨的搜索网站一样,想给客户更好的结果和体验,不过我的搜索网站走的更远,自己的创意更多而已。
    首先我提出问题,即我对百度和谷歌搜索结果不满的地方:
    1、搜索结果没有分类展示。因为同一个搜索关键词,对应的结果有多种,可能是网站,也可能是指相关资料的下载,还可能是对关键词描述的网页;百度和谷歌都是把这三种结果混在一起排序,顾客要花时间根据自己的意愿寻找了。打个比方,如搜索tomcat,百度的搜索结果第一条是tomcat的介绍,谷歌的第一条是tomcat网站首页;如果使用百度的顾客想要的是tomcat网站,使用谷歌的想要的是tomcat介绍,还有可能是要tomcat的下载,那么顾客不得不花时间往下寻找自己的结果。而在沃搜(www.ausou.net),搜索结果是按照网页描述、网站和下载分类展示的;顾客可以很快定位自己想要的结果。
    2、搜索结果没有按照正文对关键词描述的丰富程度排序。这种情况是针对网页描述类的搜索。打个比方,比如搜索tomcat配置,一般顾客想要的都是详细介绍tomcat如何配置的;但是谷歌和百度的搜索结果是:靠前排列的结果可能只说了一点,系统且详细介绍的靠在后面。这样顾客不得不花时间一个一个链接点开查看,寻找自己的想要的结果。而沃搜(www.ausou.net)基于这种搜索理念:网页描述性搜索结果,其对关键词描述的越系统、越详细(就是网页描述丰富程度),此网页的正文字数也就越多,其搜索排序应该靠前。当然这里的网页正文含义是指剔除网页中的广告等垃圾文字的。沃搜(www.ausou.net)对描述性搜索结果就是按照网页正文对关键词描述丰富程度排序的;
    3、有些搜索结果无法访问或者访问速度过慢也排在前面;沃搜(www.ausou.net)对于这样的搜索结果会给予提示,并排在最后面;
    4、百度和谷歌的各自搜索结果和相关搜索关键词没有整合,当然不只是百度和谷歌,可能还有其他大型的搜索网站结果;沃搜(www.ausou.net)可以通过配置整合基础搜索网站的搜索结果和相关搜索关键词;
    5、搜索结果中包含太多无关的广告,混淆视听。我不反对搜索结果中有广告,但是彼此相关性要大点吧?
    问题就说这几点吧,下面就谈针对这些搜索结果的问题,沃搜(www.ausou.net)如何解决及解决思路。
    要对百度和谷歌等大型搜索结果进行优化,首先要取得这些基础的搜索结果。然后提出搜索结果链接,然后及时访问每个目标链接, 获取每个目标链接的内容后,进行内容分析;分析完之后就是搜索结果的分类、搜索结果的再包装和搜索结果的排序;最好是 搜索结果的输出。
    以上就是一个优化百度和谷歌搜索结果的总体思路,至于详细的实现和核心算法,接下来我会继续发帖介绍。当然,这要看大家是否关注这方面的内容,是否有需求了解这方面的内容。今天就写到这里为止吧。
    后记:对这方面议题敢兴趣的各位可以用邮件tming31@yahoo.com.cn或者qq:277615290讨论联系。
    (后加的:看到大家提的建议,我发帖介绍了沃搜的使用方法,详细请见:  http://nunaleon2003.iteye.com/blog/622551)



也不怎么样啊,没看出有什么好的地方.....
60 楼 nunaleon2003 2010-03-25  
passtheball 写道
慢,慢,太慢了,慢得跟吃屎一样。

是你的网速慢吧?相比百度和谷歌(实际不能比呀),是有点慢,但也不至于你这么夸张吧?呵呵
59 楼 passtheball 2010-03-25  
慢,慢,太慢了,慢得跟吃屎一样。
58 楼 nunaleon2003 2010-03-24  
aoliwen521 写道
楼主能够把自己的想法花功夫付出实践,并且分享处理。我非常佩服。
我觉得没必要非得一下子把楼主的作品直接去和Google他们去比较,
毕竟要走的道路还很漫长。
我目前的感觉就是Firefox不支持,只能出来两个优先的结果,而后续的内容无法出现。

firefox不支持,是Js的问题,我暂时没有考虑,因为自己一直用ie。不过这个很容易改的。
57 楼 wanglong1615 2010-03-24  
就在大家抱怨为什么中国没有google的时候,或许大家鼓励一下,10年后中国的google也就产生了!LZ加油
56 楼 wanglong1615 2010-03-24  
LZ 加油,baidu google 不都是一步步 来的嘛!
55 楼 putonyuer 2010-03-24  
niubility
54 楼 liushilang 2010-03-24  
访问试了一下,就是有点慢。不错!
53 楼 cmzx3444 2010-03-24  
用lucene做的吧
52 楼 aoliwen521 2010-03-24  
楼主能够把自己的想法花功夫付出实践,并且分享处理。我非常佩服。
我觉得没必要非得一下子把楼主的作品直接去和Google他们去比较,
毕竟要走的道路还很漫长。
我目前的感觉就是Firefox不支持,只能出来两个优先的结果,而后续的内容无法出现。
51 楼 zhao103804 2010-03-24  
搜索google的时候怎么会有乱码啊
50 楼 maomiandyou 2010-03-24  
<p>     昨天看到这个帖子的时候才一个回复,没想到一天不到这么多回复,我也说说我的看法。<br>声明一下:我对搜索引擎不知道,只知道用,对SEO不了解,我只是一个普普通通的群众。<br>下面是我的看法,欢迎讨论。补充一句:在中国想做,差的不止是车库。<br><br>================================================================</p>
<div class="quote_title">引用</div>
<div class="quote_div">
<br>    1、搜索结果没有分类展示。因为同一个搜索关键词,对应的结果有多种,可能是网站,也可能是指相关资料的下载,还可能是对关键词描述的网页;百度和谷歌都是把这三种结果混在一起排序,顾客要花时间根据自己的意愿寻找了。打个比方,如搜索tomcat,百度的搜索结果第一条是tomcat的介绍,谷歌的第一条是tomcat网站首页;如果使用百度的顾客想要的是tomcat网站,使用谷歌的想要的是tomcat介绍,还有可能是要tomcat的下载,那么顾客不得不花时间往下寻找自己的结果。而在沃搜(www.ausou.net),搜索结果是按照网页描述、网站和下载分类展示的;顾客可以很快定位自己想要的结果。</div>
<p><br>lz分了网页描述,网站,下载三个分类,我不知道别人是怎么使用搜索的<br>例如我直接在搜索框输入java,大概我是想找到所有关于java的信息<br>如果我想下载tomcat,我会输入 tomcat下载,<br>如果我想搜索tomcat的网站,我会输入tomcat.com 或者tomcat网站,tomcat官方网站等<br><br>我以前也想过类似的,但是也只是想想,没能力做出来,即使我做出来了,google和baidu只需要稍微的修改一下就可以达到这个效果,一点竞争力也没有,就是浪费时间嘛,我的想法是这样,现在我的分辨率是1280x1024,当我使用google的时候,搜索结果所占的屏幕一半不到,大概只有570像素,右边空白这么多,完全可以用来显示图片,视频,新闻这些,至于分辨率有很多种,程序可以自己判断嘛,网民可以设置是否在右边显示相关的图片,视频,新闻搜索结果。<br><br>================================================================</p>
<div class="quote_title">引用</div>
<div class="quote_div">    2、搜索结果没有按照正文对关键词描述的丰富程度排序。这种情况是针对网页描述类的搜索。打个比方,比如搜索tomcat配置,一般顾客想要的都是详细介绍tomcat如何配置的;但是谷歌和百度的搜索结果是:靠前排列的结果可能只说了一点,系统且详细介绍的靠在后面。这样顾客不得不花时间一个一个链接点开查看,寻找自己的想要的结果。而沃搜(www.ausou.net)基于这种搜索理念:网页描述性搜索结果,其对关键词描述的越系统、越详细(就是网页描述丰富程度),此网页的正文字数也就越多,其搜索排序应该靠前。当然这里的网页正文含义是指剔除网页中的广告等垃圾文字的。沃搜(www.ausou.net)对描述性搜索结果就是按照网页正文对关键词描述丰富程度排序的;</div>
<p><br>Google的排序是按照网站,网页的PR来排序的,如果按照网页对关键词描述的程度排序,那么作#弊现象可能会很严重,我的搜索习惯就是在专业的网站里面找结果,我的偏好设置是每页显示50条结果,一般我会选择最前面的20条左右,然后筛选,筛选的条件就是看网址,例如我搜索“tomcat配置”相关的内容,如果结果里面有javaeye,csdn,我聚会点进去,如果例如是knowsky那种,我就不会点进去,不会一个一个链接点开看,你的按照字数描述排序,相信lz使用过google百宝箱,有何看法?<br><br>================================================================</p>
<div class="quote_title">引用</div>
<div class="quote_div">    3、有些搜索结果无法访问或者访问速度过慢也排在前面;沃搜(www.ausou.net)对于这样的搜索结果会给予提示,并排在最后面;</div>
<p><br>现在google.cn不能访问了,google.cn和rising还推出了安全链接,如果一个结果无法访问,搜索引擎在更新的时候会把它从结果中移除吧,至于访问速度,你真的想要判断?例如你的搜索服务器是双线的,在搜索结果里面有一个链接,现在你服务器的的判断结果是访问速度打开需要1s,那个网站是联通的宽带,但是有一位网民是电信的宽带,他访问那个链接,打开网站需要2s,现在有一位电信的网民,打开网站需要4s,数据只是为了举例说明,而且南北有差异,国外国内有差异,我想很难做,用服务器的访问速度标准判断客户端的访问速度,效果不好<br>================================================================<br></p>
<div class="quote_title">引用</div>
<div class="quote_div">    4、百度和谷歌的各自搜索结果和相关搜索关键词没有整合,当然不只是百度和谷歌,可能还有其他大型的搜索网站结果;沃搜(www.ausou.net)可以通过配置整合基础搜索网站的搜索结果和相关搜索关键词;</div>
<p><br>我想他们不可能整合吧,自己开了一家餐厅客人点了一盘“泡椒肉丝”,老板拿出一张单子说,客官你是要百度客栈的泡椒肉丝呢,还是要本店的泡椒肉丝,除非你是帮人订餐的,不知道这个比喻对不对。不论是google引入百度的结果还是百度引入google的结果,侵权的吧,如果不是合作<br>================================================================<br></p>
<div class="quote_title">引用</div>
<div class="quote_div">
<br>    5、搜索结果中包含太多无关的广告,混淆视听。我不反对搜索结果中有广告,但是彼此相关性要大点吧?<br>    问题就说这几点吧,下面就谈针对这些搜索结果的问题,沃搜(www.ausou.net)如何解决及解决思路。<br>    要对百度和谷歌等大型搜索结果进行优化,首先要取得这些基础的搜索结果。然后提出搜索结果链接,然后及时访问每个目标链接, 获取每个目标链接的内容后,进行内容分析;分析完之后就是搜索结果的分类、搜索结果的再包装和搜索结果的排序;最好是 搜索结果的输出。</div>
<p><br>至于广告,百度的竞价排名就不说了。很多广告大概都要归于seo的功劳。机器做事总是有人可以找到它的规律,然后让后让它变得friendly。</p>
<p> </p>
49 楼 Taven 2010-03-24  
体验了一下搜索功能,感觉还是有很多要改进的地方啊  加油~

相关推荐

    【免费百度优化软件】百度关键词优化-搜索优化

    一个良好的网站结构可以使得百度蜘蛛更容易抓取和理解网页内容。页面加载速度是用户体验的重要指标,也会影响百度的排名。随着移动互联网的发展,移动优先的索引策略已成为百度的标准,因此,确保网站具有响应式设计...

    百度搜索引擎优化指南

    百度搜索引擎优化指南是百度官方发布的一份重要文档,旨在帮助互联网创业者和SEO从业者更好地理解百度搜索引擎的工作原理,并提供一系列优化建议,以帮助网站提高在百度搜索结果中的排名,从而获得更多流量。...

    百度和google优化的区别

    2. Google:Google明确表示社交媒体信号是其排名因素之一,尤其是在谷歌搜索结果中的社交媒体平台链接。 七、语言和地域差异 1. 百度:作为中文搜索引擎,百度更擅长处理中文内容,对于中文网站的优化更为友好。 ...

    seo优化百度和谷歌的差别.docx

    这意味着在优化百度时,确保网站内容的独特性和原创性至关重要。 其次,权重分配方面,百度更倾向于赋予首页较高的权重,因此在优化策略上,通常需要重点优化首页以获取更好的排名。而谷歌则相对公平,无论内页还是...

    SEO蜘蛛精优化百度谷歌软件

    百度和谷歌作为两大主流搜索引擎,它们的优化策略有所不同。百度更注重网站的用户体验和内容质量,而谷歌则更加重视网站的整体结构和外部链接的质量。对于百度优化,需要确保网站加载速度快,页面布局清晰,内容原创...

    百度谷歌快照SEO优化排名软件

    "百度谷歌快照SEO优化排名软件"声称能在一到三天内将网站推上三大搜索引擎首页,这可能涉及到以下几点: 1. **快速收录**:软件可能通过提交网站至搜索引擎,加速收录过程。 2. **自动化工具**:自动化完成关键词...

    百度搜索该如何优化

    总之,优化百度搜索涉及多方面的策略,包括内容质量、关键词策略、网站结构、速度优化、外部链接和移动适配等。通过持续的努力和调整,网站排名的提升并非遥不可及。不过,请注意,所有的优化工作都应遵循搜索引擎的...

    搜索引擎 谷歌 百度 实例

    谷歌搜索引擎是全球最大的搜索引擎,其核心技术包括PageRank算法和Panda、Penguin、Hummingbird等一系列更新。PageRank是评估网页重要性的基础,它考虑了网页之间的链接结构。Panda更新则关注内容质量,旨在提升高...

    php+ajax仿百度谷歌搜索下拉效果

    在IT行业中,实现类似百度和谷歌的搜索下拉效果是一项常见的需求,这能极大地提升用户体验。本项目以"php+ajax"技术栈为基础,旨在创建一个动态的搜索建议功能,让用户在输入关键字时就能看到相关的搜索建议,无需...

    GOOGLE百度网站优化SEO最终详解(txt)简介

    3. **网站结构优化**: 一个清晰、逻辑性强的网站结构有助于搜索引擎理解和索引页面。包括URL设计、内部链接、网站地图等。 4. **内容质量**: 提供高质量、原创且有价值的内容是SEO的核心。内容应满足用户需求,同时...

    免费百度优化工具

    本文将详细讨论“免费百度优化工具”这一主题,以及如何有效地利用这些工具来提升网站在百度搜索结果中的表现。 首先,我们要理解百度优化与谷歌等其他搜索引擎优化的区别。作为中国最大的搜索引擎,百度有自己的...

    SEO优化交流前言:目前我们常用的搜索引擎:百度和谷歌,但物流的[借鉴].pdf

    在当前的网络环境中,百度和谷歌是最常用的两大搜索引擎,它们各有特点和优化重点。 谷歌在SEO方面注重链接关系,尤其是链接的质量和数量,其PageRank算法是衡量网页重要性的标准。谷歌在处理新网站时有严格的...

    EPSON推广方案 百度谷歌引擎优化seo学习资料

    描述中的“百度谷歌引擎优化”提到了两个主要的搜索引擎——百度和谷歌。百度是中国最大的搜索引擎,而谷歌则是全球范围内的主导者。对这两个平台进行优化是提升企业网站流量的关键。SEO的学习资料通常会涵盖关键词...

    搜索排名点击百度,谷歌,搜搜

    在互联网营销领域,搜索排名点击是一个关键的概念,它涉及到如何提升网站在搜索引擎结果页面(SERP)中的位置,特别是对于百度、谷歌和搜搜(已并入腾讯搜狗)这三大主流搜索引擎。本文将深入探讨搜索排名点击的重要...

    百度排名优化软件百度优化专家使用教程

    本教程将聚焦于“百度优化专家”这一工具的使用,帮助你理解如何通过该软件提升网站在百度搜索结果中的表现。 首先,我们需要了解SEO的基本概念。SEO主要包括关键词优化、元标签优化、内容质量提升、外部链接建设等...

    Google VS 百度 对搜索引擎习惯的分析.

    在本篇文章中,我们将深入探讨并对比两大全球知名的搜索引擎——Google与百度,在用户搜索习惯方面的差异及特点。本文将从搜索引擎的基本概念出发,逐步解析两者的技术实现方式、排名算法、索引策略及其对用户体验的...

    百度谷歌蜘蛛访问记录源码

    【标题】:“百度谷歌蜘蛛访问记录源码”指的是用于追踪和分析搜索引擎爬虫,如百度和谷歌的爬虫,如何访问和抓取网站内容的源代码。这些爬虫是搜索引擎的重要组成部分,它们定期扫描互联网上的网页,更新索引,以便...

Global site tag (gtag.js) - Google Analytics