论坛首页 综合技术论坛

关于搜索,我的一些看法

浏览 22180 次
该帖已经被评为良好帖
作者 正文
   发表时间:2007-06-06  
目前的搜索大体分通用搜索和垂直搜索。

两者差别在于信息来源,通用的范围很广,所以数据量一般都是海量。垂直的信息来源比较单一,所以数据量相对而言就小。

技术角度而言,通用主要关注数据量,偏重架构设计,而垂直着重搜索的UI。


如何设计好一个架构,我觉得自己还在摸索,所以不多说,感兴趣的可以看看google的paper。

垂直搜索的面向是特定用户群,他们需要的是准确快速方便的找到自己想要的信息。所以如何将用户体验做好,这个难度在这里。

因为是要通过搜索表现结果,那么就需要结合搜索。

举几个例子现在不大好的垂直搜索:

google的生活频道搜索,一大堆搜索条件让人选择,这明显是不懂搜索的人做的。

还有些搜索,对自身业务没搞清,就往通用靠拢,根据搜索关键词来拉出些相关词。

国内我觉得不错的垂直,
taobao。




欢迎大家讨论。
   发表时间:2007-06-07  
一个完整的垂直搜索生命周期包括:
Crawl:抓取足够多的数据;
Extract:从数据中解析出需要的内容存储起来;
Index:做索引;
Sort:基于相关性算法进行排序
UI:把结果对用户友好的方式表现出来。

我认为LZ只是重点强调了UI,这个无可厚非。但是真正想把垂直搜索做好,每个环节都不能忽略。

对搜索只懂一点皮毛,欢迎各位抛砖!
0 请登录后投票
   发表时间:2007-06-07  
一个完整的垂直搜索生命周期包括:
Crawl:抓取足够多的数据;
Extract:从数据中解析出需要的内容存储起来;
Index:做索引;
Sort:基于相关性算法进行排序

这些都是 全文检索必备的,我觉得基础的没必要说。

0 请登录后投票
   发表时间:2007-06-07  
imjl 写道
一个完整的垂直搜索生命周期包括:
Crawl:抓取足够多的数据;
Extract:从数据中解析出需要的内容存储起来;
Index:做索引;
Sort:基于相关性算法进行排序

这些都是 全文检索必备的,我觉得基础的没必要说。



why?因为这个原因:

引用
垂直搜索的面向是特定用户群,他们需要的是准确快速方便的找到自己想要的信息。所以如何将用户体验做好,这个难度在这里。
0 请登录后投票
   发表时间:2007-06-08  
呵呵,,你觉得呢?
0 请登录后投票
   发表时间:2007-06-15  
大家知道,用户体验在整个垂直搜索引擎中,拥有自己的位置,而且这个位置比在通用搜索引擎中显得更加重要。

LZ在这里强调用户体验非常重要,我认为已经暗含了两个前提:
(1)搜索的基础设施相对成熟,技术已经完备。要想有新的突破,需要发费非常大的努力。在实际开发中,付出和回报是不是划算,值得思考;
(2)目前来看,用户体验还未引起充分重视。缺这个,于是它显得尤为重要。缺什么,就补什么;同时,在用户体验上发功夫比在搜索的基础设施上发功夫,回报更大;

在这两个前提条件下,说用户体验非常重要,那就完全正确啦!
0 请登录后投票
   发表时间:2007-06-15  
1.数据源的量大,准确度高,
2.索引模块运行速度快
3.检索模块性能好,可扩展性可维护性好
0 请登录后投票
   发表时间:2007-06-15  
引用

roki     5 小时前
1.数据源的量大,准确度高,
2.索引模块运行速度快
3.检索模块性能好,可扩展性可维护性好



这些都是基本的考虑。我不觉得这是特性。
0 请登录后投票
   发表时间:2007-06-15  

zhangyu8374     20 小时前
大家知道,用户体验在整个垂直搜索引擎中,拥有自己的位置,而且这个位置比在通用搜索引擎中显得更加重要。

垂直和通用是两个范畴。


LZ在这里强调用户体验非常重要,我认为已经暗含了两个前提:
(1)搜索的基础设施相对成熟,技术已经完备。要想有新的突破,需要发费非常大的努力。在实际开发中,付出和回报是不是划算,值得思考;
(2)目前来看,用户体验还未引起充分重视。缺这个,于是它显得尤为重要。缺什么,就补什么;同时,在用户体验上发功夫比在搜索的基础设施上发功夫,回报更大;

在这两个前提条件下,说用户体验非常重要,那就完全正确啦!

你理解错误。我说的用户体验不单单是css,ajax。而是如何让用户能更加简便快速准确找到自己想要的信息。

0 请登录后投票
   发表时间:2007-06-15  
垂直搜索,IMHO,根本就是个伪命题
因为,如果你有了搜索的功能,你只要把这个功能应用在一个行业特定的数据集合上,你就得到了这个行业的“垂直搜索”
而另一个方面,谁需要垂直搜索?我想象不出来。“特定用户群”是什么意思?下午五点找饭辙的一群人?那我也同样希望这些信息来自所有信息源、来自我熟悉的搜索方式,例如Google或者百度。
所以,再一次的,IMHO,我觉得所谓垂直搜索,综上两点而论,只是没有搜索技术的情况下,拿半结构化甚至结构化数据检索来冒充搜索的一个半吊子概念。
0 请登录后投票
论坛首页 综合技术版

跳转论坛:
Global site tag (gtag.js) - Google Analytics