锁定老帖子 主题:关于搜索,我的一些看法
该帖已经被评为良好帖
|
|
---|---|
作者 | 正文 |
发表时间:2007-06-16
引用 gigix 9 小时前 垂直搜索,IMHO,根本就是个伪命题 因为,如果你有了搜索的功能,你只要把这个功能应用在一个行业特定的数据集合上,你就得到了这个行业的“垂直搜索” 而另一个方面,谁需要垂直搜索?我想象不出来。“特定用户群”是什么意思?下午五点找饭辙的一群人?那我也同样希望这些信息来自所有信息源、来自我熟悉的搜索方式,例如Google或者百度。 垂直搜索用户怎么个定位,我觉得这不是这个题目讨论的东西。 可能你喜欢信息来自所有信息源,但并不表示所有人有这么想法。 就拿我个人使用搜索的习惯来说吧。搜索通用信息,我喜欢用google,搜索mp3,我喜欢用baidu,bt下载,我喜欢用btchina。 通用信息量大,来源广泛,但可能一个关键词带来很多你不一定想要的信息。垂直的信息来源特定,比如视频类只和视频有关,bt的只和bt信息有关。目标群非常明确,喜欢视频的找视频搜索,喜欢bt的找bt搜索。 正是因为有些人看到有这样的需求,才会有垂直的出现。 所以,再一次的,IMHO,我觉得所谓垂直搜索,综上两点而论,只是没有搜索技术的情况下,拿半结构化甚至结构化数据检索来冒充搜索的一个半吊子概念。 即便用数据库做也可以啊,难道使用select语句不是搜索吗? 通用和垂直只是针对数据源和应用而言。并不是说非要用什么语言,什么技术,什么框架,这样才算搜索。 IT有很多浮躁的东西,只是一些新东西的产生,我觉得在评论前,先做些尝试,分析其出现背景,应用基础,使用对象群,感兴趣的分析技术。 |
|
返回顶楼 | |
发表时间:2007-06-16
gigix 写道 垂直搜索,IMHO,根本就是个伪命题
因为,如果你有了搜索的功能,你只要把这个功能应用在一个行业特定的数据集合上,你就得到了这个行业的“垂直搜索” 而另一个方面,谁需要垂直搜索?我想象不出来。“特定用户群”是什么意思?下午五点找饭辙的一群人?那我也同样希望这些信息来自所有信息源、来自我熟悉的搜索方式,例如Google或者百度。 所以,再一次的,IMHO,我觉得所谓垂直搜索,综上两点而论,只是没有搜索技术的情况下,拿半结构化甚至结构化数据检索来冒充搜索的一个半吊子概念。 如果垂直搜索只是停留在如此理解层次,那我认为它根本没戏。与通用搜索公司比起来,从事垂直搜索的公司无论是在技术上,还是在资金上都不是一个档次的。此时,做垂直搜索的要有竞争力,一定得专注于行业内,挖掘行业内有用的信息,然后展现给用户。 Google和百度简洁的风格虽是他们非常大的优势,但是也存在一些问题: (1)普通用户搜索时,有时会对选择哪些关键字进行搜索存在困惑; (2)搜索结果没有以用户期望的方式展现。比如搜索机票,我就希望满足条件的搜索结果能够以对比的方式一一列出来,而不需要我一一点击链接,自己去总结。 |
|
返回顶楼 | |
发表时间:2007-06-16
imjl 写道 即便用数据库做也可以啊,难道使用select语句不是搜索吗?
通用和垂直只是针对数据源和应用而言。并不是说非要用什么语言,什么技术,什么框架,这样才算搜索。 IT有很多浮躁的东西,只是一些新东西的产生,我觉得在评论前,先做些尝试,分析其出现背景,应用基础,使用对象群,感兴趣的分析技术。 如果你要这样讲,我就赞同你好了。 但我还是偷偷的在想:搜索似乎应该是针对非结构化数据、平文本来进行的;用SQL处理结构化数据,我大学时的老师告诉我,应该叫检索。当然很可能随着加上垂直这个前缀以后,“搜索”这个词本身的意义也发生了变化。 引用 搜索结果没有以用户期望的方式展现。比如搜索机票,我就希望满足条件的搜索结果能够以对比的方式一一列出来,而不需要我一一点击链接,自己去总结。
好例子。 现在我似乎更明白所谓“垂直搜索”是什么货色了。 |
|
返回顶楼 | |
发表时间:2007-06-17
垂直搜索我倒是做过一点--电信的号码百事通,饮食方面,它会去爬大众点评网这里饮食网站,parse它们的页面内容入库,如订座电话之类的会作为单独的field入库。
SQL 与 全文检索 的差别还是挺大的,SQL只能用like,速度是一个,对多关键字的支持是一个。 |
|
返回顶楼 | |
发表时间:2007-06-29
垂直搜索和广度搜索其本质都是把符合条件的数据查询出来,其区别主要在于索引之前的工作,对用户来说意义不大。
我做过视频搜索,据说英国的autonomy技术领先google的技术,可以解析到视频里的信息,这个概念上的检索他们定义为非结构化,简单的网页抓取一般都不叫非结构化,除非深入到视觉分块的层次。 |
|
返回顶楼 | |
发表时间:2007-06-29
marine_chen 写道 垂直搜索和广度搜索其本质都是把符合条件的数据查询出来,其区别主要在于索引之前的工作,对用户来说意义不大。
无语。 我做过视频搜索,据说英国的autonomy技术领先google的技术,可以解析到视频里的信息,这个概念上的检索他们定义为非结构化,简单的网页抓取一般都不叫非结构化,除非深入到视觉分块的层次。 不懂 |
|
返回顶楼 | |
发表时间:2007-07-01
垂直搜索,很多时候 就是花人力把原始数据中的信息提炼出来,
让用户能找到更准确的信息, 比如搜车票搜房子, 除了能让你找到信息所在页面之外,额外做了一步,帮你把车票房子的价格等等信息提取出来,省得用户再去页面中找, 这步分析的过程,技术含量不高,但是确实对用户是有帮助的, 这个切入点是垂直搜索的机会所在. |
|
返回顶楼 | |
发表时间:2007-07-01
我感觉搜索不如聚合后检索方便 聚合可以针对准确的商业信息(比如酒店预定服务 机票预定服务)作聚合 然后为客户提供全局检索
|
|
返回顶楼 | |
发表时间:2007-07-01
引用 winterwolf 4 小时前 我感觉搜索不如聚合后检索方便 聚合可以针对准确的商业信息(比如酒店预定服务 机票预定服务)作聚合 然后为客户提供全局检索 垂直的也是阿。。 有的数据比聚合还要精确。。 |
|
返回顶楼 | |
发表时间:2007-07-02
imjl 写道 引用 winterwolf 4 小时前
我感觉搜索不如聚合后检索方便 聚合可以针对准确的商业信息(比如酒店预定服务 机票预定服务)作聚合 然后为客户提供全局检索 垂直的也是阿。。 有的数据比聚合还要精确。。 聚合不仅可以提供搜索(gx说是检索)还可以直接提供服务 预定 买卖 wiki等等 数据源 可以是rss; atom; web service; rest service; xml page |
|
返回顶楼 | |