按照我的设想,下一代Internet搜索技术,应该由以下四个部分组成:
一、以互联网搜索为核心的网络资源搜索。
现在最常见的搜索工具,Google、百度、Yahoo、MSN Search之类的,都属于这个范畴。再加上今后会出现的越来越多的各种专业信息搜索,比如论文、文献、MP3、BT、RSS等等搜索工具。
二、以桌面搜索为核心的个人资源搜索。
现在的桌面搜索工具还刚刚起步,今后的发展不可限量。总的趋势是,个人的计算机内的信息资源,都只需要搜索,而不需要费力气整理。就像现在GMail提出的口号。
三、以即时通讯工具为桥梁的网格资源搜索。
这个东西,现在似乎还只是局限与P2P文件共享的搜索,我的设想是,假设我的好友,能够帮我在他的机器里搜索有没有我要的东西,前提是我们两个人都各自装了桌面搜索工具,同时如果他愿意的话,也可以将搜索到的信息共享给自己的朋友。现在的P2P文件共享搜索,除了依托中央服务器的搜索本来就算不上是网格搜索之外,即使是基于好友的互助式搜索,也没有全文检索的能力,总之大有改进的余地。
四、以机器辅助标引Tags为手段的全球信息资源整合。
全球信息资源主要存在于两种地方,一个是公开的互联网上的某个服务器中,一个就是各个不同的个人电脑之中。如何提高搜索的命中率与效率,为各种信息建立主题词索引是一个关键。我之前分析过,“主题词是有管理的tags;tags无管理的主题词”。因此,姜伟的“计算机辅助主题词标引”技术,大可以派上用处。假设用户在自己的机器上装一个工具软件,在用户上网浏览网页、进行编辑Office文档等等工作的时候,这个工具可以在合适的位置提示该文档也许可以标引出几个“主题词/tags”,这样用户就可以更好的整理自己的知识与资料。与此同时,用户浏览公共信息时标引的主题词,也可以上传到某个服务器上,这个服务器可以汇总各个使用者对于同一个URL的主题词标引词情况,统计大家最为认为的,标引重复程度最高的“前N个词”作为这个URL的主题词。这对于今后搜索的效果提升,相信大有好处。
以上的设想,总结起来,是需要一种全新的客户端软件+全新的搜索服务模式+互助式的搜索协作机制。这就是我设想的下一代搜索技术!
各位走过路过的朋友,如果对实现这样的技术有兴趣,可以和我联系!
分享到:
相关推荐
每个个体的适应度由特定的适应度函数衡量,适应度高的个体有更高的概率被选中参与下一代的生成。这一过程包括选择、交叉和变异三个主要步骤: 1. **选择**:根据适应度选择个体,通常使用轮盘赌选择策略,适应度高...
**遗传:**指生物个体的性状可以通过基因传递给下一代。在遗传算法中,这对应于解决方案(通常表示为“染色体”)的传递。 **变异:**指的是基因组内的随机变化,这可能导致新特性的出现。在遗传算法中,通过“变异...
适应度高的个体有更高的概率被选中参与下一代的生成,通过交叉和变异操作,不断优化种群,逐步逼近全局最优解。 2. **理论基础**:Holland的模式定理是遗传算法的数学基础,它描述了种群在经过遗传操作后,优秀模式...
网站快车完全基于 asp.net 2.0 和 ajax 技术 开发的新一代网站管理系统, 完全WEB2.0的CMS系统, 全球第一款采用web os方式管理网站的创时代性CMS系统,WEBOS的操作方式,令网站的技术含量大增,界面简洁,功能丰富...
完全基于 asp.net 2.0 和 ajax 技术 开发的新一代网站管理系统, 完全WEB2.0的CMS系统, 全球第一款采用web os方式管理网站的创时代性CMS系统,WEBOS的操作方式,令网站的技术含量大增,界面简洁,功能丰富,操作...
Hiweb网站快车.net完全基于 asp.net 2.0 和 ajax 技术开发的新一代网站管理系统, 完全WEB2.0的CMS系统, 全球第一款采用web os方式管理网站的创时代性CMS系统,WEBOS的操作方式,令网站的技术含量大增,界面简洁,...
完全基于asp.net2.0和ajax技术开发的新一代网站管理系统,完全WEB2.0的CMS系统,全球第一款采用webos方式管理网站的创时代性CMS系统,WEBOS的操作方式,令网站的技术含量大增,界面简洁,功能丰富,操作方便。...