`

提高检索速度

阅读更多
   我总有种做“博闻强识”者的倾向,大学四年所积累的30个笔记本便是佐证。我当初的想法是尽可能地多积累,然后不定期地回顾复习、思考。 然而最终的结果是积累了不少,回顾复习则从时间角度来讲已不具可行性了,而且那些东西大多只留下了一些模糊的影响,想真正地拿来用还是有点距离。

    平时不管是写作、策划或是干编程这种专业性工作,还是得上网搜索相关资料,有时甚至觉得当今的一切知识无非是检索而已,于我们而言核心竞争力是检索应用的能力而非知识本身。
    以前的学习,一般需要预先在肚子里存储下足够的知识,必要时,就从海量的信息中提取所需的部分。这种学习方式造就了很多“才高八斗,学富五车”的大才子。但是,到了信息领域大大超出“四书五经”的新时期,预先无目的的吞下海量信息的学习方式就有些不合时宜了


——————————————思想改进转化为行动力——————————————
关于google的使用技巧(在技术搜索方面确实较百度占优势):

1、 “与”“非”和“或”,这三种搜索语法Google分别用“ ”(空格)、“-”和“OR”表示。
     缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用“ ”连起来),目标信息不能含有的关键字(用“-”去掉),目标信息可能含有的关键字(用
“OR”连起来)。

2、 通配符问题
    通配符问题  * ?
    关键字的字母大小写(不区分大小写)/搜索整个短语或者句子(但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。)/搜索引擎忽略的字符以及强制搜索

3、 对搜索的网站进行限制
    “site”表示搜索结果局限于某个具体网站或者网站频道,如“www.sina.com.cn”、
“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。
    注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http://”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。

4、 在某一类文件中查找信息:
   
“filetype:”是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索

5、 搜索的关键字包含在URL链接中
   “inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。

   “allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只

集中于网页的链接字符串。


6、 搜索的关键字包含在网页标题中
   “intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL
进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。

分享到:
评论

相关推荐

    全文自动检索系统中的快速检索与索引文件压缩算法

    这种结构可以显著提高检索速度,尤其是在处理大规模数据集时。 ##### 有序单词搜索树 在分级索引的第一层,传统上采用排序分类查找算法。然而,由于文本中的单词数量庞大,这一层级的结构往往非常庞大,从而影响...

    daqreadCached:这个版本的 daqread 被修改以提高检索速度,特别是对于大文件。-matlab开发

    此版本的 daqread (daqreadCached.m) 在两个方面进行了修改,以提高检索速度,尤其是对于大文件。 1) 不是每次调用 daqread 时都构建文件索引,这对于大文件来说可能非常耗时,而是在持久变量中缓存调用之间的索引...

    图片检索 程序 图片检索 程序

    近似最近邻搜索算法(如Locality Sensitive Hashing, LSH 或 Annealing KNN)可以在保证一定精度的前提下,显著提高检索速度。 6. 多模态检索:除了基于图像特征的检索,现代技术还结合了文本信息,如图像的元数据...

    信息检索方法-PPT

    3. 检索效率:通过索引、缓存、并行处理等手段提高检索速度,满足实时性需求。 4. 检索效果评价:通过查准率、查全率、F值等指标评估检索系统的性能。 三、检索技术 1. 分词技术:对输入的查询进行词汇切分,是...

    基于形状特征和颜色的服装图像检索

    讨论形状特征的提取、综合颜色和纹理的多特征图像检索以及多级检索模式,并实现了基于多特征的多级服装图像检索模式,一级检索:快速提取服装外轮廓特征表达服装的形状,提高检索速度;二级检索:使用颜色、纹理结合...

    信息检索-布尔检索和倒排索引

    - 对于大型文档集合,如网络页面、书籍、论文等,倒排索引能够极大地提高检索速度并减少资源消耗。 #### 布尔检索模型与倒排索引的结合 在信息检索系统中,布尔检索模型通常与倒排索引相结合使用,从而实现高效的...

    信息检索基本原理与数据库全文检索技术

    倒排索引能快速定位到包含特定词项的文档,从而提高检索速度。 在文档查询中,常用的相似度计算方法有向量点积和余弦相似度。向量点积直接计算两个向量的内积,而余弦相似度考虑了向量的方向,能更好地评估向量之间...

    分布式环境下多关键词并行密文检索方案.pdf

    这样的设计不仅可以显著提高检索速度,还可以通过增加节点数量来提高系统的整体性能。 系统的实现需要考虑多个方面,包括如何高效地管理和分配数据存储、如何设计合理的通信机制以支持大量节点间的协作、以及如何...

    基于纹理的图像检索技术研究

    - **实时性更强**:优化算法设计,提高检索速度,满足实时应用需求。 - **适应性更广**:增强算法的泛化能力,使其能够在不同领域、不同类型的图像数据上都表现出良好的性能。 综上所述,基于纹理的图像检索技术在...

    信息检索,第二版Information Retrieval, Second Edition

    通过建立词汇与文档之间的映射关系,可以大大提高检索速度。 #### 2.3 检索模型 检索模型是决定如何匹配查询与文档的关键部分。常见的模型包括布尔模型、向量空间模型、概率模型等,每种模型都有其适用场景和优缺点...

    信息检索经典从模型到算法教程

    索引构建则是为了提高检索速度,通过预处理文档创建一种数据结构,允许快速查找包含特定关键词的文档。文档表示则涉及到如何将文本信息转换成可用于比较和匹配的形式,如TF-IDF(词频-逆文档频率)和词袋模型。 接...

    基于FastMap的固定音频分段检索技术研究

    本文的研究重点在于如何通过结合FastMap算法改进固定音频分段检索技术,旨在提高检索速度的同时,确保检索的准确性,尤其适用于实时环境下音频数据的检索。 为了深入理解这一研究的创新点和应用价值,我们首先需要...

    全文检索及其在公文处理系统中的应用

    现有的研究主要集中在提高检索速度、优化查询性能、提升检索准确率等方面,但在实际应用中,还需要解决如大规模数据索引、安全控制、个性化检索等问题。 1.3 论文组织结构 本文将从全文检索的基本概念和Lucene技术...

    大数据环境下信息智能检索系统设计.pdf

    2. 分布式处理:利用分布式计算框架(如Hadoop或Spark)处理大规模数据,提高检索速度。 3. 自然语言处理:运用NLP技术理解用户的查询意图,提供语义检索。 4. 机器学习:通过训练模型学习用户行为,个性化推荐相关...

    文本检索及挖掘

    3. **倒排索引**:预处理步骤,将每个词对应到包含它的文档列表,提高检索速度。 4. **模糊匹配**:处理拼写错误、同义词等,提高召回率。 5. **查询扩展**:利用相关词汇和短语改进用户的原始查询,提高检索质量。 ...

    SpringMvc+Lucene全文检索

    在实际开发中,你可能需要根据项目需求对这些组件进行调整和优化,比如增加缓存机制以提高检索速度,或者添加更多的预处理步骤以提高检索精度。 总的来说,Spring MVC和Lucene的结合为我们提供了一个强大而灵活的...

Global site tag (gtag.js) - Google Analytics