中文 |
英文 |
中文解释 |
|
文档 |
Document |
|
|
|
Document Frequency, df |
有多少文档包含次Term。df 越大说明越不重要 |
|
全文检索 |
Full-text Search |
|
|
索引创建 |
Indexing |
|
|
|
lemmatization |
将单词转变为词根形式 |
|
语言处理组件 |
Linguistic Processor |
|
|
小写 |
Lowercase |
|
|
倒排表 |
Posting List |
|
|
相关性 |
relevance |
|
|
打分 |
scoring |
|
|
搜索索引 |
Search |
|
|
顺序扫描法 |
Serial Scanning |
|
|
|
stemming |
将单词缩减为词根形式 |
|
停词 |
Stop word |
一种语言中最普通的一些单词,由于没有特别的意义,因而大多数情况下不能成为搜索的关键词,因而创建索引时,这种词会被去掉而减少索引的大小 |
|
词 |
Term |
|
|
|
Term Frequency, tf |
此Term在此文档中出现了多少次。tf 越大说明越重要 |
|
词的权重 |
Term weight |
表示此词在此文档中的重要程度,越重要的词有越大的权重 |
|
词元 |
Token |
|
|
|
Tokenize |
1. 将文档分成一个一个单独的单词。
2. 去除标点符号。
3. 去除停词
|
|
分词组件,分词 |
Tokenizer |
|
|
向量空间模型的算法 |
Vector Space Model |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
相关推荐
物联网中英文词汇对照表 本文档旨在提供一个物联网领域中的英文词汇对照表,涵盖了从基础概念到应用领域的各种术语。以下是从给定文件中抽取的重要知识点: 1. 基础概念 * IOT:物联网,指的是将各种信息感知、识...
9. **字符串处理**:如模式匹配(String Matching)、模糊匹配(Approximate String Matching)在文本分析和搜索技术中扮演重要角色。 10. **集合与串问题**:如集合覆盖(Set Cover)、集合配置(Set Packing)等...
这个“LabVIEW专业词汇中英对照”文件是学习和使用LabVIEW时的重要参考资料,它提供了常用术语的中文翻译,帮助用户快速理解和操作软件。 1. **前面板与菜单栏**: - 文件(File):包括新建VI (New VI),打开(Open)...
计算机专业词汇中英对照 在计算机专业领域中,英文词汇是不可或缺的一部分。作为一个程序员,拥有良好的英文基础可以提高工作效率和竞争力。下面我们就来了解一些常见的计算机专业词汇的中英对照。 词汇解释 1. ...
"大数据词汇中英文对照表" 大数据词汇中英文对照表是大数据领域中的一个重要参考资源,它涵盖了从算法到数据分析、人工智能、商业智能、云计算、数据存储、数据分析等多个方面的词汇。在本篇文章中,我们将对该表中...
她还推荐使用搜索引擎辅助学习,特别是针对“赵丽词汇5000”这样的资源。 在记忆单词的过程中,赵老师提到了三个最佳记忆时间:半饥饿状态、大脑皮层兴奋时和临睡前。这些时段人的记忆力通常较好。同时,她指出,...
### 编程词汇英汉对照 本篇内容旨在为学习计算机科学及编程的朋友提供一份详细的编程术语英汉对照表。这些术语涵盖了计算机科学中的多个重要领域,包括但不限于数据结构、算法、数学问题以及一些特定的计算机应用...
《计算机英汉对照词典》是一款专为计算机领域学习者设计的翻译工具,它提供了丰富的计算机专业词汇,帮助用户在阅读英文文档时更好地理解和翻译。这款软件尤其适合那些希望提升计算机英语水平,或是工作中需要频繁...
这份词汇字典将这些关键概念以中英文对照的方式呈现,确保用户能够迅速定位到所需词汇。下面我们将深入探讨其中的一些重要知识点。 1. **轨道工程**:涉及铁路线路的设计、建设和维护,包括直线、曲线、坡度、道岔...
用户可以通过输入英文单词来查找对应的汉语解释,也可以通过输入汉语来搜索对应的英文词汇。这种双语对照的学习方式对于学习者掌握词汇的准确含义和用法大有裨益。 5. **压缩包文件**:文件以RAR格式压缩,这是一种...
用户可以通过搜索功能快速定位所需词汇,大大提高了工作效率。 在电力行业中,精确无误的术语使用是保证工作质量、避免误解和事故的重要保障。因此,这份“电力词汇,电工专用,英汉-汉英”资料对于电工专业人员来...
同时,用户可以通过搜索功能查找特定词汇或段落,以便快速定位到他们感兴趣的内容。 而"www.pudn.com.txt"可能是一个附加文件,通常这类文件可能是下载链接的来源信息,或者是关于文档的版权、使用条款等说明。用户...
总之,【PHP实例开发源码-7x8Y中英文对照词典(php).zip】涵盖了多种PHP开发中的关键技术,包括数据库操作、前端交互、搜索算法以及安全性等方面,是学习和提升PHP技能的一个宝贵资源。通过研究源代码,开发者可以...
停词是指那些在文本中非常常见,但在检索过程中通常不会对搜索结果产生实质性影响的词汇,例如“的”、“是”、“和”等。这些词在分析文本时可能会被忽略,以提高搜索效率和结果的相关性。 Solr(Solarium)是...
中英对照版则为双语环境下的工作提供了便利,对于学习英语编程词汇和提高技术文档阅读能力非常有帮助。英文版API则是最原始的官方文档,对于保持与国际技术同步至关重要。 "jdk api 1.8_China&&English.CHM" 文件是...
在备考过程中,考生需要了解并熟悉文档中的中英文词汇对应,这涵盖了操作系统、数据库管理、网络技术、软件工程、数据结构和算法等多个领域。例如,"Operating System"(操作系统)包括了Windows、Linux、Unix等,...
本资源“计算机专业英语常用词汇.pdf.zip”聚焦于这一领域,包含了计算机科学中的核心概念和术语,特别关注了数据结构和操作系统的关键英文词汇,同时也提供了相关专业范文的中英文对照,帮助学习者巩固理解和实际...