如何对一个Document的不同Filed使用不同的分词器
TonyLian 2010-01-25
如题。
对于文章正文,希望使用中文分词器。
而用户在提交文件时让其输入的文章关键字,多个用空格分开,则希望使用WhitespaceAnalyzer进行分词并保存。
Java代码
doc.add(new Field("TXT",text, Field.Store.YES, Field.Index.ANALYZED));
doc.add(new Field("KEYWORD", keyWord, Field.Store.YES, Field.Index.ANALYZED));
doc.add(new Field("TXT",text, Field.Store.YES, Field.Index.ANALYZED));
doc.add(new Field("KEYWORD", keyWord, Field.Store.YES, Field.Index.ANALYZED));
引用 收藏
luckaway 2010-01-26
自己实现分词器! 研究下lucene相关的代码,还是蛮简单的! 引用 收藏
illu 2010-01-26
可以使用PerFieldAnalyzerWrapper
//默认为庖丁分词
PerFieldAnalyzerWrapper wrapper =
new PerFieldAnalyzerWrapper(new PaodingAnalyzer());
//fieldName 为field名称
//analyzer field对应分词器
wrapper.addAnalyzer(fieldName, analyzer); 引用 收藏
TonyLian 2010-01-26
illu 写道
可以使用PerFieldAnalyzerWrapper
//默认为庖丁分词
PerFieldAnalyzerWrapper wrapper =
new PerFieldAnalyzerWrapper(new PaodingAnalyzer());
//fieldName 为field名称
//analyzer field对应分词器
wrapper.addAnalyzer(fieldName, analyzer);
大开眼界呀!去研究一下~
转自:http://lucene-group.group.iteye.com/group/topic/17513
分享到:
相关推荐
"filed-mimefix"是一个专为前端开发设计的开源库,其主要目标是处理和修正文件的MIME类型问题。在深入探讨这个库之前,我们先来理解一下MIME类型及其在前端开发中的作用。 MIME(Multipurpose Internet Mail ...
【标题】"sound_filed-master.zip" 是一个与超声波声场相关的项目,由谭智源开发,主要使用MATLAB进行实现。这个压缩包包含了用于超声场可视化研究和图形用户界面(GUI)仿真的代码和资源。 【描述】"谭智源-基于...
`field_assignment` 就是这样一个关键概念,它指的是通过字段(field)来给对象的属性赋予特定的值。这个过程通常涉及到对象实例化、属性设置以及数据交互。本文将深入探讨由`field`给定的分配API的相关知识点,并...
- **“HCS-filed-PM笔试考题”**:这个标题意味着这份资料包含了华为认证服务解决方案(HCS)领域的项目管理(PM)相关的笔试题目。这意味着考生需要掌握的服务解决方案方面的项目管理知识。 #### 描述解析: - ...
本文档将详细介绍如何设计一个复杂的字段组报表(Complex Field Group Jasper),并涵盖了创建样式、背景颜色设置、条件性显示线条与背景色、排序字段、变量创建、分组、嵌套分组以及在相同位置展示不同字段等内容。...
`FileD.java`可能是一个辅助类,与`FileDao`协作完成更复杂的文件操作,比如批量处理、文件流的处理或文件的加密解密。它可能利用了`java.nio`包中的`Files`和`Path`类,这些类提供了更多面向函数的API,如`Files....
在`GetFieldContent`这个例子中,可能是一个示例程序,它读取输入的Word文档,提取所有域的解析结果,并可能将这些内容输出到控制台或者写入新的文档。 总结来说,Aspose.Words提供了一套全面的API,使开发者能够...
此外,Simulink环境可以用于构建动态系统模型,包括超声波发射器和接收器的工作模型。 三、超声场的数值模拟 在Matlab中,可以通过数值方法(如有限差分法或有限元法)来模拟超声场的传播。这涉及到求解波动方程,...
在"Filed-Test-master"这个压缩包中,可能包含了整个项目的源代码,包括上述的路由配置、控制器代码、模型定义、数据库上下文、测试用例以及其他支持文件。开发者可以通过解压和编译这些文件,在本地环境中运行和...
这一过程可以通过最小化一个特定的能量函数来实现,该能量函数反映了图像的不同部分之间的差异以及相邻像素之间的相似性。通过迭代优化方法,如梯度下降或模拟退火算法,可以找到使能量函数达到最小值的分割方案。 ...
python abaqus 保存每一帧的场输出为一个文件,只输出的mises值,如果需要保存其他值改动输出就可以了
最后通过Graphical User Interface设计出一个图形操作界面,有助于我们通过换能器的调参过程对声场的分布影响进行研究,同时也有助于我们更清楚地了解声场的分布理论,从而提升我们的研究效率。
在Java Swing中,JTextField可以与其他组件一起使用,通过布局管理器安排在窗口中。例如,使用GridLayout: ```java JPanel panel = new JPanel(new GridLayout(1, 2)); panel.add(new JLabel("用户名:")); ...
在本项目中,"filed-test-API"是一个基于Django框架构建的应用,它与SQL Server数据库结合,模拟了音频文件服务器的行为。这个API允许开发者通过HTTP接口进行音频文件的存储、检索以及可能的处理操作。以下是对这个...
7. **命令行接口**:可能使用`argparse`模块创建一个命令行界面,用户可以通过输入参数来运行不同的功能,例如查询特定日期范围内的支付记录。 8. **测试**:为了确保代码质量,项目可能会包含单元测试和集成测试。...
Extract all these filed to a directory (CppUnitLite) Move StackMain.cpp, StackTest.cpp and Stack.h to some other directory Create a workspace Create a project for a static library called CppUnitLite, ...
"filed-audio-server"是一个基于Python开发的音频服务器项目,它主要用于处理音频流和提供音频服务。在本文中,我们将深入探讨这个项目的背景、功能、实现原理以及相关的Python技术。 首先,音频服务器的主要作用是...
用户可以通过框架选择并加载不同的DD,对设备进行配置和诊断。 4. 现场总线和设备:FDT技术支持多种现场总线标准,如基金会现场总线(FF)、Profibus、Modbus、HART等,使得来自不同供应商的智能设备能够在同一平台...
基于Matlab的超声场可视化研究及GUI仿真模拟sound_filed-master.zip
为了简化这个过程,可以使用专门的工具,如ffmpeg等,它们内置了TS流处理功能,可以方便地进行拼接和截取操作。 总结来说,MPEG-2 TS流的拼接是一个技术性较强的过程,涉及到数据包的识别、时间戳处理、错误检测等...