`
hz_chenwenbiao
  • 浏览: 1010387 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

将文件内容加入索引

阅读更多

上一篇是使用hibernate search的一个文档说明,已经简单地介绍了如何使用bridge来将放到pojo属性里去的值进行预处理,也就是在加入索引文件前,先将set进来的值跳转到bridge去处理,再将返回的结果作为将进行分词索引的值。我使用的是将上传的文件内容加入索引,这里由于文件内容在存入数据库前就转换为二进制流(如byte[] date,上面加入@Lob标注)。我的文件是放在Files类里,还一个FileVersions类,用来存放文件内容和文件版本及关联Files这个类,

为什么这么设计,我也搞不懂,我是半路接手的,所以就没去改它里面的逻辑。

public class FileVersion implements java.io.Serializable {

。。。
/** 版本号 **/
	private float version = 0.1f;
	/** 文件大小 **/
	private int fileSize = 0;
	/** 更新时间 **/
	private java.util.Date updateDate = new java.util.Date();
	/** 文件描述 **/
	@Column(name = "DESCRIPTION", length = 255)
	private String description;

	/**
	 * 附件的内容
	 */
	@Basic(fetch = FetchType.LAZY)
	@Column(name = "CONTENT", nullable = true)
	@Lob
	@FieldBridge(impl=org.edu.scut.lab24.search.bridge.HandlerBridge.class)
	@Field(name = "data", index = Index.TOKENIZED, store = Store.NO)
	private byte[] data;

/** 关联文件信息 **/
	@ManyToOne(optional = true, fetch = FetchType.LAZY)
	@JoinColumn(name = "FILEID", nullable = false)
	@IndexedEmbedded(prefix="fileVersion_file_", depth=1)
	private Files files;

}
 
分享到:
评论

相关推荐

    利用java序列化实现基于文件的快速索引

    在“利用java序列化实现基于文件的快速索引”这一主题中,我们将探讨如何利用Java的序列化机制来创建高效的数据索引,从而加速文件数据的检索。 首先,了解Java序列化的基本概念。在Java中,一个类如果实现了`java....

    索引文件txt

    - **插入操作**:类似INSERT操作,新添加的文档会自动加入索引。 - **删除操作**:类似DELETE操作,删除文档时会从索引中移除对应的记录。 #### 3. 索引优化 文件末尾部分似乎提到了索引优化的一些概念,如“Aa,b...

    photoshop索引文件无法处理的的解决方法

    索引颜色模式是一种用于减少图像文件大小的技术,它将图像的颜色数量限制在一个较小的调色板内,通常不超过256种颜色。这种模式非常适合于Web图标、动画GIF或任何不需要高色彩保真的图像。然而,当处理复杂图像或...

    基于合并因子的多种格式文件索引技术

    1. 文本提取:无论原始文件是什么格式,首先需要将文件内容转换为文本格式。对于非文本文件,如图片或PDF,可能需要利用OCR(光学字符识别)技术或者专用的解析器提取其中的文本信息。 2. 文本预处理:在索引之前,...

    生成CHM文件中添加搜索功能

    为了解决这个问题,可以通过对CHM文件进行反编译和重新编译,加入索引来实现搜索功能。下面,我将详细介绍整个操作流程以及相关的软件工具。 首先,为了添加搜索功能,您需要一个可以将CHM文件反编译的工具。文档中...

    组合框获取文件夹内文件名称,加入到组合框中。

    接下来,我们看“读取EDB数据库内容,加入到超级列表框中”。EDB数据库通常用于存储特定类型的数据,如电子邮件或日志信息。在易语言中,处理这类数据库可能需要第三方库或者自定义模块。以下是一个假设的伪代码,...

    luncene建索引的基本实例

    写入流程中,源字符串经过 Analyzer 处理,包括分词和去除停止词(Stopword),然后将源中需要的信息加入 Document 的各个 Field 中,并将需要索引的 Field 索引起来,最后将索引写入存储器。读出流程中,用户提供...

    深入了解Lucene之二 索引结构.ppt

    本篇内容将详细解析Lucene的索引结构,帮助你更好地理解和运用这个强大的工具。 首先,我们要明白索引的基本构成。在Lucene中,索引是由一系列文档(document)组成的,每个文档包含多个域(field),每个域又由多...

    取文件图标加入到超级列表框.rar

    "取文件图标加入到超级列表框"的主题涉及到如何在编程中获取文件的图标,并将其显示在具有列表功能的控件——如“超级列表框”(Super ListBox)中。本文将详细介绍这一过程,主要涉及以下几个方面: 1. 文件图标:每...

    深入 Lucene 索引机制深入 Lucene 索引机制

    不同类型的文件索引需要不同的解析器,HTML和XML文件索引可能需要额外的步骤来过滤掉无用的标签内容。虽然这可能导致索引过程稍微慢一些,但不影响检索效率。 3.1 Demo 说明 在提供的示例中,`lucene-demos-1.4-...

    图书管理系统 c语言实现 doc界面 功能齐全可用,带详细实验报告,

    (1) 建立一个图书馆管理信息数据库文件,输入若干图书的记录,建立一个以书号为 关键字的索引文件以及相关的索引链头文件。实现1:采编入库,新采购一种书,经分 类和确定书号后登陆图书账目中去。如果这种书已经...

    LaTeX论文写作教程-建立索引及文献引用

    LaTeX论文写作教程-建立索引及文献引用 LaTeX是一种基于TeX的排版系统,用于创建高质量的科技文档,如学术论文、书籍、报告等。与传统的字处理软件(如Word)相比,LaTeX具有以下优势: 专业排版:LaTeX提供了丰富...

    行业分类-设备装置-应用于搜索引擎的海量文件异步索引及读写方法.zip

    同时,这种方式允许索引过程在数据流中动态进行,即使有新文件加入,也能快速地进行索引更新。 3. **读写优化**:搜索引擎需要频繁地读取和写入数据,优化这部分性能对于提升整体效能至关重要。这可能涉及到磁盘I/O...

    索引器实例

    根据提供的文件信息,我们可以提取并总结出以下与Java开发中的索引器相关的知识点: ### 1. 文件遍历与搜索 #### 1.1 文件遍历基础 在Java中,通常使用`java.io.File`类来操作文件系统,包括创建、删除、重命名...

    EI 工程索引期刊2010目录

    对于2009年的目录“EI 2009年索引的所有期刊目录 - COMPENDEX JOURNALS SOURCE LIST (2009).pdf”,其价值在于提供了一年的对比,研究人员可以查看两年间哪些期刊继续保持被EI收录,哪些新加入了名录,或者哪些被...

    solr官方例子加入新的项目并加上发送索引功能

    总之,将新的项目加入到Solr官方示例中并实现发送索引功能,需要对Solr的配置、Schema设计和数据导入有深入理解。通过不断实践和优化,我们可以利用Solr的强大功能,构建高效、灵活的全文搜索引擎。

    如何轻松制作CHM文件

    在CHM文件中加入这类链接可以方便用户获取更多帮助。 7. **优化技巧**: - 优化HTML代码,保持简洁和标准化,以提高加载速度和兼容性。 - 使用CSS控制样式,使文件结构清晰,易于阅读。 - 为图片和其他资源使用...

    三维模型s3c生成fbx索引

    **添加新链接**:在文件夹内搜索`*.osgb NOT _L`,全选后加入索引文件。 6. **保存索引文件**:保存修改后的.s3c文件。 #### 知识点三:模型合并与坐标系统一致性 - **模型合并前提**:确保所有参与合并的模型...

    lucene索引入门[归类].pdf

    索引模块的主要功能是将数据源解析成 Document 对象,然后将其写入索引中。 2. 检索模块(Search): Lucene 的检索模块负责从索引中检索数据,提供了多种检索方式,包括关键字检索、范围检索、精准检索等。 3. ...

Global site tag (gtag.js) - Google Analytics