`
ttitfly
  • 浏览: 622362 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

提取关键词及相应的频率,Field.Store.NO的数据获取

J# 
阅读更多
1.提取关键词及相应的频率
java 代码
 
  1. RAMDirectory ramDir = new RAMDirectory();  
  2.         IndexWriter ramWriter = null;  
  3.         IndexReader ramReader = null;  
  4.         try {  
  5.             ramWriter = new IndexWriter(ramDir, analyzer, true);  
  6.             StringBuffer strBuffer = new StringBuffer();  
  7.             for (Iterator iter = keyWordList.iterator(); iter.hasNext();) {  
  8.                 String element = (String) iter.next();  
  9.                 strBuffer.append(element + " ");  
  10.             }  
  11.             Document doc = new Document();  
  12.             doc.add(new Field("keyword", strBuffer.toString() , Field.Store.NO,Field.Index.TOKENIZED));  
  13.             ramWriter.addDocument(doc);  
  14.             ramWriter.close();  
  15.             ramReader = IndexReader.open(ramDir);  
  16.             int maxDoc = ramReader.maxDoc();  
  17.               
  18.             TermFreqVector freqVector = ramReader.getTermFreqVector(0"keyword");  
  19.               
  20.               
  21.             //提取关键字!  
  22.             if(freqVector != null){  
  23.                 for (int i = 0; i < freqVector.size(); i++) {  
  24.                     String keyword = freqVector.getTerms()[i];  
  25.                     int frequece = freqVector.getTermFrequencies()[i];  
  26.                   
  27.                 }  
  28.             }  


2. 索引中Field.Store.NO的数据一般获取方式:

java 代码
 
  1. for(int i=0;i<hits.length();i++){  
  2.         int docId = hits.id(i);  
  3.         TermFreqVector vector = reader.getTermFreqVector(docId, "itemContent");  
  4.         for (int j = 0; j < vector.size(); j++) {  
  5.             int freq = vector.getTermFrequencies()[j];  
  6.             String text = vector.getTerms()[j];  
  7.         }  
  8.     }  
分享到:
评论
1 楼 chencang 2008-10-22  
doc.add(new Field("keyword", strBuffer.toString() , Field.Store.NO,Field.Index.TOKENIZED));
大哥,你这构建Field的函数没设置Field.TermVector.YES参数啊,后面应该提取不到关键字和词频信息吧?

相关推荐

    Ext.data.Store的基本用法

    本文详细介绍了`Ext.data.Store`的基本用法,包括创建实例、数据转换、排序操作以及如何从`store`中获取数据。通过掌握这些基本知识,开发者可以更加灵活地使用`Ext.data.Store`来处理各种数据需求。

    Advanced Input Field.unitypackage

    Advanced Input Field.unitypackage

    Aspose.Words中提取域中有效内容

    4. **提取有效内容**:对于每个感兴趣的域,你可以使用`Field.Update()`方法来确保域的值是最新的,然后获取`Field.Result`属性来得到实际的文本内容: ```csharp field.Update(); string fieldValue = field....

    Ext.form.field.ComboBox结合Java、JSON实现AutoComplete

    本示例探讨如何利用Ext JS中的`Ext.form.field.ComboBox`组件,结合Java后端和JSON数据格式,来创建这样一个功能。 `Ext.form.field.ComboBox`是Ext JS框架中一个强大的组件,它提供了下拉列表的功能,可以用于创建...

    lucene基本使用,适合初学者

    doc.add(new Field("content", "不建立索引内容", Field.Store.YES, Field.Index.NO)); Document doc2 = new Document(); doc2.add(new Field("name", "jerry.lin", Field.Store.YES, Field.Index.ANALYZED)); ...

    Cisco.Press.Cisco.Field.Manual.Router.Configuration.chm

    Cisco.Press.Cisco.Field.Manual.Router.Configuration

    Ext.data.Store 读取XML属性值

    当我们需要从XML文档中提取数据并加载到`Store`时,就涉及到`Ext.data.reader.Xml`。这篇博客文章《Ext.data.Store 读取XML属性值》可能深入探讨了如何利用`Ext.data.reader.Xml`来解析XML并填充数据存储。 XML是一...

    Markov.Random.Field.Modeling.In.Image.Analysis.3rd.Edition

    《Markov.Random.Field.Modeling.In.Image.Analysis.3rd.Edition》这一书籍主要探讨了马尔可夫随机场(Markov Random Field, MRF)在图像分析领域的应用和发展。本书通过深入浅出的方式介绍了MRF的基本概念、理论...

    extract_field.zip_北京shp_高速公路 GIS_高速公路shp_高速公路北京_高速公路数据

    "extract_field.zip_北京shp_高速公路 GIS_高速公路shp_高速公路北京_高速公路数据"这个标题和描述提示我们,这是一个关于从GIS数据中提取特定信息的案例,具体来说,是从北京地区的GIS Shapefile(shp文件)中抽取...

    Apache Lucene全文检索和IKAnalyzer分词工具类

    Field FieldId = new Field("aid", String.valueOf(vo.getAid()),Field.Store.YES, Field.Index.NO); Field FieldTitle = new Field("title", vo.getTitle(), Field.Store.YES,Field.Index.TOKENIZED,Field.Term...

    Lucence创建索引

    Field(String name, String value, Field.Store store, Field.Index index, Field.TermVector termVector) ``` - **内部类解释**: - **Field.Index**: - **TOKENIZED**:进行分词索引。 - **UN_TOKENIZED**...

    Ext数据模型Store

    10. Store更新其数据集,并触发相应的事件。 理解EXT中的数据模型,特别是Store、Proxy和Reader的工作原理,对于开发复杂的EXT应用至关重要,因为这关系到数据的获取、管理和展示。通过灵活地配置和扩展这些组件,...

    Midjourney描述关键词AI绘画C-midjourney(MJ)关键词(100个).docx

    9. **深度模糊(Depth of Field)**:这是一种摄影技巧,通过模糊背景来突出主体,Midjourney可以实现这一效果,让图像具有更强的立体感。 10. **高清(High Definition, HD)**:Midjourney生成的图像通常为高清...

    [电磁场与电磁波].Cheng,.David.K,.Field.and.Wave.Electromagnetics,.Addison-Wesley,.2ed,.1989.719s_PHEI_.djvu

    [电磁场与电磁波].Cheng,.David.K,.Field.and.Wave.Electromagnetics,.Addison-Wesley,.2ed,.1989.719s_PHEI_.djvu

    extjs4 对各类型store各种数据的读取 model 前台 等等

    根据提供的文件信息,本文将详细解析ExtJS 4中如何处理不同类型的Store及与之相关的数据操作、模型定义以及前端展示等内容。 ### ExtJS 4中的Store与数据管理 #### Store概念简介 在ExtJS 4中,Store是用于存储...

    Field_II 下载

    7. `set_field.m`:可能是一个设置场参数的函数,允许用户自定义初始条件或边界条件。 8. `xdc_rectangles.m`:可能与矩形形状的天线元素或结构有关,如矩形微带天线。 9. `xdc_focused_array.m`:聚焦天线阵列的...

    基于lucene的搜索引擎总结

    doc.add(new Field("intro", "Yao Ming is a player of Houseton Rockets.", Field.Store.NO, Field.Index.ANALYZED)); writer.addDocument(doc); writer.close(); ``` 【全文搜索】则是根据关键词在索引中查找相关...

    web_tree_dynamic_colored_field.zip

    "web_tree_dynamic_colored_field"模块是Odoo社区(OCA)推出的一个开源贡献,专门用于增强列表视图的用户体验,通过动态地改变表格单元格的颜色,帮助用户更直观地理解数据。本文将深入探讨这一模块的功能、实现...

    phase field.zip_Fe-Cu-Mn_phase field_phase-field_相场_相场 合金

    标题中的"phase field.zip_Fe-Cu-Mn_phase field_phase-field_相场_相场 合金"指的是一项关于Fe-Cu-Mn合金的相场法(Phase Field)模拟研究。相场法是一种用于研究多相系统演变过程的数值计算方法,特别适合于模拟...

Global site tag (gtag.js) - Google Analytics