票
回答
求算法牛解一个分词算法,PHP ,ASP 解答。[已解决]5
数据库中3条记录。 1:i love you 2:i love her 3:i love you and her 只要有重复出现大于2次,就输出。 例如:一个字母的分词 i, love, you, her 2 个字母重复出现的 i love , love you 3个字母 i love you 这样的。
票
回答
Lucene4.2版本的IndexWriter构造函数已经不提供是否增量索引的boolean 那在哪?[已解决]5
Lucene4.2版本的IndexWriter构造函数已经不提供是否增量索引的boolean 那在哪? 我一直以为在IndexWriterConfig这个里头可以设置。 但是看了API。貌似没有这个属性。 纠结。 原来设置全量增量式在IndexWriter的参数 true\false。现在莫有了。 纠结。纠结啊~
票
回答
lunece 3.6 调用 合并段索引的各种操作 不起作用[已解决]5
public void Createindex() throws Exception { // IndexWriterConfig indexWriterConfig = new IndexWriterConfig(Version.LUCENE_36, analyzer); // LogMergePolicy mergePolicy = new LogByteSizeMergePolicy(); ...
票
回答
一个关于lucene搜索返回内容的问题~[已解决]10
我想用lucene实现搜索功能,我有6个txt文档,加起来有2G左右,存放在一个文件夹内,我想对里面的数据实现搜索,同时最后返回含有这个数据的文档名称以及该文档中包含这个数据的那一行文本,我用的是lucene3.0。但是我现在遇到了一个问题。建立索引时代码片段如下: doc.add(new Field("contents", temp, Field.Store.YES, Fie ...
票
回答
基于solr4.1 IK分词 同义词等过滤器的配置[已解决]25
基于solr4.1的配置方面 由于4.1的版本, “在Solr4.0发布以后,官方取消了BaseTokenizerFactory接口,而直接使用Lucene Analyzer标准接口。因此IK分词器2012 FF版本也取消了org.wltea.analyzer.solr.IKTokenizerFactory类。” 所以 对于IK的配置 <fieldType name="text&q ...
票
回答
tika 怎样提取内容的前几个汉字[已解决]0
现在要用tika提取word的内容里前30个汉字 我的代码是: File f=new File("i:\\1.doc"); Document doc=new Document(); Metadata metadata=new Metadata(); doc.add(new Field("content", new Tika().parse(new File ...
票
回答
solr 建立索引问题[已解决]5
新手请教问题,对于solr建立索引,比如A:document有id,name,title等字段索引,b:document有id,sex,email等字段索引,能否做到,把这些id相同的字段,索引合并成一个document 上去?
票
回答
通过 lucene 中QueryParser 设置权重的疑问[已解决]5
我想通过query.setBoost 到达某个搜索的条件优先排序。通过 QueryParser 来实现。但是起不了效果。 我的代码如下 //通过“^5.0”设置该字段的权重 String keyWord = "+AREAID:('-1') +TYPE_FLAG:('19001_knowedge'^1.0 '19002_quest'^5.0 'applicationTool'^2.0 )^1 ...
票
回答
如何得到每个文档中得分最高的那个field[已解决]20
用户输入关键词后,可以得到击中的那些文档(自然是通过对每个文档中的每个field的分值相加后排列所得到的),但我想得到的是每一个文档(指被击中的这些文档)中得分最高的那个field,谢谢!
票
回答
solr运行一段时间后出现too many open files[已解决]20
solr运行一段时间后出现too many open files,停止服务。查看java进程打开的文件,出现很多的: java 6944 root 250u IPv6 614668508 0t0 TCP localhost:45597->localhost:tproxy (CLOSE_WAIT)java 6944 root 251u IPv6 614666678 0t0 TCP localho ...
票
回答
网站后台cms和前台front分别部署在不同的服务器上,后台cms执行定时任务创建索引index, 网站前台搜索如何搜索到?[已解决]0
网站后台cms和前台front分别部署在不同的服务器上,后台cms执行定时任务创建索引index, 网站前台搜索如何搜索到?请不吝赐教,急死小弟了。
票
回答
关于网站后台统计模块的问题,大家讨论讨论![已解决]5
网站(比如一个购物网站)的后台需要统计进入网站的人搜索的关键字或者是点击网站上某个商品的名称,我们需要对这些信息进行统计,比如统计今天每个或者这个月那个关键词或者商品名称被点击了几次这些信息。 我们应该怎么去实现呢? 我能想到的最初级的方法是:客户在搜索栏输入关键词点击搜索时在数据库的统计表插入一条数据,点击商品名称同理,点击时将商品名称插入到数据库表。 这样的问题就是如果每搜索一次都会插入一条 ...
票
回答
票
回答
票
回答
lucene 中怎样查询不包含某个字段的document?[已解决]5
最近有在用lucene 做查询,遇到一个问题,请教各位大侠: 需求如下: 查询出不包含某个字段或某个字段为空的文档,然后把这些数据删掉。 那位大侠有过类似的需求呀?
票
回答
票
回答
lucence 千万级数据 总数 很慢[已解决]30
最近在用lucence的时候发现了一个问题 首先我要查询的是满足条件的数据的总数 当我开始查询的时候 条件越宽松 返回的数据越多 也就是说返回的结果越大 查询的速度就越慢 反之 条件越多 返回的数据越少 也就是说返回的结果越小 查询的速度就越快 现在的问题是我希望再任何的条件下都保持1秒内返回结果 我的数据来源是千万条数据的数据库的表。约束条件的类型有时间、字符串等
票
回答
如何物理上彻底的删除lucene生成的索引文件中的部分document呢[已解决]5
如何物理上彻底的删除lucene生成的索引文件中的部分document呢?我现在使用的Lucene3.5版本。我现在业务上有这样需求: 由于服务器磁盘空间有限,现只需用lucene保存最近90天数据(索引文件),大概占用40G的硬盘空间。每天增量追加新一天的数据,同时也删除最早一天的数据。这样一增一删,始终保持90天的数据量。但现在我该如何物理上彻底的删除一些过期的Document呢?之所以需要物 ...
票
回答
lucene索引文件过大,如何实现分割索引库[已解决]10
我的索引库文件index超过2g,且有继续增长的可能,如何实现索引库文件的分割,或有什么方式可以确保程序的正常动作
票
回答
关于Lucene的布尔查询?[已解决]5
关系是这样的 : (北京|暴雨) (死人|淹死) ^(奥运) 其中,每个括号里的词和词之间是 '或' 的关系, 比如 '北京' 和 '暴雨' 可以用一个布尔查询组织起来, 但是 每个括号 之间 是 '和' 的关系 最后 带有 异或^ 符号的 的括号中的词 是必须不能包含的 索引库中查询的字段有两个 分别是 title和content 我试着用N多 的booleanQuery 按着这个逻辑组合 ...
oznyang 评论了 关于oznyang发布的i18nTool工具的使用
huayang912 评论了 easyui datagrid 弹出窗口空白的解决方法
haihuichen 评论了 mybatis联teradata 查询时返回结果集为空,同样的代码在mysql下就可以返回结果集
haihuichen 评论了 mybatis联teradata 查询时返回结果集为空,同样的代码在mysql下就可以返回结果集
26762685 评论了 SOS!session串号现象
elbert 评论了 Java怎么实现打印机监控
sandy8508 评论了 Java String.format性能如何
feng_tai_jun 评论了 JSP里加return就会无法编译说Unreachable code
xiaojunjava 评论了 JAVA 连接打印机 打印作业属性设置无效果问题
xiaominzi 评论了 java.security.InvalidAlgorithmParameterException: Prime size must be multiple