ITeye问答频道

票

回答

283 浏览

求教，关于Lucene的一些解决方案[已解决]30

最近公司要做全文检索，选择了Lucene，研究了下，能够实现基本的创建索引及检索功能。不过在学习的过程中运到些问题，求大神指教。主要是求解一些解决思路。 1.是不是要将文章内容存储起来？如果将文章内容存储了，是不是影响效率 2.如果要做高亮显示，是不是必须将文章内容存储 3.有好的分页查询思路吗，看到网上提供的方案都是先把符合条件的数据都查询出来，然后只返回查询出的部分数据，以此来实现分页功能 4. ...

Lucene

2014年12月04日 16:40

z1050334
0
0 0 1

票

回答

453 浏览

有搜索引擎和非结构化数据挖掘的同行吗？[已解决]5

我有个朋友，现在国外的石油行业工作，他想做一个基于文件的企业搜索引擎，同时还想对大量有关钻井的非结构化数据进行数据挖掘。不知有没有高手愿意合作？他想找的是技术合伙人，全职兼职均可。如果您有兴趣和时间，请和我联系。我将我将提供更多的技术细节。多谢！

Lucene 数据挖掘非结构化

2014年11月18日 13:34

carlwu
11
0 0 5

票

回答

351 浏览

solr3.5整合mmseg4j报错，等求大神帮忙！[已解决]5

java.lang.ClassNotFundException:org.apache.solr.util.plugin.solr ResourceLoaderAware solr-core.jar是在solr.war里面的。整合mmseg4j中文分词报错。配置是按照网上的文章配的，没整前solr可以启动，整后却一直报这个错误，但是mmseg4j的jar和配置应该都没问题。搞不明白，大家指指路！谢 ...

Lucene

2014年11月12日 15:36

dreamliver
15
0 0 2

票

回答

1793 浏览

lucene 实例创建及实时索引[已解决]0

public class LuceneFactory { // song索引 private static IndexReader songReader = null; private static IndexSearcher songSearcher = null; private static Directory songDirectory = null; private static ...

Lucene 实时索引

2014年10月23日 10:08

yuhe
1
0 0 7

票

回答

1187 浏览

请教一下lucene4.x下精确与模糊组合查询怎么写？[已解决]5

刚刚接触lucene，用的是最新版的4.10.我现在有个这样的需求。人员总共有两组，A、B组。在设计索引时将A、B组的ID也保存了。我现在想A组的人只能搜A组的内容。实现思路是：通过组ID精确定位到某个组，然后使用关键字模糊搜素这个组内的所有内容。 lucene小白一个，还请大家多多指教。

Lucene 模糊查询精确查询

2014年10月19日 12:24

iablee
12
0 1 3

票

回答

3788 浏览

solr分页查询很慢,不知道什么原因[已解决]5

项目中使用solr做列表页分页搜索数据量大概在二十几万数据,应该不算大但不知道什么原因前面页码的时候还挺快,但越往后速度越慢,翻到二十万数据的时候非常慢,大概二十多秒才能出结果,甚至更慢,不带条件查询也是这样现在没有头绪,请问这可能是什么原因导致的呢? INFO - 2014-08-22 17:59:41.747; org.apache.solr.core.SolrCore; [prop ...

Lucene Solr 高性能搜索

2014年8月22日 18:16

fs_plane
25
0 0 1

票

回答

330 浏览

solr中schema.xml中定义fieldType 中的docValuesFormat和postingsFormat属性怎么用[已解决]3

最近刚接触solr，看到在solr中schema.xml中定义fieldType 中的docValuesFormat和postingsFormat属性，通过查看也不知道具体怎么用，该用在什么场景下，有了解的给解释一下这两个属性，最好给举一个例子或代码示例。

Lucene

2014年7月07日 11:12

skambc
3
0 0 3

票

回答

423 浏览

Lucene2.4.1 + compass2.2.0 + spring3mvc + jpa compassGps索引不同步[已解决]10

1.persistence.xml <persistence-unit name="test" transaction-type="RESOURCE_LOCAL"> <provider>org.hibernate.ejb.HibernatePersistence</provider> <properties> ...

Spring Lucene JPA compass

2014年7月05日 11:24

xxyifan
5
0 0 2

票

回答

3724 浏览

通过solrj查询solr 如何取消默认查询总数10条的限制[已解决]10

如题。。。

Lucene

2014年6月24日 17:22

yesorno828
20
0 0 3

票

回答

1443 浏览

Lucene4.0索引的效率问题[已解决]10

最近用Lucene4.0做全文检索：公司大约有700GB左右的文件，格式有PDF、word、ppt、图片及其它等等，文件数量大约在70万个左右。我用多线程调用Tika来解析文件，解析后的文本文件写入本地磁盘，耗时大概1-2天的样子；然后用Lucene4.0对做索引，索引代码如下： Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_40) ...

Lucene

2014年6月16日 16:33

carlwu
11
0 0 5

票

回答

1208 浏览

如何向solr服务器提交大日志文件[已解决]5

现在公司有个项目对日志文件进行全文检索，准备用solr完成。现在遇到一个问题，由于日志的文件比较大，一般10几兆，大的已经达到几百兆了。我们将日志的内容设置为content字段，类型为string，但是当我们将documnet提交到server的时候，就报OOM的错误，请问如何解决该问题？

Lucene Solr

2014年6月13日 11:20

sodmewuhan
26
0 0 3

票

回答

4612 浏览

hadoop中hdfs-site.xml配置的问题[已解决]0

我在hdfs-site.xml中是这样配置的： <configuration> <property> <name>dfs.name.dir</name> <value>/home/hadoop/tamp</value> </property> <property> <name>df ...

Hibernate 企业应用 Lucene SOA

2014年5月30日 09:10

t152021
1
0 0 3

票

回答

2232 浏览

hadoop配置了NodeData,但是管理界面却显示0个NodeData[已解决]5

安装了一台Master和一台salve 启动后的两台机器的JPS都是可看到进程的，但是在管理页面上却是0个Nodedata 基本配置如下： 1.core-site.xml <configuration> <property> <name>hadoop.tmp.dir</name> <value>/usr/hadoop/tmp< ...

企业应用 Lucene SOA

2014年5月29日 08:43

t152021
1
0 0 3

票

回答

667 浏览

Solr配置Blob字段报错[已解决]5

SOLR通过dataimport导入oracle数据库数据建立索引，表中含有blob类型的字段，在solrconfig.xml中配置了dataimport请求，data-config.xml文件配置见“data-config.zip”附件，启动solr运行，报“java.lang.RuntimeException: unsupported type : class java.lang.String” ...

Lucene Solr

2014年5月21日 15:37

guotaoli429
11
0 0 4

票

回答

4083 浏览

solr4.7数据导入问题[已解决]30

本人刚解除solr,测试从oracle导入数据，总得到如下信息： Indexing completed. Added/Updated: 0 documents. Deleted 0 documents. Requests: 1, Fetched: 4, Skipped: 0, Processed: 0 Started: 6 minutes ago 添加的索引条数总为0，但实际获取到数据为4条，不 ...

Lucene

2014年5月08日 11:50

dayanday
0
0 0 2

票

回答

244 浏览

elasticsearch[已解决]0

ES里面的将数据分为工作数据和持久化数据两种，工作数据可以都放在内存中，这样可以保证非常好的性能，es默认是先把索引存放到内存中，当内存满了时再持久化到本地硬盘，ES节点间的数据会定时刷新和同步，那这个时间点在何时回执行？可以更改这个时间点吗？

Lucene

2014年5月07日 11:40

wangzl2222
4
0 0 26

票

回答

1339 浏览

Lucene如何索引巨大的PDF文件？[已解决]5

我想用Lucene对一个529G大小的PDF文件进行索引，开始使用Tika1.5，异常为： TIKA-198: Illegal IOException from org.apache.tika.parser.pdf.PDFParser@1455935 org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:248) org ...

Lucene Tika PDFBox

2014年5月06日 14:41

carlwu
11
0 0 5

票

回答

1367 浏览

学习lucene建立检索和搜索过程中遇到的错误[已解决]30

使用lucene4.6.0版本建立的索引和搜索，在创建索引后会产生如下索引文件 [img] [/img] 但是在搜索时 ScoreDoc[] sds = tds.scoreDocs; 中的sds总为空。求大神帮忙解决！！！！！！！代码如下： package nhky.bs.lucene.test.hellolucene; import java.io.File; import java. ...

Lucene

2014年4月24日 17:52

Mr_WangB
6
0 0 3

票

回答

421 浏览

关于先在Lucene搜索电影对象，然后用in在数据库中查找喜欢电影的人，分页该怎么办？[已解决]5

查询是这样的首先先在Lucene中查找相关电影的信息，得到电影的记录id，然后再到数据库中用in(1,2,3,...n)，查找喜欢这些电影的用户，得到用户的记录现在我要做分页，该以什么标准来分呢？由于2个查询的总记录数不一样，我是把pageNum传给lucene还是数据库呢，有没有高手遇到了这类问题，谢谢

数据库 Lucene 分页

2014年3月19日 22:24

sh_peterchen
10
0 0 5

票

回答

278 浏览

lucene分布式搜索[已解决]10

想将lucene和hadoop结合，新手入门有点茫然，不知哪位可以提供点学习资料，万分感谢！！！！

Lucene Hadoop 分布式

2014年3月19日 15:26

cxj305
3
0 0 5

« 上一页 1 2 3 … 17 18 下一页 »

我的问答 FAQ | 勋章

排行榜

查看全部排名>>

求教，关于Lucene的一些解决方案[已解决]30

有搜索引擎和非结构化数据挖掘的同行吗？[已解决]5

solr3.5整合mmseg4j报错，等求大神帮忙！[已解决]5

lucene 实例创建及实时索引[已解决]0

请教一下lucene4.x下精确与模糊组合查询怎么写？[已解决]5

solr分页查询很慢,不知道什么原因[已解决]5

solr中schema.xml中定义fieldType 中的docValuesFormat和postingsFormat属性怎么用[已解决]3

Lucene2.4.1 + compass2.2.0 + spring3mvc + jpa compassGps索引不同步[已解决]10

通过solrj查询solr 如何取消默认查询总数10条的限制[已解决]10

Lucene4.0索引的效率问题[已解决]10

如何向solr服务器提交大日志文件[已解决]5

hadoop中hdfs-site.xml配置的问题[已解决]0

hadoop配置了NodeData,但是管理界面却显示0个NodeData[已解决]5

Solr配置Blob字段报错[已解决]5

solr4.7数据导入问题[已解决]30

elasticsearch[已解决]0

Lucene如何索引巨大的PDF文件？[已解决]5

学习lucene建立检索和搜索过程中遇到的错误[已解决]30

关于先在Lucene搜索电影对象，然后用in在数据库中查找喜欢电影的人，分页该怎么办？[已解决]5

lucene分布式搜索[已解决]10

问答分类

移动开发技术

Web前端技术

Java企业应用

编程语言技术

综合技术

入门技术

招聘求职

海阔天空

最新问题

排行榜

本周活跃投票用户

最新评论