- 浏览: 12884 次
- 性别:
- 来自: 深圳
最新评论
-
panshunchang:
估计是新蛋中国
endeca introduction -
ad50442003:
你啥公司的,我们公司也在用
endeca introduction
文章列表
curl "http://localhost:8080/solr/update/csv?stream.file=books.csv&stream.contentType=text/plain;charset=u
tf-8&commit=true&fieldnames=,,cat&f.cat.map=AAA:BBB&keepEmpty=true&f.cat.split=true&f.cat.separator=%20"
请求顺序如下:
keepEmpty=true
f.cat.split=tru ...
< was unexpected at this time.
note below red part.
curl http://localhost:8983/solr/update?commit=true -H "Content-Type: text/xml" --data-binary "<add><doc><field name='id'>testdoc</field></doc></add>"
endeca 简单的来说就是一个企业级的工具(不仅仅是搜索引擎)。在国内,估计知道的人并不多,因为国内用的很少,至今我所知道只有一两家公司在用,但在国外就不同了,很多大型的企业都用。
endeca 搜索前的主要步骤
- 博客分类:
- 搜索引擎
在endeca 可以做搜索之前,有几个前期的步骤:
1) 数据的准备阶段
在这个阶段,把需要可搜索的数据从数据库导出来,放在 endeca foundry (也叫ITL) 服务器上。
2) 数据Forge(中文应该叫“铸造”)阶段
在这个阶段,上步被导出的数据,经过重新加工,整合成 endeca 可以识别的数据, 并为下一步做准备。
3) Pipeline 阶段
此阶段,用上步得到的数据做为输入, 把数据的每一项做配对, 也就是endeca的数据跟我们可以搜索到项做一一配对。
4) Index 阶段
上面步骤的输出作为输入, 对匹配的数据进行Index (索引)处理。这一步也是整个en ...
endeca作为一个企业级的搜索工具,有它的优点,也有弱点。
优点:
endeca 的baseline 是离线工作的, 这样就不会影响在线的搜索功能了。
性能和稳定性都很好, 当有两个dgraph在运行的时候,每秒可以处理上百个请求。
endeca的过滤(refinement)功能也做的不错。
弱点:
由于baseline是离线工作的, 这个优点也造就了一个缺点,那就是当endeca在新旧index更新的过程中,搜索是不可用的,而且这个过程需要耗时几分钟。
数据同步也是个问题,index数据更新的节拍总会比数据库慢上半拍 ...
export merch rules to excel from webstudio
System.out.println(Thread.currentThread().getContextClassLoader().getResource(""));
System.out.println(FileTest.class.getClassLoader().getResource(""));
System.out.println(ClassLoader.getSystemResource(""));
System.out.println(FileTest.class.getResource( ...