论坛首页 Java企业应用论坛

java 内容仓库的使用?

浏览 6472 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2007-01-17  
jsr170 中定义了一个内容存储的规范,http://jcp.org/en/jsr/detail?id=170
引用

JSR-170 defines itself as "a standard, implementation independent way to access content bi-directionally on a granular level within a content repository," and goes on to define a content repository as "a high-level information management system that is a superset of traditional data repositories, [which] implements 'content services' such as: author based versioning, full textual searching, fine grained access control, content categorization and content event monitoring."





他是用于内容管理方面的,看了 透明思考网站上的文章 http://gigix.blogdriver.com/gigix/162487.html,本想研究一下看看这个 jcr的好处, 但是网站上的内容无法说服我为什么内容仓库不用数据库,而又制订了这么一个新的规范来做这件事。 这样作到底又多大的意义?
   发表时间:2007-01-17  
这个很好啊,以后不论是cvs还是svn,都可以抽象成jcr了。可惜 jcr 没有 revision 支持。
0 请登录后投票
   发表时间:2007-01-18  
不久前我刚用到了jsr170  的jackrabbit开发cms.确实很爽啊,树状节点模型\版本控制\全文检索\类sql的节点查找\导入导出XML的数据迁移.图片\文件直接保存到节点里,除了分页
0 请登录后投票
   发表时间:2007-01-19  
ronghao 写道
不久前我刚用到了jsr170  的jackrabbit开发cms.确实很爽啊,树状节点模型\版本控制\全文检索\类sql的节点查找\导入导出XML的数据迁移.图片\文件直接保存到节点里,除了分页


你应该说说哪点我用数据库做不到? 或者他比数据库突出好的地方? 我目前看到的好处是他不用新建字段,就能随意往仓库里面保存新类新的数据。

引用
,除了分页


不能分页做出来的就是玩具啊 
0 请登录后投票
   发表时间:2007-01-19  
呵呵,哪点都做的到。问题是它的树状存储结构非常适合CMS类的后台存储,个人认为。节点的复制和移动几乎就是天然的,版本控制也是内置的。文件的保存也可以作为节点。大文件你自己处理要上传到服务器端吧,全文检索要自己做吧:)
分页是有点问题,所以自己又建了张表保存节点位置。这也可能是我理解的还不够吧应该。
0 请登录后投票
   发表时间:2007-01-21  
ronghao 写道
呵呵,哪点都做的到。问题是它的树状存储结构非常适合CMS类的后台存储,个人认为。节点的复制和移动几乎就是天然的,版本控制也是内置的。文件的保存也可以作为节点。大文件你自己处理要上传到服务器端吧,全文检索要自己做吧:)
分页是有点问题,所以自己又建了张表保存节点位置。这也可能是我理解的还不够吧应该。


但是不知道他的存储量如果到达几个 G的情况下性能如何,主要是没有类似很大数据量的成功案例。可以考虑和数据库结合使用。 分页问题好像 nabble forum上有提到的,他好像能限制搜索出来节点的数量。他的全文索引和搜索是不错,但是由于他建立索引的时候都是后台自动化的,我们的代码中只有 addNode就可以了,因此现在我还没有找到怎样让他在保存二进制文件的时候同时保存摘要,关键词,被搜索文件路径等信息,而这些信息我如果直接用 lucene的话,都是可以控制到的,因为如果用lucene这些信息是手动开发的。 不知道你遇到这个问题没有?
0 请登录后投票
   发表时间:2007-01-21  
magnolia就是基于jackrabbit开发的。我想它的性能应该有过保障。对我来说,我对内容仓库的了解也并不是很多,我只是开发了内网的一个新闻发布而已。功能应用的还很不深入。所以你说的lucene的问题我没有遇到过没法回答。
时间也是个问题,前后开发才一个月时间,没办法深入。包括事务和权限都是存在问题,都是用很绕的方法变通解决的。但是我想,问题都是会解决的:)
0 请登录后投票
   发表时间:2007-01-22  
ronghao 写道
magnolia就是基于jackrabbit开发的。我想它的性能应该有过保障。对我来说,我对内容仓库的了解也并不是很多,我只是开发了内网的一个新闻发布而已。功能应用的还很不深入。所以你说的lucene的问题我没有遇到过没法回答。
时间也是个问题,前后开发才一个月时间,没办法深入。包括事务和权限都是存在问题,都是用很绕的方法变通解决的。但是我想,问题都是会解决的:)


这个得到索引,概要的问题有答案了:

http://www.nabble.com/How-to-get-MS-Word%27s-summary-when-I-index-or-search-it--tf3047296.html

就是目前对搜索结果还不能灵活的控制,它目前实现不了 
你们如果以后要对搜索出来的文件进行特殊处理,比如显示概要,关键字加亮显示等需求,实现起来也会很绕的。 论坛上想让我把问题提到 jira上面 
呵呵,目前讨论 jcr可能只有这个论坛,这个概念太新了
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics