- 浏览: 69812 次
- 性别:
- 来自: 杭州
最近访客 更多访客>>
最新评论
-
happy7259:
感谢您这篇文章,让我解决了困扰5天的问题。。。
处理中文rss解析的一点经验... -
niule:
你好,我是按照步骤来部署的,也是用的jeasy的分词
在ana ...
赞美开源,赞美luence贡献的廉价全文搜索解决方案
文章列表
刘军洛......分析的很有道理...08年中国楼市将暴涨,股市暴跌,中国粮食价格将呈现出历史性意义的暴涨http://blog.sina.com.cn/s/blog_4d7e234c01008d7d.html --------------chenjinlai2008-03-14
- 2008-03-14 04:47
- 浏览 750
- 评论(0)
刚刚看了zj推荐, 冯仑的野蛮生长... 首先讲了它对民营企业原罪的认识,观点是第一代资本原始积累牵涉太多,说不清,就既往不咎...不主动追查 后面谈到人对钱的认识,幸福指数等概念...其中讲到一个企业运用投资基金的内容...据书上说基金本土回报率是10%,到中国要20%,因为基金经理要分钱还有一些损耗等,实际回报率30-40%以上才能打动投资基金... 后面讲到多元化专业化的问题,推崇专业化...这一点我觉得国际化大公司都是这样的微软专业操作系统,办公软件,google专业搜索广告,可乐只卖碳水化合物而日本韩国那种多元化的财团,是由于特殊的国情体制才能做到在竞争激烈的市场环境下,能做好一 ...
- 2008-03-11 04:04
- 浏览 909
- 评论(0)
记录一下,恩索引方案:索引存储方案是数据库里面先存一份,然后生成文章递交建立索引索引id,标题,不存储正文,查询后依靠返回的id去数据库找文章...(也可以都不存,只保存id,反正要到数据库查询)建索引的速度:2G的文本,建立索引大概要半天,这个速度还是能忍受的...反正是异步...用户感觉不到不过建索引的时候...tomcat占用率有点高...最好本地建好索引传上去,或者慢慢递交建索引的文本...或者调整一下index的mergeFactor参数之类的空间占用: (看起来挺省)1k篇文章 2.8M5k篇文章 15.2M2w篇文章 25M查询速度:lucene本身有缓存优化的策略,用 ...
- 2008-03-11 01:43
- 浏览 1026
- 评论(0)
ruby支持的很强劲...格式化的xml数据处理起来方便....其他语言搞半天,ruby查书查资料半小时一个简化版的全文搜索功能就全套调试好上线了, 代码也很短...不过可能理解起来相对费力点... text = open('http://localhost:8080/solr/select/?q='+key+'&version=2.2&start=0&rows=20&indent=on').read require 'rexml/document' t = REXML::Document.new(text) c = [] t.root.elements ...
- 2008-03-08 02:16
- 浏览 845
- 评论(0)
由于技术大佬的分享和开源社区的贡献,让咱们小企业也能拥有廉价的搜索引擎...成本可能只是几天,就能有海量数据的快速搜索解决方案...虽然目前还没推广开,很多disscuz论坛还不能开放全文搜索...不过可以想见这一天会很快到来的luence是目前最强劲的搜索引擎之一....而且更新快,apache的重点项目,本来是java的,php等其他语言用java不方便...于是有了solr,这是把luence封装成http接口...每个插入,查询通过xml格式的post,get方法得到...可以给php之类的用...今天研究了一下基于solr的中文检索解决方案...1. 把solr压缩包的 example ...
- 2008-03-07 12:42
- 浏览 1997
- 评论(1)