`
文章列表
欢迎订阅我的blog:   http://www.jasonwangblog.dotcloud.com/     Javaeye的blog不再维护
    打开SOLR的核心配置文件: solrconfig.xml     找到 standard request handler     写入以下XML配置代码:       <requestHandler name="standard" class="solr.SearchHandler" default="true"> <!-- default values for query parameters --> & ...
1〉analyzer主要包含分词器跟过滤器,他的功能就是:将分词器跟分析器进行合理的组合,使之产生对文本分词和过滤效果。因此,分析器使用分词和过滤器构成一个管道,文本在“滤过”这个管道之后,就成为可以进入索引的最小单位。  2〉tokenizer主要用于对文本资源进行切分,将文本规则切分为一个个可以进入索引的最小单元  3〉tokenfilter主要对分词器切分的最小单位进入索引进行预处理,如:大写转小写,复数转单数,也可以复杂(根据语义改写拼写错误的单词)    附上lucene的部分类源码以讲解: public abstract TokenStream tokenStr ...
转: http://blog.outwa.com/2011/03/how-to-learn-html5/ 我们大半年来的学习HTML5实用资源汇总。同时分享一份几个月前做的一份培训材料《HTML5应用介绍》,欢迎下载(新浪微盘,需要微博帐号)!   实用资源 HTML5演示教程 IBM developerWorks 中国HTML5专题 diveint
    NodeJs中文文档: http://cnodejs.org/cman/   Node.js简单介绍并实现一个简单的Web MVC框架: http://cnodejs.org/blog/?p=342   Express: http://expressjs.com/ http://www.csser.com/tools/express-js/express-guide-reference-zh-CN.html#installation
http://regexlib.com/Search.aspx?k=URL
How do I add cron job under Linux or UNIX like operating system? 原文: http://www.cyberciti.biz/faq/how-do-i-add-jobs-to-cron-under-linux-or-unix-oses/ Cron job are used to schedule commands to be executed periodically. You can setup setup commands or scripts, which will repeatedly run at a set t ...
这本书每个章节后面都有一些小建议,不少都很有用,摘录一些跟大家分享一下:   1、最浪费时间的事 (1)、不断重复茉一件游戏规则相同的事–包括工作或娱乐   (2)、常常进行闲聊八卦,东扯西扯的下等荼,喝完后通常很空虚,对吧?   (3)、沉溺于电脑、网络、电脑、电话   (4)、报复,与某人缠斗不休   (5)、不断找东西   2、找出浪费时间的原因 (1)、什么事让我忙到抓狂   (2)、是否有什么习惯让我替自己制造麻烦   (3)、什么人让我很烦,又必须频频应付?   (4)、我做了什么浪费别人时间的事?       3、女人的时间管理 ...
今天跟大家分享的是《如何掌控自己的时间和生活》中的笔记,下面是我当时的阅读记录,很不错的一本书:   #每天一本书#,114天,2011年4月10日,《如何掌控自己的时间和生活》评分4分。这本书的核心观念就是“如何掌控”,想掌控,必须从规划目标开始,然后按ABC排序规则排序。到任何时间都要以A级任务为开始行动目标,想办法减少或剔除C级任务。必须坚持每天列清单,进行排序。每天留出15分钟进行反思。   针对A级任务可以应用如下技巧:1、获取更多信息2、尝试诱导性任务3、利用现在的心情4、跟自己对话。5、对他人许诺。6、制定更详细的计划   要学会休息和放松。定期检查自己的进度。有 ...
http://www.searchtb.com/2011/04/an-introduction-to-bigpipe.html       1.作者的博客:http://www.facebook.com/note.php?note_id=389414033919 2.bigpipe技术的ppt:http://twork.taobao.net/books/237 3.bigpipe的java实现:http://codemonkeyism.com/facebook-bigpipe-java/ 4.一篇介绍bigpipe的文章:
mobl是一种新的开源编程语言, 主要用于加速手机应用的开发, mobl可方便构建手机Web应用程序, 可用于包括iOS, Android和其他自持HTML5技术的手机.     Refer to: http://www.infoq.com/cn/news/2011/02/Mobl
  原文地址:http://www.facebook.com/note.php?note_id=389414033919译文地址:http://isd.tencent.com/?p=2419 Facebook的网站速度做为最关键的公司任务之一。在2009年,我们成功地实现了Facebook网站速度提升两倍。而正是我们的工程师团队的几个 ...
Python格式化日期时间的函数为datetime.datetime.strftime();由字符串转为日期型的函数为:datetime.datetime.strptime(),两个函数都涉及日期时间的格式化字符串,列举如下:   %a Abbreviated weekday name %A Full weekday name %b Abbreviated month name %B Full month name %c Date and time representation appropriate for locale ...
wget是linux下命令行的下载工具,功能很强大。   一般下在一些小东西都是直接用chrome自带的下载功能下载,没有必要用wget或者其他下载工具。但是某些时候却不是浏览器自带的下载功能和一些其他的下载软件所能做的的,这时候就得用wget了。比如如果你想下载一个网页目录下的所有文件,如何做呢?比如,我需要下载django官方全部API Doc,假设source code没有文档的前提下。   介绍几个常用参数:   -c 断点续传(备注:使用断点续传要求服务器支持断点续传),     -r 递归下载(目录下的所有文件,包括子目录) ...
下载单独页面: wget xxx.com/a.htm 下载整站: wget -r -k -np -p xxx.com     -r递归下载,-k将下载的网页里的链接修改为本地链接,-np不下载其他站点的链接,-p下载显示网页所需的元素 下载网站目录: wget -r -k -np -l 4 --reject=htm,html,css,js,jpg,jpeg,gif,bmp,png,swf,exe xxx.com     我们在测试网站时往往需要了解网站的目录结构,又不希望把整个站点爬下来,虽然wget没有直接提供下载网站目录的功能,但是可以通过reject和accept参数来限制 ...
Global site tag (gtag.js) - Google Analytics