`
文章列表

Inmanhust的日记

列式数据库之infobright 2010-03-06 23:21:51           年前听过Sybase中国区副总裁的关于列式数据库的讲座之后就一直被列式数据库强大的性能吸引。最近邂逅了infobright,列式数据库的学习展开了。       Sysbase可以说是 ...
原文: http://ria101.wordpress.com/2010/02/24/hbase-vs-cassandra-why-we-moved/ 原作者:Dominic Williams 原文发布日期:February 24, 2010 at 7:27 pm 译者:王旭(http://wangxu.me/blog/ , @gnawux) 翻译时间:2010年3月21-25日 我的团队近来正在忙于一个全新 ...
作者:Dong | 新浪微博:西成懂 | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明网址:http://dongxicheng.org/search-engine/log-systems/本博客的文章集合:http://dongxicheng.org/recommend/  
因为 Python 的版本问题,在 CentOS 5.6 上安装 OpenStack 不是件容易的事情,因为 OpenStack 是 Python 2.6 写的,CentOS 5.6 上默认的是 Python 2.4 的环境,一些关键工具(比如 yum 等)和依赖关系都需要 2.4,不容易直接升级到 2.6,所以要在 CentOS 上安装 OpenStack 的话简单的办法是直接用 CentOS 6.0(默认是 Python 2.6). OpenStack 的基本介绍以及如何在 Ubuntu 上安装 OpenStack Nova 可以看:在 Ubuntu 上安装和配置 OpenStack No ...
目录: 概述 演示 [一]、概述 java实现了对ttserver服务端的连接和访问。相关的源代码和jar包可以到其官网下载。 官网地址:http://code.google.com/p/tokyotyrant-java/
TCMalloc(Thread-Caching Malloc)是google开发的开源工具──“google-perftools”中的成员。与标准的glibc库的malloc相比,TCMalloc在内存的分配上效率和速度要高得多,可以在很大程度上提高MySQL服务器在高并发情况下的性能,降低系统负载。 TCMalloc库的安装步骤(Linux环境): 1、64位操作系统请先安装libunwind库,32位操作系统不要安装。libunwind库为基于64位CPU和操作系统的程序提供了基本的堆栈辗转开解功能,其中包括用于输出堆栈跟踪的API、用于以编程方式辗转开解堆栈的API以及支持C++异常 ...
从去年开始转java以来,一直在寻找一款趁手的兵器,eclipse虽然是很多java程序员的首选,但是我发现一旦安装了一些插件,workspace中的项目达到数10个以后,经常崩溃,实在影响编程的心情. 今天试用了近年获得众多好评的IntelliJ IDEA 13,感觉焕然一新,记录如下:   一、下载安装 http://www.jetbrains.com/idea/download/ 这是官网的下载地址,支持mac/windows/linux三大主流平台,我今天试用的是mac版本 说明:IntelliJ IDEA是商业软件,有二个版本,
一、框架介绍   公司最近项目要用到全文检索,检索对象是一些网站的网页内容,要使用到网络爬虫工具。         目前技术选型对象主要有两个:Heritrix 和 Nutch。二者均为Java开源框架,Heritrix 是 SourceForge上的开源产品,Nutch为Apache的一个子项目,它们都称作网络爬虫/蜘蛛( Web Crawler),它们实现的原理基本一致:深度遍历网站的资源,将这些资源抓取到本地,使用的方法都是分析网站每一个有效的URI,并提交Http请求,从而获得相应结果,生成本地文件及相应的日志信息等。   下面是二者的介绍,摘自网络: Heritrix ...
本文由浅入深,详细介绍了 Heritrix 在 Eclipse 中的配置、运行。最后对其进行扩展,介绍如何实现只抓取特定网站的页面。 通过本文,读者可以了解 Heritrix 的相关特点以及在 Eclipse 中的配置运行,能够从零开始构建特定站点的 ...
在生产环境中,log一般按照时间进行切分,如在23:59:59切分一天的日志,以便进行分析。在python中常用内建的logging模块实现     logger = logging.getLogger() logger.setLevel(logging.DEBUG) log_file = 'tornadolog.log' timelog = timelog = logging.handlers.TimedRotatingFileHandler(log_file, ...
1.修改java源代码后点击保存,IDE 自动编译并热部署,提示如下错误: Errors occurred during the build. Errors running builder 'DeploymentBuilder' on project '项目名'.java.lang.NullPointerException 产生原因: IDE勾选了自动编译部署,在部署调用时产生了异常。 解决办法: 取消myeclipse的自动部署:右键点击项目 ->properties -> Builders ,将DeploymentBuilder勾选去除.这样,系统将不会自动热部署,可 ...
原文出处: thegeekstuff   译文出处: oschina-青崖白鹿。欢迎加入技术翻译小组。<!-- div id="ad1"> <script type="text/javascript"> google_ad_client = "ca-pub-7056282119617872"; google_ad_slot = "6645040531"; google_ad_width = 300; google_ad_height = 250; </script> ...
基本格式 : *  *  *  *  *  command分 时 日 月 周 命令 第1列表示分钟1~59 每分钟用*或者 */1表示 第2列表示小时1~23(0表示0点) 第3列表示日期1~31第4列表示月份1~12第5列标识号星期0~6(0表示星期天) 第6列要运行的命令 crontab文件的一些例子: 30 21 * * * /usr/local/etc/rc.d/lighttpd restart上面的例子表示每晚的21:30重启apache。 45 4 1,10,22 * * /usr/local/etc/rc.d/lighttpd restart上面的例子表示每月1、10、2 ...
在linux下面工作,有些命令能够大大提高效率。本文就向大家介绍find、grep命令,他哥俩可以算是必会的linux命令,我几乎每天都要用到他们。本文结构如下: find命令 find命令的一般形式 find命令的常用选项及实例 find与xargs grep命令 grep命令的一般形式 grep正则表达式元字符集(基本集) grep命令的常用选项及实例 1、find命令 find命令是一个无处不在命令,是linux中最有用的命令之一。find命令用于:在一个目录(及子目录)中搜索文件,你可以指定一些匹配条件,如按文件名、文件类型、用户甚至是时间戳查找 ...
标签:find atime mtime ctime 原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://golehuang.blog.51cto.com/7499/1108124 <!--正文 begin--> find可谓是aix/linux上使用较多 ...
Global site tag (gtag.js) - Google Analytics