- 浏览: 21540 次
最新评论
文章列表
大规模文件删除的策略
- 博客分类:
- JAVA
关于过期文件删除处理:
a)写文件的时候记录相关的日志,日志文件格式为:文件ID(这个时间上是分布式文件的ID);时间戳
b)使用日志文件删除策略如下:
1、读取一条记录,根据当前的ID读取fastDts中的文件,判断时间戳,如果满足有效期,删除;要不的话不变
2、如果日志不集中,每个服务器上都按照这个策略来处理也没有问题
c)可以采用日志集中框架:Facebook Scribe ; flume
如果文件不是特别多的情况下,将:文件ID(这个时间上是分布式文件的ID);时间戳保存在数据库中,然后从数据库中读取然后进行删除也没有任何问题。
jetty中禁止使用chunked传输数据
- 博客分类:
- JAVA
Slow transfers in Jetty with chunked transfer encoding at certain buffer size
It seems that to get good performance with Jetty, you must either:
When calling setContentLength (no chunked transfer encoding) and use a buffer for writethat's the same size as the response buffer size.
When using chu ...
转:http://www.cnblogs.com/pzhfei/archive/2013/03/02/CPP_new_feature.html#section_6.4
C++11标准发布已有一段时间了, 维基百科上有对C++11新标准的变化和C++11新特性介绍的文章. 我是一名C++程序员,非常想了解一下C++11. 英文版的维基百科看起来非常费劲,而中文版维基百科不是知道是台湾还是香港人翻译的然后由工具转换成简体中文的,有些术语和语言习惯和大陆程序不一样! 我决定结合这两个版本按照我自己的习惯把这篇文章整理到我的博客中.分享给关注我和关注C++11的朋友们. 当然了, 本人水平 ...
观点1:
1. ha lb 软件的优点与缺点?两个本来就不是一路的,应该不好比较优缺点。从目的上来说:ha的目的是不中断服务,lb的目的是为了提高接入能力,虽然经常放一起用,但确实是两个不同的领域。从手段上来说:HA是有备胎;LB大型货车的一轴四胎。从功能上来说:HA在一条路不通的时候提供另一条路可走;LB是春运时的多个窗口。
几个要点:
配置文件 ftp.started=false
类:
//是否启动ftp任务
private boolean ftpStarted;
public String isFtpStarted() {
return ""+ftpStarted;
}
public void setFtpStarted(String ftpStarted) {
if (ftpStarted.equalsIgnoreCase("true")) {
this.ftpStarted = true;
}else {
this.ftpStarted = fals ...
httpclient访问restful
- 博客分类:
- JAVA
转:http://howtodoinjava.com/2013/05/21/jax-rs-restful-client-using-apache-httpclient/
JAX-RS RESTful client using apache httpclient
public static void demoPostRESTAPI() throws Exception
{
DefaultHttpClient httpClient = new DefaultHttpClient();
User user = new User();
...
linux下mysql相关目录
- 博客分类:
- JAVA
见:http://hehaibo.iteye.com/blog/465534
冒烟测试:只针对bug进行测试,存在的问题是覆盖率低一点。
构建工具一般要解决的问题:
1>和版本管理工具比较好集成
2>支持各种编译工具
3>构建过程发生错误容易查看
4>构建错误可以发送到相关开发人
每日构建工具:
R2build
http://sourceforge.net/projects/r2build/
Java相关的
常用的工具有cruisecontrol和hudson,基础的包括ant和maven
cruisecontrol相关文档
http://wenku.baidu.com/ ...
数据库版本管理包括这么几个方面:
1、好的数据库版本管理工具的支持
2、不依赖于具体RDMS数据库的自己的数据字典
3、可以查看到当前数据库scheme的版本,版本好应该是经过加密的,不能手动更改的
其实最简单的数据库版本管理工具可以这么做:
1>脚本结构
a)基础版本a
基本版本a上上修订记录
b)基础版本b
基本版本b上上修订记录
2>数据库安装过程,以安装版本a上选择的的一个具体版本来说
a)选择版本a上的版本
...
POI中增加image
- 博客分类:
- JAVA
引用:http://poi.apache.org/spreadsheet/quick-guide.html#Images
Images are part of the drawing support. To add an image just call createPicture() on the drawing patriarch. At the time of writing the following types are supported:
PNG
JPG
DIB
It should be noted that any existing drawings may ...
面型对象软件架构文档SAD的基本形式
- 博客分类:
- 软件工程
面型对象软件架构文档SAD的基本形式。
其实以下二个关键的还要包括:
1、用例视图和一些关键用例的序列图
2、关键类和其他类的序列图
[size=large]研究ISO_IEC 14496-12_2005(E),学习MP4文件格式,Media Data Box:A container box which can hold the actual media data for a presentation (‘mdat’).其实所有的元数据都为了索引MDAT中的视频和规定视频中的解码参数。time-to-sample,时间到采样,sample-to-chunk, partial data-offset information,采样到数据偏移量。chunk offset, partial data-offset informatio ...
最近在聊天工具上沟通,大家都火气很大。忽然觉得聊天工具沟通其实效率挺低的,如果有一个逻辑不太清晰的,一个问题基本上要倒腾个把个小时。无关乎外企,研发基本上不参与到现网的支持中,消耗太大了。提高效率二种方式:要不华为,现场开发,要不就是研发和支撑单独的二条线。
从例子上理解比较简单:
词频 (TF) 是一词语出现的次数除以该文件的总词语数。假如一篇文件的总词语数是100个,而词语“母牛”出现了3次,那么“母牛”一词在该文件中的词频就是3/100=0.03。一个计算文件频率 (IDF) 的方法是测定有多少份文件出现过“母牛”一词,然后除以文件集里包含的文件总数。所以,如果“母牛”一词在1,000份文件出现过,而文件总数是10,000,000份的话,其逆向文件频率就是 lg(10,000,000 / 1,000)=4。最后的TF-IDF的分数为0.03 * 4=0.12。
tf-idf 模型
当前,真正在搜索引擎等实际应用中广泛使用的是 tf-idf ...
http://office.microsoft.com/zh-cn/visio-help/HP010378145.aspx#_Toc243908558
http://www.cnblogs.com/wuhuacong/archive/2012/02/24/2365604.html
这二篇文章不错