- 浏览: 1661531 次
- 性别:
- 来自: 北京
-
最新评论
-
532870393:
请问下,这本书是基于Hadoop1还是Hadoop2?
Hadoop in Action简单笔记(一) -
dongbiying:
不懂呀。。
十大常用数据结构 -
bing_it:
...
使用Spring MVC HandlerExceptionResolver处理异常 -
一别梦心:
按照上面的执行,文件确实是更新了,但是还是找不到kernel, ...
virtualbox 4.08安装虚机Ubuntu11.04增强功能失败解决方法 -
dsjt:
楼主spring 什么版本,我的3.1 ,xml中配置 < ...
使用Spring MVC HandlerExceptionResolver处理异常
文章列表
转载请标明出处: http://fuliang.iteye.com/blog/1063352
索引基础知识
索引是帮助MySQL有效检索数据的一种数据结构,它是获得高性能的关键,但是人们常常忘记或者错误的理解了它,所以索引通常是现实中最常出现的性能问题。
当你 ...
转载请标明出处: http://fuliang.iteye.com/blog/1060530
在前面的章节,我们已经看到线性回归模型具有很简单的分析性和计算性。我么现在我们讨论这种类似的模型来解决分类问题。分类的目的是给出一个输入向量X,将它赋值为k个离 ...
对一个设计拙劣或者没有做index的schma进行优化,可以很大程度的改善性能。
如果想获得很好的性能,就需要对你运行的特定的queries来设计schema和索引,
你需要估计不同类query的性能需求,和使用的频度,以及需要检索的字段和检索
的条件。优化是一个权衡,索引可以提高检索速度,但是会降低更新速度,一个反
范式的schema可能会在某些查询下加快速度,但在其他情况下可能降低速度。添加
冗余字段、计数器、summary表可以优化查询,但是维护起来很困难。
选择最优的数据类型:
Mysql支持大量的各种个样的数据类型,如何正确的选择类型来存储数据是产生高性能
的关键。
1.足够大的越小 ...
转载自 http://www.dataminingblog.com/top-five-articles-in-data-mining/
Data Mining博客最近有篇文章,列举了他们认为的数据挖掘领域的5篇经典文章。个人深为赞同,所以转载一下。
An Introduction to Variable and Feature Selection
Isabelle Guyon and André Elisseeff
Data Clustering: A Review
A.K. Jain, M.N. Murty and P.J. Flynn
From Dat ...
如何分支和tags,这个是经常被争议的话题,参考svn最佳实践,主要有以下三种方式:
The Never-Branch system
通常在项目的初期,还没有发布可运行的版本。
用户每天都把代码提交到/trunk
在复杂的任务可能会出现/trunk的代码处于通不过编译的错误状态
非常简单的策略,不需要merge代码,不需要学习分支和tag。
The Branch-When-Needed system
这个需要维护分支和trunk,merge,但相对轻量级的解决方案,如果经常有一些小的变更,极少有很大的变更,
这种方式可以避免大量的分支管理和merge操作。
...
require 'net/http'
require 'uri'
require 'json'
customers = [{
"id" => 1123,
"name" => "B-abc",
"citys" => "",
"company" => "",
"siteUrl" => "www.abc.com",
&q ...
发送Json请求,结果返回Json.
public static JSONObject post(String url,JSONObject json){
HttpClient client = new DefaultHttpClient();
HttpPost post = new HttpPost(url);
JSONObject response = null;
try {
StringEntity s = new StringEntity(json.toString());
s.setContentEncoding("UTF-8&qu ...
3.4 文档局部性敏感哈希(Locality-Sensitive Hashing for Documents)
虽然我们可以通过minhash来压缩大的文档到小的签名,并且仍然能够保留每对文档的相似性。
但是找到相似的对仍然很难实现,因为虽然文档数可能不是非常多,但是文 ...
第三章 查找相似的Items
数据挖掘的一个基本问题是检测相似的Items.比如网页去重,从网页集合中找到近似重复的网页,这类网页通常是内容相同,但是有一些是关于不同站点和镜像的内容。
这章从集合中找到交集,交集和集合大小的相对比率表示相似度,展开介绍相似度。我们会介绍怎样把文本文档的相似性表示为集合问题,这种技术被称为指纹方式。然后介绍了minhashing,他可以将大的集合压缩,并从压缩后的版本导出原来集合的相似度。其他的一些相似度算法在3.9进行了介绍。
一个非常重要的问题是,我们要搜索相似的Items,我们需要比较两两比较,这需要比较太多
的次数,即使每一对比较都非常的简单,但是仍然需要 ...
工作这么久了,主要就是服务器端的开发,由于业务性质,对于性能的考虑是每天不得不面对的问题,每次出方案,都是以预估总pv、单机支持最大并发、预计机器资源。。。。。。等等一系列问题开始,所以程序运行中单个 ...
第三章 线性回归模型
这章主要介绍线性回归模型,回归问题的目标是给一个D-维的输入变量,预测出一个或者多个目标连续
变量的值。第一章已经介绍了多项式曲线拟合的问题,这个是特殊的回归问题,被称为线性回归模型。
通过线性组合基本函数,可以获得很有用的一类函数,具有很简单的分析属性,并且由于基本函数
可以不是线性函数,所以相对于输入来说,具有非线性,可以描述相对复杂的问题。
给一个由N个观测值组成的训练集{Xn},包括相应的目标值{tn},一种简单的方式是构建恰当的函数y(x),
给出一个输入x,可以得到预测的目标值t。然后更一般的,可以从概率的观点,我们的目标是建模预测分布p(t| ...
Model和View绑定是虽然不是MVC模式的标配,但是Model和View的绑定,为开发者提供的非常方便的方式:视图的数据自动和模型同步并装配完成,避免了繁琐的手工装配过程。
Spring MVC提供了复杂的绑定机制和验证机制(前面的一个文章介绍了更复杂的动态列表的绑定)
我们先看看绑定机制:
我们以广告订单为例,在请求创建订单表单的action中,我们添加一个新创建的模型advertiseOrder:
@RequestMapping("/getCreateForm")
public ModelAndView getCreateForm(){
ModelAndVi ...
系统大量使用jquery的ajax,Ajax浏览器不能回退和前进,这个给交互操作带来了很多不方便。jquery有个
jquery history plugin这个可以实现回退和前进。
在页面中包含
<script src="js/jquery.history.js" type="text/javascript"></script>
jQuery(document).ready(function($) {
$.history.init(function(url) {
if(url && ur ...
最近有很多客户报表需要提供客户下载,需要生成一个Excel的格式文件,所以写了
一个通用的Excel报表生成代码供各个地方使用:
public <T> void createExcelReport(List<T> reports,Map<String,String> headerMap,OutputStream output) throws IOException {
if(reports == null || reports.isEmpty()) return;
Workbook wb = new HSSFWorkbook();
...
VIRT:virtual memory usage
1、进程“需要的”虚拟内存大小,包括进程使用的库、代码、数据等
2、假如进程申请100m的内存,但实际只使用了10m,那么它会增长100m,而不是实际的使用量
RES:resident memory usage 常驻内存
1、进程当前使用的内存大小,但不包括swap out
2、包含其他进程的共享
3、如果申请100m的内存,实际使用10m,它只增长10m,与VIRT相反
4、关于库占用内存的情况,它只统计加载的库文件所占内存大小
SHR:shared memory
1、除了 ...