Mysql数据库优化学习之二索引优化（一）

博客分类：

Database

转载请标明出处： http://fuliang.iteye.com/blog/1063352 索引基础知识索引是帮助MySQL有效检索数据的一种数据结构，它是获得高性能的关键，但是人们常常忘记或者错误的理解了它，所以索引通常是现实中最常出现的性能问题。当你� ...

2011-05-29 00:25
浏览 5964
评论(0)
分类:数据库

模式识别和机器学习笔记第四章线性分类模型（一）

博客分类：

Machine Learning

算法 F#ITeye REST J#

转载请标明出处： http://fuliang.iteye.com/blog/1060530 在前面的章节，我们已经看到线性回归模型具有很简单的分析性和计算性。我么现在我们讨论这种类似的模型来解决分类问题。分类的目的是给出一个输入向量X，将它赋值为k个离� ...

2011-05-26 23:36
浏览 9868
评论(3)
分类:互联网

对一个设计拙劣或者没有做index的schma进行优化，可以很大程度的改善性能。如果想获得很好的性能，就需要对你运行的特定的queries来设计schema和索引，你需要估计不同类query的性能需求，和使用的频度，以及需要检索的字段和检索的条件。优化是一个权衡，索引可以提高检索速度，但是会降低更新速度，一个反范式的schema可能会在某些查询下加快速度，但在其他情况下可能降低速度。添加冗余字段、计数器、summary表可以优化查询，但是维护起来很困难。选择最优的数据类型： Mysql支持大量的各种个样的数据类型，如何正确的选择类型来存储数据是产生高性能的关键。 1.足够大的越小 ...

2011-05-12 23:32
浏览 4063
评论(0)
分类:数据库

[zz]数据挖掘邻域的5篇经典文章

博客分类：

Data/Web Mining

数据挖掘 J#

转载自 http://www.dataminingblog.com/top-five-articles-in-data-mining/ Data Mining博客最近有篇文章，列举了他们认为的数据挖掘领域的5篇经典文章。个人深为赞同，所以转载一下。 An Introduction to Variable and Feature Selection Isabelle Guyon and André Elisseeff Data Clustering: A Review A.K. Jain, M.N. Murty and P.J. Flynn From Dat ...

2011-05-12 13:50
浏览 1802
评论(0)
分类:互联网

版本分支控制几种方式

博客分类：

Develope Tools

SVN 项目管理工作

如何分支和tags，这个是经常被争议的话题，参考svn最佳实践，主要有以下三种方式： The Never-Branch system 通常在项目的初期，还没有发布可运行的版本。用户每天都把代码提交到/trunk 在复杂的任务可能会出现/trunk的代码处于通不过编译的错误状态非常简单的策略，不需要merge代码，不需要学习分支和tag。 The Branch-When-Needed system 这个需要维护分支和trunk，merge，但相对轻量级的解决方案，如果经常有一些小的变更，极少有很大的变更，这种方式可以避免大量的分支管理和merge操作。 ...

2011-05-05 18:49
浏览 1673
评论(0)
分类:编程语言

Ruby发送json请求

博客分类：

Ruby

Ruby json .net

require 'net/http' require 'uri' require 'json' customers = [{ "id" => 1123, "name" => "B-abc", "citys" => "", "company" => "", "siteUrl" => "www.abc.com", &q ...

2011-05-05 18:37
浏览 5872
评论(0)
分类:编程语言

HttpClient Json请求工具

博客分类：

Java SE

json

发送Json请求，结果返回Json. public static JSONObject post(String url,JSONObject json){ HttpClient client = new DefaultHttpClient(); HttpPost post = new HttpPost(url); JSONObject response = null; try { StringEntity s = new StringEntity(json.toString()); s.setContentEncoding("UTF-8&qu ...

2011-05-05 18:32
浏览 17866
评论(1)
分类:编程语言

大规模数据挖掘-第三章学习笔记二

博客分类：

Data/Web Mining

数据挖掘工作

3.4 文档局部性敏感哈希（Locality-Sensitive Hashing for Documents）虽然我们可以通过minhash来压缩大的文档到小的签名，并且仍然能够保留每对文档的相似性。但是找到相似的对仍然很难实现，因为虽然文档数可能不是非常多，但是文� ...

2011-05-02 21:12
浏览 3491
评论(0)
分类:互联网

大规模数据挖掘-第三章学习笔记一

博客分类：

Data/Web Mining

数据挖掘搜索引擎算法应用服务器 Google

第三章查找相似的Items 数据挖掘的一个基本问题是检测相似的Items.比如网页去重，从网页集合中找到近似重复的网页，这类网页通常是内容相同，但是有一些是关于不同站点和镜像的内容。这章从集合中找到交集，交集和集合大小的相对比率表示相似度，展开介绍相似度。我们会介绍怎样把文本文档的相似性表示为集合问题，这种技术被称为指纹方式。然后介绍了minhashing,他可以将大的集合压缩，并从压缩后的版本导出原来集合的相似度。其他的一些相似度算法在3.9进行了介绍。一个非常重要的问题是，我们要搜索相似的Items，我们需要比较两两比较，这需要比较太多的次数，即使每一对比较都非常的简单，但是仍然需要 ...

2011-05-01 00:06
浏览 10885
评论(1)
分类:编程语言

[zz]服务器性能评估

博客分类：

Linux

应用服务器网络应用 Linux 网络协议 Cache

工作这么久了，主要就是服务器端的开发，由于业务性质，对于性能的考虑是每天不得不面对的问题，每次出方案，都是以预估总pv、单机支持最大并发、预计机器资源。。。。。。等等一系列问题开始，所以程序运行中单个 ...

2011-04-29 14:17
浏览 4042
评论(2)
分类:操作系统

模式识别和机器学习笔记第三章线性回归模型

博客分类：

Machine Learning

J#

第三章线性回归模型这章主要介绍线性回归模型，回归问题的目标是给一个D-维的输入变量，预测出一个或者多个目标连续变量的值。第一章已经介绍了多项式曲线拟合的问题，这个是特殊的回归问题，被称为线性回归模型。通过线性组合基本函数，可以获得很有用的一类函数，具有很简单的分析属性，并且由于基本函数可以不是线性函数，所以相对于输入来说，具有非线性，可以描述相对复杂的问题。给一个由N个观测值组成的训练集{Xn}，包括相应的目标值{tn}，一种简单的方式是构建恰当的函数y(x)，给出一个输入x,可以得到预测的目标值t。然后更一般的，可以从概率的观点，我们的目标是建模预测分布p(t| ...

2011-04-27 14:08
浏览 6158
评论(6)
分类:编程语言

Spring MVC form data binding and ajax form

博客分类：

Spring

Ajax MVC Spring jQuery JSP

Model和View绑定是虽然不是MVC模式的标配，但是Model和View的绑定，为开发者提供的非常方便的方式：视图的数据自动和模型同步并装配完成，避免了繁琐的手工装配过程。 Spring MVC提供了复杂的绑定机制和验证机制(前面的一个文章介绍了更复杂的动态列表的绑定) 我们先看看绑定机制：我们以广告订单为例,在请求创建订单表单的action中，我们添加一个新创建的模型advertiseOrder： @RequestMapping("/getCreateForm") public ModelAndView getCreateForm(){ ModelAndVi ...

2011-04-12 23:26
浏览 7363
评论(0)
分类:企业架构

Ajax支持历史回退前进

博客分类：

Ajax

Ajax jQuery JavaScript 浏览器

系统大量使用jquery的ajax，Ajax浏览器不能回退和前进，这个给交互操作带来了很多不方便。jquery有个 jquery history plugin这个可以实现回退和前进。在页面中包含 <script src="js/jquery.history.js" type="text/javascript"></script> jQuery(document).ready(function($) { $.history.init(function(url) { if(url && ur ...

2011-04-12 19:56
浏览 3637
评论(0)
分类:Web前端

利用Java反射实现通用的Excel报表

博客分类：

Java SE

Excel Java J#

最近有很多客户报表需要提供客户下载，需要生成一个Excel的格式文件，所以写了一个通用的Excel报表生成代码供各个地方使用： public <T> void createExcelReport(List<T> reports,Map<String,String> headerMap,OutputStream output) throws IOException { if(reports == null || reports.isEmpty()) return; Workbook wb = new HSSFWorkbook(); ...

2011-04-12 16:00
浏览 2038
评论(0)
分类:编程语言

[zz]Top命令VIRT,RES,SHR,DATA的含义

博客分类：

Linux

F#

VIRT：virtual memory usage 1、进程“需要的”虚拟内存大小，包括进程使用的库、代码、数据等 2、假如进程申请100m的内存，但实际只使用了10m，那么它会增长100m，而不是实际的使用量 RES：resident memory usage 常驻内存 1、进程当前使用的内存大小，但不包括swap out 2、包含其他进程的共享 3、如果申请100m的内存，实际使用10m，它只增长10m，与VIRT相反 4、关于库占用内存的情况，它只统计加载的库文件所占内存大小 SHR：shared memory 1、除了 ...

2011-04-10 15:50
浏览 4147
评论(0)
分类:操作系统

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Mysql数据库优化学习之二索引优化（一）

模式识别和机器学习笔记第四章线性分类模型（一）

Mysql数据库优化学习之一 Schema优化

[zz]数据挖掘邻域的5篇经典文章

版本分支控制几种方式

Ruby发送json请求

HttpClient Json请求工具

大规模数据挖掘-第三章学习笔记二

大规模数据挖掘-第三章学习笔记一

[zz]服务器性能评估

模式识别和机器学习笔记第三章线性回归模型

Spring MVC form data binding and ajax form

Ajax支持历史回退前进

利用Java反射实现通用的Excel报表

[zz]Top命令VIRT,RES,SHR,DATA的含义

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>