- 浏览: 146208 次
- 性别:
- 来自: 杭州
最新评论
-
di1984HIT:
写的不错!!!
基于FP-tree的关联规则挖掘FP-growth算法基本思想 -
lvshuding:
你好,问个问题:你总结的FPGrowth算法的主要思想的第4步 ...
FPGrowth算法实现 -
lvshuding:
代码中每个方法的注释写的很详细,学习了。
另外,与1楼的同求。 ...
Apriori算法实现 -
爪哇鱼:
真是这个问题,感谢!
Eclipse3.6安装maven插件时遇到的问题 -
chencang:
很好哦,解决了我一个疑惑,谢谢
SVN图标含义说明
文章列表
算法分析:
转载地址:http://hi.baidu.com/shirdrn/blog/category/Data%20Minning
在挖掘关联规则的过程中,无可避免要处理海量的数据,也就是事务数据库如此之大,如果采用Apriori算法来挖掘,每次生成频繁k-项集的时候,可能都需要扫描事务数据库一遍,这是非常耗时的操作。那么,可以想尽办法来减少扫描事务数据库的次数,来改进挖掘频繁关联规则的效率。
FP-tree是频繁模式树,它是将整个事务数据库压缩到一棵频繁模式树上。而且,在构造整个事务数据库的的FP-tree的过程中,只需要扫描一次事务数据库就能生成。比AproriGen算法生成候选频繁 ...
/**
* 生成集合的所有子集(本算法中没有把空集作为子集返回,如果需要,请自行添加)
* 本算法采用递归实现
* @param sourceSet
* @param result
*/
public void buildSubSet(List<String> sourceSet, List<List<String>> result) {
//仅有一个元素时,递归终止。此时非空子集仅为其自身,所以直接添加到result中
if (sourceSet.size() == 1) {
...
/**
* 该算法使用递归方式实现,采用深度优先遍历树的节点,同时记录下已经遍历的节点保存在栈中。
* 当遇到叶子节点时,输出此时栈中的所有元素,即为当前的一条路径;然后pop出当前叶子节点
* @param stack为深度优先遍历过程中存储节点的栈
* @param root为树的要节点或子树的根节点
* @param pathList为树中所有从根到叶子节点的路径的列表
*/
public void buildPath(List<String> stack, Item root, List<String> pathList) ...
算法分析:http://ikeycn.iteye.com/blog/700740
算法实现:
/**
* FPGrowth算法的主要思想:
* 1. 构造频繁1项集:遍历初始数据集构造频繁1项集,并作为项头表,建立将指向fpTree节点对应元素的引用
* 2. 构造FPTree:再次遍历初始数据集,对于每一条事务中的元素,根据频繁1项集中元素的顺序排序,
* 由此建立FPTree,记录每条事务的节点在同一条路径上出再的节点次数;
* 3. 逆序遍历在步骤1中构造的项头表,根据其提供的引用指针,找出fpTree中由该节点到根节点的路径,
* 即生成每个频繁元 ...
Apriori算法的主题思想是:
1. 找出所有的频繁1项集
2. 递归地使用Apriori产生方法由频繁k-1项集生成k项集,直到产生的k项集为空
2.1 对每个k-1项集中的元素排序
2.2 找出k-1项集中每一对排序后的频繁集之间仅有最后一个位置不同的两个集合合并为k集合
2.3 生成k集合的所有k-1项集,然后判断集合中每一个是否在频繁k-1项集中出现:如果未曾出现,则把当前生成的k集合剪掉;否则把当前的k集合加入到候选频繁k项集中
2.4 对候选频繁k项集中的每一个集合,遍历判断其在原始数据集中出现的频率是否满足给定的最小支持度,如果满足 ...
软件错误:软件生存期内的人为错误,导致软件缺陷产生。是人为过程,相对于软件本身是外部行为。
软件缺陷:存在于软件(文档、数据、程序)中的偏差,导致软件在某个特定条件下出现故障,这时称软件 缺陷被激活。
软件故障:软件运行过程中出现的不希望或不可接收的内部状态。是动态行为。
软件失效:软件运行时产生的不希望或不可接受的外部行为结果。
综上:软件错误是一种人为错误。一个软件错误必定产生一个或多个软件缺陷。当一个软件缺陷被激活时,便产生一个软件故障;同一个软件缺陷在不同条件下被激活,可能产生不同的软件故障。软件故障如果没有集市的容错措施加以处理,便不可避免地导致软件失效;同一个 ...
CSS控制字符长度和显示长度
文章来源:http://hi.baidu.com/%BE%C5%D4%C2%B7%E3%C1%D6%B5%C4%BF%D5%BC%E4/blog/item/16f9fd4eda8ce1c1d0c86af7.html
在网页设计中,会遇到文本超过固定长度导致整体的网页变形的情况。程序员往往需要截取固定的长度来实现 ...
是不是很漂亮的表格效果,下面是使用jQuery的实现代码:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>Hello World jQuery!</title& ...
引言
在一些场景中,你的程序需要与用户交互。例如你想接收用户的输入并打印一些结果作为反馈。我们已经分别通过input()和print()函数实现了这个过程。
在输出窗口,有时我们需要看到str(string)类的各种方法。例如你可以使用rjust方法获得一个指定宽度的右对齐的字符串,更多细节通过help(str)获得。
input/output另外一个常用的方式是对文件的操作。对于很多程序来说,创建、读取和写回文件是不可或缺的部分,下面的部分将向你展示这些应用。
Input from user
# user_input.py
def reverse(text):
return text[: ...
References
当你创建对象并把它赋给一个变量后,这个变量仅仅只是关联到(refer to)这个对象,而并不代表这个对象本身。这就意味着变量名指向了你的计算机的内存中对象保存的位置。这个叫做把变量名绑定到对象上(This is called as ...
Python内置数据结构(Data Strutcures)
简介:
数据结构是用来存储相关联的一组数据的集合,在Python中内置了四种数据结构,分别是list, tuple, dictionary和set。下面我们将介绍这些数据结构的基本用法。
List
list用来存储规则的(ordered)数据集合,我们可用它来存储一系列的数据元素。假设你有一个购物清单用来表示你需要买的物品,你就可以把它们存储到list中,并用"[]"包起来,元素之间使用","隔开。当你创建一个list后,你就可以添加、删除或者查找list中的元素。因为我们能够添加或者删除元 ...
语言的学习中,难免不会用到相关的网络资源,这里做个标记,以便以后访问。
Python官方站点:http://www.python.org/
Python 手册(Tutorial):http://docs.python.org/py3k/tutorial/
Python 标准库(Standard Library):http://docs.python.org/py3k/library/index.html#library-index
Python参考(Language Reference):http://docs.python.org/py3k/reference/index.html#refer ...
如果你正在使用这个程序,是否觉得它的功能太简单了,点点右键,弹出的菜单中只能切换便笺的颜色,没有其他基本的格式编辑功能。
其实,除了标准的 Ctrl 加 XCVA 的剪切/复制/粘贴/全选快捷键之外,其实便笺程序还有一些快捷键可以使用:
快捷键 功能
Ctrl+N 新建一张便笺
Ctrl+D 删除当前便笺
Ctrl+E 居中对齐
Ctrl+R 右对齐
Ctrl+J 左对齐
Ctrl+I 斜体
Ctrl+B 粗体
Ctrl+U 下划线
Ctrl+T 删除线
Ctrl+Shift+> 加大选中文字的字号
Ctrl+Shift+< 缩小选中文字的字号 ...
Python标准库
译于 A byte of Python
引言:
Python 标准库(Standard Library)包含了大量非常有用的模块(module),并是Python的标准安装版的一部分。熟悉Python标准库是非常重要的,因为当你熟悉这些标准库的行为之后,你会发现很多东西能够 ...
Gof 设计模式
文章来源:http://www.cnblogs.com/furenjun/archive/2010/03/01/designPatterns.html
比较常用的有23种.
一.设计原则
1.1 OCP法则. 开闭法则(Open-Closed Principle)
一个软件系统应当对扩展开放,对修改关闭
优点:原则的描述就是其优 ...