文章列表
“算法”指的是用于实现某一数据挖掘技术-如分类树、辨识分析等等的特定程序。
“属性”也被称为“特性”、“变量”、或者从数据库的观点,是一个“域” 。
“个体”是关于一个单元的测量值的集合――例如一个人的 ...
第一,目标律。数据挖掘是一个业务过程,必须得有业务目标。无目的,无过程。
第二,知识律。业务知识贯穿在挖掘这个业务过程的各环节。
第三,准备律。数据获取、数据准备等数据处理耗时占整个挖掘过程的一半。
第四,NFL律。NFL,没有免费的午餐。没有一个固定的算法适用所有的业务问题,特定应用适合的模型只能通过经验发现。
第五,大卫律。要相信,数中必有业务规律。大卫?沃尔金斯最早提出的,故此名。
第六,洞察律。数据挖掘本质上是增强对业务领域的认知。
第七,预测律。数据挖掘基于过去得出模式,并泛化到类似新事物上,这就是预测,但这是统计概念的。
第八,价值律。挖掘模型的最终价值并非模型精度或稳定性,而是驱动 ...