“算法”指的是用于实现某一数据挖掘技术-如分类树、辨识分析等等的特定程序。
“属性”也被称为“特性”、“变量”、或者从数据库的观点,是一个“域” 。
“个体”是关于一个单元的测量值的集合――例如一个人的身高、体重、年龄等等;它也被称作“记录”、 或 者“行”(每一行通常代表一个记录,每一列代表一个变量)。
“置信度”在形如“如果买了A和B,就要买C”的关联法则里有特定的含义。置信度是已经买了A和B,还要买C的条件概率。
“因变量”在有约束学习里是那个被预测的变量;也被称作“输出变量”、“目标变量”、或者“结果变量”
“估计”指的是预测一个连续型输出变量的值;也被称作“预测”。
“特征”也被称作“属性”、“变量”,或者从数据库的观点,称为“域”。
“输入变量”是在有约束学习里作预测的变量;也被称作“自变量”、“预测变量”。
“模型”通常指的是一个数学公式,包括为它设置的参数(许多模型具有用户可以调节的参数)。
“结果变量” 在有约束学习里是那个被预测的变量;也被称作“因变量” “输出变量”、“目标变量”、或者“输出变量”。
“P(A|B)”读作“已知B已经发生,A将发生的概率”
“预测”指的是预测一个连续输出变量的值;也被称作“估计”。
“记录”是关于一个单元的测量值的集合-例如一个人的身高、体重、年龄等等;它也被称作“个体”、或者“排”(每一排通常代表一个记录,每一列代表一个变量)。
“分数”指的是一个估计的值或者类。
“给新数据打分”意思是利用用训练数据得出的模型预测新数据里的输出值
分享到:
相关推荐
例如,数据挖掘中常用的术语包括“知识发现”(Knowledge Discovery in Database,简称KDD)和“数据挖掘”(Data Mining,简称DM),这两个术语常常是同一过程的同义词,但KDD更强调从数据中提取知识的全过程,而DM...
4. **数据挖掘工具**:介绍常用的开源和商业工具,如R、Python的pandas和scikit-learn库,以及WEKA、SPSS Modeler等。 5. **案例研究**:通过具体的案例展示如何应用数据挖掘技术解决问题,可能是电商推荐系统、医疗...
医疗数据挖掘可以采用多种方法,以下是一些常用的方法: 1. 分类:利用历史数据来训练分类器,分类器能够根据输入数据对未知数据进行分类。 2. 聚类:将数据集划分为不同的组或簇,使得同一组内的数据更加相似,而...
报告中的常用术语涵盖了数据处理、统计分析、数据可视化等多个领域。以下是一些关键术语的详细解释: 1. 数据集(Dataset):数据集是用于分析的一组相关数据,可以来自不同的来源,如数据库、文件或调查问卷。 2....
PPT中可能涵盖数据挖掘的基本概念,如数据仓库、OLAP、数据挖掘任务分类(分类、回归、聚类、关联规则等),以及常用的数据挖掘工具和软件,如WEKA、R语言等。此外,PPT还可能包含实际案例分析,让学生了解如何在...
本文主要探讨了数据分析的基本概念、前景、六个关键步骤以及一系列常用的数据分析术语,旨在帮助读者建立对数据分析的全面理解。 首先,数据分析是一种利用统计方法和技术对大量数据进行深度挖掘和解读的过程,旨在...
在数据录入后,研究人员对相关字段进行提取,并利用数据挖掘的常用技术——频数分析、关联规则、社会网络分析等方法,对数据进行处理和分析。 在研究结果中,通过对247例患者的病例数据进行分析,研究者们得出了HBV...
Logistic模型是数据挖掘中的一种常用模型,它可以用来预测事件的可能性,例如市场营销的例子中,可以通过数据挖掘发现规律,例如如果收入大于29622,有孩子,并且孩子的数量小于等于2,那么对市场活动会回应。...
计算机编程及常用术语英语词汇大全 ...* 数据库:数据结构、数据查询、数据挖掘等 计算机编程及常用术语英语词汇大全涵盖了计算机科学和信息技术领域的多个方面的术语,是计算机科学和信息技术领域的必备工具。
数据挖掘是一种从海量数据中...如今,业界常用的数据挖掘分析工具有R、Python、SAS、SPSS、WEKA等。数据挖掘的未来发展趋势包括深度学习、流数据挖掘、实时分析、可视化等,将进一步提升我们从大数据中获取洞察的能力。
数据分析和数据挖掘是当今信息时代中非常热门的技术领域。随着信息量的飞速增长,数据的产生已经渗透到每一个行业和生活的方方面面。企业和组织越来越多地依赖于数据分析来提高效率、优化流程、增强竞争力,并对数据...
本文档主要探讨了篮球技术动作的常用统计方法及其通过数据挖掘技术进行的分析。在这项研究中,作者通过数据挖掘技术对篮球比赛中的技术动作进行了深入分析,旨在发现篮球技术动作之间的关联规则,并为教练员和运动员...
与数据挖掘类似的术语包括数据库中挖掘知识、知识提取、数据/模式分析、数据考古和数据捕捞。 常用的四种兴趣度的客观度量包括简单性、确定性、实用性、新颖性。 数据立方体的物化可以有三种选择:全物化、不物化...
随着计算机技术的发展和数据量的爆炸式增长,数据挖掘成为一门新兴的学科,催生了大量的专业术语。 在开发环境中,SQL Server 2005 或 SQL Server 2008 是常用的数据分析平台。在这样的环境中,数据挖掘的专业名词...
### 软件测试常用术语表详解 #### Acceptance Testing(验收测试) 验收测试是针对完成的系统或组件进行的一种测试活动,目的是验证系统是否满足用户的需求和期望。这种测试通常在开发周期的后期进行,当所有功能都...
### GIS专业英语常用术语解析 #### 一、引言 地理信息系统(Geographic Information System,简称GIS)是一种用于收集、存储、分析、管理和展示与地理位置相关的数据的技术系统。随着全球化的发展,掌握GIS的专业...
5. 工具与库:为了方便读者实践,书中可能会提及一些常用的数据挖掘工具和库,如R语言的 caret 包、Python 的 scikit-learn 库、WEKA 工具等。这些工具和库提供了丰富的数据处理和建模功能,能够帮助初学者快速上手...