数据挖掘有关术语(Glossary)
人工神经网络(Artificial Neural Networks)
一种非线性预测模型,通过训练和在结构上模仿生物神经网络来学习。
分类和衰退树(CART Classification and Regression Trees)
一种用于数据集分类决策树技术。它提供一套也可用于一个新的未分类的数据集的规则,以预测哪些记录将有一个给定的结果。通过创建一个两路分化对一个数据集进行分段。较 CHAID 技术,它需要较少的数据准备。
正方自动交互发现(CHAID Chi Square Automatic Interaction Detection)
一种用于数据集分类决策树技术。它提供一套也可用于一个新的未分类的数据集的规则,以预测哪些记录将有一个给定的结果。通过创建一个“多路分化”对一个数据集进行分段。较 CART 技术,它需要较多的数据准备。
分类(classification)
一种把数据集分为互斥组的处理,每组中的成员之间尽可能“接近”,而不同的组之间尽可能“远离”,其中距离的测量与你正在试图预测的指定变量有关。例如:一个典型的分类问题是把一个有关公司的数据库按其信用值分组为“好与坏”,使他们尽可能与实际信用度相符。
簇化/聚类(clustering)
一种把数据集分为互斥组的处理,每组中的成员之间尽可能“接近”,而不同的组之间尽可能“远离”,其中距离的测量与所有可用的变量有关。
数据清洗(data cleansing)
一个确保数据集中所有数值是一致的和被正确记录的处理过程。
数据挖掘(data mining)
从一个大数据库中隐藏的预测信息的抽提过程。
数据导航/浏览(data navigation)
在一个多维数据库的不同的维度、切片、分层的细节等信息的观察过程。参见在线分析处理 OLAP。
数据可视化(data visualization)
对多维数据的各种复杂关系的可视化解释过程。
数据仓库(data warehouse)
一种储存和交付大量数据的数据库系统。
决策树(decision tree)
代表一系列决策的树状结构。这些决策为数据集的分类生成规则。参见 CART 和 CHAID.
维度(dimension)
在一个平面的或关系数据库中,记录中的每一个字段代表一维。在多维数据库中,一维是一相似实体的集合;例如,在一个多维的销售数据库中会包括产品、时间和城市维。
探测性数据分析(exploratory data analysis)
使用图形化和描述性的统计技术去“学习”一个数据集的结构。
遗传算法(genetic algorithms)
一种使用类似在一个基于自然进化概念的设计中的遗传组合、变异和自然选择等处理方法的优化技术。
线性模型(linear model)
一种分析模型,它假定考虑的各变化因素是线性的关系。
非线性模型(non-linear model)
一种分析模型,它不假定正在考虑的各变化因素是线性的关系。
线性衰退(linear regression)
一种用于在目标变量和其预测因子间找出最合适的线性关系的技术。
对数衰退(logistic regression)
A linear regression that predicts the proportions of a categorical target variable, such as type of customer, in a population.
最近邻居(nearest neighbor)
A technique that classifies each record in a dataset based on a combination of the classes of the k record(s) most similar to it in a historical dataset (where k 3 1). Sometimes called a k-nearest neighbor technique.
多维数据库(multidimensional database)
一种设计用于在线分析处理的数据库系统。其结构为多维的超立方体,其中每轴一维。
在线分析处理(OLAP On-line analytical processing)
可参考面向数组的数据库应用系统,它允许用户观察、穿插导航、操作和分析多维数据库。
数据警戒(outlier)
指一个数据项,其值超出一个样本上的其他大部分项的相应值的边界时,称其为警戒项。这时会预示着数据反常,需要仔细核实;他可能携带着重要信息。
预测模型(predictive model)
一个用于在数据集上预测指定变量的值的结构和处理流程。
预期数据分析(prospective data analysis)
基于历史的数据分析,它包括预测未来趋势、行为或事件。
回顾数据分析(retrospective data analysis)
对已经发生的事情做数据分析,它提供趋势、行为或事件的洞察。
规则归纳(rule induction)
对基于统计意义上的数据,抽提有用的“IF-THEN”规则。
时间序列分析(time series analysis)
按一定时间片对某个度量所做的序列分析。时间通常是数据的主要维度。
分享到:
相关推荐
广播电视行业术语 Glossary of Broadcasting
【高清】 ANSI ESD ADV1.0 2017 中文版 术语Glossary.pdf
ANSI ESD ADV1.0 2017 中文版 术语Glossary.pdf
词汇表的目的是提供中使用的统计和R编码术语的词汇表,这些词汇表可以脱机访问。 安装 您可以使用以下命令从安装词汇表的开发版本: # install.packages("devtools") devtools :: install_github( " psyteachr/...
在软件开发领域,术语的理解和应用是至关重要的。软件设计术语汇编涵盖了多个关键概念,这些概念构成了软件设计的基础。以下是一些常见的软件设计术语及其详细解释: 1. **UML(统一建模语言)**:UML是一种图形化...
工业代码读取术语表Barcode Reading Glossary EN
用户如果要将一个Excel文件转换为Trados术语库,将先后需要使用SDL MultiTerm 2009/2011 Convert和SDL MultiTerm 2009/...用户直接将Excel、TBX拖入到Glossary Converter程序即可将文件转换为SDL MultiTerm 术语库。
它广泛应用于数据分析、数据挖掘和统计建模等领域。 **6.2 Yahoo! Pipes** Yahoo! Pipes是一个已停用的在线工具,允许用户通过拖放操作创建数据流,整合和处理来自不同来源的数据。 **6.3 Mechanical Turk** ...
而“SAP Glossary”则是一个重要的知识资源,它包含了SAP系统中的专业术语和概念,帮助用户理解和掌握SAP的相关知识。 在SAP Glossary中,你可以找到: 1. **核心模块**:例如财务会计(Financial Accounting)、...
7. 用户界面友好性:Business Glossary提供了业务分析师深入查看和识别相关业务术语的功能,并为数据管理员提供审批工作流,用以管理和编辑业务术语。 8. 部署简易性与安全性:通过Informatica的统一管理控制台,...
ERP信息化专业资料:glossary术语表SAP里的名字解释.doc
本篇《Glossary—Data_Structures_&_Algorithm_2018》专业术语词汇表,由Grant Xiao于2018年编撰,系统梳理了数据结构与算法领域内的重要术语,为学习者和研究者提供了宝贵的参考。 首先,词汇表中提到了“2-3树”...
这个版本的词汇表(Glossary)旨在为读者提供理解和应用ITIL概念的关键术语和定义。 在财务管理方面,"Absorbed Overhead"是指间接成本,即提供服务时产生的不能直接归因于特定客户的成本,但可以通过使用量或其他...
美国防部解密文件,The Ballistic Missile Defense Glossary is most useful when it is current; however, the nature of our program makes this difficult. When proposing changes to the glossary, please keep...
SAP_GLOSSARY_ENGLISH.RAR
在" AUTOSAR_TR_Glossary.pdf"文档中,我们看到一系列与AUTOSAR相关的专业术语和概念,这些对于理解AUTOSAR系统的基础知识至关重要。以下是其中一些关键术语的详细解释: 1. **E2E保护**:End-to-End (E2E) 保护...
在您的站点中添加一个简单的词汇表面板,以帮助您的用户理解术语术语。 如和DOI的。 例如: 单击标题中的Glossary图标 点击contributions 单击royalties 入门 要在本地运行示例: npm install -g parcel-bundler ...
这份术语和定义列表不仅提供了对各项技术的准确描述,而且还有助于相关领域的从业人员深化对专业知识的理解。此外,这些术语的含义还在不断更新和发展中,因此电子工程师需要持续关注专业标准的更新,以保持其知识...