`
webcode
  • 浏览: 6151342 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

数据挖掘有关术语(Glossary)

阅读更多
数据挖掘有关术语(Glossary)
人工神经网络(Artificial Neural Networks)
一种非线性预测模型,通过训练和在结构上模仿生物神经网络来学习。
分类和衰退树(CART Classification and Regression Trees)
一种用于数据集分类决策树技术。它提供一套也可用于一个新的未分类的数据集的规则,以预测哪些记录将有一个给定的结果。通过创建一个两路分化对一个数据集进行分段。较 CHAID 技术,它需要较少的数据准备。
正方自动交互发现(CHAID Chi Square Automatic Interaction Detection)
一种用于数据集分类决策树技术。它提供一套也可用于一个新的未分类的数据集的规则,以预测哪些记录将有一个给定的结果。通过创建一个“多路分化”对一个数据集进行分段。较 CART 技术,它需要较多的数据准备。
分类(classification)
一种把数据集分为互斥组的处理,每组中的成员之间尽可能“接近”,而不同的组之间尽可能“远离”,其中距离的测量与你正在试图预测的指定变量有关。例如:一个典型的分类问题是把一个有关公司的数据库按其信用值分组为“好与坏”,使他们尽可能与实际信用度相符。
簇化/聚类(clustering)
一种把数据集分为互斥组的处理,每组中的成员之间尽可能“接近”,而不同的组之间尽可能“远离”,其中距离的测量与所有可用的变量有关。
数据清洗(data cleansing)
一个确保数据集中所有数值是一致的和被正确记录的处理过程。
数据挖掘(data mining)
从一个大数据库中隐藏的预测信息的抽提过程。
数据导航/浏览(data navigation)
在一个多维数据库的不同的维度、切片、分层的细节等信息的观察过程。参见在线分析处理 OLAP。
数据可视化(data visualization)
对多维数据的各种复杂关系的可视化解释过程。
数据仓库(data warehouse)
一种储存和交付大量数据的数据库系统。
决策树(decision tree)
代表一系列决策的树状结构。这些决策为数据集的分类生成规则。参见 CART 和 CHAID.
维度(dimension)
在一个平面的或关系数据库中,记录中的每一个字段代表一维。在多维数据库中,一维是一相似实体的集合;例如,在一个多维的销售数据库中会包括产品、时间和城市维。
探测性数据分析(exploratory data analysis)
使用图形化和描述性的统计技术去“学习”一个数据集的结构。
遗传算法(genetic algorithms)
一种使用类似在一个基于自然进化概念的设计中的遗传组合、变异和自然选择等处理方法的优化技术。
线性模型(linear model)
一种分析模型,它假定考虑的各变化因素是线性的关系。
非线性模型(non-linear model)
一种分析模型,它不假定正在考虑的各变化因素是线性的关系。
线性衰退(linear regression)
一种用于在目标变量和其预测因子间找出最合适的线性关系的技术。
对数衰退(logistic regression)
A linear regression that predicts the proportions of a categorical target variable, such as type of customer, in a population.
最近邻居(nearest neighbor)
A technique that classifies each record in a dataset based on a combination of the classes of the k record(s) most similar to it in a historical dataset (where k 3 1). Sometimes called a k-nearest neighbor technique.
多维数据库(multidimensional database)
一种设计用于在线分析处理的数据库系统。其结构为多维的超立方体,其中每轴一维。
在线分析处理(OLAP On-line analytical processing)
可参考面向数组的数据库应用系统,它允许用户观察、穿插导航、操作和分析多维数据库。
数据警戒(outlier)
指一个数据项,其值超出一个样本上的其他大部分项的相应值的边界时,称其为警戒项。这时会预示着数据反常,需要仔细核实;他可能携带着重要信息。
预测模型(predictive model)
一个用于在数据集上预测指定变量的值的结构和处理流程。
预期数据分析(prospective data analysis)
基于历史的数据分析,它包括预测未来趋势、行为或事件。
回顾数据分析(retrospective data analysis)
对已经发生的事情做数据分析,它提供趋势、行为或事件的洞察。
规则归纳(rule induction)
对基于统计意义上的数据,抽提有用的“IF-THEN”规则。
时间序列分析(time series analysis)
按一定时间片对某个度量所做的序列分析。时间通常是数据的主要维度。
分享到:
评论

相关推荐

    广播电视行业术语 Glossary of Broadcasting

    广播电视行业术语 Glossary of Broadcasting

    【高清】 ANSI ESD ADV1.0 2017 中文版 术语Glossary.pdf

    【高清】 ANSI ESD ADV1.0 2017 中文版 术语Glossary.pdf

    ANSI ESD ADV1.0 2017 中文版 术语Glossary.pdf

    ANSI ESD ADV1.0 2017 中文版 术语Glossary.pdf

    glossary:专业术语

    词汇表的目的是提供中使用的统计和R编码术语的词汇表,这些词汇表可以脱机访问。 安装 您可以使用以下命令从安装词汇表的开发版本: # install.packages("devtools") devtools :: install_github( " psyteachr/...

    软件设计术语汇编(Software_Design_glossary)

    在软件开发领域,术语的理解和应用是至关重要的。软件设计术语汇编涵盖了多个关键概念,这些概念构成了软件设计的基础。以下是一些常见的软件设计术语及其详细解释: 1. **UML(统一建模语言)**:UML是一种图形化...

    工业代码读取术语表Barcode Reading Glossary EN.pdf

    工业代码读取术语表Barcode Reading Glossary EN

    Glossary Converter

    用户如果要将一个Excel文件转换为Trados术语库,将先后需要使用SDL MultiTerm 2009/2011 Convert和SDL MultiTerm 2009/...用户直接将Excel、TBX拖入到Glossary Converter程序即可将文件转换为SDL MultiTerm 术语库。

    Big Data Glossary-大数据术语

    它广泛应用于数据分析、数据挖掘和统计建模等领域。 **6.2 Yahoo! Pipes** Yahoo! Pipes是一个已停用的在线工具,允许用户通过拖放操作创建数据流,整合和处理来自不同来源的数据。 **6.3 Mechanical Turk** ...

    sap glossary

    而“SAP Glossary”则是一个重要的知识资源,它包含了SAP系统中的专业术语和概念,帮助用户理解和掌握SAP的相关知识。 在SAP Glossary中,你可以找到: 1. **核心模块**:例如财务会计(Financial Accounting)、...

    Business Glossary: Informatica PowerCenter Advanced Edition的一项重要功能

    7. 用户界面友好性:Business Glossary提供了业务分析师深入查看和识别相关业务术语的功能,并为数据管理员提供审批工作流,用以管理和编辑业务术语。 8. 部署简易性与安全性:通过Informatica的统一管理控制台,...

    ERP信息化专业资料:glossary术语表SAP里的名字解释.doc

    ERP信息化专业资料:glossary术语表SAP里的名字解释.doc

    Glossary—Data_Structures_&_Algorithm_2018

    本篇《Glossary—Data_Structures_&_Algorithm_2018》专业术语词汇表,由Grant Xiao于2018年编撰,系统梳理了数据结构与算法领域内的重要术语,为学习者和研究者提供了宝贵的参考。 首先,词汇表中提到了“2-3树”...

    Glossary_ITIL_v2.doc

    这个版本的词汇表(Glossary)旨在为读者提供理解和应用ITIL概念的关键术语和定义。 在财务管理方面,"Absorbed Overhead"是指间接成本,即提供服务时产生的不能直接归因于特定客户的成本,但可以通过使用量或其他...

    BALLISTIC MISSILE DEFENSE GLOSSARY

    美国防部解密文件,The Ballistic Missile Defense Glossary is most useful when it is current; however, the nature of our program makes this difficult. When proposing changes to the glossary, please keep...

    SAP glossary

    SAP_GLOSSARY_ENGLISH.RAR

    AUTOSAR_TR_Glossary.pdf

    在" AUTOSAR_TR_Glossary.pdf"文档中,我们看到一系列与AUTOSAR相关的专业术语和概念,这些对于理解AUTOSAR系统的基础知识至关重要。以下是其中一些关键术语的详细解释: 1. **E2E保护**:End-to-End (E2E) 保护...

    glossary:您网站的词汇表面板,可帮助读者理解术语

    在您的站点中添加一个简单的词汇表面板,以帮助您的用户理解术语术语。 如和DOI的。 例如: 单击标题中的Glossary图标 点击contributions 单击royalties 入门 要在本地运行示例: npm install -g parcel-bundler ...

    电子工程术语和定义列表,按字母顺序排列  - Maxim EE Glossary.pdf

    这份术语和定义列表不仅提供了对各项技术的准确描述,而且还有助于相关领域的从业人员深化对专业知识的理解。此外,这些术语的含义还在不断更新和发展中,因此电子工程师需要持续关注专业标准的更新,以保持其知识...

Global site tag (gtag.js) - Google Analytics