《数据挖掘与R语言》
基本信息
原书名:Data Mining with R:Learning with Case Studies
作者: (葡)Luís Torgo
译者: 李洪成 陈道轮 吴立明
丛书名: 计算机科学丛书
出版社:机械工业出版社
ISBN:9787111407003
上架时间:2013-4-25
出版日期:2013 年4月
开本:16开
页码:1
版次:1-1
所属分类:计算机 > 数据库 > 数据库存储与管理
更多关于 》》》《数据挖掘与R语言》
内容简介
计算机书籍
《数据挖掘与r语言》首先简要介绍了r软件的基础知识(安装、r数据结构、r编程、r的输入和输出等)。然后通过四个数据挖掘的实际案例(藻类频率的预测、证券趋势预测和交易系统仿真、交易欺诈预测、微阵列数据分类)介绍数据挖掘技术。这四个案例基本覆盖了常见的数据挖掘技术,从无监督的数据挖掘技术、有监督的数据挖掘技术到半监督的数据挖掘技术。全书以实际问题、解决方案和对解决方案的讨论为主线来组织内容,脉络清晰,并且各章自成体系。读者可以从头至尾逐章学习,也可以根据自己的需要进行学习,找到自己实际问题的解决方案。
《数据挖掘与r语言》不需要读者具备r和数据挖掘的基础知识。不管是r初学者,还是熟练的r用户都能从书中找到对自己有用的内容。读者既可以把《数据挖掘与r语言》作为学习如何应用r的一本优秀教材,也可以作为数据挖掘的工具书。
目录
《数据挖掘与r语言》
出版者的话
推荐序
中文版序
译者序
前言
致谢
第1章简介
1.1如何阅读《数据挖掘与r语言》
1.2r简介
1.2.1r起步
1.2.2r对象
1.2.3向量
1.2.4向量化
1.2.5因子
1.2.6生成序列
1.2.7数据子集
1.2.8矩阵和数组
1.2.9列表
1.2.10数据框
.1.2.11构建新函数
1.2.12对象、类和方法
1.2.13管理r会话
1.3mysql简介
第2章预测海藻数量
2.1问题描述与目标
2.2数据说明
2.3数据加载到r
2.4数据可视化和摘要
2.5数据缺失
2.5.1将缺失部分剔除
2.5.2用最高频率值来填补缺失值
2.5.3通过变量的相关关系来填补缺失值
2.5.4通过探索案例之间的相似性来填补缺失值
2.6获取预测模型
2.6.1多元线性回归
2.6.2回归树
2.7模型的评价和选择
2.8预测7类海藻的频率
2.9小结
第3章预测股票市场收益
3.1问题描述与目标
3.2可用的数据
3.2.1在r中处理与时间有关的数据
3.2.2从csv文件读取数据
3.2.3从网站上获取数据
3.2.4从mysql数据库读取数据
3.3定义预测任务
3.3.1预测什么
3.3.2预测变量是什么
3.3.3预测任务
3.3.4模型评价准则
3.4预测模型
3.4.1如何应用训练集数据来建模
3.4.2建模工具
3.5从预测到实践
3.5.1如何应用预测模型
3.5.2与交易相关的评价准则
3.5.3模型集成:仿真交易
3.6模型评价和选择
3.6.1蒙特卡罗估计
3.6.2实验比较
3.6.3结果分析
3.7交易系统
3.7.1评估最终测试数据
3.7.2在线交易系统
3.8小结
第4章侦测欺诈交易
4.1问题描述与目标
4.2可用的数据
4.2.1加载数据至r
4.2.2探索数据集
4.2.3数据问题
4.3定义数据挖掘任务
4.3.1问题的不同解决方法
4.3.2评价准则
4.3.3实验方法
4.4计算离群值的排序
4.4.1无监督方法
4.4.2有监督方法
4.4.3半监督方法
4.5小结
第5章微阵列样本分类
5.1问题描述与目标
5.1.1微阵列实验背景简介
5.1.2数据集all
5.2可用的数据
5.3基因(特征)选择
5.3.1基于分布特征的简单过滤方法
5.3.2anova过滤
5.3.3用随机森林进行过滤
5.3.4用特征聚类的组合进行过滤
5.4遗传学异常的预测
5.4.1定义预测任务
5.4.2模型评价标准
5.4.3实验过程
5.4.4建模技术
5.4.5模型比较
5.5小结
参考文献
主题索引
数据挖掘术语索引
r函数索引
相关推荐
书中“数据挖掘与R语言”由葡萄牙学者Luis Torgo撰写,该书详细介绍了数据挖掘的主要过程和技术,并且通过具体案例展示了如何应用R语言进行数据分析。书中不仅涵盖了数据挖掘的关键技术和方法,还提供了对数据挖掘...
数据挖掘与R语言代码,分享快乐,这是我在大学里下载的
本资源是“数据挖掘与R语言”相关的配套代码,旨在帮助用户更深入地理解和应用数据挖掘技术。 在数据挖掘过程中,我们通常会经历几个关键步骤: 1. 数据预处理:这是整个流程的第一步,包括数据清洗(去除异常值、...
《R语言数据挖掘(第2版)》是深入学习数据挖掘技术的重要参考资料,特别是对于使用R语言进行数据处理和分析的读者来说,这本书提供了丰富的实践案例和配套代码。本压缩包包含的文件主要与书中的实例相关,让我们逐一...
数据挖掘与R语言 (计算机科学丛书)_14296813_1401409
在本资源包中,我们关注的是“R语言数据分析与挖掘”的相关知识点,这是一门结合统计学、计算机科学和业务洞察的重要学科。R语言作为数据科学家的首选工具,以其强大的数据处理、图形绘制和统计分析能力,广泛应用于...
《R语言数据挖掘》这本书是数据科学领域的重要参考资料,它深入浅出地介绍了如何使用R语言进行高效的数据挖掘。R语言以其强大的统计分析能力和丰富的可视化工具,在数据科学界备受推崇,而数据挖掘则是利用统计方法...
在“数据挖掘与R语言1”这个主题中,我们将深入探讨如何利用R语言进行有效的数据挖掘。 首先,我们需要了解数据预处理的重要性。数据预处理包括数据清洗、缺失值处理、异常值检测和数据转换等步骤。在R中,可以使用...
通过《R语言数据分析与挖掘实战》的学习,读者不仅可以掌握R语言的基本技能,还能熟悉数据预处理、统计分析、数据挖掘和可视化的方法,为实际工作中的数据项目提供强大的技术支持。无论你是数据新手还是有一定经验的...
以下是使用R语言进行数据挖掘的一些基本步骤: ###1.数据导入与清洗 首先,需要将数据导入R环境中,这通常通过`read.csv`、`read.table`等函数实现。数据清洗是数据挖掘的重要步骤,包括处理缺失值、异常值和重复值...
在本资源包中,我们关注的是使用R语言进行数据挖掘的实际操作,这涉及到一系列的数据分析技术和方法。以下是一些相关的知识点: 1. **R语言**:R是一种专门用于统计计算和图形绘制的开源编程语言,广泛应用于数据...
《数据分析与数据挖掘:R语言实战》是一本深入探索数据科学领域的宝贵教材,它通过R语言的实际编程案例,引领读者逐步掌握数据分析与数据挖掘的核心技术。这个压缩包包含16个章节的源代码,旨在帮助学习者从实践中...
随着大数据时代的到来,数据挖掘技术在各行各业的应用变得越来越广泛,而R语言以其强大的统计分析和图形处理能力,成为了数据挖掘领域中一个不可或缺的工具。薛薇所著的《R语言数据挖掘方法及应用》一书,详细地介绍...
数据挖掘与R语言_Data_Ming_with_R
在这份文档中,我们看到了关于“基于R语言的数据挖掘课程实验设计”的研究与讨论。这篇文章详细探讨了在大数据时代背景下,数据挖掘作为一门重要技术领域的重要性和发展趋势,以及如何在教学中应用R语言来帮助学生...
《R语言数据挖掘:方法及应用》是由薛微编著的一本专著,该书深入浅出地介绍了如何使用R语言进行数据挖掘,并且包含了丰富的实际案例和配套代码,为读者提供了实践操作的可能。R语言是统计学和数据科学领域广泛使用...