`
noaighost
  • 浏览: 40238 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

“中国式”的数据挖掘 ——试读《数据挖掘技术(第3版)》有感

阅读更多

“中国式”的数据挖掘

                               ——试读《数据挖掘技术(3)》有感

两年前的五月,我“被老师安排”了毕业论文题。《企业电子商务平台客户细分初探和实现》,还记得那个晚上,我盗取别人的VPN账号,去知网下载论文。那种ctrl+c ctrl+v的快感,会让你迷失,迷失到一篇论文,误以为这么容易就堆砌出来。当然,论文老师很快联系上我,说了一大堆的脏话,引论跟正文没有关系……。那年我也在考研,那种排山倒海的压力,让我无法适从。早上复习,晚上去图书馆翻书,翻书主要的目的是翻看目录,目录可以让你更快了解这类知识的要点(这也是数据挖掘的一个核心思想)。

我记得老师在初评大会上,对我的论文说了一句话:“你认真写好综述先吧,论文可以重写了。”我说:“老师,怎么可以拿到优秀论文?”“你是不可能的,你慢慢写吧”。同组的人员,有一个同学抽到微博类的研究,我心里嘀咕着,我怎么没有抽到更好的呢?

就因为老师这句话,我顶住各种压力。我每天翻阅很多客户细分的书籍,为了拿到优秀论文,我甚至做了一个大胆的决定,直接把我当时打理的商城网站,做了一些功能。这功能就是对客户的行为进行了客户细分。结果当然我拿了那年的优秀论文,我从来没有办不到的事。

好了,先分享一下,我对数据挖掘的一些认识。理所当然,我打开试读pdf的《数据挖掘技术(3)》。老规矩,我先看它的目录。那些词条,让我觉得很亲切,因为以前写论文,对这些词,有过了解。

这本书的知识点很全面,是很多学习数据挖掘的经典。但问题就出在它是本经典,中国式的三个字,又套上头上去了,中国式的数据挖掘,就是一个条条框框,当某一个数据到点后,科研人员把一堆数字比对,计算,最后教条思维是数据挖掘的最大敌人。

很多人在PPT上列出一大堆数据,很多人在生产调整时,常用统计学去预测各种需要的数据。但你有想过这都是西方国家的东西吗?那种水土不服性,会让你厌恶传统的知识,空无乏味。

浏览了一下案例,这些案例都算是经典,感觉中国式的数据挖掘,需要通过理论学习,然后用实际经验,问问自己到底要得到什么数据,要用什么数学工具实现。这才是重点。

0
2
分享到:
评论

相关推荐

    【试读】明解C语言(第3版):入门篇

    本书图文并茂,示例丰富,第3版从190段代码和164幅图表增加至205段代码和220幅图表,对C语言的基础知识进行了彻底剖析,内容涉及数组、函数、指针、文件操作等。对于C语言语法以及一些难以理解的概念,均以精心绘制...

    数据挖掘技术在数字出版中的应用.pdf

    利用数据挖掘技术,出版企业可以对试读数据进行分析,了解用户的阅读行为和偏好,从而对产品进行调整和优化,以吸引和留住更多的用户。 最后,数据挖掘在数字出版中的应用,不仅限于上述方面,还可以用于市场趋势...

    09金融联考复习全书——辅导讲义(试读版)

    09金融联考复习全书——辅导讲义(试读版)

    寒江独钓——Windows 内核编程与信息安全(免费试读版)

    《寒江独钓——Windows内核编程与信息安全(免费试读版)》是一本深入探讨Windows内核模块开发的技术书籍。作者楚狂人以其丰富的实践经验和技术积累,为读者提供了关于实时扫描的防毒软件、虚拟磁盘、硬盘还原、硬盘...

    ITeye 8月技术图书有奖试读活动——已结束

    第9章详细介绍了作者曾经的冠军作品——跨终端存储方案(Storage),这是一个利用Web技术实现统一数据存储与访问的方案。 第10章完整阐述了如何通过脚本录制和回放技术实现跨终端动作同步。这项技术允许开发者记录...

    ITeye 2月技术图书有奖试读活动——已结束

    在学习过程中,海绵式思维可以帮助我们积累足够的知识,而淘金式思维则帮助我们判断知识的价值,发展批判性思维。 #### 2. 淘金式思维的实践 淘金式思维鼓励在学习过程中与内容展开对话,不只是被动接受信息,而是...

    手机游戏开发全书——部分章节试读.pdf

    ### 手机游戏开发全书——关键知识点精析 #### 1. 手机游戏开发行业背景 手机游戏开发行业自21世纪初以来经历了一段快速发展期,尤其是在中国,这个行业的崛起仅用了四年时间便达到了国际风险投资排名第四的位置。...

    《微管理——给你一个技术团队,你该怎么管》试读样章

    本书讲解了不同类型的IT技术团队如何进行管理,作者从“微管理”入手,以大量的“微科普”和“微案例”描述具体项目运作层面的管理实践,提高团队的工作效率。同时也不乏对战略、组织文化等方面的高层次思考,带给...

    Python高手之路 试读版 PDF电子书下载 带书签目录

    1. 电子书类型:所提到的是关于Python编程语言的电子书,具体为《Python高手之路》的试读版PDF格式,这表明它是一本关于Python的高级教程或进阶指南。 2. 电子书特征:试读版电子书包含书签目录功能,这意味着它被...

    高等院校研究生用书·复杂数据统计方法 基于R的应用 第2版 PDF电子书下载 带书签目录 试读版.pdf

    在这本书中,复杂数据统计方法指的可能是处理和分析大型数据集、非结构化数据、高维数据等复杂数据环境下的统计分析技术。随着大数据时代的来临,统计学家和数据分析师常常需要处理比传统数据更复杂的数据集,这...

    华为防火墙技术漫谈(完整版的不是试读版的)

    主要包括安全策略、攻击防范、NAT、、双机热备、选路,并结合网上案例给出以上技术的综合应用配置举例,以防火墙网上实际需求为导向,采用发现问题——解决问题——再发现问题——再解决问题的思路组织内容,...

    Java语言程序设计(基础篇)(英文版·第10版)试读版

    本试读版包含了部分内容,旨在帮助读者了解书中的教学方式和知识体系。以下是根据提供的文件名,结合Java语言基础知识进行的详细解读。 1. **Java语言简介**: Java是一种面向对象的、跨平台的编程语言,由Sun ...

Global site tag (gtag.js) - Google Analytics