最新文章列表

MLA Review之五:回归

回到回归的正题,回归问题是机器学习领域中应用的比较广的一种方法,不过我觉得大部分的回归模型都是广义线性模型,在Andrew NG的课程中,对广义线性模型做了比较详细的推导,这篇文章的内容是,线性回归、局部加权回归、岭回归以及前向逐步回归,除了前向逐步回归之外,其他的都是广义线性回归模型,基本思路都是 1,确定损失函数 2,使用梯度下降(或者梯度上升)求解权重参数,算是套路,而这两种套路使用Pyt ...
u010223750 评论(0) 有1097人浏览 2016-02-20 16:47

MLA Review之三:朴素贝叶斯分类

朴素贝叶斯(Naive Bayes),贝叶斯概率论在整个统计学习上都是泰山北斗一样的存在,《Pattern Recognization and Machine Learning》这一扛鼎之作全书的思想其实 ...
u010223750 评论(0) 有1205人浏览 2016-02-18 23:33

MLA Review之二:决策树

分类决策树是一种描述对实例进行分类的属性结构,决策树由内部节点和叶节点,内部节点表示一个特征或者属性,叶节点表示一个类。   Part 1 :决 ...
u010223750 评论(0) 有1192人浏览 2016-02-17 22:26

MLA Review之一: KNN算法

在看完Machine Learning in Action一书之后,觉得还是需要进行一些回顾,而且由于第一次看的时候Python基础并不牢固,所以这次也当做是Python一些知识回顾 ...
u010223750 评论(0) 有1154人浏览 2016-02-16 17:13

开启google人工智能学习Tensorflow之旅(一)

简介TensorFlow TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统。 Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,这和当前很多主流机器学习框架类似,如spark,。 TensorFlow为张量从图象的一端流动到另一端计算过程。 TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统,目前 ...
zhao_rock 评论(0) 有2328人浏览 2016-01-29 13:47

Micheal Nielsen's神经网络学习之三:过拟合与规范化

依然是Michael Nielsen的书,依然是神经网络,上文说到的是神经网络有关于损失函数的调整使得学习速度加快,但是还是有几个问题没有解决:   过拟合问题 权重和b初始化问题 一,首先来看第一个问题:过拟合(overfitting) 什么是overfitting,我这个人不是典型的学院派,所以正儿八经的定义也不会用,用我的话说就是学习过度,主要表现在两个方面:第一,在现有的训 ...
u010223750 评论(0) 有4142人浏览 2016-01-18 01:24

Micheal Nielsen's神经网络学习之二

依然是跟着Michael Nielsen的神经网络学习,基于前一篇的学习,已经大概明白了神经网络的基本结构和BP算法,也能通过神经网络训练数字识别功能,之后我试验了一下使用神经网络训练之前的文本分类,只是简单的使用了词频来作为词向量处理过程,没有任何的其他调参过程,对于八分类,其正确率到了84%,相比于之前各种调参才能勉强达到72%的SVM分类方法而言,神经网络有无可比拟的简单和高正确率。好了, ...
u010223750 评论(0) 有2331人浏览 2016-01-13 19:39

隐马尔科夫模型(HMM)浅见

隐马尔科夫模型,Hidden Marcov Model,是可用于标注问题的统计学习模型,描述由隐藏的马尔科夫链随机生成观测序列的过程,属于生成模型,是一种比较重要的机器学习方法,在语音识别等领域有重要的应用。   本文不打算使用书面的一大堆公式来说明,本人对公式无感,能用例子说明的根本不想碰公式,不知道是不是霍金说过,多加一条公式就会损失一大片读者。PS:不管有没有说过了,是这个意思,wha ...
u010223750 评论(0) 有3351人浏览 2016-01-09 12:27

达观数据:文本大数据的机器学习自动分类方法

  随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。文本分类是指在给定分类体系下,根据文本内容自动确定文本类别的过程(达观数据科技联合创始人张健)。文本分类有着广泛的应用场景,例如:       新闻网站包含大量报道文章,基于文章内容,需要将这些文章按题材进行自动分类(例如自动 ...
大数据顾问 评论(1) 有4895人浏览 2016-01-07 13:42

Michael Nielsen 's 神经网络学习之一

最近看到了一个比较好的神经网络和深度学习的网站,http://neuralnetworksanddeeplearning.com/,其实也不算是网站,算是Michael Nielsen的书籍电子版,写的算是比较生动简介,我这部分系列的文章算是一个跟书笔记,也算是半吊子翻译和代码注释工,恩,背景介绍到这里(大神直接看原文就行了,可以不用看后面的渣文了)。   没接触神经网络之前,我觉得神经网络 ...
u010223750 评论(0) 有3885人浏览 2016-01-03 17:33

LIBSVM学习——文本分类

最近期末事儿比较多,没什么大东西,最近在使用libsvm做文本分类,虽然感受到了LIBSVM的便捷之处,但是也感受到了Libsvm的调参的复杂性,写下来Mark一下   文本分类,使用的是路透社的语料最为训练和测试数据集,原始的语料有91类大概十几万篇文章,由于以一些类的数量太少(本次实验室将一个类别下的文本数量少于100篇的过滤)而不具备训练价值(对于有监督的学习而言),最后我们得到的是8个 ...
u010223750 评论(0) 有6154人浏览 2015-12-30 15:11

遗传算法使用Java实现

最近需要学习神经网络,对于神经网络问题的求解其中需要用到遗传算法,所以今天学习了一下遗传算法,主要参看了 http://blog.csdn.net/emiyasstar__/article/details/6938608这篇博客的文章,同时将其使用C++实现的程序用Java再次实现了一遍,不足之处还请指出多包涵   遗传算法:也称进化算法 。 遗传算法是受达尔文的进化论的启发,借鉴生物进化过程 ...
u010223750 评论(0) 有7901人浏览 2015-12-10 08:51

EM算法与高斯混合分布

作为机器学习的十大算法之一,EM算法可谓是风头出尽,尤其是EM算法在聚类等方面的优越表现,让EM算法备受瞩目,这个星期对EM算法进行了一番了解,说实话EM算法光从教科书上的那些公式说导我觉得很难理解,在七月算法的一节关于EM算法的公开课上慢慢的对EM算法有了算是入门的了解,今天就来说说EM算法与其典型的应用:高斯混合分布   首先简略介绍一个高斯混合分布:   在一个随机分布里面,可能存在 ...
u010223750 评论(0) 有3435人浏览 2015-12-06 14:59

SVM实战之垃圾邮件过滤

SVM作为机器学习里面的经典算法在实际中一直被广泛采用,而且其准确性也是非常之高,特别是在引入了核函数之后对识别性能变得非常高。 说明:本文不打算就SVM原理就深入分析,虽然对其原理略懂一二,但是对于SMO算法的理解确实比较浅,所以也不打算班门弄斧,略微介绍,本文重点在于SVM的应用,也就是对垃圾邮件的文本分类   关于支持向量机的原理性分析在CSDN上有July大神的博客 :http:/ ...
u010223750 评论(0) 有5637人浏览 2015-11-29 22:55

如何区分监督学习(supervised learning)和非监督学习(unsupervised learning)

如何区分监督学习(supervised learning)和非监督学习(unsupervised learning) 机器学习的常用方法中,我们知道一般分为监督学习和非监督学习。(当然还有半 ...
孤叶空兀 评论(0) 有1478人浏览 2015-08-26 09:07

【老钱说图表第一季】----面积图

        上回说到矩形树图,本期老钱给大家说说面积图。         借用一下Echart的图表,本图反映的是某楼盘销售情况的一个趋势变化图。         很多小伙伴对于折线图及面积图,不是特别了解,且听我来说下区别: 折线图,只能单纯的反映每个样本的变化趋势,例如,某产品每个月的变化趋势。 面积图 除了反映每个样本的变化趋势外,还可以显示总体数据的变化趋势,即面积。 ...
jackchan 评论(0) 有871人浏览 2015-08-18 09:40

最近博客热门TAG

Java(141741) C(73643) C++(68602) SQL(64557) C#(59604) XML(59131) HTML(59042) JavaScript(54916) .net(54782) Web(54511) 工作(54116) Linux(50906) Oracle(49861) 应用服务器(43285) Spring(40811) 编程(39452) Windows(39380) JSP(37540) MySQL(37266) 数据结构(36420)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics