CVPR读书笔记[7]:PCA的理解 -

aaabes

浏览: 8033 次
性别:
来自: 南京

最近访客更多访客>>

zhangle

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

CVPR读书笔记[7]:PCA的理解

博客分类：

CVPR

读书

CVPR读书笔记[7]:PCA的理解

朱金华 jinhua1982@gmail.com

下文中A'=A^t表示A的转置.

n维数据的m个样本构成的n*m维矩阵X, 寻找n*n的变换矩阵W, 使得变换后的矩阵Y=W*X=Y.

简单的说如果W=(w1,w2,...wn)'中wi为变换后空间的基, 则上述变换即将X映射为新空间中m个n维的点. 这个映射关系是一对一的

如果只取新空间中的d个基组成的变换矩阵W0=(w1,w2,...wd)', 则W0*X为新空间中d*m维的矩阵, 即m个样本的维数变为d, 实际即是在新空间中得到降维

这里的矩阵相乘或者说是叫project, 其意义便是将X的每一个列向量(样本)映射到以W0为基构成的新空间中去. 在这里, 因为维数得到降低, 并不能保证原空间域新空间中的点是一对一的关系了

至此,大家可能会说n维空间有无数组基的可能,, 在这些基中又如何选择d个使得m个n维样本在其上的投影尽量保持原有信息? 即如何使得新空间中d行的相关度最低?

为了寻找这组最优基组成的投影矩阵P, 一种方案是使样本在新的正交坐标系中的投影点尽量分散(几何意义), 即其投影后的方差尽量大. 这通过将原n*m矩阵X的协方差矩阵进行对角化实现(代数意义).

(另一种我们可以从最小化投影误差考虑)

设变换为Y=PX, 其中X为n*m维, P为d个n维基向量, 即d*n维, Y为d*m维

Y的协方差矩阵D=1/mYY^t=1/m*PXX'P'=P(1/m*XX')P' , 其中C=1/m*XX'为X的协方差矩阵

因此需找Project Matrix P的问题现在变成寻找使得原样本矩阵X的协方差矩阵C=1/m*XX'对角化的矩阵P,

X的协方差矩阵C为实对称矩阵, 实对称矩阵特性如下:

[1]必有n个特征值且其值均大于0

[2]特征值对应的特征向量两两正交

设C的特征值为λ1,λ2, ...λn, 对应特征向量为e1,e2,...en

则Pn=(e1,e2,...en)^t便是一个完整将X映射到新空间Y的投影矩阵.

任取d个特征向量按行组成的投影Pd为一个将X映射到d维子空间的投影矩阵

为了得到样本信息损失最小的投影矩阵P, 只需选择特征值最大的d个特征值对应的特征向量即可, 我们将特征值排序,不失一般性, 仍记作λ1,λ2, ...λn

那么P即为(e1,e2,...ed)'

X变换后的即降维后的d维样本集合为Y=PX=(e1,e2,...ed)' X

PCA算法:

[1]对于m个n维样本集合X,按列存放组成n*m矩阵

[2]X进行零均值化, 每个元素减去该行的均值(该维的均值)

[3]C=1/m*XX'

[4]计算C的特征值及特征向量, 并将其按照特征值的大小排列

[5]根据方差保持的百分比决定选取保留多少个特征值及特征向量,或者直接指定保留p个. 这p个特征向量组成投影矩阵P

[6]Y=PX即为降维后的矩阵

推广:

有时我们用行向量来表示特征, 则上面的X为m*n维, m为样本数, n为特征数. 这样我们实际找的便是变换矩阵P(n行p列)使得Y=XP

道理是一样的.

对于维数n>样本数m的情形, 对于n*m的X来说C=1/m*XX'为n*n维实对称矩阵

设a为1/m*X'X的特征值, 即1/mX'Xe=ae,

则1/mXX'Xe=aXe=CXe

即a也是C=1/mX'X的特征值, 对应的特征向量为Xe

于是我们可以通过计算1/mX'X这个较小的m*m矩阵的特征值a,与特征向量e,得到C的特征值a以及其对应特征向量Xe

参考文献:

[1]"Atutorial onPrincipalComponentsAnalysis", LindsayISmith,http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf

[2]...很多很多...

分享到：

Nginx+PHP+mysql | CVPR读书笔记[6]:Gabor特征提取

2014-08-17 21:27
浏览 350
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

CVPR读书笔记[7]:PCA的理解

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

CVPR读书笔记[7]:PCA的理解

评论

发表评论

相关推荐

cvpr读书笔记[1]:VJ人脸检测框架。Viola-Jones Objects detection framwork

cvpr读书笔记[2]:boosting方法和AdaBoost算法概述

cvpr读书笔记[3]:traincascade与AdaBoost的opencv实现框架

CVPR读书笔记[4]:Gabor特征提取之Gabor核

CVPR读书笔记[5]:Gabor特征提取之Gabor核的实现

CVPR读书笔记[6]:Gabor特征提取

最近访客更多访客>>