CVPR读书笔记[7]:PCA的理解
朱金华 jinhua1982@gmail.com
下文中A'=A^t表示A的转置.
n维数据的m个样本构成的n*m维矩阵X, 寻找n*n的变换矩阵W, 使得变换后的矩阵Y=W*X=Y.
简单的说如果W=(w1,w2,...wn)'中wi为变换后空间的基, 则上述变换即将X映射为新空间中m个n维的点. 这个映射关系是一对一的
如果只取新空间中的d个基组成的变换矩阵W0=(w1,w2,...wd)', 则W0*X为新空间中d*m维的矩阵, 即m个样本的维数变为d, 实际即是在新空间中得到降维
这里的矩阵相乘或者说是叫project, 其意义便是将X的每一个列向量(样本)映射到以W0为基构成的新空间中去. 在这里, 因为维数得到降低, 并不能保证原空间域新空间中的点是一对一的关系了
至此,大家可能会说n维空间有无数组基的可能,, 在这些基中又如何选择d个使得m个n维样本在其上的投影尽量保持原有信息? 即如何使得新空间中d行的相关度最低?
为了寻找这组最优基组成的投影矩阵P, 一种方案是使样本在新的正交坐标系中的投影点尽量分散(几何意义), 即其投影后的方差尽量大. 这通过将原n*m矩阵X的协方差矩阵进行对角化实现(代数意义).
(另一种我们可以从最小化投影误差考虑)
设变换为Y=PX, 其中X为n*m维, P为d个n维基向量, 即d*n维, Y为d*m维
Y的协方差矩阵D=1/mYY^t=1/m*PXX'P'=P(1/m*XX')P' , 其中C=1/m*XX'为X的协方差矩阵
因此需找Project Matrix P的问题现在变成寻找使得原样本矩阵X的协方差矩阵C=1/m*XX'对角化的矩阵P,
X的协方差矩阵C为实对称矩阵, 实对称矩阵特性如下:
[1]必有n个特征值且其值均大于0
[2]特征值对应的特征向量两两正交
设C的特征值为λ1,λ2, ...λn, 对应特征向量为e1,e2,...en
则Pn=(e1,e2,...en)^t便是一个完整将X映射到新空间Y的投影矩阵.
任取d个特征向量按行组成的投影Pd为一个将X映射到d维子空间的投影矩阵
为了得到样本信息损失最小的投影矩阵P, 只需选择特征值最大的d个特征值对应的特征向量即可, 我们将特征值排序,不失一般性, 仍记作λ1,λ2, ...λn
那么P即为(e1,e2,...ed)'
X变换后的即降维后的d维样本集合为Y=PX=(e1,e2,...ed)' X
PCA算法:
[1]对于m个n维样本集合X,按列存放组成n*m矩阵
[2]X进行零均值化, 每个元素减去该行的均值(该维的均值)
[3]C=1/m*XX'
[4]计算C的特征值及特征向量, 并将其按照特征值的大小排列
[5]根据方差保持的百分比决定选取保留多少个特征值及特征向量,或者直接指定保留p个. 这p个特征向量组成投影矩阵P
[6]Y=PX即为降维后的矩阵
推广:
有时我们用行向量来表示特征, 则上面的X为m*n维, m为样本数, n为特征数. 这样我们实际找的便是变换矩阵P(n行p列)使得Y=XP
道理是一样的.
对于维数n>样本数m的情形, 对于n*m的X来说C=1/m*XX'为n*n维实对称矩阵
设a为1/m*X'X的特征值, 即1/mX'Xe=ae,
则1/mXX'Xe=aXe=CXe
即a也是C=1/mX'X的特征值, 对应的特征向量为Xe
于是我们可以通过计算1/mX'X这个较小的m*m矩阵的特征值a,与特征向量e,得到C的特征值a以及其对应特征向量Xe
参考文献:
[1]"Atutorial onPrincipalComponentsAnalysis", LindsayISmith,http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf
[2]...很多很多...
相关推荐
《WateRF:辐射场中的鲁棒水印技术在保护版权中的应用——基于Pytorch的实现》 在当今数字化时代,图像和...通过深入理解和应用这一技术,我们可以更好地维护数字内容创作者的合法权益,促进数字内容市场的健康发展。
【标题】"RestoreFormer"是2022年在计算机视觉领域知名会议CVPR上发表的一项研究工作,专注于人脸恢复技术。该技术尤其关注在无监督的条件下,如何实现高质量的盲人脸修复,即在没有原始参考图像的情况下,恢复低...
【CVPR2020-代码:CVPR 2020论文开放项目合集】是一个集合了2020年计算机视觉与模式识别大会(Computer Vision and Pattern Recognition, CVPR)上优秀论文的开源代码资源。这个压缩包旨在为研究者、开发者以及对...
CVPR 2018笔记以下是我在大会期间遇到的最有趣的论文,挑战和研讨会的链接,注释和想法。 但是,您可能希望通过回顾所有979篇被接受的论文并逐步浏览所有21个教程和48个研讨会的内容,来形成自己对计算机视觉和模式...
- 图像分割与理解 - 视频分析与应用 - 深度学习在视觉中的应用等 #### CVPR 2019 - **时间**:2019年6月16日至6月20日 - **地点**:美国长滩 - **主要议题**: - 计算机视觉理论与方法 - 三维视觉与建模 - ...
【标题】"CVPR2015-OpenSfM: CVPR 2015教程的原始资料" 本文将详细介绍OpenSfM系统及其在计算机视觉领域中的应用,特别是作为2015年计算机视觉与模式识别大会(CVPR 2015)教程的一部分。OpenSfM是一个开源软件框架...
CVPR2021-代码 论文开源项目(带代码的文件)合集!CVPR 2021论文收录列表: : 注1:等2021年2月28日开奖后,欢迎各位大佬提交issue,分享CVPR 2021本文和开源项目! 注2:CVPR 2021已交稿成立!已投稿且想要进来的...
深入研究这些文件,我们可以了解到具体的模型架构、训练参数、数据集详情以及转换过程,这对于理解和改进神经网络模型,或者学习Darknet框架的使用都十分有价值。如果需要更详细的了解,需要实际解压文件并查看其...
标题中的“车道线检测 CVPR2022 PytorchAutoDrive: 源代码”表明这是一个关于车道线检测技术的研究项目,使用的工具是Pytorch框架,并且该项目在2022年的计算机视觉与模式识别会议(CVPR)上有所展示。CVPR是计算机...
git clone https://github.com/YueJiang-nj/CVPR2020-SDFDiff.git 使用virtualenv或conda安装需求: # pip source virtual_env/install_pip.sh # conda source virtual_env/install_conda.sh 介绍
pca源码下载CVPR2016_HandPoseEstimation 基于多视图CNN的3D手姿估计方法的实现。 Robust 3D Hand Pose Estimation in Single Depth Images: from Single-View CNN to Multi-View CNNs Liuhao Ge, Hui Liang, ...
【标题】"matlab中存档算法代码-FSF_CVPR2017_Demo:带运动分割的快速多帧立体声场景流演示(CVPR2017)"涉及的知识点主要集中在计算机视觉(Computer Vision)领域,尤其是立体视觉(Stereo Vision)、场景流(Scene...
如我们的CVPR 2020出版物( )中所建议,该存储库包含用于对基于排名的深度度量学习方法运行策略适应性否定采样的代码。 SAMPLE_RUNS.sh中列出了可以达到与本文报告相似的结果的示例运行,因为基于RL的方法引入了更...
Deep Learning Methods for Vision CVPR 2012 Tutorial 9:00am-5:30pm, Sunday June 17th, Ballroom D (Full day)
2 SiamRPN-CVPR2018:High Performance Visual Tracking with Siamese Region Proposal Network.pdf 3 DaSiamRPN-ECCV2018:Distractor-aware Siamese Networks for Visual Object Tracking.pdf 4 SiamRPN++-CVPR...
《DeepOIS:陀螺仪引导的深光学图像稳定器补偿》是2021年在计算机视觉领域知名会议CVPR上发表的一项研究成果。这项工作主要聚焦于解决移动设备(如智能手机、无人机等)在拍摄时由于运动引起的图像模糊问题。光学...
CVPR16-深位 使用无监督的深度神经网络学习紧凑型二进制描述符 由林凯文,陆继文,陈楚松,周杰创建 介绍 我们提出了一种新的无监督深度学习方法来学习紧凑的二进制描述符。 我们对在网络顶层学习的二进制代码执行三...
标题中的“matlab代码sqrt-TSS_CVPR2016_EvaluationKit”指的是一个用于图像处理和计算机视觉领域的开源工具包,它在2016年的计算机视觉与模式识别会议(CVPR)上被发布。这个工具包的核心功能是进行两幅图像的密集...
CVPR2020内存汇聚网络可实现高效的交互式视频对象分段这是CVPR2020论文“用于有效的交互式视频对象分段的内存聚合网络”的pytorch实施。准备依存关系Python 3.7 火炬1.0 脾气暴躁的张量板davisinteractive(请参阅)...
蔡氏电路matlab仿真代码这实现了“用于视觉关系检测的视觉翻译嵌入网络,张汉旺,邹林aw,张世富,蔡达成(CVPR2017)” 最近,yangxuntu还提供了张量流适应,这在vg数据集上获得了显着改进。 您可以在这里找到代码...