`
暴风雪
  • 浏览: 391275 次
  • 性别: Icon_minigender_2
  • 来自: 杭州
社区版块
存档分类
最新评论

[python]用python实现的pca算法

阅读更多

pca算法用于原始数据维数较高时对数据进行降维

关于pca算法的学习,有一篇分析特别详细的论文http://www.cs.otago.ac.nz/cosc453/student_tutorials/principal_components.pdf  

比较好的中文总结:http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020209.html

在使用python编写pca时需要使用python 的numpy,用这个算法库计算矩阵运算非常方便

由于没有接触过numpy以及网上介绍较少,代码是参考同学的代码写的。

#########################################################################
# File Name: npy.py
# Author: bbezxcy
# mail: 522736096@qq.com
# Created Time: Thu 10 Jul 2014 06:45:16 PM CST
#########################################################################
#coding=utf-8
from numpy import *
def pca(mat, lenth):
	meanval = mean(mat, axis = 0)
	rmmeanMat = mat - meanval
	covMat = cov(rmmeanMat,rowvar = 0)
	eigval,eigvec =  linalg.eig(mat(covMat))
	tfMat =eigvec[0:lenth,:]
	finalData = rmmeanMat*tfMat 
	recoMat = finalData * tfMat.T + meanval
	return finalData,recoMat

 

 

编写代码过程中,为了方便,将自己的vimrc参考学弟的(http://noclyt.com/blog/?p=88)加上了一些功能(例如f5一键编译以及C艹用f8自动调用gdb等等),在这里给分享出来。

"编码设置
set enc=utf-8
set fencs=utf-8,ucs-bom,shift-jis,gb18030,gbk,gb2312,cp936
"语言设置
set langmenu=zh_CN.UTF-8
set helplang=cn
if has("syntax")  
  syntax on  
endif  
""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""  
" 显示相关    
""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""  
"set shortmess=atI   " 启动的时候不显示那个援助乌干达儿童的提示    
"winpos 5 5          " 设定窗口位置    
"set lines=40 columns=155    " 设定窗口大小    
"set nu              " 显示行号    
set go=             " 不要图形按钮    
"color asmanian2     " 设置背景主题    
set guifont=Courier_New:h10:cANSI   " 设置字体    
"syntax on           " 语法高亮    
autocmd InsertLeave * se nocul  " 用浅色高亮当前行    
autocmd InsertEnter * se cul    " 用浅色高亮当前行    
"set ruler           " 显示标尺    
set showcmd         " 输入的命令显示出来,看的清楚些    
"set cmdheight=1     " 命令行(在状态行下)的高度,设置为1    
"set whichwrap+=<,>,h,l   " 允许backspace和光标键跨越行边界(不建议)    
"set scrolloff=3     " 光标移动到buffer的顶部和底部时保持3行距离    
set novisualbell    " 不要闪烁(不明白)    
set statusline=%F%m%r%h%w\ [FORMAT=%{&ff}]\ [TYPE=%Y]\ [POS=%l,%v][%p%%]\ %{strftime(\"%d/%m/%y\ -\ %H:%M\")}   "状态行显示的内容    
set laststatus=1    " 启动显示状态行(1),总是显示状态行(2)    
set foldmethod=manual   " 手动折叠    
"set background=dark "背景使用黑色   
set nocompatible  "去掉讨厌的有关vi一致性模式,避免以前版本的一些bug和局限    
"colorscheme desert  
" 显示中文帮助  
if version >= 603  
    set helplang=cn  
    set encoding=utf-8  
endif  
" 设置配色方案  
"colorscheme murphy  
"字体   
"if (has("gui_running"))   
"   set guifont=Bitstream\ Vera\ Sans\ Mono\ 10   
"endif   
set fencs=utf-8,ucs-bom,shift-jis,gb18030,gbk,gb2312,cp936  
set termencoding=utf-8  
set encoding=utf-8  
set fileencodings=ucs-bom,utf-8,cp936  
set fileencoding=utf-8  
autocmd BufNewFile *.py,*.cpp,*.[ch],*.sh,*.java exec ":call SetTitle()"   
""定义函数SetTitle,自动插入文件头   
func SetTitle()   
    "如果文件类型为.sh文件   
    if  &filetype == 'cpp'  
       	call setline(1, "/*************************************************************************")   
        call append(line("."), "    > File Name: ".expand("%"))   
        call append(line(".")+1, "    > Author: bbezxcy")   
        call append(line(".")+2, "    > Mail:522736096@qq.com ")   
        call append(line(".")+3, "    > Created Time: ".strftime("%c"))   
        call append(line(".")+4, " ************************************************************************/")   
        call append(line(".")+5, "")  
    elseif  &filetype == 'c'  
       	call setline(1, "/*************************************************************************")   
        call append(line("."), "    > File Name: ".expand("%"))   
        call append(line(".")+1, "    > Author: bbezxcy")   
        call append(line(".")+2, "    > Mail:522736096@qq.com ")   
        call append(line(".")+3, "    > Created Time: ".strftime("%c"))   
        call append(line(".")+4, " ************************************************************************/")   
        call append(line(".")+5, "")  
    else 
    	call setline(1,"\#########################################################################")   
        call append(line("."), "\# File Name: ".expand("%"))   
        call append(line(".")+1, "\# Author: bbezxcy")   
        call append(line(".")+2, "\# mail: 522736096@qq.com")   
        call append(line(".")+3, "\# Created Time: ".strftime("%c"))   
        call append(line(".")+4, "\#########################################################################")   
        if  &filetype == 'sh'  
            call append(line(".")+5, "\#!/bin/bash")   
        else
            call append(line(".")+5, "\#coding=utf-8")   
        endif
        call append(line(".")+6, "")   
    endif  
    if &filetype == 'cpp'  
        call append(line(".")+6, "#include <iostream>") 
        call append(line(".")+7, "#include <cstdio>")
        call append(line(".")+8, "using namespace std;")  
        call append(line(".")+9, "")  
    endif  
    if &filetype == 'c'  
    call append(line(".")+6, "#include <stdio.h>")  
    call append(line(".")+7, "")  
    endif  
    "新建文件后,自动定位到文件末尾  
    autocmd BufNewFile * normal G  
endfunc     
 
" 使用VIM的键盘 这样下面的配置才能有效
set nocompatible
set syntax=on   "设置语法高亮
set autoindent  "设置自动缩进
set cindent
set softtabstop=4   "统一缩进为 4
set shiftwidth=4
set tabstop=4   "设置tab 宽度为 4
set noexpandtab "不用空格代替制表符! 便于删除
set number  "显示行号
 
"自动补全功能
:inoremap ( ()<ESC>i
:inoremap ) <c-r>=ClosePair(')')<CR>
:inoremap { {<CR>}<ESC>O
:inoremap } <c-r>=ClosePair('}')<CR>
:inoremap [ []<ESC>i
:inoremap ] <c-r>=ClosePair(']')<CR>
function! ClosePair(char)
    if getline('.')[col('.') - 1] == a:char
        return "\<Right>"
    else
        return a:char
    endif
endfunction
 
"C,C++ 按F5编译运行
map <F5> :call CompileRunGcc()<CR>
func! CompileRunGcc()
    exec "w"
    if &filetype == 'c'
        exec "!g++ % -o %<"
        exec "! ./%<"
    elseif &filetype == 'cpp'
        exec "!g++ % -o %<"
        exec "! ./%<"
    elseif &filetype == 'java'
        exec "!javac %"
        exec "!java %<"
    elseif &filetype == 'sh'
        :!./%
    elseif &filetype == 'py'
 	exec "!python %"
    endif
endfunc
 
"C,C++的 F8调试
map <F8> :call Rungdb()<CR>
func! Rungdb()
    exec "w"
    exec "!g++ % -g -o %<"
    exec "!gdb ./%<"
endfunc

 

分享到:
评论
2 楼 tyfengyu 2015-03-19  
我刚刚更改的代码加上了标准差stdVal,故recoMat应该为:
recoMat = finalData * tfMat.T * stdVal+ meanVal
1 楼 tyfengyu 2015-03-19  
python的pca代码有2处错误:
1.finalData = rmmeanMat*tfMat 是点乘,numpy的矩阵乘应该用finalData =dot(rmmeanMat,tfMat)
2.tfMat =eigvec[0:lenth,:]  没有排序,该取列而不是行;


更改如下:
from numpy import * 
def pca(mat, length): 
    meanVal = mean(mat, axis = 0)
    stdVal = std(mat)
    rmmeanMat = (mat - meanVal)/stdVal
    covMat = cov(rmmeanMat,rowvar = 0) 
    eigval,eigvec =  linalg.eig(covMat)
    maxnum=argsort(-eigval, axis=0)#sort descend
    tfMat =eigvec[:,maxnum[0:length]]#top length
    finalData = dot(rmmeanMat,tfMat)#
    recoMat = finalData * tfMat.T + meanVal
    return finalData,recoMat

相关推荐

    基于Python的PCA人脸识别算法的原理及实现代码详解.zip

    这个课程设计项目将帮助学生深入理解PCA算法,掌握Python编程和数据分析技能,同时也能了解人脸识别的基本原理和应用。通过实践,学生将能更好地将理论知识与实际问题相结合,提高解决问题的能力。

    基于Python的PCA人脸识别算法的原理及实现代码+文档详解.zip

    本项目通过Python实现PCA算法,旨在帮助计算机科学专业的学生和自学者理解PCA的基本原理,并提供实际操作的代码示例。 PCA的核心思想是将高维数据转换为一组线性无关的低维表示,同时尽可能保留原始数据中的方差...

    pca.zip_pca Python_pca算法_python PCA算法_python gdal_python 算法

    在这个`pca.zip`压缩包中,我们可能找到了一个使用Python实现PCA算法的示例,特别是结合了GDAL库。GDAL(Geospatial Data Abstraction Library)是一个开源的地理空间数据处理库,通常用于处理遥感、GIS等领域的数据...

    opencv实现PCASift算法

    在使用OpenCV实现PCA-SIFT时,可能会遇到库文件缺失的问题,比如题目中提到的`cvaux.lib`。这个文件是OpenCV早期版本的一部分,用于提供额外的辅助函数。如果在运行时遇到此类问题,需要确保已经正确安装并配置了...

    PCA故障诊断,Python实现

    下面将详细讲解PCA在故障诊断中的应用以及如何用Python进行实现。 1. **PCA的基本原理** PCA的核心是找到一个新的坐标系统,使得数据在新坐标下的投影最大程度地保留了原始数据的方差。换句话说,第一主成分是原始...

    PCA 算法实验代码(python)

    在本次实验中,文件“pca算法实验”很可能包含了实现以上步骤的Python代码。这些代码可能涉及numpy库进行矩阵运算,matplotlib库用于数据可视化,以及可能用到sklearn库中的PCA类来简化PCA的实现。通过运行这个实验...

    pca_高维降维_python_pca降维_pca将多维_pca算法_

    主成分分析(PCA,Principal Component Analysis)是一种广泛应用的数据分析技术,尤其在高维数据处理中。...在Python中,使用`sklearn`库可以方便地实现PCA降维,从而在数据分析和机器学习项目中发挥重要作用。

    基于python与PCA的异常检测算法设计与实现

    本篇文章将详细探讨如何利用Python编程语言和主成分分析(Principal Component Analysis, PCA)来设计并实现一个异常检测算法。 **主成分分析PCA** PCA是一种无监督的降维技术,其目的是通过线性变换将高维数据...

    Python实现PCA

    自己用Python实现的PCA算法。Python3可直接导入数据运行。

    python-特征降维算法PCA的python实现.zip

    在这个`python_特征降维算法PCA的python实现.zip`文件中,我们很可能会看到如何使用`sklearn.decomposition.PCA`来执行PCA的过程。 1. **PCA的基本原理**: - PCA首先计算数据的协方差矩阵或相关矩阵,这取决于...

    机器学习算法之使用Python实现PCA算法.zip

    Python是数据科学和机器学习领域的主流编程语言,其拥有丰富的库支持PCA算法的实现,如Numpy、Scikit-learn等。以下我们将详细讨论PCA的原理、Python实现以及其在实际应用中的作用。 1. PCA原理: - 数据标准化:...

    基于PCA的人脸识别系统-python版

    在"2-基于PCA的人脸识别"文件中,可能包含了实现PCA算法的代码以及训练模型的过程。这通常涉及到以下步骤: 1. 数据预处理:收集人脸图像并进行归一化,确保所有图像具有相同的大小。 2. 计算协方差矩阵:对标准化后...

    PCA.rar_PCA python实现_Python PCA_pca Python_pca协方差_矩阵 python

    在这个案例中,`PCA.py` 文件很可能是实现了上述PCA过程的Python脚本,可能包含了自定义的PCA算法或者使用了scikit-learn库的PCA类。`data.csv` 文件则是包含原始数据的CSV文件,这些数据将被用作PCA分析的输入。 ...

    Python PCA遥感影像变化检测算法代码

    (1)基于Python sklearn与opencv实现的利用PCA方式的两期影像变化检测算法。 (2)支持大影像,并可以将变化图斑转成矢量。 (3)并基于图像处理的方式滤除一些面积过小(或者长宽比过大的区域)的图斑,这里可以...

    PCA算法实现

    在Python中,可以使用`sklearn`库的`PCA`类来实现PCA算法。首先,我们需要导入必要的库,例如`numpy`用于数值计算,`pandas`用于数据处理,以及`matplotlib`用于可视化。 ```python import numpy as np import ...

    Python使用三种方法实现PCA算法

    在Python的Numpy库中,可以使用`linalg.svd()`函数进行SVD,这一步骤包含了对特征值的排序,因此可以简化PCA的实现过程。 3. Scikit-learn库的PCA类: Scikit-learn是一个强大的机器学习库,提供了内置的PCA类,...

    Kmeans聚类算法,PCA降维,层次聚类算法,用Python实现

    在Python中,可以使用`scikit-learn`库的`KMeans`类来实现这一算法。 **PCA(主成分分析)** 是一种降维技术,用于将高维数据转换为一组线性无关的低维向量,即主成分。PCA通过对原始数据进行旋转和投影,保留方差...

    1_SVD_pca_python_图像压缩_

    在Python中,可以使用`sklearn.decomposition.PCA`库实现PCA。 2. **奇异值分解(SVD)**: SVD是线性代数中的一个基础概念,它可以将任何矩阵分解为三个矩阵的乘积。在图像处理中,SVD同样用于降维和数据压缩。通过...

Global site tag (gtag.js) - Google Analytics