sklearn PCA实践

huangyongxing310

浏览: 499000 次
性别:
来自: 广州

最近访客更多访客>>

hiroada

lixiaoxin

u012363178

wangyy

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

机器学习

sklearn PCA实践

PCA无需样本标签，属于无监督学习降维；LDA需要样本标签，属于有监督学习降维。
https://blog.csdn.net/ainimao6666/article/details/64933677

https://blog.csdn.net/Huangyi_906/article/details/76438885

class sklearn.decomposition.PCA(n_components=None, copy=True, whiten=False, svd_solver=’auto’, tol=0.0, iterated_power=’auto’, random_state=None)

其中参数：
n_components=None：指定降维后的维数。如果给定数在（0,1）之间，则为降维后占原维数的百分比。默认自动选择。

属性：
components_ :主成分组数
explained_variance_ratio_:每个主成分占方差比例
n_components_ :一个整数，指示主成分有多少个元素。

方法：
fit(x):训练模型
transform(x): 执行降维
fit_transform(x): 训练并降维
inverse_transform(x): 逆向操作，把降维的数据逆向转换回原来数据。

例子
https://blog.csdn.net/puredreammer/article/details/52255025
https://www.jianshu.com/p/8642d5ea5389

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets.samples_generator import make_classification
from sklearn.decomposition import PCA
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

from mpl_toolkits.mplot3d import Axes3D


X = np.array([[-1, -1], [-2, -1], [-3, -2], [1, 1], [2, 1], [3, 2]])

pca = PCA(n_components=2)#n_components表示结果取几维

pca.fit(X) #训练模型
print(pca.explained_variance_ratio_) #每维对一致性的比率，越高表示这个维度更能表示降维后的效果[0.99244289 0.00755711]

X2 =  pca.transform(X) #执行降维
print('X2==')
print(X2)
# [[ 1.38340578  0.2935787 ]
#  [ 2.22189802 -0.25133484]
#  [ 3.6053038   0.04224385]
#  [-1.38340578 -0.2935787 ]
#  [-2.22189802  0.25133484]
#  [-3.6053038  -0.04224385]]

X4 =  pca.fit_transform(X)#训练并降维
print('X4==')
print(X4)
# [[ 1.38340578  0.2935787 ]
#  [ 2.22189802 -0.25133484]
#  [ 3.6053038   0.04224385]
#  [-1.38340578 -0.2935787 ]
#  [-2.22189802  0.25133484]
#  [-3.6053038  -0.04224385]]


X3 =  pca.inverse_transform(X2)#逆向操作，把降维的数据逆向转换回原来数据。
print('X3==')
print(X3)
# [[-1. -1.]
#  [-2. -1.]
#  [-3. -2.]
#  [ 1.  1.]
#  [ 2.  1.]
#  [ 3.  2.]]

pca = PCA(n_components=1)#降为一维
X5 =  pca.fit_transform(X)
print('X5==')
print(X5)
# [[ 1.38340578]
#  [ 2.22189802]
#  [ 3.6053038 ]
#  [-1.38340578]
#  [-2.22189802]
#  [-3.6053038 ]]


X6 =  pca.inverse_transform(X5)#逆向操作，把降维的数据逆向转换回原来数据。
print('X6==')
print(X6)
# [[-1.15997501 -0.75383654]
#  [-1.86304424 -1.21074232]
#  [-3.02301925 -1.96457886]
#  [ 1.15997501  0.75383654]
#  [ 1.86304424  1.21074232]
#  [ 3.02301925  1.96457886]]

#==============================================
xSrc = X[:,0];
ySrc = X[:,1];
print (xSrc)
# [-1 -2 -3  1  2  3]
print (ySrc)
# [-1 -1 -2  1  1  2]
plt.scatter(xSrc, ySrc,marker='o',c='r',alpha=0.5) #原坐标点的图

xInverse = X6[:,0];
yInverse = X6[:,1];
plt.scatter(xInverse, yInverse,marker='o',c='b',alpha=0.5) #降为一维后再变为二维的图

# x2Inverse = X4[:,0];
# y2Inverse = X4[:,1];
# plt.scatter(x2Inverse, y2Inverse,marker='o',c='g',alpha=0.5) #降为二维后再变为二维的图

plt.show()

查看图片附件

分享到：

matplotlib 基础使用 | Numpy 小结

2018-09-27 10:46
浏览 1223
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论