Skip to content

DaMaoShan/TALinAlg

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

本部分材料主要目的在于展示一个《线性代数与几何》这门基础课程的一个重要应用,让大家体会一下数学基础理论的巨大能量。

===========================================================================================================

PCA         Principal Components Analysis  主成分分析

PCA是一种重要的机器学习(人工智能)方法,是处理大规模数据(所谓的大数据)的重要技术。
PCA实质上是一种寻找最优坐标轴的计算方法,可以编程应用计算机自动计算,因此应用广泛。
所谓的主成分,其实是选取最主要的坐标轴,省略次要的坐标轴。(抓住主要矛盾)。
所谓的主要和次要,其评价依据为坐标轴(特征向量)对应的特征值大小。特征值最大,则最主要;特征值最小,则最次要。
如果特征值之间差别不大,则
如此以来,PCA选取了最主要的坐标轴,实际上实现了降维。想象一下,

PCA方法固然很妙,但是PCA并非万能方法。
PCA方法凑效有一个前提:的确存在某一个或者某几个(高维空间)方向上面,数据分布比较广,即方差大。
数据本质上的确存在这样的一个或者多个方向,同时手工确定(想象一下大规模数据)又是不可能的,而且手工确定有主观因素影响,那怎么办呢?
PCA正好解决这两个问题。
如果数据在各个方向分布均匀,比如,假设二维数据分布呈圆形,那么其实没有必要应用PCA分析。


=========================================================================================================
                                                材料介绍
=========================================================================================================
PCA.html    下载后,使用浏览器打开
PCA.ipynb   下载后,使用Anaconda的jupyter notebook打开

注:
如果暂时不会使用jupyter notebook,推荐使用浏览器打开PCA.html
两个文件内容相同,只是PCA.ipynb可以实际运行代码,交互性好。

PCA.py    python源程序

如果有任何问题,都可以微信联系我。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published