线性降维
- 维数灾难 curse of dimensionality
MDS
Multiple Dimensional Scaling, 多维放缩
- 样本间距离在低维空间保持
- 算法
- 由距离矩阵 D 求内积矩阵:bij=−21(Dij2−Di∗2−D∗j2+D∗∗2)
- 特征值分解:B=VΛVT,非零特征值构成 Λ∗=diag{λ1,λ2,⋯,λd∗}
- 坐标 Z=Λ∗21V∗T,可取前 d′ 个最大特征值
PCA (Principal Component Analysis)
- 最近重构性:样本点到这个超平面距离足够近
- 最大可分性:样本点在这个超平面上的投影尽可能的分开
maxs.t tr(WTXXTW) WTW=1
- 算法
- 中心化
- 计算协方差矩阵 XXT 并特征值分解
- 取最大 d′ 个特征向量为投影矩阵
- PCA: 最佳描述特征
- LDA: 最佳分类特征
非线性降维
核化线性降维
流形学习
Isomap
- 只考虑局部距离
- 算法
- 最短路径算法求出任意两点距离
- 代入 MDS
LLE(Locally Linear Embedding 局部线性嵌入)
-
只考虑邻域内样本间的线性关系,在低维空间重构权值
-
算法
- 确定每个点的 k 近邻 Qi
- 根据下式求出 wij,j∈Qi,且 wij=0 if j∈Qi
ω1,ω2,⋯,ωmmins.t.i=1∑m∥xi−j∈Qi∑ωijxj∥22j∈Qi∑ωij=1
- 对 M=(I−W)T(I−W) 特征值分解,最小的 d′ 个特征值为投影 Z