Skip to Content
Machine Learning

Distance Learning

2019-04-14Original-language archivelegacy assets may be incomplete

距离

  • 正定性
  • 对称性
  • 三角不等式

有序距离

  • 闵可夫斯基距离:l=(i=1nxiyip)1pl=(\sum_{i=1}^n|x_i-y_i|^p)^{\frac{1}{p}}
    • 切比雪夫距离:l=maxi=1nxiyil_\infty=\max_{i=1}^n|x_i-y_i|
    • 欧几里得距离:l2=i=1n(xiyi)2l_2=\sqrt{\sum_{i=1}^n(x_i-y_i)^2}
    • 曼哈顿距离:l1=i=1nxiyil_1=\sum_{i=1}^n|x_i-y_i|
    • 加权闵可夫斯基距离:l=(i=1nwixiyip)1pl=(\sum_{i=1}^nw_i|x_i-y_i|^p)^{\frac{1}{p}}
  • 马氏距离:d(x,y)=(xy)TS1(xy)d(\vec x,\vec y)=\sqrt{(\vec x-\vec y)^TS^{-1}(\vec x-\vec y)}
    • SS: 协方差矩阵
    • distmah2(xi,xj)=(xixj)TM(xixj)=xixjM2dist^2_{mah}(x_i,x_j)=(x_i-x_j)^TM(x_i-x_j)=||x_i-x_j||^2_M,度量矩阵 MM 为半正定矩阵
    • M=PPTM=PP^T
      • xixjM=PTxiPTxj\Vert x_i-x_j\Vert_M=\Vert P^Tx_i-P^Tx_j\Vert
  • 余弦距离:d(x,y)=<x,y>xyd(x,y)=\frac{<x,y>}{|x||y|}

离散距离

  • VDM(Value Difference Metric)
    • mu,am_{u,a}: 在属性 uu 上取值为 aa 的样本数
    • mu,a,im_{u,a,i}: 第ii个样本簇在属性为 aa 的样本数
    • VDMp(a,b)=i=1kmu,a,imu,amu,b,imu,b\text{VDM}_p(a,b)=\sum_{i=1}^k|\frac{m_{u,a,i}}{m_{u,a}}-\frac{m_{u,b,i}}{m_{u,b}}|
  • MinkovDMp=(xiuxjup+VDMp(xiu,xju))1p\text{MinkovDM}_p=(\sum|x_{iu}-x_{ju}|^p+\sum\text{VDM}_p(x_{iu},x_{ju}))^{\frac{1}{p}}

字符串

  • 海明距离
  • Lee 距离
  • Levenshtein (编辑距离)
leva,b={max(i,j);min(i,j)=0min(leva,b(i1,j)+1,leva,b(i,j1)+1,leva,b(i1,j1)+[aibi])\text{lev}_{a,b}=\begin{cases} \max(i,j); \min(i,j)=0\newline \min(\text{lev}_{a,b}(i-1,j)+1,\text{lev}_{a,b}(i,j-1)+1,\text{lev}_{a,b}(i-1,j-1)+[a_i\not=b_i]) \end{cases}

非度量距离

不满足三角不等式(相似度度量无需满足三角不等式)

两组点集的相似程度

  • Hausdorff 距离
    • distH(X,Z)=max(disth(X,Z),disth(Z,X))\text{dist}_H(X,Z)=\max(\text{dist}_h(X,Z),\text{dist}_h(Z,X))
    • disth(X,Z)=maxxXminzZxz2\text{dist}_h(X,Z)=\max_{x\in X}\min_{z\in Z}||x-z||_2

NCA

Neighbourhood Component Analysis 近邻成分分析

  • 近邻分类器中 xjx_jxix_i 分类结果影响概率为:pij=exixjM2lexixjM2p_{ij}=\frac{e^{-\Vert x_i-x_j\Vert^2_M}}{\sum_l e^{-\Vert x_i-x_j\Vert^2_M}}
  • xix_i LOO 正确率:pi=jΩipijp_i=\sum_{j\in\Omega_i}p_{ij}, Ωi\Omega_i 为相同类别下标
  • 训练集 LOO 正确率:i=1mpi=i=1mjΩipij\sum_{i=1}^mp_i=\sum_{i=1}^m\sum_{j\in\Omega_i}p_{ij}
  • minP1i=1mjΩiexp(PTxiPTxj22)lexp(PTxiPTxl22)\min_P 1-\sum_{i=1}^m\sum_{j\in\Omega_i}\frac{\exp(-||P^Tx_i-P^Tx_j||^2_2)}{\sum_l\exp(-||P^Tx_i-P^Tx_l||_2^2)}

领域知识

必连约束M\mathcal{M},勿连约束C\mathcal{C}

minM(xi,xj)MxixjM2s.t.(xi,xk)CxixkM1M0\begin{aligned} \min_{M} & \sum_{(x_i,x_j)\in\mathcal{M}}\Vert x_i-x_j\Vert^2_M \newline s.t. & \sum_{(x_i,x_k)\in\mathcal{C}}\Vert x_i-x_k\Vert_M\geq 1 \newline & M \succeq 0 \end{aligned}

LMNN

Large Margin Nearest Neighbors

  • kk 个目标邻居相近,入侵样本远离
    • 目标邻居:最近的同类别样本
    • 入侵样本:最近中的非同类别样本
minMi,jNid(xi,xj)+i,j,lξijls.t.i,jNk,l,ylyid(xi,dj)+1d(xi,xl)+ξijlξijl0M0\begin{aligned} \min*{M} & \sum_{i,j\in N*i}d(x_i,x_j)+\sum_{i,j,l}\xi_{ijl} \newline s.t. & \forall_{i,j\in N_k,l,y_l\not=y_i} d(x_i,d_j)+1\leq d(x_i,x_l)+\xi_{ijl}\newline & \xi_{ijl}\geq 0 \newline & M\succeq0 \end{aligned}