Skip to Content
Deep Learning

7-Unsupervised Learning

2020-06-18Original-language archivelegacy assets may be incomplete

Unsupervised Feature Learning

  • PCA

  • Sparse Coding(字典学习)

  • 自编码器

    • 编码器:f:RDRMf:\mathbb{R}^D\rightarrow\mathbb{R}^M

    • 解码器:g:RMRDg:\mathbb{R}^M\rightarrow\mathbb{R}^D

    • 优化目标:最小化重构错误

      L=n=1Nx(n)g(f(x(n)))+λW2L=\sum_{n=1}^N\|x^{(n)}-g(f(x^{(n)}))\|+\lambda\|W\|^2

    • 捆绑权重:W(2)=W(1)W^{(2)}=W^{(1)\top}

  • 稀疏自编码器

    • M>DM>Dzz 稀疏

      L=n=1Nx(n)g(f(x(n)))+ηρ(Z)+λW2L=\sum_{n=1}^N\|x^{(n)}-g(f(x^{(n)}))\|+\eta\rho(Z)+\lambda\|W\|^2

    • 稀疏性度量函数:ρ\rho

      • l1l_1 范数:ρ(z)=m=1Mzm\rho(z)=\sum_{m=1}^M|z_m|

      • 对数函数:ρ(z)=m=1Mlog(1+zm2)\rho(z)=\sum_{m=1}^M\log(1+z_m^2)

      • 指数函数:ρ(z)=m=1Mexp(zm2)\rho(z)=\sum_{m=1}^M-\exp(-z_m^2)

      • ρ(z)=j=1pKL(ρρ^j)\rho(z)=\sum_{j=1}^p\text{KL}(\rho^*\|\hat\rho_j)

        jj 个神经元激活概率近似(平均活性值):ρ^j=1Nn=1Nzj(n)\hat\rho_j=\frac{1}{N}\sum_{n=1}^Nz_j^{(n)}

  • 堆叠自编码器

  • 降噪自编码器:先根据一 个比例 μ\mu 随机将 𝒙𝒙 的一些维度的值设置为 00,得到一个被损坏的向量 𝒙~𝒙̃,然后将被损坏的向量 𝒙~𝒙̃ 输入给自编码器得到编码 𝒛𝒛,并重构出无损的原始输入 𝒙𝒙

Probabilistic Density Estimation

  • 参数估计
    • 最大似然估计
  • 非参数密度估计
    • 直方图方法
    • 核方法估计(Parzen 窗方法)
    • KK 近邻方法

Clustering

  • See Machine Learning Clustering