多元线性回归
- f(x)=ωTx+b
- 决策平面:f(x;ω)=0
- 有向距离:γ=∥ω∥f(x;ω)
- 最小二乘法
- ω^∗=argminω^(y−Xω^)T(y−Xω^)=(XTX)−1XTy
- 广义线性模型:y=g−1(wTx+b)
对数几率回归
- 单位跃阶函数(Heaviside function): 理想但不连续
y=⎩⎨⎧0,0.5,1,z<0z=0z>0
- 对数几率函数 (logistic function/Sigmoid function)
- g=ln1−yy
- 几率:1−yy,反映了 x 作为正例的相对可能性
- g−1=S(x)=1+e−x1
- S(x)′=S(x)(1−S(x))
- 对数几率回归:用线性模型逼近真实标记的几率
- lnp0p1=x^β=(x,1)(ω;b)
- 二分类:yia+(1−yi)b=ayib1−yi
- Maxmimum likelihood method
- l(β)=∑i=1mlnp(yi∣xi;βi)=∑i=1myiln(g(x^iβ)+(1−yi)ln(1−g(x^iβ)))
- l′=∑i=1m(yi−g(x^iβ))x^iT=XT(Y−g(βTX))
- l′′=∑i=1mx^ix^iTp1(x^i;β)(1−p1(x^i;β))
- 交叉熵作损失函数梯度下降
- 梯度下降:θt+1=θt−α∂θ∂L
Softmax 回归
- p(y=c∣x)=softmax(ωcTx)=∑c′=1Cexp(ωc′Tx)exp(ωcTx)=1CTexp(WTx)exp(WTx)
LDA
- 给定训练集数据,设法将样例投影到一条直线上,使得同类样例投影点尽可能接近,异类投影点尽可能远离
- 协方差矩阵:Σ=n−11(X−μI)(X−μI)T
- Σij=σ(xi,xj)
- 投影后:ωTΣω
|
两类 |
一般 |
| Within-class scatter matrix |
Sω=Σ0+Σ1 |
Sw=∑i=1NΣi |
| Between-class scatter maxtrix |
Sb=(μ0−μ1)(μ0−μ1)T |
Sb=∑i=1Nmi(μi−μ)(μi−μ)Y |
| 全局散度矩阵 |
St=Sb+Sw |
∑i=1m(xi−μ)(xi−μ)T |
| 优化目标 |
maxωωTSwωωTSbω |
maxWtr(WTSwW)tr(WTSbW) |
| 闭式解 |
w=Sw−1(μ0−μ1) |
Sw−1Sb 前 k 大广义特征向量 |