Course cluster

Machine Learning

A preserved cluster of undergraduate notes grouped by subject area.

12 notes

History

2019-04-14

Introduction

2019-04-14

机器学习机器学习要素模型学习准则优化算法数据集：$D=\{x 1,x 2,\cdots,x m\}$ 通常假设全体样本服从一个未知分布 $\mathcal{D}$，且采样 i.i.d 归纳偏好 No Free Lunch Theorem Occam's Razor Ugly Duckling Theorem all vectors are assu...

Linear Model

2019-04-14

多元线性回归 $f(x)=\omega^Tx+b$ 决策平面：$f(x;\omega)=0$ 有向距离：$\gamma=\frac{f(x;\omega)}{\|\omega\|}$ 最小二乘法 $\hat\omega^ =\arg\min {\hat\omega}(y X\hat\omega)^T(y X\hat\omega)=(X^TX)^{ 1}X^T...

Decision Tree

2019-04-14

决策树算法当前节点包含样本全部同类：标记为该类当前样本属性值为空/取值相同：标记为最多一类属性划分选择为属性每个值分配一个结点继续执行算法若某属性值上为空则标记为当前最多一类划分选择 | 指标名称 | 指标 | 辅助函数 | 例子 | Remark | | | | | | | | Information Gain | $\text{Gain}(D...

Bayesian Classifier

2019-04-14

Bayesian decision theory | | 定义 | 最小化分类错误率 | | | | | | loss | $\lambda {ij}$ | $[i=j]$ | | Expected loss | $R(c i\vert x)=\sum {j=1}^N\lambda {ij}P(c j\vert x)$ | $1 P(c\vert x)$ |...

Support Vector Machine

2019-04-14

SVM 基本型划分超平面：$\omega^Tx+b=0$ 点到超平面的距离：$\frac{|\omega^Tx+b|}{||\omega||}$ $$ \begin{cases} \omega^Tx i+b\geq y i, & y i=+1 \newline \omega^Tx i+b\leq y i, & y i= 1 \end{cases} $$ 支...

Essemble Learning

2019-04-14

集成学习个体学习器同质：基学习器，基学习算法异质：组件学习器准确性，多样性学习器结合可能带来的好处统计：学习任务假设空间大，多个假设在训练集上达到同等性能，使用单学习器可能因误选而导致泛化性能不佳计算：降低陷入糟糕局部极小点的风险表示：某些学习任务的真实假设可能不在当前算法所考虑的假设空间中，使用多学习器可能学得较好的近似序列化方法 Boo...

Cluster

2019-04-14

性能度量性能度量，有效性指标 validity index 外部指标：与某个参考模型比较簇划分：$\mathcal{C}=\{C 1,C 2,\cdots,C k\}$, 参考模型簇划分 $\mathcal{C}^ =\{C 1^ ,C 2^ ,\cdots,C s^ \}$,$\lambda,\lambda^ $ 为分别为两者簇标记向量，定义 $a=|...

Dimension Reduction

2019-04-14

线性降维维数灾难 curse of dimensionality 高维空间样本稀疏计算内积难 MDS Multiple Dimensional Scaling, 多维放缩样本间距离在低维空间保持算法 1. 由距离矩阵 $D$ 求内积矩阵：$b {ij}= \frac{1}{2}(D {ij}^2 D {i }^2 D { j}^2+D { }^2)$...

Distance Learning

2019-04-14

距离正定性对称性三角不等式有序距离闵可夫斯基距离：$l=(\sum {i=1}^n|x i y i|^p)^{\frac{1}{p}}$ 切比雪夫距离：$l \infty=\max {i=1}^n|x i y i|$ 欧几里得距离：$l 2=\sqrt{\sum {i=1}^n(x i y i)^2}$ 曼哈顿距离：$l 1=\sum {i=1}^...

Feature Selection

2019-04-14

特征选择方法冗余特征去除：减轻负担保留：对应中间概念特征选择方法子集搜索前向后向子集评价过滤式选择先过滤，再训练 Relief near hit: 同类样本中最近 near miss: 异类样本中最近相关统计量（属性$j$）: $\delta^j=\sum i \text{diff}(x i^j,x {i,nh}^j)^2+\text{...

Dictionary Learning

2019-04-14

稀疏表达稀疏表达（稀疏编码，字典学习） $x=Az$ 字典 $A$：过完备，一般不独立且不正交优化目标：$\min {B,\alpha i}\sum i^m||x i B\alpha i|| 2^2+\lambda\sum {i=1}^m||\alpha i|| 1$ 变量交替优化固定 $B$，LASSO 求解 $\alpha i$ 固定 $\alph...