图模型
- 联合概率表:需要 个参数
- 图模型基本问题
- 表示问题:如何用图结构描述变量间的依赖关系
- 学习问题:结构学习,参数学习
- 推断问题:已知部分变量,求其它变量条件分布概率
- 有向图模型:贝叶斯网(信念网, Judea Pearl)
- 无向图模型:马尔可夫网
有向图模型
-
- : 有向无环图 (DAG)
- : 条件概率表 (CPT)
- 联合分布:
独立性判断
- 三变量间的典型依赖关系
- 同父结构:
- 顺序结构:
- 冲撞结构(V-structure): ⫫
- marginal independece: 完全未知则独立,给定 则不独立
- 有向分离 (D-seperation,或道德化)
- 转化为无向图 (moral graph)
- 有向边改无向边
- V 型结构两个父节点之间加边
- 与 有向分离:, 在 中分属两个连通分支则
- 转化为无向图 (moral graph)
- 马尔科夫覆盖
常见有向图模型
- Sigmoid 信念网络
- 变量取值为
- 个父节点
- 表格记录: 参数
- 参数化模型: 参数
- 朴素贝叶斯分类器: 条件独立性假设
- 隐马尔科夫网
结构学习
- 搜索最优贝叶斯网络结构: -hard
- 评分搜索:
- MDL(最小描述长度):综合编码长度最短的网络
- AIC 准则:
- BIC 准则:
- MDL(最小描述长度):综合编码长度最短的网络
- 常用策略
- 贪心法
- 网络结构约束
无向图模型
- 马尔科夫网:
- : 随机变量
- : 变量间的依赖关系
- : 第个团随机变量
- 无向图为马尔科夫网络 满足以下三条性质之一
- Pairwise Markov Property:
- Local Markov Property:
- : 邻居,马尔科夫毯
- Global Markov Property: , 两个子集间任何一条路径都经过子集,则给定 后, 两个子集相互条件独立
- 构造
- 如果满足 ,则 加边
- 给定 的马尔可夫毯, 独立于余下的变量
- Hammersley-Clifford 定理: 满足局部马尔科夫性质当且仅当可表为马尔科夫网上的吉布斯分布
- 吉布斯分布:
- 势函数:
- 配分函数:
- 势函数:
- 一般定义为玻尔兹曼分布
常见无向图模型
- 对数线性模型(最大熵模型)
- 条件最大熵模型(Softmax 回归模型):
- 条件随机场(CRF):
- 线性链条件随机场
- 马尔科夫逻辑网 (MLN) = Markov Net + 一阶逻辑
- 判断一个知识库中是否包含公式 , 在所有满足知识库的世界中恒真
- 公式附加权值的一阶逻辑知识库
- 基本思想:将一阶逻辑的限制放松,即一个可能世界违反公式越多,其发生的概率越小
- :
- : 一阶逻辑闭规则(无变元)
- : 实数表示权重
- : 有限常数集
- 马尔科夫逻辑网
- 中的任意闭原子对应一个二值结点,真为 ,假为
- 任意闭规则对应一个特征值,若规则为真,特征值为 否则为 。权重为
-
- : 在 中所有取真值的公式的数量
- 判断一个知识库中是否包含公式 , 在所有满足知识库的世界中恒真
参数学习
无隐变量
- 有向图:
- 无向图:
- 采样近似第二个期望
- 坐标上升法:固定其它参数,优化一个参数
有隐变量
- EM 算法
推断
- 条件概率查询:
- 因果推理
- 已知网络中的祖先节点而计算后代节点的条件概率
- 诊断推理
- 已知后代节点计算祖先节点,贝叶斯定理
- 支持推理
- 原因间的相互影响
精确推断
- 精确推断:NP-hard
- 变量消除法
- 信念传播算法(BP, 合积算法,消息传递算法)
- 链上的 BP 算法
- 树结构上的 BP 算法
- 图结构上的 BP 算法:联合树算法
- 链上的 BP 算法
近似推断
- 环路信念传播:使用信念传播算法在含环图上获得近似解
变分推断
- 变分推断(变分贝叶斯):寻找简单分布 近似条件概率密度
- 泛函优化问题:
- 候选分布族
- 平均场分布族:
- 神经网络拟合
-
- 关于 未归一化分布
- 最优化
- 坐标上升法:迭代优化 ,使其收敛到局部最优解
采样法
- 随机采样:cdf 递增,则在 cdf 逆函数上进行均匀采样
- 拒绝采样
- 未归一化分布
- 采样样本
- 提议分布(参考分布)
- 接受概率:
- 重要性采样:从参考分布中采样
- 重要性权重:
- 未归一:
- 拒绝采样和重要性采样的效率随空间维数的增加而指数降低
- MCMC 方法采样
- 预烧期(Burn-in Period)
- 相邻样本高度相关:每间隔 次随机游走取一个样本
- Metropolis-Hastings 算法
- 根据 采样
- 以如下概率接受:
- Metropolis 算法:MH 算法中提议分布对称
- Gibbs Sampling:使用全条件概率作为提议分布,
- 按下标顺次采样