Skip to Content
Course cluster

Artificial Intelligence

A preserved cluster of undergraduate notes grouped by subject area.

9 notes

01

1-概论

2019-09-10

科学与技术关系的探讨 周光绍 科学:正确反映客观世界现象、物质内部结构和运动规律的系统理论知识 技术:在科学指导下,总结实践经验,各方面的系统知识 白春礼 科学:发现、探索研究事物运动的客观规律 技术:[做什么、怎么做 人工智能 强人工智能:人工智能使探索人脑与意识的科学 弱人工智能:模拟人脑相应功能且得到应用,偏向于技术 何为人工智能 像人一样行动 图灵测...

02

2-搜索

2019-09-10

无信息搜索 问题定义:初始状态,可能行动,转移模型,目标测试,路径耗散 参数 分支因子 $d$:每个状态有 $d$ 个后继 最优解代价 $C^ $ 每个行动代价至少为 $\epsilon$ 任一结点最大深度 性能度量 完备性:有解则一定能找到 最优性:能找到最优解 时间复杂度 空间复杂度 | 标准 | 宽度优先 | 一致代价 | 深度优先 | 深度受限 |...

03

3-推理(演算)

2019-09-10

推理 推理规则 完备性 completeness 可靠性 soundness 推理算法 = 推理规则 + 搜索算法 完备的推理算法 = 完备推理规则 + 完备搜索算法 反证法:证明 $a\vDash b$,只需证 $a\wedge\neg b$ 不可满足 单元归结:$\frac{l 1\vee\cdots\vee l k, m}{l 1\vee\cdots\...

04

4-知识表示

2019-09-10

知识表示 数据:信息的载体和表示 信息:数据的语义 知识:信息关联后形成的信息 结构 (事实和规则) 相对正确性 可表示/利用性 不确定性 一阶谓词表示(First Order Predicate) 一阶逻辑的知识工程 确定任务 搜集相关知识 确定词汇表,包括谓词,函词和常量 对邻域通用知识编码 对特定问题编码 提交查询给推理过程并获取答案 知识库调试 谓词...

05

5-强化学习

2019-09-10

强化学习 交互学习:通过交互学习一个目标,Trial and Error 状态/奖励的分布式是策略依赖的 model base: $V$ 根据已知数据计算,如动态规划 model free: 取样试验得到 在线学习:如 Sarsa 离线学习:如 Q Learning Markov Decision Process $S$: 状态集合 $A$: 动作集合 $R...

06

5-符号学习

2019-09-10

符号学习 又称样例学习,概念学习,归纳推理 实例集合:$X$ 目标概念:$c:X\rightarrow\{0,1\}$ 假设空间 $H$: $h:X\rightarrow\{0,1\}$ 概念学习:寻找假设 $h$,使得 $\forall x\in X,h(x)=c(x)$ 归纳学习假设:任一假设如果在足够大的训练样例集合中能很好的逼近目标概念函数,它也能在...

07

7-概率图

2019-09-10

图模型 $p(x)=\prod {k=1}^{K}p(x k|x 1,\cdots,x {k 1})$ 联合概率表:需要 $2^K 1$ 个参数 图模型基本问题 表示问题:如何用图结构描述变量间的依赖关系 学习问题:结构学习,参数学习 推断问题:已知部分变量,求其它变量条件分布概率 有向图模型:贝叶斯网(信念网, Judea Pearl) 无向图模型:马尔可...

08

8-博弈论

2019-09-10

博弈论 策略 囚徒困境 布雷斯悖论(Braess's paradox) 最优策略 帕里托优(Pareto Efficiency) 不存在另一个方案 $x'$, $\exists t,\text{UTILITY} {x'}(t) \text{UTILITY} {x}(t),\forall t,\text{UTILITY} {x'}(t)\geq\text{UT...

09

9-Information-Theory

2020-06-09

基本概念 随机变量:$S$ 信息:消除随机变量不确定性的事物 信息量与传播媒介无关 信息是相对的 信息是客观物理量 噪音(非信息) 数据 = 噪音 + 信息 信源:产生信息的实体 信源符号 $s i$ 发生概率 $p i$ 自信息:$I(s i)= \log p i$ 信息熵:$H(S)=\sum {i=1}^np iI(s i)$ 信源发出符号平均信息量,...