收藏
课程目录
1.0 课程导引
1.1 搜索问题定义
1.2 搜索空间
1.3 搜索图和搜索树
1.4 搜索算法的基本设定和评测
1.5 树搜索和图搜索
1.6 代价无关搜索算法
1.7 代价一致搜索算法
2.1 启发式函数
2.2 贪心搜索算法
2.3 A*算法和最优性
2.4 启发式函数的可采纳性
2.5 启发式函数的一致性
2.6 启发式函数的构建
2.7 启发式函数的性质
3.1 博弈的类型
3.2 对抗搜索
3.3 估值函数
3.4 剪枝算法
3.5 期望对抗搜索
3.6 其他搜索类型
3.7 期望效用
4.1 约束满足问题的定义
4.2 约束图
4.3 约束满足问题的性质
4.4 回溯搜索
4.5 回溯提升——变量和值的选择
4.6 回溯提升——过滤
4.7 回溯提升——树结构
5.1 序列决策问题
5.2 马尔可夫决策过程
5.3 马尔可夫决策过程样例
5.4 值迭代
5.5 期望最大搜索树中的值迭代
5.6 策略评估
5.7 策略迭代
6.1 强化学习:无模型设定
6.2 策略评估:基于模型的强化学习
6.3 策略评估:模型无关的强化学习(蒙特卡洛算法)
6.4 策略评估:模型无关的强化学习(时序差分算法)
6.5 策略评估:模型无关的强化学习(算法比较)
6.6 策略控制:基本设定
6.7 策略控制:蒙特卡洛的策略评估
6.8 策略控制:蒙特卡洛的策略提升
6.9 策略控制:时序差分方法
7.1 状态的泛化
7.2 值函数近似方法
7.3 值函数近似的策略评估:蒙特卡洛方法
7.4 值函数近似的策略评估:时序差分
7.5 值函数近似的策略控制及强化学习总结
8.1 概率基础
8.2 贝叶斯公式
8.3 独立性
8.4 贝叶斯网络简介
8.5 贝叶斯网络的基本语义
8.6 贝叶斯网络的独立性
8.7 D分离方法
8.8 D分离方法:样例演示
8.9 贝叶斯网络的独立性隐含关系
9.1 概率推理
9.2 因子介绍
9.3 枚举法精确推理
9.4 变量消元精确推理
9.5 变量消元中的消元顺序选择
9.6 近似概率推理:采样
9.7 直接采样
9.8 拒绝采样
9.9 似然权重采样
10.1 马尔可夫模型
10.2 马尔可夫模型的迷你前向算法
10.3 马尔可夫模型的稳定性
10.4 隐马尔可夫模型
10.5 隐马尔可夫模型的过滤任务
10.6 隐马尔可夫模型的极大似然解释
10.7 隐马尔可夫模型的近似求解:粒子滤波
课程详情
本课程授课内容包括搜索、对抗博弈、强化学习和概率图模型等经典算法和前沿知识,手把手带你走进人工智能的理论、模型和算法基础。(复旦大学)
本课程授课内容包括搜索、对抗博弈、强化学习和概率图模型等经典算法和前沿知识,手把手带你走进人工智能的理论、模型和算法基础。(复旦大学)
本课程授课内容包括搜索、对抗博弈、强化学习和概率图模型等经典算法和前沿知识,手把手带你走进人工智能的理论、模型和算法基础。(复旦大学)