线性模型
线性回归
给出$xy$平面上的一个含有$n$个样例点的训练集,要找到最匹配这些数据的线性函数$hw$,该任务被称为线性回归,要用数据拟合出一条直线,实际上需要做的就是找到对应的权重值使得其经验损失最小。通常采用平方误差损失函数$L2$,并对所有训练样例进行求和,该问题有唯一解。
&nbs……继续阅读 »
yanzexi
1年前 (2023-11-06) 364浏览 0评论
5个赞
引入
机器学习的目标是选择一个和未来的样例最佳拟合的假设。要做到这一点,需要定义“未来的样例”和“最佳拟合”。首先,假设未来的样例类似于过去观测过的样本。称之为平稳性假设;若没有它,所有的方法都没有意义。对于满足这些等式的样例,称它们为独立同分布的或$i.i.d.$。
下一……继续阅读 »
yanzexi
1年前 (2023-11-05) 251浏览 0评论
0个赞
神经元
激活函数
它们都是单调不减的,这意味着它们的导数是非负的。
前馈神经网络
单层感知机
单层感知机无法表达亦或,这也导致了上世纪神经网络研究的低谷(沐神说的)。
多层感知机
反向传播算法
……继续阅读 »
yanzexi
1年前 (2023-11-04) 257浏览 0评论
0个赞
机器学习
引入
一个智能体程序的各个组件都可以通过机器学习进行改进,而学习则是面对未知环境的重要方法。改进及用于改进的技巧取决于下面几个因素:● 哪些组件可以被改进;● 智能体有哪些先验知识,这将影响模型构建;● 有哪些数据,以及关于这些数据的反馈。
从一组特定的观测结果得……继续阅读 »
yanzexi
1年前 (2023-11-02) 254浏览 0评论
1个赞
本体论
速览
在“玩具”领域,选择何种表示并不那么重要,很多表示都可以良好运作。但在复杂的领域,如网上购物或者在车流中驾驶,就需要更为通用和灵活的表示方法。如何创建这些表示?主要关注于许多不同领域中都会出现的一般性的概念,如事件、时间、对象、信念等。有时,表示这些抽象概念被称为本体论工程。
&nb……继续阅读 »
yanzexi
1年前 (2023-10-31) 231浏览 0评论
0个赞
隐马尔可夫模型
简化矩阵形式
隐马尔可夫模型是一种时序概率模型,其过程状态由单个离散随机变量描述。变量的可能的值是世界的可能状态。虽然隐马尔可夫模型要求状态是单个离散变量,但它对证据变量没有相应的限制。这是因为证据变量总是被观测的,这意味着没有必要追踪有关它们值的任何分布。(如果一个变量未被观测,可以简单地将它从模型的那个时间步中移除)。同时隐……继续阅读 »
yanzexi
1年前 (2023-10-31) 274浏览 0评论
0个赞
时间与不确定性
引入
部分可观测环境中的智能体必须能够在其传感器允许的范围内追踪当前所处的状态。在搜索中展示了实现这一目标的一种方法:智能体维护一个信念状态,它表示目前哪些世界状态是可能的。根据信念状态和转移模型,智能体可以预测世界在下一个时间步将如何发展。基于观测感知和传感器模型,智能体可以更新信念状态。
……继续阅读 »
yanzexi
1年前 (2023-10-30) 246浏览 0评论
0个赞
引入
如前所述,大型贝叶斯网络中精确推断的往往是指数级时间复杂度的,但是幸运的是存在许多高效近似推断方法。使用的方法是随机采样算法,也被称为蒙特卡罗算法,它能够提供近似的答案,且准确性取决于生成的样本数。该方法的工作原理是基于贝叶斯网络中的概率生成随机事件并计数这些随机事件中发现的不同答案。有了足够的样本,就可以以任意的精度恢复真实概率分布——……继续阅读 »
yanzexi
1年前 (2023-10-28) 305浏览 0评论
0个赞
引入
引入
任何概率推理系统的基本任务都是给定一些观测到的事件——通常是一组证据变量的赋值,计算一组查询变量的后验概率分布。为了简化表示,每次只考虑一个查询变量;很多方法可以很容易地扩展到具有多个变量的查询。沿用之前的记号有:$X$表示查询变量;$E$表示证据变量$E_1,…,E_m$的集合,$e$是一个特定的观测事件;$Y$代表隐……继续阅读 »
yanzexi
1年前 (2023-10-27) 285浏览 0评论
0个赞
引入
贝叶斯网络结构
贝叶斯网络($Bayesian$ $network$)是一种数据结构,用于表示变量之间的依赖关系。贝叶斯网络可以本质上表示任何完全联合概率分布,并且它在很多情况下可以非常简洁。
贝叶斯网络是一个有向图,其中每个节点用定量的概率信息标记,完整的描述如下:……继续阅读 »
yanzexi
1年前 (2023-10-26) 248浏览 0评论
0个赞