Popular posts
风险(Risk)
样本数据 (Samples)
$$S = {\mathbf{z}_1, \mathbf{z}_2, \ldots, \mathbf{z}_n} \quad$$ 这是对我们用来训练模型的“数据集”的数学定义。
$S$ (Sample Set): 代表我们手头拥有的训练数据集,公式 (1) 表示这个集合包含了 $n$ 个数据点。
$\mathbf{z}_i = (\mathbf{x}_i, y_i)$: 代表数据集中的第 $i$ 个样本。在监督学习中,每个样本通常是一个键值对:$\mathbf{x}_i$ 是输入特征向量(比如图片的像素),$y_i$ 是对应的真实标签(比如图片的类别)。
独立同分布 (independent and identical draws, 缩写为 i.i.d.): 这是一个极其重要的假设。它假定这 $n$ 个样本都是相互独立地从同一个隐藏的、未知的真实数据分布 $\mathbb{P}$ 中抽取出来的。我们在现实中只能拿到有限的样本集 $S$,但我们真正关心的是那个产生这些数据的背后规律 $\mathbb{P}$。
损失函数 (Loss Function)
$$f(\mathbf{w}; \mathbf{z}) = \ell(h_\mathbf{w}(\mathbf{x}), y),$$ where $\ell: \mathbb{R} \times \mathbb{R} \mapsto \mathbb{R}+$._
损失函数用于量化“模型在单个样本上预测错得有多离谱”。
$\mathbf{w}$: 代表模型的参数集合(例如神经网络中的权重)。确定了 $\mathbf{w}$,就确定了一个具体的模型。
$h_\mathbf{w}(\mathbf{x})$: 假设函数(Hypothesis)。它表示给定输入 $\mathbf{x}$ 时,参数为 $\mathbf{w}$ 的模型给出的预测值。
$\ell$ (基础损失函数): 它的映射关系是 $\ell: \mathbb{R} \times \mathbb{R} \mapsto \mathbb{R}+$。意思是它接收两个实数(一个是预测值 $h\mathbf{w}(\mathbf{x})$,一个是真实标签 $y$),经过计算后输出一个非负实数($\mathbb{R}_+$ 代表非负实数集)。输出的值越大,说明预测与真实结果偏差越大。常见的 $\ell$ 包括平方损失 (MSE) 或交叉熵损失。
- So Cute!
- A\可能会倒闭,但绝不会变质(指封号)