Avatar
😀

Organizations

Popular posts

  1. 围绕「长公共前缀的长度」这道 LeetCode 题,记录题意理解、解题思路与实现要点。

    Leetcode

  2. 风险(Risk)

    样本数据 (Samples)

    $$S = {\mathbf{z}_1, \mathbf{z}_2, \ldots, \mathbf{z}_n} \quad$$ 这是对我们用来训练模型的“数据集”的数学定义。

    • $S$ (Sample Set): 代表我们手头拥有的训练数据集,公式 (1) 表示这个集合包含了 $n$ 个数据点。

    • $\mathbf{z}_i = (\mathbf{x}_i, y_i)$: 代表数据集中的第 $i$ 个样本。在监督学习中,每个样本通常是一个键值对:$\mathbf{x}_i$ 是输入特征向量(比如图片的像素),$y_i$ 是对应的真实标签(比如图片的类别)。

    • 独立同分布 (independent and identical draws, 缩写为 i.i.d.): 这是一个极其重要的假设。它假定这 $n$ 个样本都是相互独立地从同一个隐藏的、未知的真实数据分布 $\mathbb{P}$ 中抽取出来的。我们在现实中只能拿到有限的样本集 $S$,但我们真正关心的是那个产生这些数据的背后规律 $\mathbb{P}$。

    损失函数 (Loss Function)

    $$f(\mathbf{w}; \mathbf{z}) = \ell(h_\mathbf{w}(\mathbf{x}), y),$$ where $\ell: \mathbb{R} \times \mathbb{R} \mapsto \mathbb{R}+$._

    损失函数用于量化“模型在单个样本上预测错得有多离谱”。

    • $\mathbf{w}$: 代表模型的参数集合(例如神经网络中的权重)。确定了 $\mathbf{w}$,就确定了一个具体的模型。

    • $h_\mathbf{w}(\mathbf{x})$: 假设函数(Hypothesis)。它表示给定输入 $\mathbf{x}$ 时,参数为 $\mathbf{w}$ 的模型给出的预测值

    • $\ell$ (基础损失函数): 它的映射关系是 $\ell: \mathbb{R} \times \mathbb{R} \mapsto \mathbb{R}+$。意思是它接收两个实数(一个是预测值 $h\mathbf{w}(\mathbf{x})$,一个是真实标签 $y$),经过计算后输出一个非负实数($\mathbb{R}_+$ 代表非负实数集)。输出的值越大,说明预测与真实结果偏差越大。常见的 $\ell$ 包括平方损失 (MSE) 或交叉熵损失。

  3. 围绕「跳跃游戏 IX」这道 LeetCode 题,记录题意理解、解题思路与实现要点。

    Leetcode

  4. A\可能会倒闭,但绝不会变质(指封号)

  5. 围绕「等和矩阵分割 II」这道 LeetCode 题,记录题意理解、解题思路与实现要点。

    Leetcode

    Post activity