实向量空间
集合 $\mathbb{R}^n$ 是一个向量空间。这里的 $\mathbb{R}$ 代表所有实数的集合,而上标 $n$ 代表维度。$\mathbb{R}^n$ 中的元素是像 $(a1,a2,…,an)$ 这样的有序元组。这里的每一个 $a_i$ 都是一个实数。
- 我们看待这些元素有两种视角:
- 点 (Points) - 几何视角:当我们把 $(a1,a2,…,an)$ 看作是 $n$ 维空间中的一个位置或坐标时,我们把它称作一个“点”。为了强调它的几何属性,我们通常用大写字母来表示,比如 $A,B,C$。你可以想象在地图上标记一个位置,那就是一个点。
- 向量 (Vectors) - 代数视角:当我们把 $(a1,a2,…,an)$ 看作是一个具有大小和方向的整体时,我们称之为一个“向量”。它代表了一种位移或者说一个有向线段。为了强调它的代数属性,我们用粗体小写字母表示,比如 $a,b,c$。
向量的基本运算
- 向量加法两个向量相加,就是把它们对应的分量(component)分别相加。
$$(a1,…,an)+(b1,…,bn)=(a1+b1,…,an+bn)$$
- 向量乘法如果 c 是一个实数(标量),a=(a1,a2,…,an) 是一个向量,那么:
$$ca=c(a1,a2,…,an)=(ca1,ca2,…,can)$$
封闭性和公理
我们之所以称实向量空间为“空间” (Space) 而不是仅仅叫“集合” (Set)?因为在这个空间里,我们可以自由地进行这两种运算(向量加法和标量乘法),并且运算的结果永远不会跑出这个空间。这叫做封闭性 (Closure)。两个 $\mathbb{R}^n$ 里的向量相加,结果还在 $\mathbb{R}^n$ 里;一个实数乘以一个 $\mathbb{R}^n$ 里的向量,结果也还在 $\mathbb{R}^n$ 里。
更进一步,一个真正的向量空间,其加法和标量乘法必须满足十条公理。我不会在这里一一列举,但它们可以被归纳为:
- 加法性质:满足交换律、结合律,存在一个零向量$0=(0,0,…,0)$,并且每个向量都有一个负向量(比如 $a$ 的负向量是 $−a$)。
- 标量乘法性质:满足分配律和结合律,并且数字 1 乘以任何向量都等于该向量本身。
位置向量
为了将抽象的代数向量(比如 $a=(a1,...,an)$)和几何图形联系起来,我们引入位置向量 (Position Vector)。
位置向量是一个有向箭头,它的起点固定在坐标系的原点 O (0, 0, ..., 0),终点则指向空间中的某一个点。通过位置向量,向量可以通过平行四边形法则或者三角形法则进行计算。
- 现在我们建立了向量的代数定义(分量运算)和它的几何直观(位置向量与平行四边形法则)。现在,我们将利用这些工具来描述几何对象,我们从最简单的开始:直线。
- 从现在开始,我们将采纳“几何-代数约定”,即我们不再严格区分代数向量 $a$ 和它所对应的几何位置向量 $OA$。当我们写粗体的 $a$ 时,它既可以指代坐标元组 $(a1,...,an)$,也可以指代从原点指向该坐标点的那个箭头。这是一个为了方便而做的简化,使得我们能够流畅地在代数和几何之间切换。
自由向量与直线
根据以上的前提,我们现在可以让箭头不再被要求拥有一个固定的起点(例如原点 $O$)。这意味着一个向量只由它的长度和方向唯一确定,而与它在空间中的位置无关。
在统一了这两个约定之后,我们可以给出了$\mathbb{R}^n$ 空间中直线的向量表达式:
$$a+tv$$
这个表达式中:
- a: 这是一个固定的向量。在几何上,我们可以把它看作是一个位置向量,它的终点 A 是直线上一个已知的点。它的作用是定位这条直线,把我们从原点“带到”这条线上。
- v: 这是另一个固定的向量,称为方向向量 (direction vector)。它决定了直线的朝向。它本身不一定在直线上,但它一定与直线平行。
- t: 这是一个标量参数 (scalar parameter),它可以取遍所有的实数($t∈R$)。它的作用是让我们沿着方向向量 $v$ 进行伸缩和移动。
直线的参数方程
我们以三维空间 $\mathbb{R}^3$ 为例:
- 设直线上任意一点 $p=(x,y,z)$
- 线上已知点 $a=(a1,a2,a3)$
- 方向向量 $v=(v1,v2,v3)$
那么向量方程 $p=a+tv$ 就可以写成:
$$(x,y,z)=(a1,a2,a3)+t(v1,v2,v3)=(a1+tv1,a2+tv2,a3+tv3)$$
根据向量相等的定义(对应分量相等),我们可以得到:
$$\begin{cases} x = a_1 + tv_1 \ y = a_2 + tv_2 \ z = a_3 + tv_3 \end{cases}$$
这就是在微积分或者解析几何里学过的直线的参数方程。
范数(Norm)
范数的定义与性质
简单来说,范数是“长度”概念的推广。在日常生活中,我们很熟悉如何测量一条线的长度。在数学中,范数将这个“长度”或“大小”的概念推广到了更广泛的数学对象上,比如向量、矩阵、函数等等。它是一个函数,输入一个数学对象(比如一个向量),输出一个非负的实数,用来量化这个对象的大小。
一个函数要被称为范数,必须满足以下三个基本性质。假设我们有一个向量 $v$ ,它的范数记作 $|v|$ 。范数作为一个函数 $|⋅|$ 必须满足的三条性质,也是它的公理化定义。任何一个函数,只要满足这三条,我们就可以称它为范数,并把它当作一种“长度”的度量。
- (i) $|tu|=|t|⋅|u|$ (绝对齐次性或伸缩性)如果你把一个向量 u 的长度拉伸或压缩 t 倍,那么它的新长度就是原长度乘以 ∣t∣(绝对值)。
- (ii) $|u+v|≤|u|+|v|$(三角不等式)这是范数最重要的性质。从几何上看,向量 $u$、$v$ 和它们的和 $u+v$ 可以构成一个三角形的三条边。这个不等式说的就是“三角形中,任意两边之和大于等于第三边”。从原点直接通过向量 $u+v$ 到达终点,这条路径的长度,永远不会比先走完向量 $u$ 再走完向量 $v$ 的路径总长大。
- (iii) $∥u∥≥0,并且 ∥u∥=0 当且仅当 u=0$ (正定性)长度不可能是负数。并且唯一一个长度为0的向量,就是零向量 0。任何非零向量都必须有大于零的长度。
范数定义距离
一旦我们有了测量单个向量长度的工具(范数),我们就可以非常优雅地定义空间中任意两点之间的距离。
点 $A$ 和点 $B$ 之间的距离,被定义为它们位置向量之差 $a−b$ 的范数(或长度)。 $$dist(a,b)=∥a−b∥$$ 向量 $a−b$ 在几何上是从点 $B$ 指向点 $A$ 的那个箭头(位移向量)。所以两点间的距离,就是连接这两点的线段的长度。
常见的范数
常见的向量范数,大多属于一个大的家族,叫做 $L_p 范数$。
对于一个向量 $x=(x_1,x_2,...,x_n)$,$L_p$ 范数的通用定义是: $$|\mathbf{x}|p=\left(\sum{i=1}^n|x_i|^p\right)^{1/p}$$ 通过改变 p 的值,我们能得到不同特点的范数。最常用的就是 $p=1,2$ 和 $p_\infty$ 的情况。
- $L_2$ 范数 (Euclidean Norm)$|\mathbf{x}|2=\sqrt{\sum{i=1}^nx_i^2}=\sqrt{x_1^2+x_2^2+\cdots+x_n^2}$
- 这是我们最熟悉、最常用、最符合几何直觉的范数。当人们只说“范数”而不加任何限定时,通常指的就是它,它的定义源于勾股定理在n维空间中的推广。
- $L_1$ 范数 (Manhattan Norm)$|\mathbf{x}|1=\sum{i=1}^n|x_i|=|x_1|+|x_2|+\cdots+|x_n|$
- 想象在一个像曼哈顿那样的城市里,街道都是横平竖直的网格。你不能斜穿过去,只能沿着街道走。$L_1$范数衡量的就是你走过的路径总长度。它只计算在各个坐标轴方向上移动距离的总和。
- 稀疏性 (Sparsity):$L_1$范数倾向于产生稀疏解(即解向量中有很多0)。这个特性被广泛用于LASSO回归中,可以实现特征选择,剔除掉那些不重要的特征。
- $L_\infty$ 范数 (Infinity Norm)$|\mathbf{x}|_\infty=\max_i|x_i|=\max(|x_1|,|x_2|,\ldots,|x_n|)$
- 此范数不关心分量的总和或平方和,只关心那个绝对值最大的分量。它衡量的是向量在所有坐标轴方向上投影长度的最大值。
- 在数值分析中,经常用它来衡量误差向量,因为我们通常最关心的是在最坏情况下的误差,即最大的那个误差分量。
内积(Inner Product)
- 为了在抽象的 $\mathbb{R}^n$ 空间中定义向量之间的夹角,我们需要一个强大的代数工具,为此我们引入内积 (Inner Product)。
内积是一个函数,我们用尖括号 ⟨⋅, ⋅⟩ 来表示。
- 输入:这个函数接收两个来自 $\mathbb{R}^n$ 空间的向量,比如 $u$ 和 $v$。
- 输出:它输出一个实数($a∈R$)。 这一点非常关键:两个向量做内积,得到的是一个数,而不是一个向量。 这个数将会蕴含这两个向量之间关系的重要信息(比如它们的夹角)。
- . 对于空间中任意的向量 u,v,w 和任意实数 r,s,一个运算要成为内积,必须满足以下三条性质:
- (i) $⟨u, u⟩ ≥ 0, 且 ⟨u, u⟩ = 0 当且仅当 u = 0$ (正定性)
- 一个向量与自身的内积永远是一个非负数。并且,这个值只有在向量是零向量时才为0。内积的正定性和范数的正定性公理几乎一模一样。这并非巧合,因为这条性质是连接内积和长度的桥梁。
- (ii) $⟨u, v⟩ = ⟨v, u⟩$ (对称性)
- 内积的运算顺序可以交换,u 和 v 的内积等于 v 和 u 的内积。这和我们熟悉的数字乘法一样,是满足交换律的。
- (iii) $⟨ru + sv, w⟩ = r⟨u, w⟩ + s⟨v, w⟩$ (线性)
- 这是最关键的一条代数性质。它说明内积运算对于加法和标量乘法是“可以分配”的。由于对称性(ii)的存在,这个线性性质对第二个向量同样适用,因此我们称内积是双线性 (Bilinear) 的。
- (i) $⟨u, u⟩ ≥ 0, 且 ⟨u, u⟩ = 0 当且仅当 u = 0$ (正定性)
标准内积 / 点积(Dot Product)
- 在实向量空间 $\mathbb{R}^n$ 中,标准内积就是我们可能在物理或者基础数学中学过的点积(也叫标量积)。 对于两个向量 $u=(u1,u2,…,un)$ 和 $v=(v1,v2,…,vn)$,它们的点积定义为: $$\langle\mathbf{u},\mathbf{v}\rangle:=\mathbf{u}\cdot\mathbf{v}=u_1v_1+u_2v_2+\cdots+u_nv_n=\sum_{i=1}^nu_iv_i$$ 我们用点积的公式来计算一个向量 $u$ 与它自己的内积: $$\langle\mathbf{u},\mathbf{u}\rangle=u_1u_1+u_2u_2+\cdots+u_nu_n=u_1^2+u_2^2+\cdots+u_n^2$$ 这个结果是欧几里得范数 $∥u∥^2$ 的平方。所以有以下关系: $$|\mathbf{u}|=\sqrt{\langle\mathbf{u},\mathbf{u}\rangle}$$ 一个向量的长度(范数),可以通过它与自身的内积来导出 (induced)。这说明,内积是一个比范数更基本、更深刻的概念。只要定义了内积,就自动定义了长度。
柯西-施瓦茨不等式 (Cauchy–Schwarz inequality)
对于内积空间中的任意向量 a 和 b,以下不等式成立: $$|\langle a,b\rangle|\leq|a|\cdot|b|$$ 证明如下:
1.处理平凡情况
如果 $b=0$(零向量),那么根据内积的线性性质,$⟨a,0⟩=0$。同时,$∥b∥=∥0∥=0$。 不等式变为 $∣0∣≤∥a∥⋅ 0$,即 $0≤0$。这显然成立。 此时 a 和 b (零向量) 是线性相关的,所以等号成立的情况也符合定理。
2.非平凡情况
对于任意标量 $t$,我们构造一个向量 $c=a−t⋅b$。 根据内积公理的正定性,我们知道任何向量的范数平方(即其与自身的内积)必须是非负的: $$|c|^2=\langle c,c\rangle=\langle a-t\cdot b,a-t\cdot b\rangle\geq0$$ 现在我们利用内积的线性和共轭对称性来展开上式: $$\begin{aligned}\langle a-t\cdot b,a-t\cdot b\rangle&=\langle a,a-t\cdot b\rangle-\langle t\cdot b,a-t\cdot b\rangle\&=\langle a,a\rangle-\langle a,t\cdot b\rangle-\langle t\cdot b,a\rangle+\langle t\cdot b,t\cdot b\rangle\&=\langle a,a\rangle-\bar{t}\langle a,b\rangle-t\langle b,a\rangle+t\bar{t}\langle b,b\rangle\&=|a|^2-\bar{t}\langle a,b\rangle-t\overline{\langle a,b\rangle}+|t|^2|b|^2\geq0\end{aligned}$$ 从第二行到第三行,我们使用了 $\langle x,\alpha y\rangle=\bar{\alpha}\langle x,y\rangle$ 和 $\langle\alpha x,y\rangle=\alpha\langle x,y\rangle$。同时,$\langle b,a\rangle=\overline{\langle a,b\rangle}$。
这个不等式对于任意标量 $t$ 都成立。为了让这个式子变得最简单并揭示出我们想要的关系,我们可以选择一个特定的 $t$ 值。一个非常巧妙的选择是: $$t=\frac{\langle a,b\rangle}{\langle b,b\rangle}=\frac{\langle a,b\rangle}{|b|^2}$$ 现在我们将这个 $t$ 代入到不等式中。 首先,$t$ 的共轭是: $${\bar{t}}=\overline{\frac{\langle a,b\rangle}{|b|^2}}$$$$|t|^2=t\bar{t}=\frac{\langle a,b\rangle\overline{\langle a,b\rangle}}{|b|^4}=\frac{|\langle a,b\rangle|^2}{|b|^4}$$ 代入不等式: $$|a|^2-\overline{\langle a,b\rangle}\langle a,b\rangle-\frac{\langle a,b\rangle}{|b|^2}\overline{\langle a,b\rangle}+\frac{|\langle a,b\rangle|^2}{||b||^4}|b|^2\geq0$$ 简化每一项: $$|a|^2-\frac{|\langle a,b\rangle|^2}{|b|^2}-\frac{|\langle a,b\rangle|^2}{|b|^2}+\frac{|\langle a,b\rangle|^2}{|b|^2}\geq0$$ $$|a|^2-\frac{|\langle a,b\rangle|^2}{|b|^2}\geq0$$ 将第二项移到不等式右边: $$|a|^2\geq\frac{|\langle a,b\rangle|^2}{|b|^2}$$ 因为 $∥b∥^2>0$,两边同乘以 $∥b∥^2$: $$|a|^2|b|^2\geq|\langle a,b\rangle|^2$$ 对两边取非负平方根,我们得到最终结果: $$|a||b|\geq|\langle a,b\rangle|$$ 不等式的来源是 $⟨c,c⟩≥0$。等号成立的唯一可能是当 $⟨c,c⟩=0$ 时。
根据正定性公理,$⟨c,c⟩=0 当且仅当 c=0$。 而 $c=a−t⋅b$。 所以,等号成立当且仅当 $a−t⋅b=0$,即 $a=t⋅b$。 其中 $t$ 是一个标量。 $a=t⋅b$ 的定义就是说向量 a 是向量 b 的一个标量倍数,这意味着 a 和 b 是线性相关 (linearly dependent) 的。
内积定义角度
基于我们刚刚证明的柯西-施瓦茨不等式 $∣⟨a,b⟩∣≤∥a∥⋅∥b∥$,我们可以推导出(对于非零向量 $a$ 和 $b$ ): $$-1\leq\frac{\langle a,b\rangle}{|a|\cdot|b|}\leq1$$ 因为上述表达式的值域与反余弦函数 cos⁻¹ (或 arccos) 的定义域 [-1, 1] 完全吻合,我们才可以(或者说有资格)用它来定义两个向量之间的夹角 θ。 $$\theta=\cos^{-1}\left(\frac{\langle a,b\rangle}{|a|\cdot|b|}\right)$$ 这里规定了角度的范围 $0≤θ≤π$,这正好是 cos⁻¹ 函数的主值区间,符合我们对两个向量夹角的直观理解(不大于180度)。
边界情况
θ = 0:当且仅当 $\frac{\langle a,b\rangle}{|a|\cdot|b|}=1$,即 $⟨a,b⟩=∥a∥⋅∥b∥$。这对应了柯西-施瓦茨不等式取等号的一种情况,即a和b线性相关且方向相同($a=k⋅b,k>0$)。θ = π:当且仅当 $\frac{\langle a,b\rangle}{|a|\cdot|b|}=-1$,即 $⟨a,b⟩=−∥a∥⋅∥b∥$。这对应了取等号的另一种情况,即a和b线性相关且方向相反($a=k⋅b,k<0$)。
正交(Orthogonal)
θ = π/2(即90度) 时,我们有 $cos(π/2)=0$。根据角度的定义,这意味着: $$\frac{\langle a,b\rangle}{|a|\cdot|b|}=0$$
即两个非零向量的内积为0,是它们之间夹角为90度的充要条件。在任意内积空间中,我们称满足这个条件的两个向量是正交 (Orthogonal) 的。这是“垂直”这个几何概念在更高维度和更抽象空间中的推广。
推广的勾股定理
在直角三角形中,$a^2+b^2=c^2$。现在我们用向量和内积的语言来重新审视它。
考虑两个向量 a 和 b,它们构成的第三边是向量 a + b(或者 a - b)。它们的长度分别是 ||a||, ||b||, ||a + b||。 现在我们计算 ||a + b||²: $$|a+b|^2=\langle a+b,a+b\rangle=\langle a,a\rangle+\langle a,b\rangle+\langle b,a\rangle+\langle b,b\rangle$$ 在实数空间 $\mathbb{R}^n$ 中,$⟨a,b⟩=⟨b,a⟩$,所以: $$|a+b|^2=|a|^2+2\langle a,b\rangle+|b|^2$$ 如果向量 a 和 b 是正交的,即 $⟨a,b⟩=0$,那么上式就变为: $$|a+b|^2=|a|^2+|b|^2$$
这是勾股定理的向量形式,这说明,勾股定理本质上是内积空间中正交向量的一个自然属性。
推广的余弦定理
三角形中的余弦定理是$c^2=a^2+b^2-2ab\cos(C)$,我们可以证明,余弦定理就是内积性质的一个直接代数推论。 $$\begin{aligned} |a-b|^2 &= \langle a-b, a-b \rangle \ &= \langle a,a \rangle - \langle a,b \rangle - \langle b,a \rangle + \langle b,b \rangle \ &= |a|^2 - 2\langle a,b \rangle + |b|^2 \quad (\text{在 } \mathbb{R}^n \text{ 中}) \end{aligned} $$现在,我们使用角度定义,可以反过来得到内积的表达式:$$ \langle a,b \rangle = |a||b|\cos(\theta) $$其中 θ 是 a 和 b 的夹角。将这个表达式代入上面的式子中:$$ |a-b|^2 = |a|^2 + |b|^2 - 2|a||b|\cos(\theta) $$
开集与闭集
基本开集
我们有两种基本的“开放”形状来构建拓扑概念:
- 圆的 (round):使用开球 (open balls)。
- 平的 (flat):使用开矩形盒子 (open rectangular boxes)。
要定义“球”,首先需要一个范数 $|| ⋅ ||$。这个范数作为球体距离的衡量。以点 a 为中心,半径为 r 的球体被精确地分为三种 :
- 开球 (Open ball) $B_a(r)$:所有与中心 a 的距离严格小于 r 的点的集合 (
< r) 。 - 闭球 (Closed ball) $\bar{B}_a(r)$:所有与中心 a 的距离小于等于 r 的点的集合 (
≤ r) 。 - 球面 (Sphere) $S_a(r)$:所有与中心 a 的距离正好等于 r 的点的集合 (
= r) 。
与以上同理,我们也可以定义“盒子”:
- 闭矩形盒子
[a, b]:由一系列闭区间[aᵢ, bᵢ]的笛卡尔积构成 。 - 开矩形盒子
(a, b):由一系列开区间(aᵢ, bᵢ)的笛卡尔积构成 。
在定义“开集”这个概念上,它们是等价的。因为总可以在一个开矩形内部画一个更小的开球,也总可以在一个开球内部画一个更小的开矩形。这种在拓扑学上等价的性质意味着,无论你使用“圆的”还是“平的”基本形状来定义一个集合是否开放,最终的结论都是一样的。
同时,我们在定义“球”的时候,“球”的形状完全取决于你选择用哪种范数(尺子)来测量距离。
- L2 范数 (欧几里得范数):它定义的“球”就是我们传统观念中的圆形(或球形)。
- L1 范数 (曼哈顿范数):用它定义的“球”在二维平面上是一个旋转了45度的正方形(菱形)。因为所有满足 $|x-a_x| + |y-a_y| < r$ 的点构成的就是一个菱形。
- L-infinity 范数 (无穷范数):用它定义的“球”则是一个与坐标轴平行的正方形。因为所有满足 $\max(|x-a_x|, |y-a_y|) < r$ 的点构成的是一个正方形。
同时,在 $\mathbb{R}^n$ 这样的有限维空间中,一个集合的开闭性质是绝对的,与选择哪种范数无关。这也意味着,一个集合的“开”与“闭”的性质,不会因为选择了不同的范数而改变。
点
对于空间 $\mathbb{R}^n$ 中的任意一个集合 $X$,我们可以将空间中所有的点 $v$ 分为三种类型,用以描述点 $v$ 和集合 $X$ 之间的相对位置关系 。
- $X^c$,它代表集合 $X$ 在 $\mathbb{R}^n$ 空间中的补集(即所有不属于 $X$ 的点)。我们可以把空间中的所有点分为这三种点:
- 内点 (Interior Point, IP)
- 定义:如果存在一个包含点 $v$ 的“基本开集” $U$,并且这个 $U$ 完全包含在集合 $X$ 内部($U⊂X$),那么 v 就是一个内点 。
- 外点 (Exterior Point, EP)
- 定义:如果存在一个以点 $v$ 为中心的“基本开集” $U$,并且这个 $U$ 完全位于集合 $X$ 的外部(即完全在 $X$ 的补集 $X^c$ 中),那么 $v$ 就是一个外点 。
- 边界点 (Boundary Point, BP)
- 定义:如果每一个以点 $v$ 为中心的“基本开集” $U$,无论这个 $U$ 多么小,它都同时与集合 $X$ 和 $X$ 的补集 $X^c$ 相交,那么 $v$ 就是一个边界点 。
这三种分类是互斥且完备的。也就是说,对于任何一个集合 X,空间 Rn 中的任何一个点,都必然是内点、外点、边界点这三者中的有且仅有的一个。
开集与闭集
- 开集的定义
- 一个集合 X 是“开”的,当且仅当它的每一个点都是内点 (interior point)。
- 这意味着,一个开集完全由其“内部”构成,它不包含任何自身的边界点。
- 闭集的双重定义
- 从补集定义:一个集合 $X$ 是“闭”的,如果它的补集 $X^c$ 是一个开集。这是一个比较抽象但非常强大的定义。
- 从边界点定义:一个集合 $X$ 是“闭”的,当且仅当它包含其所有的边界点。这个定义通常更直观,更容易理解和应用。
从开集和闭集的定义,我们可以知道,存在一些集合,它们既不是开集,也不是闭集。例子:半开半闭区间 [0, 1)。
- 它不是闭集,因为它包含了边界点0,却没有包含另一个边界点1。
- 它不是开集,因为它包含了点0,而0不是它的内点(任何以0为中心的小开区间都会包含负数,超出了
[0, 1)的范围)。
同时,也存在既是开集也是闭集的集合,如空集 ($∅$) 和全空间 ($\mathbb{R}^n$)。
向量场与标量场
- 标量场 (Scalar Field)
- 定义:一种函数 f:D→R,其定义域 D 是 Rn 的一个子集,而其输出是一个标量(即一个实数)。
- 向量场 (Vector Field)
- 定义:一种函数 f:D→Rm,其定义域 D 是 Rn 的一个子集,而其输出是一个向量。
- 分量场 (Component Fields) :一个向量场完全可以被看作是一组标量场的集合。一个输出$m$维向量的向量场$f(a)$,可以被分解为 $m$ 个独立的分量场 $(f_1(a),f_2(a),...,f_m(a))$,其中每一个 $f_i$ 都是一个标量场。
极限与连续性
- 极限的定义 (Definition 1.9)
- 对于任何你给定的一个衡量输出接近度的微小正数 $ϵ$(你所能接受的误差范围),总存在一个对应的衡量输入接近度的微小正数 $δ$,使得只要输入 $x$ 与 $a$ 的距离在 $δ$ 之内($x$不等于$a$),那么输出 $f(x)$ 与极限 $b$ 的距离就一定在你要求的 ϵ 范围之内。
![[Pasted image 20250904172954.png]]
- 连续性的定义 (Definition 1.10)
- 函数 $f(x)$ 在点 $a$ 处是连续的,当且仅当它在该点的极限值正好等于它在该点的函数值,即 $\lim_{\boldsymbol{x}\to\boldsymbol{a}}f(\boldsymbol{x})=f(\boldsymbol{a})$。
![[Pasted image 20250904173007.png]]
- 重要结论:一个向量场(多变量向量函数)$f$ 在点 $a$ 处是连续的,当且仅当 它的每一个分量场(标量函数)$f_i$ 都在点 $a$ 处是连续的。这个结论很有用,因为研究一个从 $\mathbb{R}^n$ 映射到 $\mathbb{R}^m$ 的抽象向量函数的连续性——分解为 $m$ 个相对简单的、我们更熟悉的问题:研究 $m$ 个从 $\mathbb{R}^n$ 映射到 $\mathbb{R}$ 的标量函数的连续性。
- 同时,一个向量场 $f$ 是可微的,当且仅当它的每一个分量场 $f_i$ 都是可微的。因为一个向量场在某一点的“导数”不再是一个数字,而是一个线性变换,这个线性变换由一个雅可比矩阵 (Jacobian Matrix)表示,记作 $J_f$。 这个矩阵的每一个元素,都是一个偏导数。它的结构如下: $$\begin{gathered}J_f=\begin{pmatrix}\frac{\partial f_1}{\partial x_1}&\frac{\partial f_1}{\partial x_2}&\cdots&\frac{\partial f_1}{\partial x_n}\\frac{\partial f_2}{\partial x_1}&\frac{\partial f_2}{\partial x_2}&\cdots&\frac{\partial f_2}{\partial x_n}\\vdots&\vdots&\ddots&\vdots\\frac{\partial f_m}{\partial x_1}&\frac{\partial f_m}{\partial x_2}&\cdots&\frac{\partial f_m}{\partial x_n}\end{pmatrix}\end{gathered}$$
- 向量场 $f$ 在某点是可微的,意味着这个雅可比矩阵在该点存在。
- 矩阵的存在,意味着矩阵中的每一个元素(即偏导数 $\frac{\partial f_i}{\partial x_j}$)都必须存在。
- 而 $\frac{\partial f_i}{\partial x_j}$ 的存在,恰恰是分量场 $f_i$ 可微的体现。
之前概念在场中的应用
- 范数
|| ⋅ ||和内积⟨⋅,⋅⟩都是标量场。- 我们可以将这些用于“度量”的工具,也看作是一种函数。范数函数接收一个向量,输出一个代表其长度的标量。内积函数接收一对向量,输出一个代表它们关系的标量。这完全符合标量场的定义。
- 参数化曲线 (Parametrised curve) 是一种时间性向量场。
- 一个用于“绘制”曲线的连续函数 $α:[r,s]→R_n$,其输入是一个一维的标量参数 $t$(通常代表时间),输出是空间中的一个位置向量。这符合向量场的广义定义,即一个将某个定义域映射到向量空间的函数。
- 线性映射 (Linear map) 是一种空间型向量场。
- 一个线性映射 $L:R_n→R_m$,例如旋转、缩放、投影等,其输入是一个$n$维向量,输出是一个$m$维向量。这也完全符合向量场的定义。
对这三种场应用“求导”,会得到三种在形式和意义上都截然不同的结果。
- 对标量场(如范数)求导:得到梯度向量场
- 导数概念:梯度 (Gradient),记作 $∇f$。
- 数学形式:一个向量场。一个标量场的导数是一个向量场。
- 几何意义:在任意一点,梯度向量指向该点标量值上升最快的方向,其大小等于该最快上升率。例如,范数函数 $∣∣x∣∣$ 的梯度向量在点 $x$ 处,指向从原点出发穿过 $x$ 的径向方向,因为这是向量长度增长最快的方向。
- 对参数化曲线(“路径型”向量场)求导:得到速度向量
- 导数概念:速度向量 (Velocity Vector),记作 $α′(t)$。
- 数学形式:一个向量。我们是对一个向量函数关于其单一标量参数 t 求导,结果是另一个向量。
- 几何意义:向量 $α′(t)$ 在几何上与曲线在 $α(t)$ 点相切,它代表了在该时刻,沿着该路径运动的质点的瞬时速度(包括方向和快慢)。
- 对线性映射(“空间型”向量场)求导:得到代表其自身的矩阵
- 导数概念:雅可比矩阵 (Jacobian Matrix),记作 $J_f$。
- 数学形式:一个矩阵。一个向量场的导数是一个矩阵。
- 几何意义:对于一个一般的、非线性的向量场,它在某一点的雅可比矩阵描述了该场在这一点的最佳线性近似——即它如何对该点附近的一个微小区域进行拉伸、旋转、剪切等线性变换。而对于一个本身就是线性的映射 $L(x)=Ax$,它的“最佳线性近似”在任何地方都就是它自己,因此它的导数(雅可比矩阵)在所有点都是常数矩阵 $A$。