← 返回目录
这一页怎么用:这是把线性方程组从"解题套路"提升到"空间结构"的一份理解型讲义。
沿着 Gilbert Strang《线性代数》从 Space(空间) 出发的思路,先把"解集其实是一个子空间"讲透,
再用四个基本子空间这张全景图,把有没有解、唯不唯一、同解、公共解统统翻译成图上的位置关系。
每节末尾的 为什么 小块帮你接通直觉。
一解集为什么是"空间"
Strang 的教材不从行列式、也不从消元法开篇,而是从 Space 讲起。原因是:齐次方程组 $A\mathbf{x}=\mathbf 0$ 的解,不是一堆零散的解,而是一个有结构的子空间。
$$A\mathbf{x}_1=\mathbf 0,\ A\mathbf{x}_2=\mathbf 0\ \Longrightarrow\ A(k_1\mathbf{x}_1+k_2\mathbf{x}_2)=\mathbf 0$$
解的线性组合还是解——这正是"子空间"的定义(对加法和数乘封闭,且含零向量)。所以我们干脆给它起名叫解空间,也就是后面要讲的零空间 $N(A)$。它的维数 $=n-r(A)$,一组基就是基础解系。
换个眼光:研究方程组 = 研究子空间。一旦把"解集"看成"空间",同解、公共解、解的结构就都变成几何问题,而不是符号游戏。
二一个方程 = 一个垂直约束
把方程组的第 $i$ 个方程 $a_{i1}x_1+\cdots+a_{in}x_n=0$ 的系数排成行向量 $\boldsymbol{\alpha}_i$,这个方程就是一句话:
$$\boldsymbol{\alpha}_i\cdot\mathbf{x}=0\quad(\text{内积为零,即 }\mathbf{x}\perp\boldsymbol{\alpha}_i)$$
所以"$\mathbf{x}$ 是解"的真正含义是:$\mathbf{x}$ 垂直于每一个行向量。而垂直于一堆向量,等价于垂直于它们张成的整个子空间——那个子空间就是行空间 $C(A^{\mathsf T})=\mathrm{span}\{\boldsymbol{\alpha}_1,\dots,\boldsymbol{\alpha}_m\}$。结论是一座桥:
$$\boxed{\ \text{解空间}\ N(A)\;=\;C(A^{\mathsf T})^{\perp}\ }\quad(\text{零空间 = 行空间的正交补})$$
这就是"秩为什么能管住解"的根。 解空间只由行空间这个子空间决定,跟你具体写下哪几个方程无关。换一组方程,只要张成的行空间不变,垂直于它的那些 $\mathbf{x}$ 一个都不会变。秩 $r$ 只是行空间的维数,正交补的维数自动是 $n-r$,正好是基础解系的个数。
三四个基本子空间
一个 $m\times n$ 矩阵 $A$ 是一台 $\mathbb{R}^n\to\mathbb{R}^m$ 的线性机器:$\mathbf{x}\mapsto A\mathbf{x}$。输入有 $n$ 个分量住在 $\mathbb{R}^n$,输出有 $m$ 个分量住在 $\mathbb{R}^m$。这台机器自然切出四个子空间,$\mathbb{R}^n$ 里两个、$\mathbb{R}^m$ 里两个(记 $r=r(A)$):
| 子空间 | 定义 | 住在 | 维数 |
| 列空间 $C(A)$ | 列向量张成 $=\{A\mathbf{x}\}$ | $\mathbb{R}^m$ | $r$ |
| 左零空间 $N(A^{\mathsf T})$ | $\{\mathbf{y}\mid \mathbf{y}^{\mathsf T}A=\mathbf 0\}$ | $\mathbb{R}^m$ | $m-r$ |
| 行空间 $C(A^{\mathsf T})$ | 行向量张成 | $\mathbb{R}^n$ | $r$ |
| (右)零空间 $N(A)$ | $\{\mathbf{x}\mid A\mathbf{x}=\mathbf 0\}$ = 解空间 | $\mathbb{R}^n$ | $n-r$ |
"左零空间 / 右零空间"到底是什么? 平时说的零空间 $N(A)=\{\mathbf{x}:A\mathbf{x}=\mathbf 0\}$,$\mathbf{x}$ 写在 $A$ 右边,严格叫右零空间,就是 $A\mathbf{x}=\mathbf 0$ 的解空间。把 $\mathbf{y}$ 乘在 $A$ 左边得零行向量($\mathbf{y}^{\mathsf T}A=\mathbf 0$,等价于 $A^{\mathsf T}\mathbf{y}=\mathbf 0$),叫左零空间,它就是 $N(A^{\mathsf T})$。两者本质一样,只是分别属于 $A$ 和 $A^{\mathsf T}$;默认说"零空间"指右零空间。
它们不是随意排列的,而是两两正交、维数互补——这就是 Strang 所谓的"线性代数基本定理":
$$\underbrace{C(A^{\mathsf T})\perp N(A)}_{\text{在 }\mathbb{R}^n:\ r+(n-r)=n},\qquad \underbrace{C(A)\perp N(A^{\mathsf T})}_{\text{在 }\mathbb{R}^m:\ r+(m-r)=m}$$
同一个世界里的那对子空间:维数加起来 = 该世界的维数,且彼此垂直、互为正交补。$\mathbb{R}^n=$ 行空间 $\oplus$ 零空间;$\mathbb{R}^m=$ 列空间 $\oplus$ 左零空间。
四全景图:A 这台机器在干什么
把四个子空间画成 Strang 那张著名的"全景图"。左边是输入世界 $\mathbb{R}^n$,右边是输出世界 $\mathbb{R}^m$,箭头表示 $A$ 的作用:
A 把零空间整体压成 0,把行空间一一对应地搬到列空间(两者维数都是 r,这是 A 真正"可逆、有信息"的核心)。
左零空间是输出世界里 A 永远够不到的方向——$\mathbf{b}$ 一旦在这里有分量,方程就无解。
怎么读这台机器: 任何输入 $\mathbf{x}$ 都能拆成"行空间分量 + 零空间分量"(正交分解)。零空间那一半被 $A$ 抹平成 $\mathbf 0$;行空间那一半被 $A$ 完好地映到列空间。所以 $A$ 的"有效信息"全部装在那个维数为 $r$ 的一一对应里。
五方程组三问:有解 / 唯一 / 通解
有了这张图,$A\mathbf{x}=\mathbf{b}$ 的三个经典问题各自对应一个子空间:
① 有没有解 —— 看列空间
$$A\mathbf{x}=\mathbf{b}\ \text{有解}\iff \mathbf{b}\in C(A)\iff r(A)=r(A\mid\mathbf{b})$$
因为 $A\mathbf{x}$ 永远是 $A$ 各列的线性组合,能取到的全体就是列空间。$\mathbf{b}$ 落在左零空间方向上越多,就越无解。
② 解唯不唯一 —— 看零空间
$$\text{解唯一}\iff N(A)=\{\mathbf 0\}\iff r=n$$
通解的结构永远是"一个特解 + 整个零空间":
$$\mathbf{x}=\underbrace{\mathbf{x}_0}_{\text{特解}}+\underbrace{k_1\boldsymbol{\xi}_1+\cdots+k_{n-r}\boldsymbol{\xi}_{n-r}}_{N(A)\,:\ \dim=n-r}$$
一个漂亮的小结论: 在全体解里,长度最短的那个解唯一地落在行空间 $C(A^{\mathsf T})$ 里,其余解都比它多出一段零空间分量。这就是"最小范数解",是正交分解的直接推论。
③ 几何直觉:最短解 = 原点到解集的垂足
拿最简单的非齐次方程 $x_1+x_2=2$(这里 $A=(1,\ 1)$)在平面上画出来。它的全体解是一条直线,方向正是零空间方向 $(1,-1)$——可以理解成"把过原点的零空间直线,平移、推离原点",这正是非齐次的样子:
蓝色虚线是行空间(45°,过原点);它与解集(实线)垂直。
从原点向解集作垂线,垂足 $(1,1)$ 就是最短解,且恰好落在行空间上(长 $\sqrt2$)。
沿零空间方向 $(1,-1)$ 离开 $(1,1)$,就得到 $(2,0)$、$(0,2)$ 等其它解——都更长。
这张图就是上面那段话的全部:解集是平行于零空间的直线,哪个解最短,就看哪个离原点最近,而离原点最近的方向恰是垂直于零空间的行空间方向,所以垂足必然落在行空间里,且唯一。
六同解 = 行空间相同
两个齐次方程组同解,意思是它们的解空间(零空间)完全重合。由第二节那座桥(零空间 = 行空间正交补),零空间相等 $\iff$ 行空间相等:
$$A\mathbf{x}=\mathbf 0\ \text{与}\ B\mathbf{x}=\mathbf 0\ \text{同解}\iff N(A)=N(B)\iff C(A^{\mathsf T})=C(B^{\mathsf T})\iff r(A)=r(B)=r\begin{pmatrix}A\\ B\end{pmatrix}$$
那串秩等式只是"两个行空间相等"的可计算版本:把方程摞起来 $\binom{A}{B}$,其行空间是 $C(A^{\mathsf T})+C(B^{\mathsf T})$;
- $r(A)=r\binom{A}{B}$ ⟹ 加进 $B$ 的行没把空间撑大 ⟹ $C(B^{\mathsf T})\subseteq C(A^{\mathsf T})$;
- $r(B)=r\binom{A}{B}$ ⟹ 同理 $C(A^{\mathsf T})\subseteq C(B^{\mathsf T})$;
- 两个包含合起来 ⟹ 行空间完全相等 ⟹ 同解。
为什么单看 $r(A)=r(B)$ 不够? 秩相等只说"行空间一样大",不说"是同一个"。$\mathbb{R}^3$ 里 $x_1=0$ 与 $x_2=0$ 秩都是 1,但解空间一个是 $yz$ 面、一个是 $xz$ 面,并不同解。必须再补"互相包含",才能把"一样大"升级成"完全相同"。
非齐次同解要换成增广矩阵:$r(\bar A)=r(\bar B)=r\binom{\bar A}{\bar B}$,且都相容。漏掉常数列是常见失分点。
七公共解 = 零空间求交
同解是两个解空间重合;公共解是两个解空间求交——别混。在图上一目了然:
左:同解 ⟹ 两个零空间是同一个子空间。右:公共解 ⟹ 取两个零空间的交集。
把两组方程联立(摞起来),它们的公共解就是:
$$\text{公共解集}=N(A)\cap N(B)=N\!\begin{pmatrix}A\\ B\end{pmatrix},\qquad \dim\big(N(A)\cap N(B)\big)=n-r\!\begin{pmatrix}A\\ B\end{pmatrix}$$
这正是"联立 = 求公共解"的本质:摞起来后行空间变成两者之和 $C(A^{\mathsf T})+C(B^{\mathsf T})$,它的正交补恰好是两个零空间的交。
三种常见求法
| 题目给的条件 | 方法 |
| 两组都给方程 | 把所有方程联立成大方程组,对增广矩阵做行变换求解 |
| 一组给解 + 一组给方程 | 把通解 $\mathbf{x}=\sum k_i\boldsymbol{\xi}_i$ 代入另一组方程,解出参数 $k_i$ 满足的关系(算量最小,优先用) |
| 两组都给通解 | 令两边通解相等 $\sum k_i\boldsymbol{\xi}_i=\sum l_j\boldsymbol{\eta}_j$,解关于 $k_i,l_j$ 的方程组 |
非齐次方程组之间可能没有公共解(联立后无解,$r$系数 $\ne r$增广)。求公共解前先验相容性;求完代回任意一组验算。
八初等变换动了谁
最后用这张图回答"消元法为什么合法":初等行变换到底改变了哪些子空间?
| 操作 | 行空间 $C(A^{\mathsf T})$ | 零空间 $N(A)$ | 列空间 $C(A)$ | 秩 |
| 初等行变换 | 不变 | 不变 | 可能改变 | 不变 |
| 初等列变换 | 可能改变 | 改变 | 不变 | 不变 |
消元法合法的根本原因: 行变换 = 对方程做线性组合,只是在行空间内部折腾,行空间不动 → 它的正交补(零空间 = 解集)一点不动。"行变换不改变解集"和"行变换不改变行空间"本来就是同一件事,中间的扣子就是"解空间 = 行空间正交补"。
反过来,行变换会搅动列空间(列被重新组合),所以不能用行变换后的列去判断原矩阵列之间的数值关系——但哪几列是主列(线性相关结构)不变,这正是求列空间基的依据。
九脉络地图 + 看懂自检
把全章连成一条线:
$$\underbrace{\text{一个方程}=\text{一个}\perp\text{约束}}_{\text{解空间}=C(A^{\mathsf T})^{\perp}}\ \Rightarrow\ \underbrace{\text{四个子空间}}_{\mathbb{R}^n=\,\text{行}\oplus\text{零},\ \mathbb{R}^m=\,\text{列}\oplus\text{左零}}\ \Rightarrow\ \underbrace{\text{有解}\,|\,\text{列空间}}_{\text{唯一}\,|\,\text{零空间}}\ \Rightarrow\ \underbrace{\text{同解}=\text{行空间相同}}_{\text{公共解}=\text{零空间求交}}$$
| 问题 | 归到哪个子空间 |
| $A\mathbf{x}=\mathbf{b}$ 有没有解 | $\mathbf{b}\in C(A)$ ?(列空间,管存在性) |
| 解唯不唯一 | $N(A)=\{\mathbf 0\}$ ?(零空间,管唯一性) |
| 两组方程同解 | 行空间相同 ⟺ 零空间相同 ⟺ $r(A)=r(B)=r\binom{A}{B}$ |
| 两组方程的公共解 | $N(A)\cap N(B)=N\binom{A}{B}$(零空间求交) |
不用背公式,只问自己能不能用自己的话讲清楚:
- 说得清"为什么齐次方程组的解集是一个子空间"
- 能把"一个方程 = 一个垂直约束"讲出来,并推出"解空间 = 行空间正交补"
- 能默写四个基本子空间各自住在哪、维数多少,以及两对正交补关系
- 能凭记忆画出第四节那张全景图(行空间↔列空间一一对应,零空间被压成 0)
- 分得清"有解看列空间、唯一看零空间"
- 讲得出"同解 = 行空间相同",并解释为什么 $r(A)=r(B)$ 还不够
- 分得清同解(重合)与公共解(求交)的区别,会用三种方法求公共解
- 能说清"行变换为什么不改变解集"(行空间没动)
✅ 这张全景图是整个线代的"地图"——后面学矩阵、秩、特征值时回头看,会发现它们都挂在这四个子空间上。