线性方程组 · 空间视角与四个基本子空间

← 返回目录

这一页怎么用：这是把线性方程组从"解题套路"提升到"空间结构"的一份理解型讲义。沿着 Gilbert Strang《线性代数》从 Space（空间） 出发的思路，先把"解集其实是一个子空间"讲透，再用四个基本子空间这张全景图，把有没有解、唯不唯一、同解、公共解统统翻译成图上的位置关系。每节末尾的为什么小块帮你接通直觉。

一解集为什么是"空间"

Strang 的教材不从行列式、也不从消元法开篇，而是从 Space 讲起。原因是：齐次方程组 $A\mathbf{x}=\mathbf 0$ 的解，不是一堆零散的解，而是一个有结构的子空间。

$$A\mathbf{x}_1=\mathbf 0,\ A\mathbf{x}_2=\mathbf 0\ \Longrightarrow\ A(k_1\mathbf{x}_1+k_2\mathbf{x}_2)=\mathbf 0$$

解的线性组合还是解——这正是"子空间"的定义（对加法和数乘封闭，且含零向量）。所以我们干脆给它起名叫解空间，也就是后面要讲的零空间 $N(A)$。它的维数 $=n-r(A)$，一组基就是基础解系。

换个眼光：研究方程组 = 研究子空间。一旦把"解集"看成"空间"，同解、公共解、解的结构就都变成几何问题，而不是符号游戏。

二一个方程 = 一个垂直约束

把方程组的第 $i$ 个方程 $a_{i1}x_1+\cdots+a_{in}x_n=0$ 的系数排成行向量 $\boldsymbol{\alpha}_i$，这个方程就是一句话：

$$\boldsymbol{\alpha}_i\cdot\mathbf{x}=0\quad(\text{内积为零，即 }\mathbf{x}\perp\boldsymbol{\alpha}_i)$$

所以"$\mathbf{x}$ 是解"的真正含义是：$\mathbf{x}$ 垂直于每一个行向量。而垂直于一堆向量，等价于垂直于它们张成的整个子空间——那个子空间就是行空间 $C(A^{\mathsf T})=\mathrm{span}\{\boldsymbol{\alpha}_1,\dots,\boldsymbol{\alpha}_m\}$。结论是一座桥：

$$\boxed{\ \text{解空间}\ N(A)\;=\;C(A^{\mathsf T})^{\perp}\ }\quad(\text{零空间 = 行空间的正交补})$$

这就是"秩为什么能管住解"的根。 解空间只由行空间这个子空间决定，跟你具体写下哪几个方程无关。换一组方程，只要张成的行空间不变，垂直于它的那些 $\mathbf{x}$ 一个都不会变。秩 $r$ 只是行空间的维数，正交补的维数自动是 $n-r$，正好是基础解系的个数。

三四个基本子空间

一个 $m\times n$ 矩阵 $A$ 是一台 $\mathbb{R}^n\to\mathbb{R}^m$ 的线性机器：$\mathbf{x}\mapsto A\mathbf{x}$。输入有 $n$ 个分量住在 $\mathbb{R}^n$，输出有 $m$ 个分量住在 $\mathbb{R}^m$。这台机器自然切出四个子空间，$\mathbb{R}^n$ 里两个、$\mathbb{R}^m$ 里两个（记 $r=r(A)$）：

子空间	定义	住在	维数
列空间 $C(A)$	列向量张成 $=\{A\mathbf{x}\}$	$\mathbb{R}^m$	$r$
左零空间 $N(A^{\mathsf T})$	$\{\mathbf{y}\mid \mathbf{y}^{\mathsf T}A=\mathbf 0\}$	$\mathbb{R}^m$	$m-r$
行空间 $C(A^{\mathsf T})$	行向量张成	$\mathbb{R}^n$	$r$
(右)零空间 $N(A)$	$\{\mathbf{x}\mid A\mathbf{x}=\mathbf 0\}$ = 解空间	$\mathbb{R}^n$	$n-r$

"左零空间 / 右零空间"到底是什么？ 平时说的零空间 $N(A)=\{\mathbf{x}:A\mathbf{x}=\mathbf 0\}$，$\mathbf{x}$ 写在 $A$ 右边，严格叫右零空间，就是 $A\mathbf{x}=\mathbf 0$ 的解空间。把 $\mathbf{y}$ 乘在 $A$ 左边得零行向量（$\mathbf{y}^{\mathsf T}A=\mathbf 0$，等价于 $A^{\mathsf T}\mathbf{y}=\mathbf 0$），叫左零空间，它就是 $N(A^{\mathsf T})$。两者本质一样，只是分别属于 $A$ 和 $A^{\mathsf T}$；默认说"零空间"指右零空间。

它们不是随意排列的，而是两两正交、维数互补——这就是 Strang 所谓的"线性代数基本定理"：

$$\underbrace{C(A^{\mathsf T})\perp N(A)}_{\text{在 }\mathbb{R}^n:\ r+(n-r)=n},\qquad \underbrace{C(A)\perp N(A^{\mathsf T})}_{\text{在 }\mathbb{R}^m:\ r+(m-r)=m}$$

同一个世界里的那对子空间：维数加起来 = 该世界的维数，且彼此垂直、互为正交补。$\mathbb{R}^n=$ 行空间 $\oplus$ 零空间；$\mathbb{R}^m=$ 列空间 $\oplus$ 左零空间。

四全景图：A 这台机器在干什么

把四个子空间画成 Strang 那张著名的"全景图"。左边是输入世界 $\mathbb{R}^n$，右边是输出世界 $\mathbb{R}^m$，箭头表示 $A$ 的作用：

A 把零空间整体压成 0，把行空间一一对应地搬到列空间（两者维数都是 r，这是 A 真正"可逆、有信息"的核心）。
左零空间是输出世界里 A 永远够不到的方向——$\mathbf{b}$ 一旦在这里有分量，方程就无解。

怎么读这台机器： 任何输入 $\mathbf{x}$ 都能拆成"行空间分量 + 零空间分量"（正交分解）。零空间那一半被 $A$ 抹平成 $\mathbf 0$；行空间那一半被 $A$ 完好地映到列空间。所以 $A$ 的"有效信息"全部装在那个维数为 $r$ 的一一对应里。

五方程组三问：有解 / 唯一 / 通解

有了这张图，$A\mathbf{x}=\mathbf{b}$ 的三个经典问题各自对应一个子空间：

① 有没有解 —— 看列空间

$$A\mathbf{x}=\mathbf{b}\ \text{有解}\iff \mathbf{b}\in C(A)\iff r(A)=r(A\mid\mathbf{b})$$

因为 $A\mathbf{x}$ 永远是 $A$ 各列的线性组合，能取到的全体就是列空间。$\mathbf{b}$ 落在左零空间方向上越多，就越无解。

② 解唯不唯一 —— 看零空间

$$\text{解唯一}\iff N(A)=\{\mathbf 0\}\iff r=n$$

通解的结构永远是"一个特解 + 整个零空间"：

$$\mathbf{x}=\underbrace{\mathbf{x}_0}_{\text{特解}}+\underbrace{k_1\boldsymbol{\xi}_1+\cdots+k_{n-r}\boldsymbol{\xi}_{n-r}}_{N(A)\,:\ \dim=n-r}$$

一个漂亮的小结论： 在全体解里，长度最短的那个解唯一地落在行空间 $C(A^{\mathsf T})$ 里，其余解都比它多出一段零空间分量。这就是"最小范数解"，是正交分解的直接推论。

③ 几何直觉：最短解 = 原点到解集的垂足

拿最简单的非齐次方程 $x_1+x_2=2$（这里 $A=(1,\ 1)$）在平面上画出来。它的全体解是一条直线，方向正是零空间方向 $(1,-1)$——可以理解成"把过原点的零空间直线，平移、推离原点"，这正是非齐次的样子：

蓝色虚线是行空间（45°，过原点）；它与解集（实线）垂直。
从原点向解集作垂线，垂足 $(1,1)$ 就是最短解，且恰好落在行空间上（长 $\sqrt2$）。
沿零空间方向 $(1,-1)$ 离开 $(1,1)$，就得到 $(2,0)$、$(0,2)$ 等其它解——都更长。

这张图就是上面那段话的全部：解集是平行于零空间的直线，哪个解最短，就看哪个离原点最近，而离原点最近的方向恰是垂直于零空间的行空间方向，所以垂足必然落在行空间里，且唯一。

六同解 = 行空间相同

两个齐次方程组同解，意思是它们的解空间（零空间）完全重合。由第二节那座桥（零空间 = 行空间正交补），零空间相等 $\iff$ 行空间相等：

$$A\mathbf{x}=\mathbf 0\ \text{与}\ B\mathbf{x}=\mathbf 0\ \text{同解}\iff N(A)=N(B)\iff C(A^{\mathsf T})=C(B^{\mathsf T})\iff r(A)=r(B)=r\begin{pmatrix}A\\ B\end{pmatrix}$$

那串秩等式只是"两个行空间相等"的可计算版本：把方程摞起来 $\binom{A}{B}$，其行空间是 $C(A^{\mathsf T})+C(B^{\mathsf T})$；

$r(A)=r\binom{A}{B}$ ⟹ 加进 $B$ 的行没把空间撑大 ⟹ $C(B^{\mathsf T})\subseteq C(A^{\mathsf T})$；
$r(B)=r\binom{A}{B}$ ⟹ 同理 $C(A^{\mathsf T})\subseteq C(B^{\mathsf T})$；
两个包含合起来 ⟹ 行空间完全相等 ⟹ 同解。

为什么单看 $r(A)=r(B)$ 不够？ 秩相等只说"行空间一样大"，不说"是同一个"。$\mathbb{R}^3$ 里 $x_1=0$ 与 $x_2=0$ 秩都是 1，但解空间一个是 $yz$ 面、一个是 $xz$ 面，并不同解。必须再补"互相包含"，才能把"一样大"升级成"完全相同"。

非齐次同解要换成增广矩阵：$r(\bar A)=r(\bar B)=r\binom{\bar A}{\bar B}$，且都相容。漏掉常数列是常见失分点。

七公共解 = 零空间求交

同解是两个解空间重合；公共解是两个解空间求交——别混。在图上一目了然：

左：同解 ⟹ 两个零空间是同一个子空间。右：公共解 ⟹ 取两个零空间的交集。

把两组方程联立（摞起来），它们的公共解就是：

$$\text{公共解集}=N(A)\cap N(B)=N\!\begin{pmatrix}A\\ B\end{pmatrix},\qquad \dim\big(N(A)\cap N(B)\big)=n-r\!\begin{pmatrix}A\\ B\end{pmatrix}$$

这正是"联立 = 求公共解"的本质：摞起来后行空间变成两者之和 $C(A^{\mathsf T})+C(B^{\mathsf T})$，它的正交补恰好是两个零空间的交。

三种常见求法

题目给的条件	方法
两组都给方程	把所有方程联立成大方程组，对增广矩阵做行变换求解
一组给解 + 一组给方程	把通解 $\mathbf{x}=\sum k_i\boldsymbol{\xi}_i$ 代入另一组方程，解出参数 $k_i$ 满足的关系（算量最小，优先用）
两组都给通解	令两边通解相等 $\sum k_i\boldsymbol{\xi}_i=\sum l_j\boldsymbol{\eta}_j$，解关于 $k_i,l_j$ 的方程组

非齐次方程组之间可能没有公共解（联立后无解，$r$系数 $\ne r$增广）。求公共解前先验相容性；求完代回任意一组验算。

八初等变换动了谁

最后用这张图回答"消元法为什么合法"：初等行变换到底改变了哪些子空间？

操作	行空间 $C(A^{\mathsf T})$	零空间 $N(A)$	列空间 $C(A)$	秩
初等行变换	不变	不变	可能改变	不变
初等列变换	可能改变	改变	不变	不变

消元法合法的根本原因： 行变换 = 对方程做线性组合，只是在行空间内部折腾，行空间不动 → 它的正交补（零空间 = 解集）一点不动。"行变换不改变解集"和"行变换不改变行空间"本来就是同一件事，中间的扣子就是"解空间 = 行空间正交补"。

反过来，行变换会搅动列空间（列被重新组合），所以不能用行变换后的列去判断原矩阵列之间的数值关系——但哪几列是主列（线性相关结构）不变，这正是求列空间基的依据。

九脉络地图 + 看懂自检

把全章连成一条线：

$$\underbrace{\text{一个方程}=\text{一个}\perp\text{约束}}_{\text{解空间}=C(A^{\mathsf T})^{\perp}}\ \Rightarrow\ \underbrace{\text{四个子空间}}_{\mathbb{R}^n=\,\text{行}\oplus\text{零},\ \mathbb{R}^m=\,\text{列}\oplus\text{左零}}\ \Rightarrow\ \underbrace{\text{有解}\,|\,\text{列空间}}_{\text{唯一}\,|\,\text{零空间}}\ \Rightarrow\ \underbrace{\text{同解}=\text{行空间相同}}_{\text{公共解}=\text{零空间求交}}$$

问题	归到哪个子空间
$A\mathbf{x}=\mathbf{b}$ 有没有解	$\mathbf{b}\in C(A)$ ？（列空间，管存在性）
解唯不唯一	$N(A)=\{\mathbf 0\}$ ？（零空间，管唯一性）
两组方程同解	行空间相同 ⟺ 零空间相同 ⟺ $r(A)=r(B)=r\binom{A}{B}$
两组方程的公共解	$N(A)\cap N(B)=N\binom{A}{B}$（零空间求交）

不用背公式，只问自己能不能用自己的话讲清楚：

说得清"为什么齐次方程组的解集是一个子空间"
能把"一个方程 = 一个垂直约束"讲出来，并推出"解空间 = 行空间正交补"
能默写四个基本子空间各自住在哪、维数多少，以及两对正交补关系
能凭记忆画出第四节那张全景图（行空间↔列空间一一对应，零空间被压成 0）
分得清"有解看列空间、唯一看零空间"
讲得出"同解 = 行空间相同"，并解释为什么 $r(A)=r(B)$ 还不够
分得清同解（重合）与公共解（求交）的区别，会用三种方法求公共解
能说清"行变换为什么不改变解集"（行空间没动）

✅ 这张全景图是整个线代的"地图"——后面学矩阵、秩、特征值时回头看，会发现它们都挂在这四个子空间上。