线性方程组 · 空间视角

考研线性代数 · 用「四个基本子空间」看穿 同解 / 公共解 / 解的结构
Strang 的 Space 视角 · 理论 + 图 + 公式
← 返回目录
这一页怎么用:这是把线性方程组从"解题套路"提升到"空间结构"的一份理解型讲义。 沿着 Gilbert Strang《线性代数》从 Space(空间) 出发的思路,先把"解集其实是一个子空间"讲透, 再用四个基本子空间这张全景图,把有没有解、唯不唯一、同解、公共解统统翻译成图上的位置关系。 每节末尾的 为什么 小块帮你接通直觉。

解集为什么是"空间"

Strang 的教材不从行列式、也不从消元法开篇,而是从 Space 讲起。原因是:齐次方程组 $A\mathbf{x}=\mathbf 0$ 的解,不是一堆零散的解,而是一个有结构的子空间

$$A\mathbf{x}_1=\mathbf 0,\ A\mathbf{x}_2=\mathbf 0\ \Longrightarrow\ A(k_1\mathbf{x}_1+k_2\mathbf{x}_2)=\mathbf 0$$

解的线性组合还是解——这正是"子空间"的定义(对加法和数乘封闭,且含零向量)。所以我们干脆给它起名叫解空间,也就是后面要讲的零空间 $N(A)$。它的维数 $=n-r(A)$,一组基就是基础解系

换个眼光:研究方程组 = 研究子空间。一旦把"解集"看成"空间",同解、公共解、解的结构就都变成几何问题,而不是符号游戏。

一个方程 = 一个垂直约束

把方程组的第 $i$ 个方程 $a_{i1}x_1+\cdots+a_{in}x_n=0$ 的系数排成行向量 $\boldsymbol{\alpha}_i$,这个方程就是一句话:

$$\boldsymbol{\alpha}_i\cdot\mathbf{x}=0\quad(\text{内积为零,即 }\mathbf{x}\perp\boldsymbol{\alpha}_i)$$

所以"$\mathbf{x}$ 是解"的真正含义是:$\mathbf{x}$ 垂直于每一个行向量。而垂直于一堆向量,等价于垂直于它们张成的整个子空间——那个子空间就是行空间 $C(A^{\mathsf T})=\mathrm{span}\{\boldsymbol{\alpha}_1,\dots,\boldsymbol{\alpha}_m\}$。结论是一座桥:

$$\boxed{\ \text{解空间}\ N(A)\;=\;C(A^{\mathsf T})^{\perp}\ }\quad(\text{零空间 = 行空间的正交补})$$
这就是"秩为什么能管住解"的根。 解空间只由行空间这个子空间决定,跟你具体写下哪几个方程无关。换一组方程,只要张成的行空间不变,垂直于它的那些 $\mathbf{x}$ 一个都不会变。秩 $r$ 只是行空间的维数,正交补的维数自动是 $n-r$,正好是基础解系的个数。

四个基本子空间

一个 $m\times n$ 矩阵 $A$ 是一台 $\mathbb{R}^n\to\mathbb{R}^m$ 的线性机器:$\mathbf{x}\mapsto A\mathbf{x}$。输入有 $n$ 个分量住在 $\mathbb{R}^n$,输出有 $m$ 个分量住在 $\mathbb{R}^m$。这台机器自然切出四个子空间,$\mathbb{R}^n$ 里两个、$\mathbb{R}^m$ 里两个(记 $r=r(A)$):

子空间定义住在维数
列空间 $C(A)$列向量张成 $=\{A\mathbf{x}\}$$\mathbb{R}^m$$r$
左零空间 $N(A^{\mathsf T})$$\{\mathbf{y}\mid \mathbf{y}^{\mathsf T}A=\mathbf 0\}$$\mathbb{R}^m$$m-r$
行空间 $C(A^{\mathsf T})$行向量张成$\mathbb{R}^n$$r$
(右)零空间 $N(A)$$\{\mathbf{x}\mid A\mathbf{x}=\mathbf 0\}$ = 解空间$\mathbb{R}^n$$n-r$
"左零空间 / 右零空间"到底是什么? 平时说的零空间 $N(A)=\{\mathbf{x}:A\mathbf{x}=\mathbf 0\}$,$\mathbf{x}$ 写在 $A$ 右边,严格叫右零空间,就是 $A\mathbf{x}=\mathbf 0$ 的解空间。把 $\mathbf{y}$ 乘在 $A$ 左边得零行向量($\mathbf{y}^{\mathsf T}A=\mathbf 0$,等价于 $A^{\mathsf T}\mathbf{y}=\mathbf 0$),叫左零空间,它就是 $N(A^{\mathsf T})$。两者本质一样,只是分别属于 $A$ 和 $A^{\mathsf T}$;默认说"零空间"指右零空间。

它们不是随意排列的,而是两两正交、维数互补——这就是 Strang 所谓的"线性代数基本定理":

$$\underbrace{C(A^{\mathsf T})\perp N(A)}_{\text{在 }\mathbb{R}^n:\ r+(n-r)=n},\qquad \underbrace{C(A)\perp N(A^{\mathsf T})}_{\text{在 }\mathbb{R}^m:\ r+(m-r)=m}$$
同一个世界里的那对子空间:维数加起来 = 该世界的维数,且彼此垂直、互为正交补。$\mathbb{R}^n=$ 行空间 $\oplus$ 零空间;$\mathbb{R}^m=$ 列空间 $\oplus$ 左零空间。

全景图:A 这台机器在干什么

把四个子空间画成 Strang 那张著名的"全景图"。左边是输入世界 $\mathbb{R}^n$,右边是输出世界 $\mathbb{R}^m$,箭头表示 $A$ 的作用:

输入世界 ℝⁿ 行空间 C(Aᵀ) 方程系数张成 · dim = r 零空间 N(A) 解空间 · dim = n − r ⊥ 正交 输出世界 ℝᵐ 列空间 C(A) Ax 能到达的全部 · dim = r 左零空间 N(Aᵀ) A 够不到的方向 · dim = m − r ⊥ 正交 A:一一对应 (可逆部分 ≅) 0 Ax=0
A 把零空间整体压成 0,把行空间一一对应地搬到列空间(两者维数都是 r,这是 A 真正"可逆、有信息"的核心)。
左零空间是输出世界里 A 永远够不到的方向——$\mathbf{b}$ 一旦在这里有分量,方程就无解。
怎么读这台机器: 任何输入 $\mathbf{x}$ 都能拆成"行空间分量 + 零空间分量"(正交分解)。零空间那一半被 $A$ 抹平成 $\mathbf 0$;行空间那一半被 $A$ 完好地映到列空间。所以 $A$ 的"有效信息"全部装在那个维数为 $r$ 的一一对应里。

方程组三问:有解 / 唯一 / 通解

有了这张图,$A\mathbf{x}=\mathbf{b}$ 的三个经典问题各自对应一个子空间:

① 有没有解 —— 看列空间

$$A\mathbf{x}=\mathbf{b}\ \text{有解}\iff \mathbf{b}\in C(A)\iff r(A)=r(A\mid\mathbf{b})$$

因为 $A\mathbf{x}$ 永远是 $A$ 各列的线性组合,能取到的全体就是列空间。$\mathbf{b}$ 落在左零空间方向上越多,就越无解。

② 解唯不唯一 —— 看零空间

$$\text{解唯一}\iff N(A)=\{\mathbf 0\}\iff r=n$$

通解的结构永远是"一个特解 + 整个零空间":

$$\mathbf{x}=\underbrace{\mathbf{x}_0}_{\text{特解}}+\underbrace{k_1\boldsymbol{\xi}_1+\cdots+k_{n-r}\boldsymbol{\xi}_{n-r}}_{N(A)\,:\ \dim=n-r}$$
一个漂亮的小结论: 在全体解里,长度最短的那个解唯一地落在行空间 $C(A^{\mathsf T})$ 里,其余解都比它多出一段零空间分量。这就是"最小范数解",是正交分解的直接推论。

③ 几何直觉:最短解 = 原点到解集的垂足

拿最简单的非齐次方程 $x_1+x_2=2$(这里 $A=(1,\ 1)$)在平面上画出来。它的全体解是一条直线,方向正是零空间方向 $(1,-1)$——可以理解成"把过原点的零空间直线,平移、推离原点",这正是非齐次的样子:

x₁ x₂ 1 2 1 2 行空间 C(Aᵀ) 解集:x₁+x₂=2 O 最短解 (1,1) ∈ 行空间 · 长 √2 (2,0) 长 2 (0,2) 长 2 + 零空间分量
蓝色虚线是行空间(45°,过原点);它与解集(实线)垂直
从原点向解集作垂线,垂足 $(1,1)$ 就是最短解,且恰好落在行空间上(长 $\sqrt2$)。
沿零空间方向 $(1,-1)$ 离开 $(1,1)$,就得到 $(2,0)$、$(0,2)$ 等其它解——都更长。

这张图就是上面那段话的全部:解集是平行于零空间的直线,哪个解最短,就看哪个离原点最近,而离原点最近的方向恰是垂直于零空间的行空间方向,所以垂足必然落在行空间里,且唯一。

同解 = 行空间相同

两个齐次方程组同解,意思是它们的解空间(零空间)完全重合。由第二节那座桥(零空间 = 行空间正交补),零空间相等 $\iff$ 行空间相等:

$$A\mathbf{x}=\mathbf 0\ \text{与}\ B\mathbf{x}=\mathbf 0\ \text{同解}\iff N(A)=N(B)\iff C(A^{\mathsf T})=C(B^{\mathsf T})\iff r(A)=r(B)=r\begin{pmatrix}A\\ B\end{pmatrix}$$

那串秩等式只是"两个行空间相等"的可计算版本:把方程摞起来 $\binom{A}{B}$,其行空间是 $C(A^{\mathsf T})+C(B^{\mathsf T})$;

为什么单看 $r(A)=r(B)$ 不够? 秩相等只说"行空间一样大",不说"是同一个"。$\mathbb{R}^3$ 里 $x_1=0$ 与 $x_2=0$ 秩都是 1,但解空间一个是 $yz$ 面、一个是 $xz$ 面,并不同解。必须再补"互相包含",才能把"一样大"升级成"完全相同"。
非齐次同解要换成增广矩阵:$r(\bar A)=r(\bar B)=r\binom{\bar A}{\bar B}$,且都相容。漏掉常数列是常见失分点。

公共解 = 零空间求交

同解是两个解空间重合公共解是两个解空间求交——别混。在图上一目了然:

同解 · 两解空间重合 N(A) = N(B) 同一个子空间 公共解 · 两解空间求交 N(A) N(B) 交集 = 公共解
左:同解 ⟹ 两个零空间是同一个子空间。右:公共解 ⟹ 取两个零空间的交集

把两组方程联立(摞起来),它们的公共解就是:

$$\text{公共解集}=N(A)\cap N(B)=N\!\begin{pmatrix}A\\ B\end{pmatrix},\qquad \dim\big(N(A)\cap N(B)\big)=n-r\!\begin{pmatrix}A\\ B\end{pmatrix}$$

这正是"联立 = 求公共解"的本质:摞起来后行空间变成两者之和 $C(A^{\mathsf T})+C(B^{\mathsf T})$,它的正交补恰好是两个零空间的交。

三种常见求法

题目给的条件方法
两组都给方程把所有方程联立成大方程组,对增广矩阵做行变换求解
一组给解 + 一组给方程把通解 $\mathbf{x}=\sum k_i\boldsymbol{\xi}_i$ 代入另一组方程,解出参数 $k_i$ 满足的关系(算量最小,优先用)
两组都给通解令两边通解相等 $\sum k_i\boldsymbol{\xi}_i=\sum l_j\boldsymbol{\eta}_j$,解关于 $k_i,l_j$ 的方程组
非齐次方程组之间可能没有公共解(联立后无解,$r$系数 $\ne r$增广)。求公共解前先验相容性;求完代回任意一组验算。

初等变换动了谁

最后用这张图回答"消元法为什么合法":初等行变换到底改变了哪些子空间?

操作行空间 $C(A^{\mathsf T})$零空间 $N(A)$列空间 $C(A)$
初等行变换不变不变可能改变不变
初等列变换可能改变改变不变不变
消元法合法的根本原因: 行变换 = 对方程做线性组合,只是在行空间内部折腾,行空间不动 → 它的正交补(零空间 = 解集)一点不动。"行变换不改变解集"和"行变换不改变行空间"本来就是同一件事,中间的扣子就是"解空间 = 行空间正交补"。

反过来,行变换会搅动列空间(列被重新组合),所以不能用行变换后的列去判断原矩阵列之间的数值关系——但哪几列是主列(线性相关结构)不变,这正是求列空间基的依据。

脉络地图 + 看懂自检

把全章连成一条线:

$$\underbrace{\text{一个方程}=\text{一个}\perp\text{约束}}_{\text{解空间}=C(A^{\mathsf T})^{\perp}}\ \Rightarrow\ \underbrace{\text{四个子空间}}_{\mathbb{R}^n=\,\text{行}\oplus\text{零},\ \mathbb{R}^m=\,\text{列}\oplus\text{左零}}\ \Rightarrow\ \underbrace{\text{有解}\,|\,\text{列空间}}_{\text{唯一}\,|\,\text{零空间}}\ \Rightarrow\ \underbrace{\text{同解}=\text{行空间相同}}_{\text{公共解}=\text{零空间求交}}$$
问题归到哪个子空间
$A\mathbf{x}=\mathbf{b}$ 有没有解$\mathbf{b}\in C(A)$ ?(列空间,管存在性
解唯不唯一$N(A)=\{\mathbf 0\}$ ?(零空间,管唯一性
两组方程同解行空间相同 ⟺ 零空间相同 ⟺ $r(A)=r(B)=r\binom{A}{B}$
两组方程的公共解$N(A)\cap N(B)=N\binom{A}{B}$(零空间求交)

不用背公式,只问自己能不能用自己的话讲清楚:

✅ 这张全景图是整个线代的"地图"——后面学矩阵、秩、特征值时回头看,会发现它们都挂在这四个子空间上。