对角化

数学 / 线性代数

本地源文件:docs/math__linear-algebra__diagonalization.md

对角化

特征子空间

矩阵 𝐴A 的属于 𝜆0λ0 的全部特征向量,再添上零向量,构成一个线性空间,称为矩阵 𝐴A 的一个特征子空间,记为 𝐸(𝜆0)E(λ0).它是齐次线性方程组:

(𝜆0𝐼−𝐴)𝑋=0(λ0I−A)X=0

的解空间.

对于特征子空间 𝐸(𝜆𝑖) =𝑁(𝜆𝑖𝐼 −𝐴)E(λi)=N(λiI−A),由亏加秩定理有:

𝑟(𝜆𝑖𝐼−𝐴)+dim⁡𝑁(𝜆𝑖𝐼−𝐴)=𝑛r(λiI−A)+dim⁡N(λiI−A)=n

因此,特征子空间 𝐸(𝜆𝑖)E(λi) 的维数为:

dim⁡𝐸(𝜆𝑖)=𝑛−𝑟(𝜆𝑖𝐼−𝐴)dim⁡E(λi)=n−r(λiI−A)

也称为 𝜆𝑖λi几何重数

不变子空间

在研究线性变换 𝑇T 的时候,常常希望选取空间 𝑉V 的一个基,使得线性变换 𝑇T 对于这个基的矩阵具有尽可能简单的形状.

设 𝑉V 是数域 𝐹F 上的线性空间,𝑊W 是 𝑉V 的一个子空间,𝑇T 是 𝑉V 上的一个线性变换.如果对于 𝑊W 中任意的向量 𝑥x,都有 𝑇(𝑥)T(x) 也在 𝑊W 中(也称为空间在变换下不变或稳定),称 𝑊W 是 𝑇T 的一个不变子空间.

空间在变换下不变,并不是说坐标在变换下真的「不变」,有可能是进行了一个拉伸等变形,只是变形后还落在空间里.

  • 线性空间 𝑉V 的任意一个子空间都是数乘变换的不变子空间.
  • 对于 𝑉V 中任意的线性变换 𝑇T,空间 𝑉V 和零子空间都是 𝑇T 的不变子空间,称为平凡不变子空间.
  • 不变子空间的交与和也是不变子空间.

设 𝑊W 是线性变换 𝑇T 的一个不变子空间.只考虑 𝑇T 在不变子空间 𝑊W 上的作用,就得到子空间 𝑊W 本身的线性变换,称为 𝑇T 在子空间 𝑊W 上的限制,记作 𝑇|𝑊T|W

对于 𝑉V 中任意的线性变换 𝑇T,像空间 𝑅(𝑇)R(T) 与核空间 𝑁(𝑇)N(T) 是 𝑇T 的不变子空间.这两种情况的含义是,空间 𝑉V 在变换前后,完成了自身的压缩(像空间),或者压缩到 00(核空间).

对于 𝑉V 中任意的线性变换 𝑇T,𝑇T 的特征子空间是 𝑇T 的不变子空间.

准素分解

根据代数基本定理,最小多项式可以分解为:

𝑚𝐴(𝜆)=(𝜆−𝜆1)𝑟1⋯(𝜆−𝜆𝑆)𝑟𝑆mA(λ)=(λ−λ1)r1⋯(λ−λS)rS

考虑最小多项式代入变元 𝜆λ 为矩阵 𝐴A 后,各个因式的核空间,构成矩阵 𝐴A 的一系列不变子空间:

𝑊𝑖=𝑁((𝜆𝑖𝐼−𝐴)𝑟𝑖)Wi=N((λiI−A)ri)

定理:该不变子空间 𝑊𝑖Wi 的维数,恰好为特征值 𝜆𝑖λi 的代数重数.

回顾一下,代数重数是指特征多项式各个因式的次数,几何重数是指特征子空间 𝐸(𝜆𝑖) =𝑁(𝜆𝑖𝐼 −𝐴)E(λi)=N(λiI−A) 的维数.这个不变子空间 𝑊𝑖Wi 与特征子空间 𝐸(𝜆𝑖)E(λi),两者都是矩阵的核空间,并且两个矩阵构成最小多项式 𝑟𝑖ri 次幂的关系.也就是说,特征子空间的维数是几何重数,「特征子空间」经过最小多项式 𝑟𝑖ri 次幂后到达一个「不变子空间」,不变子空间的维数到达了特征多项式的代数重数.

该定理其实是下面准素分解定理的推论.

记矩阵 𝐴A 对应的线性变换 𝑇T,在每个子空间 𝑊𝑖Wi 上的限制 𝑇𝑖 =𝑇|𝑊𝑖Ti=T|Wi.于是 𝑇𝑖Ti 的最小多项式是 (𝑥 −𝜆𝑖)𝑟𝑖(x−λi)ri

定理:设 𝑉V 是域 𝐹F 上的线性空间,𝑇T 是 𝑉V 上的一个线性变换.那么空间 𝑉V 可以关于线性变换 𝑇T 进行准素分解,拆成若干不变子空间 𝑊𝑖Wi 的直和.

𝑉=𝑊1⊕𝑊2⊕⋯⊕𝑊𝑆V=W1⊕W2⊕⋯⊕WS

这意味着,𝑇T 在某组基下的矩阵是准对角阵:

diag⁡{𝐴1,𝐴2,⋯,𝐴𝑆}diag⁡{A1,A2,⋯,AS}

其中,𝐴𝑖Ai 是 𝑇𝑖Ti 在对应基下的矩阵.

该定理表明,可以使用不变子空间简化线性变换的矩阵.

可对角化矩阵

对于 𝑛n 阶方阵 𝐴A,如果相似于一个对角阵,则称 𝐴A 为可对角化矩阵,或称单纯矩阵.

  • 对角阵的和、积、逆,如果存在,仍然是对角阵,其对角线上的元素就是它的特征值.
  • 线性变换 𝑇T 的矩阵为可对角化矩阵,等价于 𝑇T 在某组基下的矩阵为对角阵.

定理:设矩阵 𝐴A 的全部互异特征根为 𝜆1,⋯,𝜆𝑚λ1,⋯,λm,则以下命题等价:

  • 矩阵 𝐴A 可对角化.
  • 矩阵 𝐴A 有 𝑛n 个线性无关的特征向量.
  • 以下公式成立:

dim⁡𝐸(𝜆1)+⋯+dim⁡𝐸(𝜆𝑚)=𝑛dim⁡E(λ1)+⋯+dim⁡E(λm)=n

前文已经指出,特征多项式的分解式中特征值的次数称为代数重数,特征子空间的维数称为几何重数.这个定理也表明,矩阵 𝐴A 可对角化,等价于 𝐴A 的每个特征值 𝜆λ 的代数重数都等于它的几何重数.

推论:如果 𝑛n 阶方阵 𝐴A 恰有 𝑛n 个互异特征值,则它必可对角化.反之则不一定.

定理:矩阵 𝐴A 可对角化当且仅当 𝐴A 的最小多项式没有重根.

矩阵的相似也会保持特征向量之间的线性相关关系不变.

特征向量完全可能不是实数,也完全可能找不到 𝑛n 个线性无关的特征向量.

对于重特征值而言,特征向量张成空间.为了描述这个空间,需要从其中选择代表.一般会选择线性无关的代表,代表的个数就是空间的维数.

选取代表时,常常将它们正交化与单位化.最终得到的就是一套单位正交的代表.

特征向量不一定正交,不同特征值的特征向量,可能无法正交.因此正交化只能对于重特征值的特征向量进行.但是单位化可以对任意特征向量进行.

幂零矩阵

设 𝑇T 是空间 𝑉V 的一个线性变换.如果存在一个正整数 𝑟r,使得 𝑇𝑟Tr 为零变换,称 𝑇T 是空间 𝑉V 的一个幂零变换.

对于某一个正整数 𝑟r,满足条件 𝑁𝑟 =0Nr=0 的矩阵称为幂零矩阵.

一般可以进一步假定 𝑟r 是使 𝑇𝑟Tr 为零变换的最小正整数,于是 𝑇T 的最小多项式是 𝑥𝑟xr.于是存在一个向量 𝜉0ξ0,使得:

  • 𝑇𝑟(𝜉0)=0Tr(ξ0)=0
  • 𝑇𝑟−1(𝜉0)≠0Tr−1(ξ0)≠0

循环子空间

定理:设 𝑇T 是空间 𝑉V 的一个线性变换,𝜉ξ 是空间 𝑉V 的一个向量.如果存在一个正整数 𝑠s,使得:

  • 𝑇𝑠(𝜉)=0Ts(ξ)=0
  • 𝑇𝑠−1(𝜉)≠0Ts−1(ξ)≠0

那么向量 𝜉,𝑇(𝜉),⋯,𝑇𝑠−1(𝜉)ξ,T(ξ),⋯,Ts−1(ξ) 线性无关.

由这个定理可以给出一个定义:

设 𝑇T 是空间 𝑉V 的一个线性变换,𝑊W 是 𝑉V 的一个子空间.如果存在一个向量 𝜉0ξ0 和一个正整数 𝑟r,使得:

  • 向量 𝜉0,𝑇(𝜉0),⋯,𝑇𝑟−1(𝜉0)ξ0,T(ξ0),⋯,Tr−1(ξ0) 构成 𝑊W 的一个基.
  • 如下等式成立:

𝑇𝑟(𝜉0)=0Tr(ξ0)=0

那么子空间 𝑊W 称为关于 𝑇T 的一个循环子空间,简称 𝑇T 循环子空间.此时 𝜉0ξ0 称为循环子空间 𝑊W 的一个生成向量,向量 𝜉0,𝑇(𝜉0),⋯,𝑇𝑟−1(𝜉0)ξ0,T(ξ0),⋯,Tr−1(ξ0) 称为 𝑊W 的一个循环基.

显然,一个 𝑇T 循环子空间 𝑊W 在 𝑇T 作用下不变,并且对于循环子空间 𝑊W 中的任意向量 𝜉ξ,均有 𝑇𝑟(𝜉) =0Tr(ξ)=0,这里 𝑟r 为循环子空间的维数.

幂零 Jordan 块

如果空间 𝑊W 是变换 𝑇T 的循环子空间,那么 𝑇T 在 𝑊W 上的限制 𝑇|𝑊T|W 是 𝑊W 的一个幂零变换,并且 𝑇|𝑊T|W 关于 𝑊W 的倒序排列的循环基 𝑇𝑟−1(𝜉0),𝑇𝑟−2(𝜉0),⋯,𝜉0Tr−1(ξ0),Tr−2(ξ0),⋯,ξ0 的矩阵是如下形状的 𝑟r 阶上三角矩阵:

𝑁𝑟=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝010⋯00001⋯00000⋯00⋮⋮⋮⋮⋮000⋯01000⋯00⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠Nr=(010⋯00001⋯00000⋯00⋮⋮⋮⋮⋮000⋯01000⋯00)

矩阵 𝑁𝑟Nr 称为一个 𝑟r 阶幂零 Jordan 矩阵,或者 𝑟r 阶幂零 Jordan 块.

设 𝑇T 是 𝑛n 维空间 𝑉V 的一个幂零变换,把出现在 𝑉V 关于 𝑇T 的循环子空间的分解中,唯一确定的一组正整数 𝑟1 ≥⋯ ≥𝑟𝑆r1≥⋯≥rS 叫做 𝑇T 的不变指数.

对于 𝑛n 阶幂零矩阵 𝐴A,𝐴A 与一个上述形状的矩阵 𝑁N 相似,也唯一确定一个正整数序列 𝑟1 ≥⋯ ≥𝑟𝑆r1≥⋯≥rS,称为矩阵 𝐴A 的不变指数.

幂零阵虽然不能和对角阵相似,但是可以相似于这样的标准形式.在 Jordan 标准型,将相似对角化与幂零阵的标准形式,二者结合起来,给出一般的矩阵通过相似变换可以达到的标准形式.

一些定理

  1. 设 𝑇T 是空间 𝑉V 的一个幂零变换,而

ℎ(𝑥)=𝑎0+𝑎1𝑥+⋯+𝑎𝑚𝑥𝑚h(x)=a0+a1x+⋯+amxm

是一个多项式,那么当且仅当 𝑎0 ≠0a0≠0 时,线性变换 ℎ(𝑇)h(T) 有逆变换.当 ℎ(𝑇)h(T) 可逆时,ℎ(𝑇)h(T) 的逆变换也是 𝑇T 的一个多项式.

  1. 设 𝑇T 是空间 𝑉V 的一个幂零变换,𝑊W 是一个 𝑟r 维 𝑇T 循环子空间,𝜉ξ 是 𝑊W 中的向量.如果存在一个整数 𝑘k,使得

𝑇𝑟−𝑘(𝜉)=0Tr−k(ξ)=0

那么存在 𝑊W 中的向量 𝜂η,使得

𝜉=𝑇𝑘(𝜂)ξ=Tk(η)

  1. 设 𝑇T 是 𝑛n 维空间 𝑉V 的一个幂零变换,𝑥𝑟xr 是 𝑇T 的最小多项式,令 𝑊1W1 是一个 𝑟r 维 𝑇T 循环子空间,那么存在 𝑊1W1 的一个余子空间 𝑊2W2,使得:

𝑉=𝑊1⊕𝑊2V=W1⊕W2

并且 𝑊2W2 也在 𝑇T 作用下不变.

  1. 设 𝑇T 是 𝑛n 维空间 𝑉V 的一个幂零变换,那么 𝑉V 可以分解为 𝑇T 循环子空间的直和:

𝑉=𝑊1⊕𝑊2⊕⋯⊕𝑊𝑆V=W1⊕W2⊕⋯⊕WS

  1. 每一个 𝑛n 阶幂零矩阵都与一个形如:

𝑁=⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑁𝑟10𝑁𝑟2⋯0𝑁𝑟𝑆⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠N=(Nr10Nr2⋯0NrS)

的矩阵相似,这里的每一个 𝑁𝑟𝑖Nri 是一个 𝑟𝑖ri 阶幂零 Jordan 块.

  1. 如果规定 𝑇T 循环子空间 𝑊𝑖Wi 按照维数 𝑟𝑖ri 降序排列 𝑟1 ≥⋯ ≥𝑟𝑆r1≥⋯≥rS,那么将 𝑉V 分解为 𝑇T 循环子空间的方法是由 𝑇T 唯一确定的.
本页面最近更新: 2026/1/7 08:56:54,更新历史 发现错误?想一起完善?在 GitHub 上编辑此页! 本页面贡献者:Tiphereth-A, CCXXXI, Great-designer 本页面的全部内容在CC BY-SA 4.0SATA 协议之条款下提供,附加条款亦可能应用