线性映射

数学 / 线性代数

本地源文件:docs/math__linear-algebra__linear-mapping.md

线性映射

研究线性映射是研究线性空间之间的映射.

线性映射可以表示为矩阵的形式,所以在线性映射中矩阵中的大量概念都可以找到对应关系.

线性映射与线性变换

设 𝑉V 和 𝑊W 是域 𝐹F 上的两个线性空间,𝑇T 是 𝑉V 到 𝑊W 的一个映射.

如果对于 𝑊W 中任意的向量 𝑥x 和 𝑦y,域 𝐹F 中任意的标量 𝑘k 和 𝑙l,有:

𝑇(𝑘𝑥+𝑙𝑦)=𝑘𝑇𝑥+𝑙𝑇𝑦T(kx+ly)=kTx+lTy

称 𝑇T 是 𝑉V 到 𝑊W 的一个线性映射.如果 𝑊 =𝑉W=V,则称 𝑇T 是 𝑉V 上的一个线性变换.

例如,恒等变换 𝑇𝑒Te 保持空间不变,零变换 𝑇0T0 将空间映射至零空间.

可以记 𝐿(𝑉,𝑊)L(V,W) 为所有 𝑉V 到 𝑊W 的线性映射构成的集合.对于全体线性变换 𝐿(𝑉,𝑉)L(V,V),也记为 𝐿(𝑉)L(V)

性质

  • 线性映射将零向量映射到零向量.
  • 线性映射保持线性运算形式不变,即,线性运算的线性映射,等于线性映射的线性运算.
  • 线性映射保持线性相关性,即,映射前线性相关,映射后也线性相关.

但是线性映射不保持线性无关性.映射前线性无关,映射后不一定线性无关.

线性映射的矩阵表示

设 𝑉V 的维数是 𝑛n,𝑉V 的一组基为 𝛼1,⋯,𝛼𝑛α1,⋯,αn,𝑊W 的维数是 𝑚m,𝑊W 的一组基为 𝛽1,⋯,𝛽𝑚β1,⋯,βm,𝑇T 是 𝑉V 到 𝑊W 的一个线性映射.

将每个 𝛼α 经由 𝑇T 映射后的向量用 𝛽β 表示:

𝑇𝛼𝑗=𝑎1𝑗𝛽1+⋯+𝑎𝑚𝑗𝛽𝑚Tαj=a1jβ1+⋯+amjβm

采用矩阵记法:

𝑇(𝛼1,⋯,𝛼𝑛)=(𝑇𝛼1,⋯,𝑇𝛼𝑛)=(𝛽1,⋯,𝛽𝑚)𝐴T(α1,⋯,αn)=(Tα1,⋯,Tαn)=(β1,⋯,βm)A

称矩阵 𝐴A 为线性映射 𝑇T 在这两组基下的矩阵表示.

线性映射的核空间与像空间

这里的核空间与像空间是站在线性映射的视角下叙述的.借助矩阵表示可以看出,线性映射的核空间与像空间与矩阵的核空间与像空间是一致的.

设 𝑇T 是由空间 𝑉V 到空间 𝑊W 的线性映射,令:

𝑁(𝑇)={𝑥∈𝑉|𝑇𝑥=0}N(T)={x∈V|Tx=0}𝑅(𝑇)=𝐼𝑚(𝑇)={𝑦∈𝑊|𝑦=𝑇𝑥,𝑉𝑥∈𝑉}R(T)=Im(T)={y∈W|y=Tx,Vx∈V}

易验证 𝑁(𝑇)N(T) 为 𝑉V 的子空间,𝑅(𝑇)R(T) 为 𝑊W 的子空间,称 𝑁(𝑇)N(T) 及 𝑅(𝑇)R(T) 为 𝑉V 的核空间和像空间,并称 𝑁(𝑇)N(T) 的维数为 𝑇T零度 ,𝑅(𝑇)R(T) 的维数为 𝑇T

定理:设 𝑇T 是由空间 𝑉V 到空间 𝑊W 的线性映射,𝑉V 的维数有限,则 𝑁(𝑇)N(T) 及 𝑅(𝑇)R(T) 均为有限维,且有:

dim⁡𝑁(𝑇)+dim⁡𝑅(𝑇)=dim⁡𝑉dim⁡N(T)+dim⁡R(T)=dim⁡V

即 𝑇T 的亏加秩等于其定义域 𝑉V 的维数.

线性变换的矩阵表示

设 𝑉V 的维数是 𝑛n,𝑉V 的一组基为 𝛼1,⋯,𝛼𝑛α1,⋯,αn,𝑇T 是 𝑉V 上的一个线性变换,则有:

𝑇𝛼𝑗=𝑎1𝑗𝛼1+⋯+𝑎𝑛𝑗𝛼𝑛Tαj=a1jα1+⋯+anjαn

采用矩阵记法:

𝑇(𝛼1,⋯,𝛼𝑛)=(𝑇𝛼1,⋯,𝑇𝛼𝑛)=(𝛼1,⋯,𝛼𝑛)𝐴T(α1,⋯,αn)=(Tα1,⋯,Tαn)=(α1,⋯,αn)A

称矩阵 𝐴A 为线性变换 𝑇T 在这组基下的矩阵表示.

由空间结构和 𝑇T 的线性性质,𝑇T 由 𝑇𝛼1,⋯,𝑇𝛼𝑛Tα1,⋯,Tαn 完全确定,故由 𝑇T 唯一确定一个矩阵 𝐴A

定理:设 𝑉V 的维数是 𝑛n,𝛼1,⋯,𝛼𝑛α1,⋯,αn 为 𝑉V 的一组基,任取 𝑛n 阶方阵 𝐴A,有且仅有一个从 𝑉V 到 𝑉V 的线性变换 𝑇T,使得 𝑇T 的矩阵恰好为 𝐴A

推论:在 𝐿(𝑉,𝑉)L(V,V) 和全体 𝑛n 阶方阵之间存在一一对应关系.

例如:零变换对应零矩阵,恒等变换对应单位矩阵.

线性变换构成的空间

定理:𝐿(𝑉)L(V) 也可以构成线性空间,引入 𝐿(𝑉)L(V) 中的运算:对于 𝐿(𝑉)L(V) 中任意的 𝑇1T1 与 𝑇2T2,𝑉V 中任意的 𝑥x,域 𝐹F 中任意的 𝑘k,有:

(𝑇1+𝑇2)𝑥=𝑇1𝑥+𝑇2𝑥(T1+T2)x=T1x+T2x(𝑘𝑇1)𝑥=𝑘(𝑇1𝑥)(kT1)x=k(T1x)

容易验证 𝐿(𝑉)L(V) 是 𝐹F 上的一个线性空间,即线性变换空间.

对于 𝐿(𝑉)L(V) 中的线性变换 𝑇1T1 与 𝑇2T2,定义 𝑇1T1 与 𝑇2T2 的乘积 𝑇1𝑇2T1T2 为:

(𝑇1𝑇2)𝑥=𝑇2(𝑇1𝑥)(T1T2)x=T2(T1x)

可以验证 (𝑇1𝑇2)(T1T2) 也是 𝐿(𝑉)L(V) 中的线性变换,并且线性变换的乘积满足结合律,而不满足交换律,与矩阵的乘积类似.

对于 𝐿(𝑉)L(V) 中的线性变换 𝑇1T1,如果 𝐿(𝑉)L(V) 中的线性变换 𝑇2T2,使得对于 𝑉V 中任意的向量 𝑥x,有:

(𝑇1𝑇2)𝑥=𝑇1(𝑇2𝑥)=𝑥(T1T2)x=T1(T2x)=x

则称 𝑇2T2 是 𝑇1T1 的逆变换,记作:

𝑇2=𝑇−11T2=T1−1

且有:

𝑇1𝑇2=𝑇2𝑇1=𝑇𝑒T1T2=T2T1=Te

定理:设 𝑉V 的维数为 𝑛n,𝛼1,⋯,𝛼𝑛α1,⋯,αn 为 𝑉V 的一组基,在这组基下线性变换 𝑇1T1 的矩阵为 𝐴A,𝑇2T2 的矩阵为 𝐵B,则:

  • 线性变换 𝑇1 +𝑇2T1+T2 的矩阵为 𝐴 +𝐵A+B
  • 线性变换的数乘 𝑘𝑇1kT1 的矩阵为 𝑘𝐴kA
  • 线性变换的乘积 𝑇1𝑇2T1T2 的矩阵为 𝐴𝐵AB
  • 线性变换 𝑇1T1 的逆变换若存在,矩阵为 𝐴−1A−1

坐标

设 𝑛n 个向量 𝑥x 是 𝑛n 维空间 𝑉V 的一个基,对于 𝑉V 中任意的向量 𝑦y,令 𝑦y 为:

𝑦=𝑎1𝑥1+𝑎2𝑥2+⋯+𝑎𝑛𝑥𝑛=(𝑥1,𝑥2,⋯,𝑥𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑎1𝑎2⋮𝑎𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠y=a1x1+a2x2+⋯+anxn=(x1,x2,⋯,xn)(a1a2⋮an)

称列向量:

⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑎1𝑎2⋮𝑎𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠(a1a2⋮an)

为向量 𝑦y 在基 𝑥1,𝑥2,⋯,𝑥𝑛x1,x2,⋯,xn 下的 坐标

可见,坐标是由域中的标量构成的列向量,与阿贝尔群中的向量应当进行区分.

坐标变换公式

设 𝑉V 的维数为 𝑛n,𝐿(𝑉)L(V) 中有变换 𝑇T,𝑇T 在基 𝛼1,⋯,𝛼𝑛α1,⋯,αn 下的矩阵为 𝐴A.设:

𝜉=(𝛼1,⋯,𝛼𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑥1𝑥2⋮𝑥𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠ξ=(α1,⋯,αn)(x1x2⋮xn)

且有:

𝑇𝜉=𝑇(𝛼1,⋯,𝛼𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑦1𝑦2⋮𝑦𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠Tξ=T(α1,⋯,αn)(y1y2⋮yn)

则有:

𝑇𝜉=𝑇(𝛼1,⋯,𝛼𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑦1𝑦2⋮𝑦𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=(𝛼1,⋯,𝛼𝑛)𝐴⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑥1𝑥2⋮𝑥𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠Tξ=T(α1,⋯,αn)(y1y2⋮yn)=(α1,⋯,αn)A(x1x2⋮xn)

空间 𝑉V 中的列向量点本质上都是「基乘坐标」的形式.空间 𝑉V 中的列向量点 𝑥x,本身用了单位阵 𝐼I 作为基,即 𝑥 =𝐼𝑥x=Ix

只有同一个基,基不动的时候,单纯的线性变换 𝑇T,就是坐标左乘普通矩阵.

把线性变换 𝑇T 看成对于空间 𝑉V 的一个观测滤镜.线性变换 𝑇T 的作用对象是空间 𝑉V,将空间 𝑉V 扭曲了.加了滤镜之后,点本身的位置没有变.

这个定理也说明,对于列向量基的线性变换 𝑇T,等价于对于基右乘一个过渡矩阵.

于是,在不同的基之间,坐标关系是左乘过渡矩阵的逆矩阵.

过渡矩阵

设 𝑛n 个向量 𝑥x 与 𝑛n 个向量 𝑦y 是空间 𝑉V 的两组基.对于 1 ≤𝑖 ≤𝑛1≤i≤n,令每个向量 𝑦𝑖yi 在基 𝑥1,𝑥2,⋯,𝑥𝑛x1,x2,⋯,xn 下的坐标为:

𝑦𝑖=(𝑥1,𝑥2,⋯,𝑥𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑎1𝑖𝑎2𝑖⋮𝑎𝑛𝑖⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠yi=(x1,x2,⋯,xn)(a1ia2i⋮ani)

于是 𝑛n 个向量 𝑦y 排成等式左边的矩阵,𝑛n 个坐标排成等式右边的矩阵 𝐴A

(𝑦1,𝑦2,⋯,𝑦𝑛)=(𝑥1,𝑥2,⋯,𝑥𝑛)𝐴(y1,y2,⋯,yn)=(x1,x2,⋯,xn)A

矩阵 𝐴A 称为由基 𝑥1,𝑥2⋯,𝑥𝑛x1,x2⋯,xn 到基 𝑦1,𝑦2⋯,𝑦𝑛y1,y2⋯,yn过渡矩阵 ,也称为变换矩阵.

显然过渡矩阵可逆.对于上式,由基 𝑦1,𝑦2⋯,𝑦𝑛y1,y2⋯,yn 到基 𝑥1,𝑥2⋯,𝑥𝑛x1,x2⋯,xn 的过渡矩阵为 𝐴−1A−1

可见,过渡矩阵是由域中的标量构成的矩阵,并非阿贝尔群中的向量排成的矩阵,应当予以区分.

设 𝑛n 个向量 𝑥x 与 𝑛n 个向量 𝑦y 是空间 𝑉V 的两组基.对于空间 𝑉V 中的同一个向量 𝑧z,有:

𝑧=(𝑥1,𝑥2,⋯,𝑥𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜉1𝜉2⋮𝜉𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=(𝑦1,𝑦2⋯,𝑦𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜂1𝜂2⋮𝜂𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠z=(x1,x2,⋯,xn)(ξ1ξ2⋮ξn)=(y1,y2⋯,yn)(η1η2⋮ηn)

代入上文的

(𝑦1,𝑦2⋯,𝑦𝑛)=(𝑥1,𝑥2⋯,𝑥𝑛)𝐴(y1,y2⋯,yn)=(x1,x2⋯,xn)A

由唯一性,得到:

⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜉1𝜉2⋮𝜉𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=𝐴⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜂1𝜂2⋮𝜂𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠(ξ1ξ2⋮ξn)=A(η1η2⋮ηn)

或者

⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜂1𝜂2⋮𝜂𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=𝐴−1⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜉1𝜉2⋮𝜉𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠(η1η2⋮ηn)=A−1(ξ1ξ2⋮ξn)

这是纯粹坐标之间的变换,坐标变换公式均在标量域中.由于前文做了区分,线性空间与阿贝尔群中的向量是「抽象的向量」,而坐标与过渡矩阵的元素均在标量域中,视为「具体的向量」,两种向量应当视为「不同的东西」.

矩阵可以对整个空间,即全体坐标进行变换,列向量 𝑥x 作为坐标遍布整个空间.

单位矩阵 𝐼I 由单位向量构成.矩阵 𝐴A 会将单位矩阵 𝐼I 变换到矩阵 𝐴A 的每个列向量,即将单位向量变换到矩阵 𝐴A 的每个列向量.因此左乘矩阵 𝐴A,也可以视为将空间做了这样的变换.

向量左乘矩阵,也可以视为坐标左乘向量组.用坐标的观点看待就是:

𝐼𝑦=𝑋𝑎Iy=Xa

同一个列向量 𝑦y,在「正常」的空间,单位矩阵 𝐼I 代表的空间下,坐标为 𝑦y,在变换后新的空间里,坐标将记为 𝑎a.这样一来,矩阵 𝑋X 不仅是正常空间下的一组基,也是从向量组 𝐼I 到向量组 𝑋X 的过渡矩阵.

线性变换 𝑇T 会将一个基映射为另一个基,于是坐标也被映射为另一个坐标.

如果将基 𝛼α 映射到 𝛽β 对应的线性变换 𝑇T 的过渡矩阵是 𝐴A,那么对应的基矩阵就有 𝛽 =𝛼𝐴β=αA

于是坐标的关系恰好反过来.假设线性变换 𝑇T 映射后的坐标是 𝑏b,即加滤镜后观察到坐标 𝑏b,于是点在 𝑉V 的表示就是 𝛽𝑏βb.还原的办法就是用过渡矩阵,把点在 𝑉V 的表示写成 𝛼𝐴𝑏αAb.于是坐标变换为左乘过渡矩阵的逆矩阵的看法就明显了.

线性变换与矩阵相似

在空间 𝑉V 中的一个线性变换 𝑇T 对于空间 𝑉V 的基 𝛼α 的关系:

线性变换 𝑇T 作用于基 𝛼α,将基 𝛼α 映射到了 𝑇(𝛼)T(α),相当于在基 𝛼α 右乘一个 𝐴A,即 𝑇(𝛼) =𝛼𝐴T(α)=αA

矩阵相似考虑的问题是:同一个线性变换 𝑇T,在基 𝛽β 的空间 𝑉V 中描述为矩阵 𝐵B,在基 𝛼α 的空间 𝑉V 中描述为矩阵 𝐴A

如果过渡矩阵为 𝐶C,即 𝛽 =𝛼𝐶β=αC,那么两个描述 𝐵B 和 𝐴A 之间有怎样的联系.

由于是同一个变换 𝑇T,可以发现一个事实,变换前后的过渡矩阵关系始终成立,即:

𝑇(𝛽)=𝑇(𝛼)𝐶=𝛼𝐴𝐶T(β)=T(α)C=αAC

线性变换 𝑇T 在基 𝛽β 视角下仍旧为右乘,基 𝛽β 转化到基 𝛼α 再右乘一个 𝐶C,变换前后保持过渡矩阵 𝐶C 的关系:

𝑇(𝛽)=𝛽𝐵=𝛼𝐶𝐵T(β)=βB=αCB

于是问题得到解决:

𝐵=𝐶−1𝐴𝐶B=C−1AC

定理:设 𝐿(𝑉)L(V) 中有变换 𝑇T,则 𝑇T 在不同基下的矩阵 相似

对于方阵 𝐴A 和方阵 𝐵B,如果存在可逆矩阵 𝐶C 使得 𝐵 =𝐶−1𝐴𝐶B=C−1AC,则 𝐴A 和 𝐵B 相似.

矩阵相似保持秩不变,因此矩阵相似可以推出矩阵等价.但是,等价的两个矩阵未必相似.

由于矩阵相似与形状密切相关,因此矩阵相似和向量组等价、方程组同解之间没有关系.

回过头来,矩阵相似的解释就是 4 个等式:𝛽 =𝛼𝐶β=αC、𝑇(𝛼) =𝛼𝐴T(α)=αA、𝑇(𝛽) =𝛽𝐵T(β)=βB、𝑇(𝛽) =𝑇(𝛼)𝐶T(β)=T(α)C

参考资料

本页面最近更新: 2026/1/7 08:56:54,更新历史 发现错误?想一起完善?在 GitHub 上编辑此页! 本页面贡献者:Tiphereth-A, aofall, CCXXXI, CoelacanthusHex, Great-designer, Larry0716, Marcythm, Persdre, shuzhouliu 本页面的全部内容在CC BY-SA 4.0SATA 协议之条款下提供,附加条款亦可能应用