本地源文件：docs/math__linear-algebra__linear-mapping.md

线性映射

研究线性映射是研究线性空间之间的映射．

线性映射可以表示为矩阵的形式，所以在线性映射中矩阵中的大量概念都可以找到对应关系．

线性映射与线性变换

设 𝑉V 和 𝑊W 是域 𝐹F 上的两个线性空间，𝑇T 是 𝑉V 到 𝑊W 的一个映射．

如果对于 𝑊W 中任意的向量 𝑥x 和 𝑦y，域 𝐹F 中任意的标量 𝑘k 和 𝑙l，有：

𝑇(𝑘𝑥+𝑙𝑦)=𝑘𝑇𝑥+𝑙𝑇𝑦T(kx+ly)=kTx+lTy

称 𝑇T 是 𝑉V 到 𝑊W 的一个线性映射．如果 𝑊 =𝑉W=V，则称 𝑇T 是 𝑉V 上的一个线性变换．

例如，恒等变换 𝑇𝑒Te 保持空间不变，零变换 𝑇0T0 将空间映射至零空间．

可以记 𝐿(𝑉,𝑊)L(V,W) 为所有 𝑉V 到 𝑊W 的线性映射构成的集合．对于全体线性变换 𝐿(𝑉,𝑉)L(V,V)，也记为 𝐿(𝑉)L(V)．

性质

线性映射将零向量映射到零向量．
线性映射保持线性运算形式不变，即，线性运算的线性映射，等于线性映射的线性运算．
线性映射保持线性相关性，即，映射前线性相关，映射后也线性相关．

但是线性映射不保持线性无关性．映射前线性无关，映射后不一定线性无关．

线性映射的矩阵表示

设 𝑉V 的维数是 𝑛n，𝑉V 的一组基为 𝛼1,⋯,𝛼𝑛α1,⋯,αn，𝑊W 的维数是 𝑚m，𝑊W 的一组基为 𝛽1,⋯,𝛽𝑚β1,⋯,βm，𝑇T 是 𝑉V 到 𝑊W 的一个线性映射．

将每个 𝛼α 经由 𝑇T 映射后的向量用 𝛽β 表示：

𝑇𝛼𝑗=𝑎1𝑗𝛽1+⋯+𝑎𝑚𝑗𝛽𝑚Tαj=a1jβ1+⋯+amjβm

采用矩阵记法：

𝑇(𝛼1,⋯,𝛼𝑛)=(𝑇𝛼1,⋯,𝑇𝛼𝑛)=(𝛽1,⋯,𝛽𝑚)𝐴T(α1,⋯,αn)=(Tα1,⋯,Tαn)=(β1,⋯,βm)A

称矩阵 𝐴A 为线性映射 𝑇T 在这两组基下的矩阵表示．

线性映射的核空间与像空间

这里的核空间与像空间是站在线性映射的视角下叙述的．借助矩阵表示可以看出，线性映射的核空间与像空间与矩阵的核空间与像空间是一致的．

设 𝑇T 是由空间 𝑉V 到空间 𝑊W 的线性映射，令：

𝑁(𝑇)={𝑥∈𝑉|𝑇𝑥=0}N(T)={x∈V|Tx=0}𝑅(𝑇)=𝐼𝑚(𝑇)={𝑦∈𝑊|𝑦=𝑇𝑥,𝑉𝑥∈𝑉}R(T)=Im(T)={y∈W|y=Tx,Vx∈V}

易验证 𝑁(𝑇)N(T) 为 𝑉V 的子空间，𝑅(𝑇)R(T) 为 𝑊W 的子空间，称 𝑁(𝑇)N(T) 及 𝑅(𝑇)R(T) 为 𝑉V 的核空间和像空间，并称 𝑁(𝑇)N(T) 的维数为 𝑇T 的零度或亏，𝑅(𝑇)R(T) 的维数为 𝑇T 的秩．

定理：设 𝑇T 是由空间 𝑉V 到空间 𝑊W 的线性映射，𝑉V 的维数有限，则 𝑁(𝑇)N(T) 及 𝑅(𝑇)R(T) 均为有限维，且有：

dim⁡𝑁(𝑇)+dim⁡𝑅(𝑇)=dim⁡𝑉dim⁡N(T)+dim⁡R(T)=dim⁡V

即 𝑇T 的亏加秩等于其定义域 𝑉V 的维数．

线性变换的矩阵表示

设 𝑉V 的维数是 𝑛n，𝑉V 的一组基为 𝛼1,⋯,𝛼𝑛α1,⋯,αn，𝑇T 是 𝑉V 上的一个线性变换，则有：

𝑇𝛼𝑗=𝑎1𝑗𝛼1+⋯+𝑎𝑛𝑗𝛼𝑛Tαj=a1jα1+⋯+anjαn

采用矩阵记法：

𝑇(𝛼1,⋯,𝛼𝑛)=(𝑇𝛼1,⋯,𝑇𝛼𝑛)=(𝛼1,⋯,𝛼𝑛)𝐴T(α1,⋯,αn)=(Tα1,⋯,Tαn)=(α1,⋯,αn)A

称矩阵 𝐴A 为线性变换 𝑇T 在这组基下的矩阵表示．

由空间结构和 𝑇T 的线性性质，𝑇T 由 𝑇𝛼1,⋯,𝑇𝛼𝑛Tα1,⋯,Tαn 完全确定，故由 𝑇T 唯一确定一个矩阵 𝐴A．

定理：设 𝑉V 的维数是 𝑛n，𝛼1,⋯,𝛼𝑛α1,⋯,αn 为 𝑉V 的一组基，任取 𝑛n 阶方阵 𝐴A，有且仅有一个从 𝑉V 到 𝑉V 的线性变换 𝑇T，使得 𝑇T 的矩阵恰好为 𝐴A．

推论：在 𝐿(𝑉,𝑉)L(V,V) 和全体 𝑛n 阶方阵之间存在一一对应关系．

例如：零变换对应零矩阵，恒等变换对应单位矩阵．

线性变换构成的空间

定理：𝐿(𝑉)L(V) 也可以构成线性空间，引入 𝐿(𝑉)L(V) 中的运算：对于 𝐿(𝑉)L(V) 中任意的 𝑇1T1 与 𝑇2T2，𝑉V 中任意的 𝑥x，域 𝐹F 中任意的 𝑘k，有：

(𝑇1+𝑇2)𝑥=𝑇1𝑥+𝑇2𝑥(T1+T2)x=T1x+T2x(𝑘𝑇1)𝑥=𝑘(𝑇1𝑥)(kT1)x=k(T1x)

容易验证 𝐿(𝑉)L(V) 是 𝐹F 上的一个线性空间，即线性变换空间．

对于 𝐿(𝑉)L(V) 中的线性变换 𝑇1T1 与 𝑇2T2，定义 𝑇1T1 与 𝑇2T2 的乘积 𝑇1𝑇2T1T2 为：

(𝑇1𝑇2)𝑥=𝑇2(𝑇1𝑥)(T1T2)x=T2(T1x)

可以验证 (𝑇1𝑇2)(T1T2) 也是 𝐿(𝑉)L(V) 中的线性变换，并且线性变换的乘积满足结合律，而不满足交换律，与矩阵的乘积类似．

对于 𝐿(𝑉)L(V) 中的线性变换 𝑇1T1，如果 𝐿(𝑉)L(V) 中的线性变换 𝑇2T2，使得对于 𝑉V 中任意的向量 𝑥x，有：

(𝑇1𝑇2)𝑥=𝑇1(𝑇2𝑥)=𝑥(T1T2)x=T1(T2x)=x

则称 𝑇2T2 是 𝑇1T1 的逆变换，记作：

𝑇2=𝑇−11T2=T1−1

且有：

𝑇1𝑇2=𝑇2𝑇1=𝑇𝑒T1T2=T2T1=Te

定理：设 𝑉V 的维数为 𝑛n，𝛼1,⋯,𝛼𝑛α1,⋯,αn 为 𝑉V 的一组基，在这组基下线性变换 𝑇1T1 的矩阵为 𝐴A，𝑇2T2 的矩阵为 𝐵B，则：

线性变换 𝑇1 +𝑇2T1+T2 的矩阵为 𝐴 +𝐵A+B
线性变换的数乘 𝑘𝑇1kT1 的矩阵为 𝑘𝐴kA
线性变换的乘积 𝑇1𝑇2T1T2 的矩阵为 𝐴𝐵AB
线性变换 𝑇1T1 的逆变换若存在，矩阵为 𝐴−1A−1

坐标

设 𝑛n 个向量 𝑥x 是 𝑛n 维空间 𝑉V 的一个基，对于 𝑉V 中任意的向量 𝑦y，令 𝑦y 为：

𝑦=𝑎1𝑥1+𝑎2𝑥2+⋯+𝑎𝑛𝑥𝑛=(𝑥1,𝑥2,⋯,𝑥𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑎1𝑎2⋮𝑎𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠y=a1x1+a2x2+⋯+anxn=(x1,x2,⋯,xn)(a1a2⋮an)

称列向量：

⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑎1𝑎2⋮𝑎𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠(a1a2⋮an)

为向量 𝑦y 在基 𝑥1,𝑥2,⋯,𝑥𝑛x1,x2,⋯,xn 下的坐标．

可见，坐标是由域中的标量构成的列向量，与阿贝尔群中的向量应当进行区分．

坐标变换公式

设 𝑉V 的维数为 𝑛n，𝐿(𝑉)L(V) 中有变换 𝑇T，𝑇T 在基 𝛼1,⋯,𝛼𝑛α1,⋯,αn 下的矩阵为 𝐴A．设：

𝜉=(𝛼1,⋯,𝛼𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑥1𝑥2⋮𝑥𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠ξ=(α1,⋯,αn)(x1x2⋮xn)

且有：

𝑇𝜉=𝑇(𝛼1,⋯,𝛼𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑦1𝑦2⋮𝑦𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠Tξ=T(α1,⋯,αn)(y1y2⋮yn)

则有：

𝑇𝜉=𝑇(𝛼1,⋯,𝛼𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑦1𝑦2⋮𝑦𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=(𝛼1,⋯,𝛼𝑛)𝐴⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑥1𝑥2⋮𝑥𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠Tξ=T(α1,⋯,αn)(y1y2⋮yn)=(α1,⋯,αn)A(x1x2⋮xn)

空间 𝑉V 中的列向量点本质上都是「基乘坐标」的形式．空间 𝑉V 中的列向量点 𝑥x，本身用了单位阵 𝐼I 作为基，即 𝑥 =𝐼𝑥x=Ix．

只有同一个基，基不动的时候，单纯的线性变换 𝑇T，就是坐标左乘普通矩阵．

把线性变换 𝑇T 看成对于空间 𝑉V 的一个观测滤镜．线性变换 𝑇T 的作用对象是空间 𝑉V，将空间 𝑉V 扭曲了．加了滤镜之后，点本身的位置没有变．

这个定理也说明，对于列向量基的线性变换 𝑇T，等价于对于基右乘一个过渡矩阵．

于是，在不同的基之间，坐标关系是左乘过渡矩阵的逆矩阵．

过渡矩阵

设 𝑛n 个向量 𝑥x 与 𝑛n 个向量 𝑦y 是空间 𝑉V 的两组基．对于 1 ≤𝑖 ≤𝑛1≤i≤n，令每个向量 𝑦𝑖yi 在基 𝑥1,𝑥2,⋯,𝑥𝑛x1,x2,⋯,xn 下的坐标为：

𝑦𝑖=(𝑥1,𝑥2,⋯,𝑥𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝑎1𝑖𝑎2𝑖⋮𝑎𝑛𝑖⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠yi=(x1,x2,⋯,xn)(a1ia2i⋮ani)

于是 𝑛n 个向量 𝑦y 排成等式左边的矩阵，𝑛n 个坐标排成等式右边的矩阵 𝐴A：

(𝑦1,𝑦2,⋯,𝑦𝑛)=(𝑥1,𝑥2,⋯,𝑥𝑛)𝐴(y1,y2,⋯,yn)=(x1,x2,⋯,xn)A

矩阵 𝐴A 称为由基 𝑥1,𝑥2⋯,𝑥𝑛x1,x2⋯,xn 到基 𝑦1,𝑦2⋯,𝑦𝑛y1,y2⋯,yn 的 过渡矩阵 ，也称为变换矩阵．

显然过渡矩阵可逆．对于上式，由基 𝑦1,𝑦2⋯,𝑦𝑛y1,y2⋯,yn 到基 𝑥1,𝑥2⋯,𝑥𝑛x1,x2⋯,xn 的过渡矩阵为 𝐴−1A−1．

可见，过渡矩阵是由域中的标量构成的矩阵，并非阿贝尔群中的向量排成的矩阵，应当予以区分．

设 𝑛n 个向量 𝑥x 与 𝑛n 个向量 𝑦y 是空间 𝑉V 的两组基．对于空间 𝑉V 中的同一个向量 𝑧z，有：

𝑧=(𝑥1,𝑥2,⋯,𝑥𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜉1𝜉2⋮𝜉𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=(𝑦1,𝑦2⋯,𝑦𝑛)⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜂1𝜂2⋮𝜂𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠z=(x1,x2,⋯,xn)(ξ1ξ2⋮ξn)=(y1,y2⋯,yn)(η1η2⋮ηn)

代入上文的

(𝑦1,𝑦2⋯,𝑦𝑛)=(𝑥1,𝑥2⋯,𝑥𝑛)𝐴(y1,y2⋯,yn)=(x1,x2⋯,xn)A

由唯一性，得到：

⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜉1𝜉2⋮𝜉𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=𝐴⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜂1𝜂2⋮𝜂𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠(ξ1ξ2⋮ξn)=A(η1η2⋮ηn)

或者

⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜂1𝜂2⋮𝜂𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠=𝐴−1⎛⎜ ⎜ ⎜ ⎜ ⎜ ⎜⎝𝜉1𝜉2⋮𝜉𝑛⎞⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎠(η1η2⋮ηn)=A−1(ξ1ξ2⋮ξn)

这是纯粹坐标之间的变换，坐标变换公式均在标量域中．由于前文做了区分，线性空间与阿贝尔群中的向量是「抽象的向量」，而坐标与过渡矩阵的元素均在标量域中，视为「具体的向量」，两种向量应当视为「不同的东西」．

矩阵可以对整个空间，即全体坐标进行变换，列向量 𝑥x 作为坐标遍布整个空间．

单位矩阵 𝐼I 由单位向量构成．矩阵 𝐴A 会将单位矩阵 𝐼I 变换到矩阵 𝐴A 的每个列向量，即将单位向量变换到矩阵 𝐴A 的每个列向量．因此左乘矩阵 𝐴A，也可以视为将空间做了这样的变换．

向量左乘矩阵，也可以视为坐标左乘向量组．用坐标的观点看待就是：

𝐼𝑦=𝑋𝑎Iy=Xa

同一个列向量 𝑦y，在「正常」的空间，单位矩阵 𝐼I 代表的空间下，坐标为 𝑦y，在变换后新的空间里，坐标将记为 𝑎a．这样一来，矩阵 𝑋X 不仅是正常空间下的一组基，也是从向量组 𝐼I 到向量组 𝑋X 的过渡矩阵．

线性变换 𝑇T 会将一个基映射为另一个基，于是坐标也被映射为另一个坐标．

如果将基 𝛼α 映射到 𝛽β 对应的线性变换 𝑇T 的过渡矩阵是 𝐴A，那么对应的基矩阵就有 𝛽 =𝛼𝐴β=αA．

于是坐标的关系恰好反过来．假设线性变换 𝑇T 映射后的坐标是 𝑏b，即加滤镜后观察到坐标 𝑏b，于是点在 𝑉V 的表示就是 𝛽𝑏βb．还原的办法就是用过渡矩阵，把点在 𝑉V 的表示写成 𝛼𝐴𝑏αAb．于是坐标变换为左乘过渡矩阵的逆矩阵的看法就明显了．

线性变换与矩阵相似

在空间 𝑉V 中的一个线性变换 𝑇T 对于空间 𝑉V 的基 𝛼α 的关系：

线性变换 𝑇T 作用于基 𝛼α，将基 𝛼α 映射到了 𝑇(𝛼)T(α)，相当于在基 𝛼α 右乘一个 𝐴A，即 𝑇(𝛼) =𝛼𝐴T(α)=αA．

矩阵相似考虑的问题是：同一个线性变换 𝑇T，在基 𝛽β 的空间 𝑉V 中描述为矩阵 𝐵B，在基 𝛼α 的空间 𝑉V 中描述为矩阵 𝐴A．

如果过渡矩阵为 𝐶C，即 𝛽 =𝛼𝐶β=αC，那么两个描述 𝐵B 和 𝐴A 之间有怎样的联系．

由于是同一个变换 𝑇T，可以发现一个事实，变换前后的过渡矩阵关系始终成立，即：

𝑇(𝛽)=𝑇(𝛼)𝐶=𝛼𝐴𝐶T(β)=T(α)C=αAC

线性变换 𝑇T 在基 𝛽β 视角下仍旧为右乘，基 𝛽β 转化到基 𝛼α 再右乘一个 𝐶C，变换前后保持过渡矩阵 𝐶C 的关系：

𝑇(𝛽)=𝛽𝐵=𝛼𝐶𝐵T(β)=βB=αCB

于是问题得到解决：

𝐵=𝐶−1𝐴𝐶B=C−1AC

定理：设 𝐿(𝑉)L(V) 中有变换 𝑇T，则 𝑇T 在不同基下的矩阵相似．

对于方阵 𝐴A 和方阵 𝐵B，如果存在可逆矩阵 𝐶C 使得 𝐵 =𝐶−1𝐴𝐶B=C−1AC，则 𝐴A 和 𝐵B 相似．

矩阵相似保持秩不变，因此矩阵相似可以推出矩阵等价．但是，等价的两个矩阵未必相似．

由于矩阵相似与形状密切相关，因此矩阵相似和向量组等价、方程组同解之间没有关系．

回过头来，矩阵相似的解释就是 4 个等式：𝛽 =𝛼𝐶β=αC、𝑇(𝛼) =𝛼𝐴T(α)=αA、𝑇(𝛽) =𝛽𝐵T(β)=βB、𝑇(𝛽) =𝑇(𝛼)𝐶T(β)=T(α)C．

参考资料

【官方双语/合集】线性代数的本质 - 系列合集 P13 09 - 基变换

本页面最近更新： 2026/1/7 08:56:54，更新历史 发现错误？想一起完善？在 GitHub 上编辑此页！ 本页面贡献者：Tiphereth-A, aofall, CCXXXI, CoelacanthusHex, Great-designer, Larry0716, Marcythm, Persdre, shuzhouliu 本页面的全部内容在CC BY-SA 4.0 和 SATA 协议之条款下提供，附加条款亦可能应用