第2讲 线性变换
第2讲 线性变换
内容:1. 线性变换
2. 线性变换的矩阵表示,特征值与特征向量 3. 线性变换的值域、核及不变子空间
线性空间是某类客观事物从量的方面的一个抽象,线性空间V中自身到自身的一种线性映射称为V的一个线性变换,线性变换研究线性空间中元素之间的最基本联系.介绍线性变换的基本概念并讨论它与矩阵之间的联系.
§1 线性变换 1 线性变换
T是V到自身V的定义1.1 设V是数域P上的线性空间,
一个映射,即对于V中的任意元素x均存在唯一的y∈V与之对应,则称T为V的一个变换或算子,记为T(x)=y,称y为x在变换T下的象,x为y的原象.若映射T还满足:
T(kx+ly)=kT(x)+lT(y),∀x,y∈V,k,l∈P,
称T为V的线性变换.
例
⎧⎡ξ1⎤⎫
1.1 二维实向量空间R=⎨⎢⎥ξi∈R,i=1,2⎬,将其绕原
ξ⎩⎣2⎦⎭
2
点旋转θ角的操作就是一个线性变换.
证明: x=⎢
⎡ξ1⎤⎡η1⎤⎧η1=ξ1cosθ-ξ2sinθ
y=T(x)=, , ⎨⎥⎢η⎥
⎣ξ2⎦⎣2⎦⎩η2=ξ1sinθ+ξ2cosθ
,
⎡η1⎤⎡cosθ
⎢⎥=⎢
⎣η2⎦⎣sinθ-sinθ⎤⎡ξ1⎤
∈R2。可见该操作T⎢⎥⎥cosθ⎦⎣ξ2⎦
为变换,下面
证明其为线性变换.
⎡x⎤⎡z⎤⎡kx⎤⎡lz⎤⎡kx+lz1⎤
∀x=⎢1⎥,z=⎢1⎥∈R2,k,l∈R,kx+lz=⎢1⎥+⎢1⎥=⎢1⎥, xzkxlzkx+lz2⎦⎣2⎦⎣2⎦⎣2⎦⎣2⎦⎣2⎡cosθ-sinθ⎤⎡kx1+lz1⎤T(kx+ly)=⎢⎥⎥⎢
⎣sinθcosθ⎦⎣kx2+lz2⎦
⎡cosθ-sinθ⎤⎡x1⎤⎡cosθ-sinθ⎤⎡z1⎤
, =k⎢+l⎢⎢⎥⎢⎥⎥⎥
⎣sinθcosθ⎦⎣x2⎦⎣sinθcosθ⎦⎣z2⎦=kT(x)+lT(z)
所以, T是线性变换. 2 几种常用的线性变换
1)单位变换
把线性空间V的任一向量都变为其自身的变换称为单位变换或恒等变换,记为 Te,即:Te(x)=x,
2)零变换
把线性空间V中的任一向量都变为零向量的变换称为零变换,记为 T0,即T0(x)=0,∀x∈V.
3)变换相等
∀x∈V.
如果T1,T2是V的两个变换,∀x∈V,均有T1(x)=T2(x),则称变换T1与T2相等,记为T1=T2.
4)满秩(线性)变换
若(线性)变换T将所有的线性无关元素组仍变换为线性无关的元素组,则称之为满秩(线性)变换.
5) 变换的和T1+T2,∀x∈V,(T1+T2)(x)=T1(x)+T2(x),则
T=T1+T2.
6) 变换的数乘kT:∀x∈V,(kT)(x)=kT(x). 7) 负变换:(-T)(x)=-T(x).
8) 变换的乘积T1T2:∀x∈V,(T1T2)(x)=T1(T2(x)). 9) 逆变换T-1:∀x∈V,若存在变换S使得(ST)(x)≡x,则称S为T的逆变换S=T-1.
10) 变换的多项式:Tn=TT T,并规定T0=Te;
n
f(t)=∑ant
n=0
N
n
→ f(T)=∑anT →
n
n=0
N
f(T)(x)=∑anTn(x).
n=0
N
说明:变换的乘积不满足交换律;只有满秩变换才有逆变换,ST=Te. 3 线性变换的性质
1)线性变换把零元素仍变为零元素 2)负元素的象为原来元素的象的负元素
3)线性变换把线性相关的元素组仍变为线性相关的元素组.
注意,线性无关的元素组经过线性变换不一定是线性无
关的,变换后的情况与元素组和线性变换有关. §2 线性变换的矩阵表示、特征值与特征向量
有限维线性空间的任一元素(向量)都可由基元素(向量)唯一线性表示,元素(向量)可以用坐标表示出来,通过坐标把线性变换用矩阵表示出来,从而可把比较抽象的线性变换转化为具体的矩阵来处理. 1 线性变换的矩阵表示
设T是线性空间Vn的一个线性变换,且{x1,x2, ,xn}是Vn的一个基,
x=∑ξixi=[x1
i=1n
∀x∈Vn
,则存在唯一的坐标表示
x2
⎡ξ1⎤⎢ξ⎥
xn]⎢2⎥,有
⎢ ⎥⎢⎥⎣ξn⎦
T(x)=T(ξ1x1+ξ2x2+ +ξnxn)
⎡ξ1⎤⎡ξ1⎤⎢ξ⎥⎢ξ⎥2
=[T(x1)T(x2) T(xn)]⎢⎥=T(x1x2 xn)⎢2⎥,
⎢ ⎥⎢ ⎥⎢⎥⎢⎥ξ⎣n⎦⎣ξn⎦
要确定线性变换T,只需确定基元素在该变换下的象就可以了.
定义
⎡a1i⎤
⎢a⎥
2.1 设T(xi)=[x1x2 xn]⎢2i⎥,
⎢ ⎥⎢⎥⎣ani⎦
⎡a11⎢a xn]⎢21
⎢ ⎢⎣an1
a12a22 an2
a1n⎤ a2n⎥⎥=[xx x]A, 12n ⎥
⎥
ann⎦
T(x1,x2, ,xn)=[x1
x2
对于任意元素x,在该基下,变换后T(x)的坐标表示为
⎡η1⎤⎡ξ1⎤⎡ξ1⎤⎢η⎥⎢ξ⎥⎢ξ⎥
T(x)=[x1x2 xn]⎢2⎥,即T(x)=T(x1,x2, ,xn)⎢2⎥=[x1,x2, ,xn]A⎢2⎥,
⎢ ⎥⎢ ⎥⎢ ⎥⎢⎥⎢⎥⎢⎥ηξ⎣n⎦⎣n⎦⎣ξn⎦⎡η1⎤
⎢η⎥
可知:⎢2⎥=
⎢ ⎥⎢⎥⎣ηn⎦
⎡ξ1⎤⎢ξ⎥
A⎢2⎥,即: x⎢ ⎥⎢⎥⎣ξn⎦
⎡ξ1⎤⎢ξ⎥
⎢2⎥,T(x)⎢ ⎥⎢⎥⎣ξn⎦
⎡ξ1⎤⎢ξ⎥
A⎢2⎥,把A称为T⎢ ⎥⎢⎥⎣ξn⎦
在基
{x1,x2, ,xn}下的矩阵表示.
定理2.1 设{x1,x2, ,xn}是Vn的一个基,T1、T2在该基下的矩阵分别为A、B.则有 (1)(T1+T2)[x1(2)(kT1)[x1(3)(T1T2)[x1(4)T-1[x1
x2 xn]=[x1x2 xn](A+B)
x2 xn]=[x1x2 xn](kA) x2 xn]=[x1x2 xn](AB)
x2 xn]=[x1x2 xn]A-1
m
推论2.1 设f(t)=∑aiti为纯量t的m次多项式,T为线
i=0
性空间Vn的一个线性变换,且在Vn的基{x1,x2, ,xn}下的矩阵表示为A,则f(T)[x1
A0=I.
x2 xn]=[x1x2 xn]f(A),其中f(A)=∑aiAi,
i=0
m
推论2.2 设线性变换T在Vn的基{x1,x2, ,xn}下的矩阵表示为A,元素x在该基下的坐标为(ξ1,ξ2, ,ξn),则T(x)在该基
⎡η1⎤⎢η⎥
下的坐标(η1,η2, ,ηn)满足 ⎢2⎥=
⎢ ⎥⎢⎥⎣ηn⎦⎡ξ1⎤⎢ξ⎥
A⎢2⎥ . ⎢ ⎥⎢⎥⎣ξn⎦
定理2.2 设T在Vn的两个基{x1,x2, ,xn}及{y1,y2, ,yn}的矩阵分别为A和B,且[y1
则B=C-1AC.y2 yn]=[x1x2 xn]C,
即A和B相似,记为A~B.
线性变换在不同基下的矩阵是相似的;反之,如果两个矩阵相似,那么它们可以看成同一个线性变换在两组不同基下的矩阵.
定理2.3 n阶方阵A和B相似的充要条件是A和B为同一线性变换在不同基下的矩阵表示. 2 特征值与特征向量
定义2.2 设T是数域P上线性空间V中的线性变换.如果对于数域P中某一数λ,存在非零向量α,使得
T(α)=λα
. (1)
则称λ为T的一个特征值,而α称为T的对应于特征值λ的一个特征向量.
式(1)表明,在几何上,特征向量α的方位,经过线性变换后保持不变.特征向量不是被特征值惟一确定;但是,特征值却被特征向量惟一确定.
设x1,x2, ,xn是线性空间Vn的基,线性变换T在该基下的矩阵表示是A=(aij).令λ0是T的特征值,属于λ0的特征向量
x=ξ1x1+ξ2x2+ +ξnxn
,则由式(1)知T(x)及λ0x的坐标分别是
⎡ξ1⎤⎡ξ1⎤⎡ξ1⎤⎡ξ1⎤⎢ξ⎥⎢ξ⎥⎢ξ⎥⎢ξ⎥
A⎢2⎥,λ0⎢2⎥,有A⎢2⎥=λ0⎢2⎥,即 ⎢ ⎥⎢ ⎥⎢ ⎥⎢ ⎥⎢⎥⎢⎥⎢⎥⎢⎥ξξξ⎣n⎦⎣n⎦⎣n⎦⎣ξn⎦
⎡ξ1⎤
⎢ξ⎥
(λ0E-A)⎢2⎥=0, (2)
⎢ ⎥⎢⎥⎣ξn⎦
由于x≠0,因此,ξ1,ξ2, ,ξn不全为零,从而就有
λ0-a11
det(λ0E-A)=
-a21 -an1
-a12 -an2
-a1n-a2n
λ0-ann
=0
λ0-a22
定义2.3 设A=(aij)是数域P上的n阶矩阵,λ是参数,称
A
的特征
-a12 -an2
矩
-a1n
阵
λE-A
的
A
行列式
λ-a11
-a21
det(λE-A)=
-an1
λ-a22
-a2n
=ϕ(λ)
为矩阵的特征多项
λ-ann
式.它是P上的一个n次多项式.ϕ(λ)的根(或零点) λ0,即
ϕ(λ)=0,称为A的特征值(根);而相应于方程组(2)的非零
解向量(ξ1,ξ2, ,ξn)T称为A的属于特征值λ0的特征向量.
说明:如果λ0是线性变换的特征值,那么λ0必定是矩阵A的特征多项式ϕ(λ)=det(λE-A)的一个根;反之,如果λ0是ϕ(λ)在数域P中的一个根,即有ϕ(λ0)=det(λ0E-A)=0,那么齐次线性方程组(2)就有非零解.于是非零向量x=ξ1x1+ξ2x2+ +ξnxn就满足式(1),从而λ0是T的特征值,所x是T的属于λ0的特征向量.
以,欲求线性变换T的特征值和特征向量,只要求出T的矩阵A的特征值和特征向量就行了.换言之,T的特征值与A的特征值相一致,而T的特征向量在Vn的基下的坐标(列向量)与A的特征向量相一致.因此,计算特征值和特征向量的步骤如下:
第一步:取定数域P上的线性空间Vn的一个基,写出线性变换T在该基下的矩阵A;第二步:求出A的特征多项式ϕ(λ)在数域P上的全部根,它们就是T的全部特征值;第三步:把求得的特征值逐个代入方程组(2),解出矩阵A属于每个特征值的全部线性无关的特征向量.第四步:以A的属于每个特征值的特征向量为Vn中取定基下的坐标,即得T的相应特征向量.
例2.1 设线性变换T在V3的基x1,x2,x3下的矩阵是
⎛122⎫
⎪
A= 212⎪,求T
221⎪⎝⎭
的特征值和特征向量.
解 容易算出A的特征多项式是
λ-1
-2
-2
-2=(λ+1)(λ-5).
λ-1
2
ϕ(λ)=det(λE-A)=-2
-2
λ-1
-2
因此,T的特征值是λ1=一1(二重特征值)和λ2=5.特征方程(λ1E-A)x=0的一个基础解系为:(1,0,-1)T,(0,1,-1)T ,T的属于λ1的
T的属于λ1的两个线性无关的特征向量为y1=x1-x3,y2=x2-x3,
全体特征向量为:k1y1+k2y2 ,(k1,k2∈P不同时为零);特征方程
(λ2E-A)x=0的一个基础解系为(1,1,1)T,记y3=x1+x2+x3,则T的
属于λ2的全体特征向量为:k3y3,(k3∈P不等于零).
定理2.4 对于线性空间Vn的线性变换T的任一特征值
λ0,T
的属于λ0的全部特征向量,再添上零向量所构成的集
合Vλ
={x(x)=λ0x,x∈Vn}是Vn的一个线性子空间.
事实上,设x,y∈Vλ,则有T(x)=λ0x,T(y)=λ0y;于是:
T(x+y)=T(x)+T(y)=λ0x+λ0y=λ0(x+y),T(kx)=k(Tx)=k(λ0x)=λ0(kx),
这就是说明x+y与kx均属于Vλ.
§3 线性变换的值域、核及不变子空间 1 线性变换的值域和核
定义3.1 设数域P上的线性空间Vn和Vm,T是 Vn到Vm
的一个线性映射,T的全体像组成的集合称为T的值域,用
R(T)表示,也称为T
的像空间,记为TVn,即
R(T)=TVn=T(α)∈Vn⊂Vm;
{}
所有被T变成零元素(零向量)的元素(向量)构成的集合称为T的核,记为ker(T)或T-1(0),有时也称ker(T)为T的零空间,记为N(T),即
N(T)=ker(T)=α(α)=0,α∈Vn⊂Vn.
{}
当T是线性变换时,称R(T)和N(T)分别为线性变换T的值域和核.
可以证明,R(T)和N(T)分别是Vm和Vn的线性子空间. 定义3.2 称R(T)的维数dimR(T)为线性变换T的秩,记为
r(T);称N(T)null(T).
的维数dimN(T)称为线性变换T的零度,记为
例
⎛110⎫ ⎪
3.1 设T(x)=Ax,A= 110⎪,求T
001⎪⎝⎭
的值域和核.
解 令 A={A1,A2,A3},x=(x1,x2,x3)T,
T
T
其中A1=(1,1,0);A3=(0,0,1)R(T)={x1A1+x2A2+x3A3}=span(A1,A3),
Ax=0的x=(1,-1,0)T=kα,故N(T)=span{α}.
.满足
2 线性变换的不变子空间
定义3.3 如果T是线性空间V的线性变换,V1是V的子空间,并且对于任意一个x∈V1,都有T(x)∈V1,则称V1是T的不变子空间.
定义3.4 以Cm表示全体m维复向量在复数域C上构成的线性空间,A为m⨯n复矩阵,其列(向量)为α1,α2, ,αn.显然,αi∈Cm,i=1,2, ,n.子空间span(α1,α2, ,αn)称为矩阵A的列空间(值域),记作R(A),即
R(A)=span(α1,α2, ,αn).
记
A=(α1,α2, ,αn)
,
y=(y1,y2, ,yn)∈Cn
T
.则
R(A)
可表成
R(A)=Ayy∈Cn
{}.
显然,A的秩等于A的值域的维数,即rank(A)=dimR(A). 定义3.5 设A为m⨯n复矩阵,称线性方程组Ax=0在复数域上的解空间为
N(A)={xAx=0}.
A
的化零空间(核),记作N(A),即
显然,N(A)是Cn的一个子空间,称N(A)的维数为A的零度,即null(A)=dimN(A).
定理3.1 (1)dimR(T)+dimN(T)=dimVn (2)dimR(A)=rank(A)
(3)dimR(A)+dimN(A)=n,n为A的列数.
例3.2 设A=⎛
112⎫
⎪⎪,求null(A). 1-13⎝⎭
解 由Ax=0解得x=k(-5,1,2)T,故null(A)=1. 定理3.2 设A为m⨯n矩阵,则rank(A)+null(A)=n. 证明 因为齐次线性方程组Ax=0的解空间的维数(基础解系包含的线性无关向量的个数)为n-rank(A),故上式成立.
下面给出怎样利用不变子空间的概念将线性变换的矩阵简化为简单的准对角矩阵或对角矩阵.
假设S={α1,α2, ,αk}是T的不变子空间W的一个基,可以将
S扩充为V的一个基S={α1,α2, ,αk,αk+1, ,αn}.T是V上的一个线
~
~
性变换.对S中的每个基向量αj,T(αj)∈W,可以表示成
T(α1)=a11α1+ +ak1αk
T(αk)=a1kkα1+ +akkαk
T(αk+1)=a1k+1α1+ +akk+1αk+ak+1k+1αk+1+ +ank+1αn
T(αn)=a1nα1+ +aknαk+ak+1nαk+1+ +annαn
⎡a11⎢ ⎢⎢ak1
线性变换T在基S下的矩阵是A=⎢
⎢0⎢ ⎢⎢⎣0
⎛A11
A可以分块写成A= 0
⎝
A12⎫⎪. A22⎪⎭
a1k
akk
a1k+1
akk+1 ak+1k+1 ank+1
a1n⎤
⎥⎥akn⎥
⎥, ak+1n⎥ ⎥⎥ann⎥⎦
定理3.3 如果V1⊕V2=V,并且V1,V2是T的两个不变子空间,即T(V1)⊆V1,T(V2)⊆V2.则线性变换T的矩阵为准对角形
⎛A11
A= 0
⎝
0⎫⎪. ⎪A22⎭
特别地,若所有Vi都是一维子空间时,则矩阵A简化为对角矩阵
⎛a1
A=diag(a1,a2, ,an)=
⎝
a2
⎫⎪⎪. ⎪ ⎪an⎪⎭
定理3.4 设T是线性空间Vn的线性变换,λ1,λ2, ,λn是T的全部不同的特征值,则T在某一基下的矩阵为对角矩阵的充分必要条件是
dimVλ1+dimVλ2+ +dimVλn=n.
可知,线性变换T的矩阵简化为一个准对角矩阵(或对角矩阵)与线性空间Vn可分解为若干个不变子空间的直和是相当的.