矩阵论之矩阵的分解
矩阵的分解
一、矩阵的三角分解 定义 3.1 设A ∈F
n ⨯n
.
(1) 若L , U ∈F n ⨯n 分别为下三角矩阵和上三角矩阵,A =LU , 则称A 可作LU 分解。 (2) 若L , U ∈F n ⨯n 分别是对角线元素为1的下三角矩阵和上三角矩阵,D 为对角矩阵。
A =LDU , 则称A 可作LDU 分解。
用Gauss 消去法,一个方阵总可以用行初等变换化为上三角矩阵,若只用第i 行乘以数k 加到第j 行(i
PA =U , 从而有LU 分解:A =P -1U .
⎡223⎤⎢⎥例1 设A =477,求A 的LU 分解和LDU 分解。 ⎢⎥⎢⎣-245⎥⎦
解 为求P , 对下面的矩阵做如下行初等变换:
⎡2
(A I 3) =⎢⎢4
⎢⎣-2⎡223→⎢⎢031⎢⎣00623100⎤⎡223100⎤
⎢031-210⎥77010⎥→⎥⎢⎥
45001⎥⎦⎢⎣068101⎥⎦
100⎤-210⎥⎥5-21⎥⎦
00⎤⎡1⎡223⎤⎢⎥⎢⎥因此 P =-210, PA =031. ⎢⎥⎢⎥⎢⎢⎣5-21⎥⎦⎣006⎥⎦⎡100⎤⎡223⎤⎢⎥⎢⎥-1
令L =P =210, U =031
⎢⎥⎢⎥⎢⎢⎣-121⎥⎦⎣006⎥⎦⎡223⎤⎢⎥则A =L 031=LU . ⎢⎥⎢⎣006⎥⎦
再利用初等变换,有
⎡⎢11
⎡100⎤⎡2⎤⎢⎢⎥⎢3⎥⎢01 A =210⎢⎥⎢⎥⎢⎢6⎥⎣-121⎥⎦⎢⎣⎦⎢00
⎢⎢⎣
就得到A =LDU
3⎤
2⎥⎥1⎥ 3⎥⎥1⎥⎥⎦
3⎤
2⎥⎥1⎥ 3⎥⎥1⎥⎥⎦
⎡
⎢11
⎡100⎤⎡2⎤⎢⎢⎥⎢3⎥, U =⎢01其中 L =210, D =⎢⎥⎢⎥⎢⎢⎥⎢⎥6⎦⎢⎣-121⎦⎣
⎢00⎢⎣
一般来说,LU , LDU 分解一般不是惟一的。下面讨论方阵的LU 和LDU 分解的 存在性和唯一性。
定理 3.1 设A =(a ij ) n ⨯n ∈F 顺序主子式
n ⨯n
, 则A 有惟一LDU 分解A =LDU 的充分必要条件是A 的
a 12a 22...
... a 1k ... a 2k ...
...
≠0, k =1, 2,..., n ; ∆0=1,
a 11
∆k =
a 21... a k 1
a k 2... a kk
⎡d 1
⎢
其中 D =⎢
⎢⎢⎣
⎤⎥d 2
⎥, d =∆k ; k =1, 2, n ... , k ⎥... ∆k -1⎥d n ⎦
证明:只证充分性:对A 的阶数n 进行归纳证明
n =1, A =(a 11) =(1)(a 11)(1)=L 1DU 11 所以定理对n =1成立,设定理对n -1成立,即 A =(a ij ) (n -1) ⨯(n -1) =L n -1D n -1U n -1 则对n , 将A 分块成
⎡A n -1
A = ⎢u T
⎣n
T
a nn ⎥⎦
T
τn ⎤
其中 τn =(a 1n , a 2n ,..., a n -1, n ) , u n =(a n 1, a n 2,..., a n , n -1) ,
设
⎢
⎡A n -1τn ⎤⎡L n -10⎤⎡D n -10⎤⎡V n -1v n ⎤
=⎢T , ⎥⎥⎢⎥T ⎢⎥1⎦⎣0d n ⎦⎣01⎦⎣u n a nn ⎦⎣l n
比较两边,则有
A n -1=L n -1D n -1U n -1, (3.1)
τn =L n -1D n -1v n (3.2)
T T
u n =l n D n -1U n -1 (3.3) T a nn =l n D n -1v n +d n (3.4)
由归纳假设(3.1)式成立。由∆k ≠0, L n -1D n -1非奇异,D n -1U n -1非奇异,从而由(3.2)
T 式和(3.3)式可惟一确定v n 和l n . 又从(3.4)式可唯一求得d n , 所以A =LDU 分解是存在而
且惟一的。
又由归纳证明过程,A 的k 阶顺序主子式
∆1=|A 1|=|L 1DU 11|=|D 1|,
∆2=|A 2|=|L 2D 2U 2|=|D 2|=d 2|D 1|,............
∆k =|A k |=|L k D k U k |=|D k |=d k |D k -1|.
所以 d k =
∆k
, k =1,2,..., n . ∆k -1
n ⨯n
推论 可逆矩阵A ∈F 有LU 分解的充分必要条件是A 的顺序主子式
∆k ≠0, k =1,2,..., n -1.
⎡123-1⎤⎢2-19-7⎥
⎥,求A 的LDU 分解。 例 2 设A =⎢
⎢-34-319⎥⎢⎥4-26-21⎣⎦
解 A 由(3.1), —(3.4)式,得到 1=(1)(1)(1)
v 2=τ2=2,
l 2=u 2=2,
d 2=-5,
所以
⎡12⎤⎡10⎤⎡10⎤⎡12⎤A 2=⎢, L =, D =, U =⎥2⎢21⎥2⎢0-5⎥2⎢10⎥,
2-1⎣⎦⎣⎦⎣⎦⎣⎦A 2=L 2D 2U 2
⎡123⎤⎢⎥ A 3=2-19, 同理求得: ⎢⎥⎢⎣-34-3⎥⎦
⎡123⎤100100⎡⎤⎡⎤⎢⎥3⎢⎥⎢⎥ L 3=210⎥, D 3=⎢0-50⎥, U 3=⎢01-⎥, ⎢5⎥⎢⎢⎥⎢⎥-3-210012⎣⎦⎣⎦⎢001⎥
⎣⎦
A 4=A , 从(3.1)—(3.4)式求得
l 4=(4,2, -1,1) , d 4=1, v 4=(-1,1, ,1) . 所以
T
12
T
⎡100⎢210
L 4=⎢
⎢-3-21⎢
⎣42-1⎡1⎢⎢0⎢ U 4=⎢⎢0⎢⎢⎣0
2
0⎤⎡1⎤
⎢-5⎥0⎥⎥, D 4=⎢⎥ ⎢⎥0⎥12
⎥⎢⎥1⎦-1⎣⎦
3-1⎤⎥3
1-1⎥
5⎥
1⎥
01⎥
2⎥
001⎥⎦
A =L 4D 4U 4
来定义3.2 设矩阵A 有惟一的LDU 分解。若把A =LDU 中的D 和U 结合起来,并且用U
表示,就得到唯一的分解
A =L (DU ) =LU
称为A 的Doolittle 分解.
练习:求矩阵
2-4⎡5⎢21-2
A =⎢
⎢-4-25⎢
10⎣00⎤
⎥1⎥ ⎥0⎥2⎦
的LDU 分解和Doolittle 分解 矩阵的满秩分解 定义 3.2 设A ∈F
m ⨯n
,秩(A )=r , 若存在秩为r 的矩阵B ∈F m ⨯r , C ∈F r ⨯n , 使得
A =BC 则称(3.7)式为矩阵A 的满秩分解。
定理 3.2 对任何非零矩阵A ∈F m ⨯n , 都存在满秩分解。
证明:设秩(A ) =r , 由等价标准形知道存在可逆矩阵P ∈F m ⨯n , Q ∈F n ⨯n , 使得 PAQ =⎢
⎡I r ⎣0⎡I r ⎣0
0⎤, 0⎥⎦0⎤-1
Q ⎥0⎦
即 A =P -1⎢
分块为 P -1=(B |B 1), Q -1=⎢
⎡C ⎤
. ⎥⎣C 1⎦
B 为P -1的前r 列组成的矩阵,则B ∈F m ⨯r , C ∈F r ⨯n , 且秩(B ) =秩(C ) =r .
A =P -1⎢
⎡I r ⎣00⎤-1⎡I r
Q =(B |B ) 1⎢0⎥⎦⎣00⎤⎡C ⎤
=BC ⎢⎥⎥0⎦⎣C 1⎦
⎡C ⎤
⎣0⎦
分解方法二:若只对A 作行初等变换,可得到阶梯形矩阵:⎢⎥, 其中秩(C ) =秩(C ) =秩
(A ) =r ,因此有可逆矩阵P , 使
PA =⎢⎥, 从而
A =P -1⎢⎥=(B |B 1) ⎢⎥=BC ,
⎡C ⎤⎣0⎦
⎡C ⎤⎣0⎦⎡C ⎤⎣0⎦
方法是 (A |I m ) −−−→⎢|P ⎥,
行变换
⎡C
⎣0
⎤⎦
B 为P -1的前r 列,C 是A 化为阶梯形中的非零行。A =BC .
⎡112⎤⎢⎥例 4 设A =022, 求A 的满秩分解。 ⎢⎥⎢⎣101⎥⎦
⎡
⎢1
⎡11210⎤0⎢
⎥→⎢解 (A |I 3) =⎢02201⎢⎥0⎢
⎢⎣10100⎥⎦1⎢
⎢0⎣
⎡⎢1⎢2⎤
, P =⎢0⎥⎢1⎦
⎢⎢-1⎣
01212
⎤
1210⎥0
⎥1
0110⎥
⎥2⎥1
⎥100-12⎦
解得 C =⎢
⎡1
⎣0
11
⎤⎥0
⎡100⎤⎡10⎤⎥
⎥,P -1=⎢020⎥, 所以,B =⎢02⎥, 0⎢⎥⎢⎥⎥
⎢⎢⎥⎣1-11⎥⎦⎣1-1⎥⎦
1⎥⎦
⎡10⎤
⎡112⎤⎢⎥ A =BC =02⎢⎢⎥011⎥ ⎣⎦⎢⎣1-1⎥⎦
方法 3. 我们首先考虑这样的情形:A ∈F m ⨯n , 设秩(A ) =r , 而且A 的前r 列线性无关,则它们是A 的列向量的极大无关组{α1, α2,..., αr }, 设A 1=(α1, α2,..., αr ), 则秩
(A 1) =r , A 1∈F m ⨯r . 又A 的后n -r 列{αr +1, αr +2,..., αn }可表示为列向量极大无关组的线
性组合,设
A 2=(αr +1, αr +2,..., αn ) 则 A 2=A 1S 其中 S r ⨯(n -r ) =(X
r +1
, X
r +2
) , , ... X , n
X j 满足
αj =(α1, α2,..., αr ) X j
因此 A =(A 1|A 2) =(A 1|A 1S ), 即 A =A 1(I r |S ), 即B =A 1, C =(I r |S ) 即为满秩分解。
Hermite 标准形是阶梯形中每一行第一个非零元素为1,而且该元素所在的列中其它元
素为0的特殊的一种。方法三如下:
(1) 用行初等变换把A 化为Hermite 标准形。
(2) 依Hermite 标准形中,向量e i 所在的列的位置为第j i 列,相应取出A 的第j i 列αj i ,
得到A 的列向量极大无关组{αj 1, αj 2,..., αj r },B =(αj 1, αj 2,..., αj r ).
(3) A 的Hermite 标准形中非零行构成矩阵C ,得到A 的满秩分解:A =BC . 例 5. 用方法三求例四中A 的满秩分解 解 用行初等变换花A 为Hermite 标准形
⎡112⎤⎡112⎤⎡112⎤⎡101⎤⎢⎥⎢⎥→⎢011⎥→⎢011⎥
2 A =022→02⎢⎥⎢⎥⎢⎥⎢⎥
⎢⎣101⎥⎦⎢⎣0-1-1⎥⎦⎢⎣000⎥⎦⎢⎣000⎥⎦
则可知:秩(A ) =2, A 的前两列线性无关,取出A 的前两列构成B . 因此
⎡11⎤
⎡101⎤⎢⎥ B =02, C =⎢⎥, A =BC . ⎢⎥011⎣⎦⎢⎥10⎣⎦
3.3 矩阵的奇异值分解
定理 3.9 设A ∈C m ⨯n , 则矩阵A A ∈C (1) 秩(A ) =秩(A H A ) =秩(AA H ); (2) A A 和AA 的非0特征值相等.
(3) A A 和AA 都是半正定矩阵,当秩(A ) =n 时,A A 为正定矩阵,当秩(A ) =m 时,
H
H
H
H
H
H n ⨯n
和矩阵AA ∈C
H m ⨯m
具有如下性质
AA H 为正定矩阵。
定义 3.4 对于A ∈C
m ⨯n
, 秩(A ) =r
第四章 矩阵的广义逆 定义 4.1 设A ∈C
n ⨯m
, 若存在矩阵B ∈C n ⨯m , 使得
BA =I n
-1
则称A 是左可逆的,称B 为A 的一个左逆矩阵,记为A L .
若存在矩阵C ∈C
n ⨯m
, 使得
AC =I m
-1则称A 是右可逆的,称C 为A 的一个右逆矩阵,记为A R .
定理 4.1 设A ∈C m ⨯n , 则下面的条件是等价的: (1)A 是左可逆的; (2)A 的零空间N (A ) =(0};
(3)m ≥n , 秩(A ) =n , 即A 的列满秩的; (4)A A 是可逆的. 定理 4.2 设A ∈C
m ⨯n
H
,则下列条件是等价的:
(1) A 是右可逆的; (2) A 的列空间R (A ) =C m ;
(3)m ≤n , 秩(A ) =m , 即A 是行满秩的; (4)AA 是可逆的.
H
⎡400⎤
例 1 矩阵A =⎢⎥是右可逆的,不是左可逆的。由于
050⎣⎦
⎡1⎤
0⎢4⎥⎢⎥
⎡400⎤⎢1⎥⎡10⎤
=⎢ ⎢⎥⎢0⎥ ⎥050015⎣⎦⎣⎦
⎢⎥⎢c 31c 32⎥⎢⎥⎣⎦
注意到右逆最后一行元素是完全任意的,故存在无穷多个右逆矩阵。
一般地,一个矩阵左可逆未必右可逆,而且左逆矩阵和右逆矩阵都不是唯一的。 二、单侧逆与解线性方程组 定理 4.3 设A ∈C
m ⨯n
是左可逆的,B ∈C
n ⨯m
是A 的一个左逆矩阵,则线性方程组AX =b
有形如X =Bb 的解的充分必要条件是 (I m -AB ) b =0 若上式成立,则方程组有唯一解 X =(A A ) A b 定理 4.4 设A ∈C
m ⨯n
m
是右可逆的,则线性方程组AX =b 对任何b ∈C 都有解。且对A 的
H -1H
-1-1
任意一个右逆矩阵A R , X =A R b 是其解。特别地,X =A H (AA H ) -1b 是方程组AX =b 的
一个解。
4.2 广义逆矩阵 一、减号广义逆
定义 4.2 设A ∈C m ⨯n , 若存在矩阵G ∈C n ⨯m , 使得 AGA =A 则称G 为A 的一个减号广义逆或{1}—逆
--
A 的全部减号广义逆的集合记为A {1},A {1}的元素用A 1, A 2,... 表示。
定理4.5 设A ∈C m ⨯n , 秩(A ) =r ,若存在可逆矩阵P ∈C PAQ =⎢则G ∈A {1}的充分必要条件是
m ⨯m
和Q ∈C n ⨯n , 使得
⎡I r
⎣00⎤, 0⎥⎦
G =Q ⎢
⎡I r U ⎤P , ⎥
⎣V W ⎦
其中U ∈C r ⨯(m -r ) , V ∈C (n -r ) ⨯r , W ∈C (n -r ) ⨯(n -r ) 是任意的。 例 2 设
⎡0-130⎤⎢⎥,
5 A =2-41⎢⎥
⎢⎣-457-10⎥⎦
求A 的减号广义逆。
解 ⎢
⎡A
⎣I 4
⎡0-1⎢2-4⎢
⎢-45I 3⎤⎢
=⎢100⎥⎦⎢
01⎢
⎢00⎢00⎣
3170010
100⎤5010⎥⎥-10001⎥
⎥
0000⎥0000⎥
⎥
0000⎥1000⎥⎦
⎡
⎢1⎢⎢0⎢0⎢→⎢⎢1⎢⎢0⎢0⎢⎢⎣0
0100
000
000
-2
115
-2213000
10
01
1⎤
0⎥2
⎥
-100⎥-321⎥
⎥
000⎥⎥
⎥
000⎥000⎥
⎥
000⎥⎦
于是
⎡
⎢-2⎢
P =⎢-1
⎢-3⎢⎣
⎡1⎤
0⎥⎢12⎢⎥
00⎥, Q =⎢0
⎢021⎥
⎢⎥
⎢0⎦⎣115⎤
-⎥22
⎥
130⎥ 010⎥
⎥
001⎦⎥0
所以A 的减号广义逆为 G =Q ⎢
⎡I 2U ⎤
P , ⎥
⎣V W ⎦
其中U ∈C 2⨯1, V ∈C 2⨯2, W ∈C 2⨯1. 作业:
求矩阵
1⎤⎡02j j 04+2j
⎥(000-3-6-3-3j A =⎢⎢⎥j =⎢1⎥⎣02114-4j ⎦
的{1}-逆
Moore-Penrose 广义逆
定义4.3 设A ∈C m ⨯n , 若存在矩阵G ∈C n ⨯m , 使得 (1) AGA =A ; (2) GAG =G ;
(3) (AG ) H =AG ; (H 表示共轭转置) (4) (GA ) =GA .
则称G 为A 的Moore-Penrose 广义逆或加号广义逆,简称为A 的M-P 逆。A 的任意M-P 逆记为A
定理 4.7 若矩阵A ∈C
m ⨯n
+
H
存在M-P 广义逆,则A 的M-P 逆是唯一的。
都存在M-P 广义逆A 。设秩(A ) =r , A 的一个满秩分解为
m ⨯r
+
定理 4.8 任意矩阵A ∈C
m ⨯n
A =BC , B ∈C 则
, C ∈A r ⨯n , 秩(B ) =秩(C ) =r
A =C (CC ) (B B ) B 。
+H H -1H -1H
⎡10-11⎤⎢⎥+
例 6 求矩阵A =0222的M-逆A
⎢⎥⎢⎣-1453⎥⎦
解 首先求得A 的满秩分解为
⎡10⎤⎢⎥⎡10-11⎤
A =BC =02⎢⎢⎥0111⎥
⎣⎦⎢⎣-14⎥⎦
A +=C H (CC H ) -1(B H B ) -1B H ⎡1
⎢0故 =⎢
⎢-1⎢⎣1
0⎤
-1-1
1⎥302-4⎡⎤⎡⎤⎡10-1⎤⎥
⎥⎢-420⎥⎢024⎥ 1⎥⎢03⎣⎦⎣⎦⎣⎦⎥1⎦
⎡52-1⎤⎢⎥1⎢111⎥=
18⎢-4-12⎥⎢⎥630⎣⎦
第五章 矩阵分析
5.1 向量范数的概念
定义 5.1 设V 是数域F 上的线性空间,且对于V 的任一个向量x ,对应一个非负实数||x ||,满足以下条件:
(1) 正定性:x ≥0, x =0当且仅当x =0;
(2) 齐次性:ax =|a |⋅x , a ∈F ;
(3) 三角不等式:对任何x , y ∈V , 都有x +y ≤x +y .
则称x 为向量x 的范数,[V ; ⋅]为赋范空间。
例1 在n 维酉空间C 上,复向量x =(ξ1, ξ2,..., ξn ) 的长度
n
x =
2
就是一种范数,通常称这种范数为2-范数,记为x 。
n
例2 证明 x =max i x i 是C 上的一种向量范数。其中x =(x 1, x 2,..., x n ) T ∈C T . 通常称这
种范数为∞-范数,记为x 。
∞
n n
例3 证明x =∑x i 也是C 上的一种范数,其中x =(x 1, x 2,..., x n ) T ∈C T ,称这种范数为
i =1
1-范数,记为x 。
1
p n 1/p
例4 证明x =(∑ξi ) 是一种范数,称为向量x 的p 范数或者l p -范数,记为x p 。
i =1
线性空间V 上的向量
n
定理 2.1 设x 和x 为有限维线性空间V 的任意两个向量范数(它们不限于p -范数),
α
β
则存在两个与向量x 无关的常数c 1和c 2,使得下面的不等式成立
c 1x
β
≤x
α
≤c 2x , ∀x ∈V (2.1)
β
定义 2.2 满足不等式(2.1)的两种范数称为等价的。 2.2 矩阵的范数
定义 2.3 设A ∈C m ⨯n , 定义一个实值函数A ,它满足以下三个条件 (1) 非负性:当A ≠0时,A >0; 当A =0时,A =0; (2) 齐次性:
A =A ,α∈C ;
m ⨯n
(3) 三角不等式:A +B ≤A +B , B ∈C 则称A 为A 的广义矩阵范数 若多C m ⨯n , C n ⨯l 及C (4) 相容性:
AB ≤A B , B ∈C 则称A 为A 的矩阵范数。 定义 2.4对于C
m ⨯n
m ⨯l
,
上的同类广义矩阵范数⋅,有
n ⨯l
上的矩阵范数⋅
M
和C 与C 上的同类向量范数⋅V ,如果
m n
Ax
则称矩阵范数⋅
M
≤A M
m ⨯n
x , ∀A ∈C , ∀x ∈C n (2.2)
与向量范数⋅V 是相容的。
几种常用的矩阵范数 例 1. 已知 A =(a ij ) ∈C
n ⨯n
, 下面二函数:
A m =∑a ij ,
1
n
i , j =1
A m =n ⋅max a ij
∞
i , j
都是C
n ⨯n
上的矩阵范数。
m
定理 2.4 已知C 和C 上的同类向量范数⋅,设A ∈C m ⨯n , 则函数 A =max
x =1是C
m ⨯n
n
Ax (2.3)
上的矩阵范数,且与已知的向量范数相容。并称(2.3)给出的矩阵范数为由向量范数导
出的矩阵范数,简称为从属范数。 定理 2.5 设A =(a ij ) ∈C
1
2
∞
m ⨯n
n T
, x =(ξ1, ξ2,..., ξn ) ∈C , 则从属于向量x 的三种范数
x , x , x 的矩阵范数依次是:
(1) A =max j (2
)A (3) A
通常称A 1, A 2以及A ∞依次为列和范数,谱范数及行和范数。 矩阵幂级数 定义5.7 设A
(k )
(k )
(k ) =(a ij ) ∈C m ⨯n ,{A (k ) }是一个矩阵序列。如果当k →+∞时,它的n 2个数
∑a
i =1
m
ij
;
2
=λ1为A H A 的最大特征值; =max i ∑a ij .
j =1n
∞
列{a ij }都收敛,即
lim a ij =a ij , i , j =1, 2,..., n .
k →∞
(k )
则称矩阵序列{A }按元素数列收敛,矩阵A =(a ij ) ∈C 或者A
(k )
(k ) m ⨯n
是它的极限。记为lim A
k →∞
(k )
=A
→A . 如果至少有一个元素数列是发散的,则称该矩阵序列发散。
(k )
n ⨯n
定义 5.8 设{A }是C 阵A ∈C
m ⨯n
空间的一个矩阵序列,A 是C
n ⨯n
的一个矩阵范数。如果存在矩
, 当k →+∞时,A (k ) -A →0, 则称矩阵序列按向量范数收敛于A .
(k )
m ⨯n
定理5.5 设{A }是C 的一个矩阵序列,它按元素数列收敛的充分必要条件是它按C
n ⨯n
的任意一个矩阵范数收敛。
矩阵幂级数 定义 5.10 设A ∈C
n ⨯n
, a k ∈C , k =0,1,2,..., 称
a 0+a 1A +a 2A 2+... +a k A k +... 为矩阵A 的幂级数,记为
∑a
k =0
k k
∞
k
A k .
N
定义5.11 矩阵级数
∑a
k =0
k
∞
A . 的前N +1项的和S N (A ) =∑a k A k 称为矩阵幂级数的部分
k =0
∞
和。若矩阵幂级数
∑a
k =0
∞
A . 的部分和序列{S N (A )}收敛,则称∑a k A k 收敛;否则,称起
k
k =0
为发散。若lim S N (A ) =S , 则称S 为
N →∞
∑a
k =0
∞
k
A k 的和矩阵。
定理 5.8 若复变量z 的幂级数则
∑a z
k k =0
∞
∞
k
的收敛半径为R ,而方阵A ∈C
n ⨯n
的谱半径为ρ(A ),
(1) 当ρ(A )
∑a
k =0∞
k
A k 收敛;
(2) 当ρ(A ) >R 时,矩阵幂级数
∑a
k =0
k
A k 发散。
当计算A 的特征值比较困难时,由定理5.6知A 的每个范数都是谱半径ρ(A ) 的上界,只要能找到一种特殊的矩阵范数A , 使A
一、矩阵函数的定义和性质
定义5.12 设f (z ) 是复变量的解析函数,f (z ) =
∑a z
k k =0
∞
k
的收敛半径为R 。如果矩阵
A ∈C n ⨯n 的谱半径为ρ(A )
f (A ) =二、矩阵函数的求法 1. Jordan标准形法
n ⨯n
定理 5.9 设f (z ) 是复变量z 的解析函数,A ∈C , 且存在可逆矩阵P , 使得
∑a A
k k =0
∞
k
A =PJP
-1
=Pdiag (J 1, J 2,..., J m ) P -1.
则
f (A ) =Pf (J ) P -1=Pdiag [f (J 1), f (J 2),..., f (J m )]P -1 其中
⎡
⎢f (λi ) ⎢⎢⎢0
f (J i ) =⎢
⎢⎢0⎢⎢... ⎢⎣0
例 10 已知矩阵
f '(λi ) f (λi ) 0... 0
1
f ''(λi ) ... 2! f '(λi ) f (λi ) ... 0
1⎤
f (n i -1) (λi ) ⎥
(n i -1)!
⎥
1⎥... f (n i -2) (λi ) ⎥
(n i -2)!
⎥ ⎥1
... f (n i -3) (λi ) ⎥
(n i -3)! ⎥
⎥... ...
⎥
0f (λi ) ⎦
⎡200⎤
⎢⎥ A =111 ⎢⎥⎢⎣1-13⎥⎦
A
计算e 和sin A 。
解 A 的Jordan 标准形为
⎡210⎤⎢⎥ J =020 ⎢⎥⎢⎣002⎥⎦
变换矩阵P 和P 分别为
-1
⎡011⎤⎡010⎤
⎢⎥⎢⎥-1
P =100 和 P =1-11
⎢⎥⎢⎥⎢⎢⎣10-1⎥⎦⎣01-1⎥⎦
且
⎡f (2)
⎢0 f (J ) =⎢⎢⎣0
故
f '(2)f (2)
0⎤0⎥⎥ f (2)⎥⎦
f (A ) =Pf (J ) P -1
0⎤⎡010⎤⎡011⎤⎡f (2)f '(2)
⎢⎥⎢0⎥⎢1-11⎥
=100f (2)0⎢⎥⎢⎥⎢⎥
⎢0f (2)⎥⎣10-1⎥⎦⎢⎣0⎦⎢⎣01-1⎥⎦
00⎡f (2)⎤
⎥=⎢f '(2)f (2_-f '(2)f '(2)⎢⎥
⎢-f '(2)f (2)+f '(2)⎥⎣f '(2)⎦
当f (z ) =e z 时,f (2)=e 2, f '(2)=e 2, 故
⎡e 2⎢2A
e =⎢e
⎢e 2⎣
00-e 2
0⎤⎥e 2⎥ 2e 2⎥⎦
当f (z ) =sin z ,f (2)=sin 2, f '(2)=cos 2, 故
00⎡sin 2⎤
⎢⎥
cos 2 sin A =cos 2sin 2-cos 2⎢⎥
⎢-cos 2sin 2+cos 2⎥⎣cos 2⎦
2. 最小多项式法
设m A (λ) 是n 阶矩阵A 的最小多项式,它的次数为m ,若f (λ) 是l (l ≥m ) 次多项式,以m A (λ) 去除f (λ) ,即得
f (λ) =m A (λ) q (λ) +r (λ),
余式r (λ) =0或者r (λ) 的次数低于m A (λ) 的次数。因此 f (A ) =m A (A ) q (A ) =r (A ) =r (A ).
由此可见,次数大于等于m 的任意矩阵多项式f (A ) 都可以化为次数小于等于m -1的A 的多项式r (A ) 来计算。
定理 5.10 设n 阶矩阵A 的最小多项式为
m A (λ) =(λ-λ1) 1(λ-λ2) 2...(λ-λs ) s 其中λ1, λ2,..., λs 为A 的所有不同的特征值, g (λ) =c 0+c 1λ+... +c m -1λ
n
n
n
∑n
i =1
s
i
=m , f (λ) 是复变量λ的解析函数,令
m -1
,
则f (A ) =g (A ) 的充分必要条件是:
g (j ) (λi ) =f (j ) (λi ), i =1,2,..., s , j =0,1,2,..., n -1. 例 10 已知矩阵
⎡200⎤⎢⎥ A =111 ⎢⎥⎢⎣1-13⎥⎦
A
计算e 和sin A 。
我们用定理5.10提供的方法求解
解:A 的最小多项式为m λ(A ) =(λ-2) 2, 令 g (λ) =c 0+c 1λ, 则 ⎨
⎧f (2)=c 0+2c 1
f '(2)=c ⎩1
解得c 0=f (2)-2f '(2),c 1=f '(2), 故
f (A ) =c 0I +c 1A
⎡f (2)=⎢⎢f '(2)⎢⎣f '(2)
z
f (2)-f '(2)-f '(2)
2
⎤⎥. ⎥
f (2)+f '(2)⎥⎦
2
0f '(2)
当f (z ) =e 时,f (2)=e , f '(2)=e , 故
⎡e 2⎢2A
e =⎢e
⎢e 2⎣
00-e 2
0⎤⎥e 2⎥ 2e 2⎥⎦
当f (z ) =sin z 时,f (2)=sin 2, f '(2)=cos 2,故
00⎡sin 2⎤⎢⎥
cos 2 sin A =cos 2sin 2-cos 2⎢⎥
⎢-cos 2sin 2+cos 2⎥⎣cos 2⎦
第六章 特征值的估计及对称矩阵的极性
一、特征值的界
定理 6.1 设A =(a rs ) ∈R 虚部Im(λ) 满足不等式
n ⨯n
, 令M =max
1
a rs -a sr . 若λ表示A 的任一特征值,则λ的
1≤r , s ≤n 2
Im(λ) ≤ (6.1) 引理:设A ∈C n ⨯n , 则A 的任一特征值λ满足 λ≤A
m ∞
1
A +A H 2
1
Im(λ) ≤A -A H
2
Re(λ) ≤
定义 5.1 设A =(a ij ) ∈C
n ⨯n
m ∞
m ∞
,记R r (A ) =
∑a
s =1s ≠r
n
rs
, 2, . . (简写为R r ),r =1
n 如果
A 按行严格对角占优;如果a rr ≥R r (r =1,2,..., n ), 且有a r r >R r (r =1, 2,... n , 则称矩阵) ,
1≤r 0≤n 使得a r 0r 0>R r 0成立,则称矩阵A 按行(弱)对角占优。
同样可以定义按列对角占优。 定理 5.3 设A =(a rs ) ∈C 格对角占优,则 0
n ⨯n
, 令M r =a rr +
s =r +1
∑
n
a rs , m r =a rr -
s =r +1
∑
N
a rs 如果A 按行严
∏m
r =1
n
r
≤det A =∏λr (A ) ≤∏M r (6.5)
i =1
r =1
n n
且当a rs =0(s >r ) 时,式(6.5)中等号成立。
定理 5.4(Hadamard’s inequality)设A =(a rs ) ∈C n ⨯n , 则有
∏λ(A ) =det A ≤[∏(∑a
r
r =1
s =1
r =1
n n n
2rs
)]1/2 (6.7)
且式(6.7)中等号成立的充分必要条件是某a s 0=0或者(a r , a s ) =0(r ≠s ). 这里a 1, a 2,..., a n 表示A 的n 个列向量。
定理 5.5 (Schur’s inequality)设A =(a rs ) ∈C
n
n
2
n ⨯n
的特征值为λ1, λ2,..., λn , 则有
∑λr ≤∑a rs =A F (6.9)
r =1
r , s =1
2
定义5.3 设A =(a rs ) ∈C
n ⨯n
, 称由不等式
z -a ii ≤R i (6.10)
在复平面上确定的区域为矩阵A 的第i 个Gerschgorin 圆(盖尔圆),并用记号G i 来表示。其中
R i =R i (A ) =
∑a
j =1
j ≠i
n
ij
(6.11)
称为盖尔圆G i 的半径(i =1,2,..., n )
定理 5.7 (Gerschgorin) 由矩阵A 的所有盖尔圆组成的连通部分中任取一个,如果它是由k 个盖尔圆构成的,则在这个连通部分中有且仅有A 的k 个特征值(盖尔圆相同时重复记数,特征值相同时也重复计数)
下面应用盖尔圆定理研究矩阵特征值的隔离问题。设A =(a ij ) ∈C D =diag (a 1, a 2,..., a n ) 其中a 1, a 2,..., a n 都是正数。由于 B =DAD
-1
n ⨯n
, 构造对角矩阵
⎛a ⎫
= i a ij ⎪ (6.12) a ⎪⎝j ⎭n ⨯n
相似于A ,所以B 与A 的特征值集合相同。注意到B 与A 的主对角线元素对应相等。于是有下面的推论。
推论 若将(6.10)中的R i 改作 r i =
∑a ij
j =1j ≠i
n
a i
a j
则定理 5.6和5.7的结论仍然成立。 例 5.7隔离矩阵
⎡2050.8⎤⎢⎥
1 A =410⎢⎥
⎢⎣1210j ⎥⎦
的特征值。
解 A 的三个盖尔圆为
G 1:z -20≤5.8
G 2:z -10≤5
G 3:z -10j ≤3
G 1与G 2相交;而G 3孤立,其中恰好有A 的一个特征值,记做λ3。根据式(6.12),选取
D =diag (1,1,2)
则
⎡2050.4⎤⎢⎥-1
B =DAD =4100.5
⎢⎥⎢⎣2410j ⎥⎦
的三个盖尔圆为
G 1' :z -20≤5.4
'
G 2:z -10≤4.5
G 3' :z -10j ≤6
' 易见,这是三个孤立的盖尔圆,每个盖尔圆中恰好有B 的(也是A 的)一个特征值。注意G 3' 中的特征值就是G 3中的特征值λ3,所以A 的三个特征值分别位于G 1' , G 2和G 3之中。
定理 5.8 设
练习:应用Gerschgorin 定理,隔离矩阵
⎡2031⎤⎢⎥ A =2102 ⎢⎥⎢⎣810⎥⎦
的特征值;再应用实矩阵特征值的性质,改进得出的结果。