特征值、特征向量
特征值在我看来,实际上是一个高维矩阵在单维空间上的某种映射,携带自身的一些特性,而特征向量是特征值对应的一组显性表示
特征值、特征向量定义
对于矩阵A
,若
Aα=λα
则 λ 为 A 的一个特征值,α 为特征值 λ 对应的一个特征向量
上述等式等价于
(A−λE)α=0
我们可以发现这其实是一个齐次线性方程组,系数矩阵为A-λE
,未知数为特征向量 α,这个方程组有解
根据行列式值为 0,在已知 A 的情况下,很显然可以解出行列式中唯一的未知数 λ,自此解决特征值和特征向量的问题
我们称|A-λE|
为 A 的特征多项式,|A-λE| = 0
为 A 的特征方程
求解特征值、特征向量
总的来说,求解特征值和特征向量的方法为:
- 设 λ,列出特征方程,解出 λ
- 代入 λ,得到齐次线性方程组的系数矩阵
A-λE
,求解方程组,得到基础解系 - 方程组的通解即为特征值对应的特征向量,一一列出即可
特征值的一些性质(tr(A)
为矩阵 A 的迹,为主对角线元素之和)
∑λi=i=1∑naii=tr(A)−−−−−−−−Πλi=∣A∣
特征值的运算
A−1⇒λ1−−−−−−−−A∗⇒∣A∣λ1−−−−−−−−3A+2E⇒3λ+2−−−−−−−−A2⇒λ2
在求解特征值的特征向量时,发现重根的特征值对应的特征向量,可能是一个,也可能是两个,取决于A-λE
的秩
相似矩阵
相似矩阵概念及性质
若对于矩阵A
,存在可逆矩阵P
,使得
P−1AP=B
则 A 与 B 相似,记作
相似矩阵性质:反身性,对称性,传递性
特征多项式相等
∣A−λE∣=∣B−λE∣
特征值相同
λA=λB⇒∣A∣=∣B∣=Πλi=1∑naii=i=1∑nbii=∑λ
A 和 B 秩相同
r(A)=r(B)
一些推论,当 A B 相似时,有
An∼BnA−1∼B−1A+kE∼B+kE
相似对角化
特征值、特征向量求解的高阶形式
当A~B
且 B 为一个对角矩阵(除主对角线上元素均为 0)时,我们称 A 可被相似对角化,B 为 A 的相似对角型
A 能被相似对角化的充要条件
- 方阵 A 有 n 个不同的特征值
- 矩阵 A 每个特征值的重根数均等于其特征向量分量的个数,如二重根对应两个线性无关的特征向量
已知矩阵 A,求解相似对角阵 B 以及过度矩阵 P
P−1AP=B
首先明确一点,若一个矩阵可以被相似对角化,其相似对角型的主对角线元素均为其特征值(重根占多个元素位),如
B=[λ100λ2]
设 λ1 的特征向量为 α1,λ2 的特征向量为 α2,则有
Aα1=λ1α1Aα2=λ2α2
设
P=(α1,α2)
则
AP=A(α1,α2)=(Aα1,Aα2)=(λ1α1,λ2α2)
根据矩阵乘法的性质
PB=(α1,α2)[λ100λ2]=(λ1α1,λ2α2)=AP
哦哟,这不就是相似矩阵的定义吗,两边同时乘一个P^{-1}
,得
P−1AP=B
于是我们发现,每个特征值对应的特征向量组成的矩阵(我称之为特征矩阵),就是要求的 A 到 B 的过度矩阵
一定要注意,特征值的位置和其对应的特征向量的位置要一一对应
于是相似矩阵的问题又变成了
- 求特征值,得相似对角型
- 解特征值对应特征向量
- 组合特征向量为特征矩阵
实对称矩阵
相似对角矩阵的更进一步,实对称矩阵要求其所有特征向量两两正交且均为单位向量
- 两两正交:数量积为 0(各分量相乘再相加)
- 单位向量:模为 1,各分量平方和开根
这里要用到施密特正交化
另外注意,特征向量正交是极有用的信息,可以通过这一条件通过特征向量求特征向量,如已知三位实对称矩阵 A,其有一个特征值 a 对应特征向量 α,已知另一特征值 b
α=(1,0,1)T
设另外的特征向量为 β
β=(x1,x2,x3)
则
αβ=x1+x3=0
令
(x1,x2)=(0,1)⇒β1=(0,1,0)T(x1,x2)=(1,0)⇒β2=(1,0,−1)T
于是得到实对称矩阵 A 的三个特征向量 α,β1,β2
P=(α,β1,β2)→B=a000b000b