文章转载请注明出处,加上原文地址链接,谢谢!(CSDN:汉密士2025)
文章目录
一、前言二、前提解析——正交化(正交变换)三、经典例题——实对称矩阵的正交化四、什么是实对称矩阵?五、实对称矩阵A的性质六、实对称矩阵性质的证明| “性质3⃣️:实对称矩阵A的特征值都落在实数域
R
\mathsf{R}
R”的证明| “性质4⃣️:存在某个大于零实数C,满足任意
x
∈
R
n
\mathsf{x \in R^n}
x∈Rn,
∣
x
′
A
x
∣
≤
C
x
′
x
|x'Ax|\le Cx'x
∣x′Ax∣≤Cx′x”的证明| “性质5⃣️:实对称矩阵A主对角线上的任意元素
a
i
i
≤
λ
m
a
x
\mathsf{a_{ii}\le \lambda_{max}}
aii≤λmax”的证明| “性质6⃣️:实对称矩阵
A
′
A
\mathsf{A'A}
A′A 的特征值都是非负实数”的证明| “性质7⃣️:实对称矩阵的正特征值与正主元数相同”的证明| 非对称矩阵和实对称矩阵对角化的区别(含参考博文链接)
七、舒尔分解(Schur Decomposition)八、参考资料九、文章更新时间记录
一、前言
实对称矩阵是一类极其重要的矩阵并蕴有丰富的性质,如实对称矩阵均可对角化,实对称矩阵正交相似于对角阵,实对称矩阵的特征值都落在实数
R
\mathsf{R}
R 的范围内……类似的性质的还有很有。笔者将在这一篇笔记中对其性质进行一一的剖析,尽力做到事无巨细。不同与以往的几篇笔记,笔者在开篇会引入一道经典的实对称矩阵正交化的例题,在例题的基础附加几道相应的思考题,以便帮助读者展开思考。
二、前提解析——正交化(正交变换)
在正式开始经典例题的求解之前,笔者首先要澄清一个概念:什么是矩阵亦或向量的正交化?矩阵或者向量的正交化具体发生了什么? 在回答这个问题之前,我们必须先将“正交化”这个概念表述清楚。有人会说,所谓正交化就是线性空间内互异的两个向量两两正交。确实在几何直观上已经很明了,但笔者在前几篇博文已经明确提到过,光有几何直观还不够,必须提升到抽象定义的层面。下面我们来定义抽象层面的“正交化”。
定义 设
V
\mathsf{V}
V 是
n
\mathsf{n}
n 维欧氏空间,
A
\mathsf{A}
A 是
V
\mathsf{V}
V 的一个线性变换,如果对任意
α
,
β
∈
V
\mathsf{\alpha,\beta \in V}
α,β∈V 都有
(
A
α
,
A
β
)
=
(
α
,
β
)
\mathsf{(A\alpha,A\beta)=(\alpha,\beta)}
(Aα,Aβ)=(α,β)
则称
A
A
A 为
V
V
V 内的一个 正交变换 。
对于正交变换,我们有以下的相互等价的命题:
A是正交变换;A在标准正交基下的矩阵为正交矩阵;A把V的标准正交基
(
ϵ
1
,
ϵ
2
,
⋯
,
ϵ
n
)
(\mathsf{\epsilon_1,\epsilon_2,\cdots,\epsilon_n})
(ϵ1,ϵ2,⋯,ϵn) 变为标准正交基
(
A
ϵ
1
,
,
A
ϵ
2
,
⋯
,
A
ϵ
n
)
(\mathsf{A\epsilon_1,,A\epsilon_2,\cdots,A\epsilon_n})
(Aϵ1,,Aϵ2,⋯,Aϵn) 「几何变换表现为坐标系轴心保持不动,整个坐标系拉伸或者缩放」;对任意
α
∈
V
\mathsf{\alpha \in V}
α∈V ,
∣
A
α
∣
=
∣
α
∣
。
\mathsf{\mid A\alpha \mid=\mid \alpha \mid}。
∣Aα∣=∣α∣。
上述是关于正交变换的定义以及在该定义之下互相等价的命题,在阅读实对称矩阵正交化例题以及具体的解题过程之前,请务必对以上内容细细品味!我们立刻开始实对称矩阵的例题。
三、经典例题——实对称矩阵的正交化
题: 设
A
=
(
4
−
1
−
1
1
−
1
4
1
−
1
−
1
1
4
−
1
1
−
1
−
1
4
)
\mathsf{A=\begin{pmatrix}{4}&{-1}&{-1}&{1}\\{-1}&{4}&{1}&{-1}\\{-1}&{1}&{4}&{-1}\\{1}&{-1}&{-1}&{4}\\\end{pmatrix}}
A=
4−1−11−141−1−114−11−1−14
,求正交矩阵
T
T
T ,使得
T
−
1
A
T
\mathsf{T^{-1}AT}
T−1AT 为对角矩阵。
解:
∣
λ
I
−
A
∣
=
∣
λ
−
4
1
1
−
1
1
λ
−
4
−
1
1
1
−
1
λ
−
4
1
−
1
1
1
λ
−
4
∣
=
(
λ
−
3
)
3
(
λ
−
7
)
=
0
\mathsf{\mid \lambda I-A\mid=\begin{vmatrix}{\lambda-4}&{1}&{1}&{-1}\\{1}&{\lambda-4}&{-1}&{1}\\{1}&{-1}&{\lambda-4}&{1}\\{-1}&{1}&{1}&{\lambda-4}\\\end{vmatrix}=(\lambda-3)^3(\lambda-7)}=0
∣λI−A∣=
λ−411−11λ−4−111−1λ−41−111λ−4
=(λ−3)3(λ−7)=0故A有特征值3(三重),7(一重)。
将特征值3代入
(
λ
I
−
A
)
α
=
0
\mathsf{(\lambda I-A)\alpha=0}
(λI−A)α=0 解得三个基础解系:
α
1
=
(
1
1
0
0
)
,
α
2
=
(
1
0
1
0
)
,
α
3
=
(
1
0
0
−
1
)
\alpha_1=\begin{pmatrix}1\\1\\0\\0\\\end{pmatrix},\alpha_2=\begin{pmatrix}1\\0\\1\\0\\\end{pmatrix},\alpha_3=\begin{pmatrix}1\\0\\0\\-1\\\end{pmatrix}
α1=
1100
,α2=
1010
,α3=
100−1
将
α
1
,
α
2
,
α
3
\mathsf{\alpha_1,\alpha_2,\alpha_3}
α1,α2,α3 正交化,令
β
1
=
α
1
,
\mathsf{\beta_1=\alpha_1},
β1=α1,
β
2
=
α
2
−
(
α
2
,
β
1
)
(
β
1
,
β
1
)
β
1
=
(
1
0
1
0
)
−
1
2
(
1
1
0
0
)
=
(
1
2
−
1
2
1
0
)
,
\mathsf{\beta_2=\alpha_2-\frac{(\alpha_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1=\begin{pmatrix}1\\0\\1\\0\\\end{pmatrix}-\frac{1}{2}\begin{pmatrix}1\\1\\0\\0\\\end{pmatrix}=\begin{pmatrix}{\frac{1}{2}}\\{-\frac{1}{2}}\\{1}\\{0}\\\end{pmatrix}},
β2=α2−(β1,β1)(α2,β1)β1=
1010
−21
1100
=
21−2110
,
β
3
=
α
3
−
(
α
3
,
β
1
)
(
β
1
,
β
1
)
β
1
−
(
α
3
,
β
2
)
(
β
2
,
β
2
)
β
2
=
(
1
0
0
−
1
)
−
1
2
(
1
1
0
0
)
−
1
2
3
2
(
1
2
−
1
2
1
0
)
=
(
1
3
−
1
3
−
1
3
−
1
)
\mathsf{\beta_3=\alpha_3-\frac{(\alpha_3,\beta_1)}{(\beta_1,\beta_1)}\beta_1-\frac{(\alpha_3,\beta_2)}{(\beta_2,\beta_2)}\beta_2}=\begin{pmatrix}1\\0\\0\\-1\\\end{pmatrix}-\frac{1}{2}\begin{pmatrix}1\\1\\0\\0\\\end{pmatrix}-\frac{\frac{1}{2}}{\frac{3}{2}}\begin{pmatrix}\frac{1}{2}\\-\frac{1}{2}\\{1}\\{0}\\\end{pmatrix}=\begin{pmatrix}{\frac{1}{3}}\\{-\frac{1}{3}}\\-\frac{1}{3}\\-1\\\end{pmatrix}
β3=α3−(β1,β1)(α3,β1)β1−(β2,β2)(α3,β2)β2=
100−1
−21
1100
−2321
21−2110
=
31−31−31−1
以上三步为施密特正交化。
把
β
1
,
β
2
,
β
3
\mathsf{\beta_1,\beta_2,\beta_3}
β1,β2,β3 单位化,得
η
1
=
(
2
2
2
2
0
0
)
,
η
2
=
(
6
6
−
6
6
6
3
0
)
,
η
3
=
(
3
6
−
3
6
−
3
6
−
3
2
)
.
\mathsf{\eta_1=\begin{pmatrix}\frac{\sqrt2}{2}\\\frac{\sqrt2}{2}\\0\\0\\\end{pmatrix},\eta_2=\begin{pmatrix}\frac{\sqrt6}{6}\\-\frac{\sqrt6}{6}\\\frac{\sqrt6}{3}\\0\\\end{pmatrix},\eta_3=\begin{pmatrix}\frac{\sqrt3}{6}\\-\frac{\sqrt3}{6}\\-\frac{\sqrt3}{6}\\-\frac{\sqrt3}{2}\\\end{pmatrix}}.
η1=
22
22
00
,η2=
66
−66
36
0
,η3=
63
−63
−63
−23
.
将特征值7代入
(
λ
I
−
A
)
α
=
0
\mathsf{(\lambda I-A)\alpha=0}
(λI−A)α=0 求得一个基础解系:
α
4
=
(
1
,
−
1
,
−
1
,
1
)
′
,
\mathsf{\alpha_4=(1,-1,-1,1)'},
α4=(1,−1,−1,1)′, 把
α
4
\alpha_4
α4 单位化,得
η
4
=
(
1
2
,
−
1
2
,
−
1
2
,
1
2
)
′
\mathsf{\eta_4=(\frac{1}{2},-\frac{1}{2},-\frac{1}{2},\frac{1}{2})'}
η4=(21,−21,−21,21)′
令正交矩阵
T
=
(
η
1
,
η
2
,
η
3
,
η
4
)
,
\mathsf{T=(\eta_1,\eta_2,\eta_3,\eta_4)},
T=(η1,η2,η3,η4), 有
T
−
1
A
T
=
d
i
a
g
{
3
,
3
,
3
,
7
}
\mathsf{T^{-1}AT=diag\lbrace3,3,3,7\rbrace}
T−1AT=diag{3,3,3,7}
至此,笔者已经将一个经典的实对称矩阵例题的完整过程全方位的展示出来了。笔者的引导式提问基本会围绕以上的例题展开,在此笔者再度提醒一遍,必须将这道至少做到熟悉的程度,否则,你的思考收获并不大。
四、什么是实对称矩阵?
现在请跟随笔者将一个最基本的问题解决,那就是 什么是实对称矩阵? 在这里我们先不谈实对称矩阵的性质,就从纯粹的矩阵角度出发,以纯粹观察的方式得到实对称矩阵的定义。
A
=
(
4
−
1
−
1
1
−
1
4
1
−
1
−
1
1
4
−
1
1
−
1
−
1
4
)
\mathsf{A=\begin{pmatrix}{4}&{-1}&{-1}&{1}\\{-1}&{4}&{1}&{-1}\\{-1}&{1}&{4}&{-1}\\{1}&{-1}&{-1}&{4}\\\end{pmatrix}}
A=
4−1−11−141−1−114−11−1−14
仔细观察上述矩阵A,我们不难发现对于 矩阵A里的所有元素均落在实数域
R
\mathsf{R}
R 的范围内,且矩阵A中关于主对角线对称的每一对元素相等。
至此,我们可以立即得到实对称矩阵的定义:
若
s
×
n
\mathsf{s \times n}
s×n 阶矩阵的元素都落在 实数域R 内,且对于矩阵A的转置运算有
A
=
A
′
,
\mathsf{A=A'},
A=A′, 即
a
i
j
=
a
j
i
,
\mathsf{a_{ij}=a_{ji}},
aij=aji, 则称矩阵A为 实对称矩阵
(
s
y
m
m
e
t
r
i
c
−
m
a
t
r
i
c
e
s
)
\mathsf{(symmetric-matrices)}
(symmetric−matrices)。
五、实对称矩阵A的性质
实对称矩阵A的特征值都落在实数域
R
\mathsf{R}
R上;实对称矩阵A其互异的特征向量两两正交;实对称矩阵A正交相似于对角阵;存在某个大于零实数C,满足任意
x
∈
R
n
\mathsf{x \in R^n}
x∈Rn,
∣
x
′
A
x
∣
≤
C
x
′
x
|x'Ax|\le Cx'x
∣x′Ax∣≤Cx′x;实对称矩阵A主对角线上的任意元素
a
i
i
≤
λ
m
a
x
\mathsf{a_{ii}\le \lambda_{max}}
aii≤λmax;实对称矩阵
A
′
A
\mathsf{A'A}
A′A 的特征值都是非负实数;实对称矩阵的正特征值与正主元数相同。
在上述几条性质中,性质1⃣️与性质2⃣️证明对于大家来说应该是老生常谈了。笔者不想在这两者上话费太多的笔墨,这里笔者直接将截图附上,其余则不再细说。
对于其他性质,笔者将会在下一小节展开细细的分析。
六、实对称矩阵性质的证明
| “性质3⃣️:实对称矩阵A的特征值都落在实数域
R
\mathsf{R}
R”的证明
对于“性质3⃣️:实对称矩阵A正交相似于对角阵” ,其本质上是说对任何实对称矩阵A存在正交矩阵Q使得
Q
′
A
Q
\mathsf{Q'AQ}
Q′AQ 为对角阵。
| “性质4⃣️:存在某个大于零实数C,满足任意
x
∈
R
n
\mathsf{x \in R^n}
x∈Rn,
∣
x
′
A
x
∣
≤
C
x
′
x
|x'Ax|\le Cx'x
∣x′Ax∣≤Cx′x”的证明
证明:
| “性质5⃣️:实对称矩阵A主对角线上的任意元素
a
i
i
≤
λ
m
a
x
\mathsf{a_{ii}\le \lambda_{max}}
aii≤λmax”的证明
证明:
| “性质6⃣️:实对称矩阵
A
′
A
\mathsf{A'A}
A′A 的特征值都是非负实数”的证明
这一性质有两种证法。
证法一:
由于
A
′
A
\mathsf{A'A}
A′A 是n级实对称矩阵,因此存在n级正交矩阵
T
\mathsf{T}
T,使得
T
−
1
(
A
′
A
)
T
=
d
i
a
g
{
λ
1
,
⋯
,
λ
n
}
,
T^{-1}(A'A)T=diag\lbrace\lambda_1,\cdots,\lambda_n\rbrace,
T−1(A′A)T=diag{λ1,⋯,λn}, 其中
λ
1
,
⋯
,
λ
n
\mathsf{\lambda_1,\cdots,\lambda_n}
λ1,⋯,λn 是
A
′
A
\mathsf{A'A}
A′A 的全部特征值,故有
λ
i
=
[
(
A
T
)
′
(
A
T
)
]
(
i
;
i
)
=
∑
k
=
1
n
[
(
A
T
)
′
(
i
;
k
)
]
[
(
A
T
)
(
k
;
i
)
]
=
∑
k
=
1
n
[
(
A
T
)
(
k
;
i
)
]
2
≥
0
\lambda_i=[(AT)'(AT)](i;i)=\displaystyle\sum_{k=1}^{n}[(AT)'(i;k)][(AT)(k;i)]=\displaystyle\sum_{k=1}^{n}[(AT)(k;i)]^2\ge 0
λi=[(AT)′(AT)](i;i)=k=1∑n[(AT)′(i;k)][(AT)(k;i)]=k=1∑n[(AT)(k;i)]2≥0
证法二:
设
λ
o
\mathsf{\lambda_o}
λo 是
A
′
A
\mathsf{A'A}
A′A 的一个特征值,则存在
α
∈
R
n
\alpha\in R^n
α∈Rn 且
a
≠
0
a \ne 0
a=0,使得
A
′
A
α
=
λ
o
α
\mathsf{A'A\alpha=\lambda_o\alpha}
A′Aα=λoα。两边左乘
α
′
\alpha'
α′,得
α
′
A
′
A
α
=
λ
o
α
′
α
\alpha'A'A\alpha=\lambda_o\alpha'\alpha
α′A′Aα=λoα′α 即
(
A
α
)
′
(
A
α
)
=
λ
α
′
α
(A\alpha)'(A\alpha)=\lambda \alpha'\alpha
(Aα)′(Aα)=λα′α。由于
α
≠
0
,
\alpha\ne 0,
α=0, 因此
α
′
α
=
∣
α
∣
2
>
0
,
\alpha'\alpha=|\alpha|^2 \gt 0,
α′α=∣α∣2>0, 从而
λ
o
=
(
A
α
)
′
(
A
α
)
α
′
α
=
(
A
α
,
A
α
)
∣
α
2
∣
≥
0
.
\mathsf{\lambda_o=\frac{(A\alpha)'(A\alpha)}{\alpha'\alpha}=\frac{(A\alpha,A\alpha)}{|\alpha^2|} \ge 0}.
λo=α′α(Aα)′(Aα)=∣α2∣(Aα,Aα)≥0.
| “性质7⃣️:实对称矩阵的正特征值与正主元数相同”的证明
在开始证明之前,我们先来看一条引理,并通过对引理的证明来引出对性质7⃣️的证明。
引理: 设矩阵
C
=
(
C
i
j
)
n
×
n
,
\mathsf{C=(C_{ij})_{n\times n}},
C=(Cij)n×n, 可逆,且
(
I
P
−
I
n
−
p
)
=
C
′
(
I
q
−
I
n
−
q
)
C
\mathsf{\begin{pmatrix}I_P& \\ &-I_{n-p}\\\end{pmatrix}=C'\begin{pmatrix}I_q& \\ &-I_{n-q}\\\end{pmatrix}C}
(IP−In−p)=C′(Iq−In−q)C则有
p
=
q
\mathsf{p=q}
p=q
引理的证明:
假设
p
>
q
,
\mathsf{p\gt q},
p>q, 则齐次线性方程组
{
C
11
x
1
+
⋯
+
C
1
p
x
P
=
0
⋮
C
q
1
x
1
+
⋯
+
C
q
p
x
p
=
0
\mathsf{\left\{\begin{array}{c}C_{11}x_1+\cdots+C_{1p}x_P=0 \\ \vdots\\C_{q1}x_1+\cdots+C_{qp}x_p=0\end{array}\right.}
⎩
⎨
⎧C11x1+⋯+C1pxP=0⋮Cq1x1+⋯+Cqpxp=0
因列数
p
>
\mathsf{p\gt}
p> 行数
q
,
\mathsf{q},
q, 必有非零解
(
x
1
,
x
2
,
⋯
,
x
p
)
′
\mathsf{(x_1,x_2,\cdots,x_p)}'
(x1,x2,⋯,xp)′。
令
X
=
(
x
1
,
⋯
,
x
p
,
0
,
⋯
,
0
)
′
∈
R
,
y
=
C
x
,
\mathsf{X={(x_1,\cdots,x_p,0,\cdots,0)}' \in R,y=Cx},
X=(x1,⋯,xp,0,⋯,0)′∈R,y=Cx, 则有
y
=
(
0
,
⋯
,
0
,
y
q
+
1
,
⋯
,
y
n
)
′
\mathsf{y=(0,\cdots,0,y_{q+1},\cdots,y_n)'}
y=(0,⋯,0,yq+1,⋯,yn)′。
于是
X
′
(
I
p
−
I
n
−
p
)
X
=
X
′
C
′
(
I
q
−
I
n
−
q
)
C
X
=
y
′
(
I
q
−
I
n
−
q
)
y
.
\mathsf{X'\begin{pmatrix}I_p& \\ &-I_{n-p}\\\end{pmatrix}X=X'C'\begin{pmatrix}I_q& \\ &-I_{n-q}\\\end{pmatrix}CX}=y'\begin{pmatrix}I_q \\ &-I_{n-q}\\\end{pmatrix}y.
X′(Ip−In−p)X=X′C′(Iq−In−q)CX=y′(Iq−In−q)y.
由上可得出:
等式左边
=
x
1
2
+
⋯
+
x
p
2
>
0
(
x
≠
0
)
\mathsf{=x_1^2+\cdots+x_p^2\gt 0(x \neq 0)}
=x12+⋯+xp2>0(x=0)
等式右边
=
−
y
q
+
1
2
−
⋯
−
y
n
2
≤
0
\mathsf{=-y_{q+1}^2-\cdots-y_n^2 \le 0}
=−yq+12−⋯−yn2≤0
故左右两边矛盾,因此
p
≤
q
\mathsf{p\le q}
p≤q
同理可证
p
≥
q
,
\mathsf{p\ge q},
p≥q, 因此
p
=
q
\mathsf{p=q}
p=q
在有了以上的引理及其证明之后,我们可以着手性质7⃣️的证明。
性质7⃣️证明:
设实对称矩阵A的主元数为p,正特征值数为q,则
A
=
L
D
L
′
\mathsf{A=LDL'}
A=LDL′。 其中L是对角数为1的下三角阵,
D
=
d
i
a
g
(
d
1
,
⋯
,
d
n
)
\mathsf{D=diag(d_1,\cdots,d_n)}
D=diag(d1,⋯,dn)。 又有
A
=
Q
′
Λ
Q
,
Q
\mathsf{A=Q'\Lambda Q},Q
A=Q′ΛQ,Q 是正交阵,
Λ
=
d
i
a
g
(
λ
1
,
⋯
,
λ
n
)
,
\mathsf{\Lambda=diag(\lambda_1,\cdots,\lambda_n)},
Λ=diag(λ1,⋯,λn), 故
A
=
L
(
∣
d
1
∣
⋱
∣
d
n
∣
)
(
I
p
−
I
n
−
p
)
(
∣
d
1
∣
⋱
∣
d
n
∣
)
L
′
\mathsf{A=L\begin{pmatrix}\sqrt|d_1|& & \\ &\ddots& \\ & &\sqrt|d_n|\\\end{pmatrix}\begin{pmatrix}I_p& \\ &-I_{n-p}\\\end{pmatrix}\begin{pmatrix}\sqrt|d_1|& & \\ &\ddots& \\ & &\sqrt|d_n|\\\end{pmatrix}L'}
A=L
∣
d1∣⋱∣
dn∣
(Ip−In−p)
∣
d1∣⋱∣
dn∣
L′
A
=
Q
(
∣
λ
1
∣
⋱
∣
λ
n
∣
)
(
I
q
−
I
n
−
q
)
(
∣
λ
1
∣
⋱
∣
λ
n
∣
)
Q
′
\mathsf{A=Q\begin{pmatrix}\sqrt|\lambda_1|& & \\ &\ddots& \\ & &\sqrt|\lambda_n|\\\end{pmatrix}\begin{pmatrix}I_q& \\ &-I_{n-q}\\\end{pmatrix}\begin{pmatrix}\sqrt|\lambda_1|& & \\ &\ddots& \\ & &\sqrt|\lambda_n|\\\end{pmatrix}Q'}
A=Q
∣
λ1∣⋱∣
λn∣
(Iq−In−q)
∣
λ1∣⋱∣
λn∣
Q′
两者相等。
令
U
=
(
∣
d
1
∣
⋱
∣
d
n
∣
)
L
′
,
\mathsf{U=\begin{pmatrix}\sqrt|d_1|& & \\ &\ddots& \\ & &\sqrt|d_n|\\\end{pmatrix}L'},
U=
∣
d1∣⋱∣
dn∣
L′,
V
=
Q
(
∣
λ
1
∣
⋱
∣
λ
n
∣
)
,
V=\mathsf{Q\begin{pmatrix}\sqrt|\lambda_1|& & \\ &\ddots& \\ & &\sqrt|\lambda_n|\\\end{pmatrix}},
V=Q
∣
λ1∣⋱∣
λn∣
,
则
U
、
V
\mathsf{U、V}
U、V 可逆,且
(
I
p
−
I
n
−
p
)
=
(
U
′
)
−
1
V
′
(
I
q
−
I
n
−
q
)
V
U
−
1
,
\mathsf{\begin{pmatrix}I_p& \\ &-I_{n-p}\\\end{pmatrix}=(U')^{-1}V'\begin{pmatrix}I_q& \\ &-I_{n-q}\\\end{pmatrix}VU^{-1}},
(Ip−In−p)=(U′)−1V′(Iq−In−q)VU−1,
由引理可知
p
=
q
\mathsf{p=q}
p=q,得证。
| 非对称矩阵和实对称矩阵对角化的区别(含参考博文链接)
对于非对称矩阵的对角化求解,如
A
=
(
1
−
1
1
2
−
4
−
2
−
3
−
3
5
)
A=\begin{pmatrix}1&{-1}&1\\2&{-4}&{-2}\\{-3}&{-3}&5\\\end{pmatrix}
A=
12−3−1−4−31−25
我们通常先求出其特征值
λ
i
\lambda_i
λi ,再根据特征方程
(
A
−
λ
i
I
)
v
i
=
0
(A-\lambda_i I)v_i=0
(A−λiI)vi=0
求出对应的特征向量
v
i
\mathsf{v_i}
vi 组成特征向量矩阵
U
U
U,有
U
−
1
A
U
=
Λ
=
(
6
2
2
)
U^{-1}AU=\Lambda=\begin{pmatrix}6& & \\ &2& \\ & &2\\\end{pmatrix}
U−1AU=Λ=
622
在实对称矩阵的对角化求解中,我们一般是根据特征值求出对应的特征向量,开始施密特正交化紧接着单位化获取特征向量组成特征向量矩阵 T。但笔者想问的是这步是必须的吗?回顾前文所举的经典例题可以清晰的发现,即便不进行施密特正交化,所得的特征向量是天然正交的。问题来了,对角化
P
−
1
A
P
,
Q
−
1
A
Q
P^{-1}AP,Q^{-1}AQ
P−1AP,Q−1AQ 中的
P
、
Q
P、Q
P、Q 是什么关系呢?
对于这一问题,笔者在搜索的过程中发现一篇博文已经作出了精湛的见解,笔者会将博文的链接放在该小节末尾,但在你点击跳转之前,请确保自己已经作出一定的思考。该小节结束。
链接:「实对称矩阵为什么要进行正交化单位化操作呢?」
七、舒尔分解(Schur Decomposition)
https://blog.csdn.net/niu_123ming/article/details/82860983?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase
八、参考资料
笔者个人清华大学线性代数公开课笔记高等代数学习指导 邱维声著高等代数学习指南 蓝以中著百度文库文档两篇参考博文
九、文章更新时间记录
上一次发布时间系统记录为;「2020.6.1 22:47:09」修改标题;「2022.11.5 10:02」公开阅读权限;「2023.2.17 16:30」文章各个章节加上序号。「2025.2.21 23:06」