《矩阵分解与广义逆矩阵》学习笔记

本文系统地介绍了矩阵之间的等价、相似和合同关系,以及几种重要的矩阵分解技巧,包括核心-幂零分解、Hartwig-Spindelböck分解和广义逆矩阵的构造方法。本文还讨论了矩阵分解在工程领域的一些应用,例如求解线性方程组、最小二乘问题、奇异值分解等。本文利用了一些数学语言和自然语言来表达矩阵理论的概念和性质.

第一部分 矩阵的分类与不变量

这一部分总结了矩阵之间的等价、相似和合同关系,以及它们的不变量。这些关系和不变量在矩阵分解和广义逆矩阵的构造中起到了重要的作用。

  1. $A$,$B$等价

    $A$, $B$等价$\iff A$可以通过初等行变换或者初等列变换变成$B$.
    如果存在$m$阶可逆矩阵$P$和$n$阶可逆矩阵$Q$,使得
    $$
    A=P\begin{pmatrix}E_r & O \\ O & O\end{pmatrix}Q,
    $$
    其中$r=\operatorname{rank}(A)=\operatorname{rank}(B)$,$E_r$是$r$阶单位矩阵,$O$是零矩阵。这个分解式称为$A$的标准分解式。这里,秩是矩阵的一个重要的不变量,它表示矩阵的最大线性无关行(或列数),也就是矩阵所对应的线性映射的秩。等价关系具有自反性、对称性和传递性,因此可以把所有$m \times n$矩阵分为若千个等价类,每个等价类中的矩阵都有相同的秩,并且都可以化为如上所示的标准形。

    等价关系具有以下性质:

    • 等价关系是一种等价关系,即满足自反性、对称性和传递性。
    • 等价关系不改变矩阵的秩,即$\operatorname{rank}(A)=\operatorname{rank}(B)$。
    • 等价关系可以用初等变换来实现,即通过有限次的行变换或列变换,可以把一个矩阵变成另一个等价的矩阵。
    • 等价关系可以用于判断两个矩阵是否相等,即两个矩阵相等的充分必要条件是它们等价于同一个标准形。
  2. $A$,$B$相似

    $A$, $B$相似$\iff$存在$n$阶可逆矩阵$P$,使得$B=P^{-1}AP$.

    或者说,如果它们表示同一个线性映射在不同基下的矩阵。相似关系也具有自反性、对称性和传递性,因此可以把所有nxn矩阵分为若千个相似类,每个相似类中的矩阵都有相同的特征多项式、特征值、迹和行列式等代数不变量。另外每个相似类中都存在一个最简单的标准形,称为 Jordan 标准形,它是由若干个 Jordan 块组成的分块对角矩阵,每个Jordan 块是一个上三角矩阵,其主对角线上都是同一个特征值,其次对角线上都是 1。 Jordan 标淮形在不计较 Jordan块顺序的情况下是唯一确定的。另外,如果一个矩阵可以相似对角化,即相似于一个对角矩阵,则它必须满足其最小多项式没有重根。

    相似关系具有以下性质:

    • 相似关系是一种等价关系,即满足自反性、对称性和传递性。
    • 相似关系不改变矩阵的特征值和特征多项式,即$\det(A-\lambda I)=\det(B-\lambda I)$。
    • 相似关系可以用于判断两个矩阵是否相同,即两个矩阵相同的充分必要条件是它们相似于同一个对角形。
    • 相似关系可以用于求解线性方程组或线性微分方程组,即通过相似变换,可以把一个复杂的方程组化为一个简单的方程组。
  3. $A$,$B$合同

    $A$, $B$合同$\iff$存在$n$阶可逆矩阵$P$,使得$B=P^TAP$.

    或者说,如果它们表示同一个二次型在不同基下的矩阵。合同关系也具有自反性、对称性和传递性,因此可以把所有nxn矩阵分为若干个合同类。对于实对称矩阵而言,它们合同的充分必要条件是它们具有相同的正惯性指数和负惯性指数,这两个数表示实对称矩阵所对应的二次型正定部分和负定部分的维数。另外,每个合同类中都存在一个最简单的标淮形,称为规范形,它是由若干个1和-1 组成的对角矩阵。规范形在不计较1 和-1顺序的情况 下是唯一确定的。另外,如果一个实对称矩阵是正定或负定或半正定或半负定,则它必须满足其所有特征值都是正数或负数或非负数或非正数。

    合同关系具有以下性质:

    • 合同关系是一种等价关系,即满足自反性、对称性和传递性。
    • 合同关系不改变矩阵的秩和正惯性指数(正特征值的个数),即$\operatorname{rank}(A)=\operatorname{rank}(B)$,$\operatorname{p}(A)=\operatorname{p}(B)$。
    • 合同关系可以用于判断两个实对称矩阵是否相等,即两个实对称矩阵相等的充分必要条件是它们合同于同一个对角形,并且对角元素按从大到小排列。
    • 合同关系可以用于求解实二次型或实二次微分方程组,即通过合同变换,可以把一个复杂的二次型化为一个标准形或规范形。

第二部分 矩阵分解

  1. 核心-幂零分解:任意一个$n\times n$复矩阵$A$都可以唯一地分解为
    $$
    A=A_1+A_2,
    $$
    其中$r(\operatorname{rank}(A_1))=r(\operatorname{rank}(A_2))=r(\operatorname{rank}(A))$, $A_1A_2=A_2A_1=O$, $A_2^k=O$, 其中$k>0$. 这个分解式称为核心-幂零分解。它具有以下性质:

    • $A_1=AAdA$, 其中$dA=A^+$是Drazin逆(广义逆)。
    • $A_2=A-AAdA=(I-A^+A)A=A(I-AA^+)$.
    • $d(A_1)=d(A)$, $d(A_2)=0$, 其中$d(A)$表示最小多项式(最小次数且能整除特征多项式)。
    • $s(A_1)=s(A)$, $s(A_2)=0$, 其中$s(A)$表示谱半径(最大模特征值)。

    核心-幂零分解是指把一个$n \times n$复矩阵$A$分解成两个矩阵$A_1$和$A_2$的和,其中$A_1$是$A$的核心部分,即满足$A_1^2$=$A_1$的部分,而$A_2$是幂零部分,即满足$A_2^k=0$的部分,而且这两个部分相互正交,即$A_1A_2=A_2A_1=0$。这种分解可以用如下定理给出:

    设$A$为$n \times n$复矩阵,则存在$n \times n$复矩阵 $A_1$, $A_2$ 满足,$A=A1 +A2$且

    • $\operatorname{rank}(A_1^2)=\operatorname{rank}(A_1)$,
    • $A_1A_2=A_2A_1=0$
    • $A_2$是幂零矩阵, 即存在正整数$k$,使得$A_2^k=0$。
  2. Hartwig-Spindelböck分解:任意一个$n\times n$复矩阵$A$都可以唯一地分解为

    $$
    A=U\begin{pmatrix}\Sigma K & \Sigma L \\ O & O \end{pmatrix}U^H,
    $$

    其中$\Sigma=\operatorname{diag}(\sqrt{\lambda_1},\ldots,\sqrt{\lambda_r})$, $\lambda_1,\ldots,\lambda_r>0$是非零奇异值(非零特征值), $K,L,O,U,U^H$都是酉矩阵(满足 $UU^H=U^HU=I$, $I$是单位矩阵),并且满足 $KK^H+LL^H=I$. 这个分解式称为Hartwig-Spindelböck分解。它具有以下性质:

    • $K,L,O,U,U^H$都与$\Sigma,A,A^H,AA^H,A^HA$相容(满足交换律)。
    • $\Sigma K,\Sigma L,O,O$都与$\Sigma,A,A^H,AA^H,A^HA$不相容(不满足交换律)。
    • $\Sigma K,\Sigma L,O,O$都与$\Sigma K,\Sigma L,O,O$相容(满足交换律)。
    • $\Sigma K,\Sigma L,O,O$都与$\Sigma K,\Sigma L,O,O$不可约(不能再进一步分解)。
  3. Core-EP分解: 将一个矩阵分解为一个半单矩阵和一个可逆矩阵的和,其中半单矩阵是指与对角矩阵相似的矩阵。
    这种分解的优点是可以将矩阵的特征值和特征向量分离出来,从而方便进行矩阵的运算和分析。

  4. EP-幂零分解: 将一个矩阵分解为一个可逆矩阵和一个幂零矩阵的和,其中幂零矩阵是指存在正整数k使得矩阵的k次方为零矩阵。
    这种分解的优点是可以将矩阵的秩和核心部分分离出来,从而方便进行矩阵的偏序和广义逆的研究。

  5. 广义逆矩阵:任意一个$m\times n$复矩阵 $X$都存在一个$n\times m$复矩阵 $X^{(k)}$满足以下四个条件:
    $$
    XX^{(k)}X=X, \quad X^{(k)}XX^{(k)}=X^{(k)}, \quad (XX^{(k)})^H=XX^{(k)}, \quad (X^{(k)}X)^H=X^{(k)}X.
    $$

    这个矩阵 $X^{(k)}$称为 $X$的广义逆矩阵,其中 $k$是一个非负整数,表示 $X^{(k)}$的秩。广义逆矩阵具有以下性质:

    • 广义逆矩阵是唯一的,即如果 $X^{(k)}$和 $Y^{(k)}$都是 $X$的广义逆矩阵,则 $X^{(k)}=Y^{(k)}$.
    • 广义逆矩阵的秩等于原矩阵的秩,即 $\operatorname{rank}(X)=\operatorname{rank}(X^{(k)})=k$.
    • 广义逆矩阵的广义逆矩阵等于原矩阵,即 $(X^{(k)})^{(k)}=X$.
    • 广义逆矩阵可以用于求解线性方程组或线性最小二乘问题,即如果 $AX=B$是一个线性方程组或线性最小二乘问题,则 $A^{(k)}B$是一个解,其中 $A^{(k)}$是 $A$的广义逆矩阵。
    • 广义逆矩阵可以用Hartwig-Spindelböck分解来求得,即如果
      $$
      A=U\begin{pmatrix}\Sigma K & \Sigma L \\ O & O \end{pmatrix}U^*
      $$
      是 $A$的Hartwig-Spindelböck分解,则
      $$
      A^{(k)}=U\begin{pmatrix}K\Sigma^{-1} & O \\ O & O \end{pmatrix}U^*
      $$是 $A$的广义逆矩阵。

(注:在文中出现的$A^H$是指$A$的共轭转置,即$A^H=\bar{A}^T$)

《矩阵QR分解的三种方法》学习笔记

本文介绍了矩阵的QR分解的三种方法,分别是Schmidt正交化方法,初等变换方法和Givens变换方法。QR分解是指将一个矩阵分解为一个正交矩阵和一个上三角矩阵的乘积,这种分解在数值分析和线性代数中有很多应用。文章给出了每种方法的原理,步骤和例子,以及一些性质和结论。

  1. Schmidt正交化方法是最常用的方法,它的基本思想是将矩阵的列向量进行正交化和单位化,得到一个列正交矩阵Q和一个非奇异上三角矩阵R。这种方法利用了正交向量组的等价性和线性无关性。
  2. 初等变换方法是利用矩阵的第三种行和列初等变换,将矩阵A转化为对称正定矩阵A^T A,然后对A^T A同时进行相应的行和列初等变换,得到一个对角矩阵D,其中对角元素全为正数。再利用D构造一个非奇异上三角矩阵R和一个列正交矩阵Q。
  3. Givens变换方法是利用Givens矩阵,也称为平面旋转矩阵,对矩阵A进行左乘,使得A的某些元素变为零,从而得到一个上三角矩阵R。Givens矩阵是一个正交矩阵,它只在某两个坐标轴上进行旋转,不改变其他坐标轴上的元素。通过逆序地将所有Givens矩阵相乘,可以得到一个列正交矩阵Q。

1 Schmidt正交化方法

这种方法是将矩阵的列向量进行正交化和单位化,得到一个列正交矩阵Q和一个非奇异上三角矩阵R。具体步骤如下:

  1. 令$\alpha_1 = a_1$,其中$a_1$是矩阵A的第一列向量。
  2. 令$q_1 = \frac{\alpha_1}{|\alpha_1|}$,其中$|\cdot|$表示向量的模长。
  3. 对于$i=2,3,\dots,n$,令$\alpha_i = a_i - \sum_{j=1}^{i-1}(q_j^T a_i)q_j$,其中$a_i$是矩阵A的第i列向量,$q_j$是已经求出的第j个单位正交向量。
  4. 令$q_i = \frac{\alpha_i}{|\alpha_i|}$。
  5. 最后得到$Q=[q_1,q_2,\dots,q_n]$和$R=Q^T A$。

  1. 从矩阵A中取出第一列向量$a1$,将其单位化,得到$q1$。

  2. 从矩阵A中取出第二列向量$a2$,将其减去与$q1$的投影,得到一个与$q1$正交的向量$b2$,然后将其单位化,得到$q2$。(注意:这里的投影是指向量在另一个向量上的投影,即向量在另一个向量上的投影长度乘以另一个向量的单位向量。)

  3. 重复上述过程,直到取出所有的列向量,得到一组正交单位向量$q1,q2,…,qn$。

  4. 将这组向量作为矩阵$Q$的列向量,即$Q=[q1,q2,…,qn]$。

  5. 计算$R=Q^TA$,其中$Q^T$是$Q$的转置矩阵。由于$Q$是正交矩阵,$Q^TQ=I$,所以$R=AQQ^TA$。由于$Q$的列向量是正交的,$R$是一个上三角矩阵。

例如,对于矩阵$$A=\begin{bmatrix}1 & -1 & 4 \\ 1 & 4 & -2 \\ 1 & 4 & 2 \\ 1 & -1 & 0 \end{bmatrix}$$,我们可以按照上述步骤求出$$Q=\begin{bmatrix}0.5 & -0.5 & 0.5 \\ 0.5 & 0.5 & -0.5 \\ 0.5 & 0.5 & 0.5 \\ 0.5 & -0.5 & -0.5 \end{bmatrix}$$和$$R=\begin{bmatrix}2 & 3 & 2 \\ 0 & 5 & -2 \\ 0 & 0 & \sqrt{10} \end{bmatrix}$$

注: 步骤1-3位为Gram–Schmidt过程,具体过程如下:
给定一组线性无关的向量${v_1, …, v_k}$,Gram–Schmidt过程可以产生一组标准正交的向量${u_1, …, u_k}$,使得
$$u_1 = \frac{v_1}{|v_1|}$$
$$u_i = \frac{v_i - \sum_{j=1}^{i-1} \langle v_i, u_j \rangle u_j}{|v_i - \sum_{j=1}^{i-1} \langle v_i, u_j \rangle u_j|}, \quad i = 2, …, k$$
其中$\langle \cdot, \cdot \rangle$表示内积,$|\cdot|$表示向量的范数(长度)。

这个过程可以看作是对给定向量组的一种正交化处理,将原来的向量组变成一组正交的向量组。这个过程的几何意义是,从原来的向量组中,依次取出一个向量,然后将其减去与前面所有向量的投影,得到一个与前面所有向量都正交的向量,然后将其单位化,得到一个单位正交向量。重复这个过程,直到取出所有的向量,得到一组正交单位向量。

2 初等变换方法

这种方法是利用矩阵的第三种行和列初等变换,将矩阵A转化为对称正定矩阵$A^T A$,然后对$A^T A$同时进行相应的行和列初等变换,得到一个对角矩阵D,其中对角元素全为正数。再利用D构造一个非奇异上三角矩阵R和一个列正交矩阵Q。具体步骤如下:

  1. 对于$i=1,2,\dots,n-1$,令$p_{ii}=a_{ii}$,其中$a_{ii}$是矩阵A的第i行第i列元素。
  2. 对于$j=i+1,i+2,\dots,n$,令$p_{ij}=a_{ij}-\frac{a_{ii}}{p_{ii}}a_{ji}$,其中$a_{ij}$和$a_{ji}$是矩阵A的第i行第j列和第j行第i列元素。
  3. 对于$k=i+1,i+2,\dots,n$,令$p_{kk}=a_{kk}-\sum_{j=i+1}^{k-1}\frac{p_{kj}^2}{p_{jj}}$。
  4. 对于$k=i+2,i+3,\dots,n$和$j=i+1,i+2,\dots,k-1$,令$p_{kj}=a_{kj}-\sum_{s=i+1}^{j-1}\frac{p_{ks}}{p_{ss}}p_{sj}$。
  5. 最后得到$P=[p_{ij}]$和$D=P^T P$。
  6. 对于$i=1,2,\dots,n$,令$r_{ii}=\sqrt{d_{ii}}$,其中$d_{ii}$是矩阵D的第i行第i列元素。
  7. 对于$i=1,2,\dots,n-1$和$j=i+1,i+2,\dots,n$,令$r_{ij}=\frac{p_{ij}}{r_{ii}}$。
  8. 最后得到$R=[r_{ij}]$和$Q=A R^{-1}$。

  1. 将矩阵$A$转置乘以$A$,得到一个对称正定矩阵$B=A^TA$。
  2. 对$B$进行第三种行和列初等变换,使得$B$变成一个对角矩阵$D$,并记录每次变换所用的初等矩阵$P_i$和$Q_i$。
  3. 对$D$开平方根,得到一个非奇异上三角矩阵$R$。
  4. 将所有的$P_i$和$Q_i$相乘,得到一个正交矩阵$Q$。

例如,对于矩阵$$A=\begin{bmatrix}3 & -6 \\ 4 & -8 \end{bmatrix}$$,我们可以按照上述步骤求出$$P=\begin{bmatrix}3 & -6 \\ 4 & -4 \end{bmatrix}$$,$$D=\begin{bmatrix}25 & -50 \\ -50 &100 \end{bmatrix}$$,$$R=\begin{bmatrix}5 & -10 \\ 0 &10 \end{bmatrix}$$和$$Q=\begin{bmatrix}-0.6 & -0.8 \\ -0.8 &0.6 \end{bmatrix}$$

3 Givens变换方法

这种方法是利用Givens矩阵,也称为平面旋转矩阵,对矩阵A进行左乘,使得A的某些元素变为零,从而得到一个上三角矩阵R。Givens矩阵是一个正交矩阵,它只在某两个坐标轴上进行旋转,不改变其他坐标轴上的元素。通过逆序地将所有Givens矩阵相乘,可以得到一个列正交矩阵Q。具体步骤如下:

  1. 从矩阵A的第一列开始,依次对每一列进行Givens变换,使得每一列除了对角线上的元素外,其他元素都变为零,得到一个上三角矩阵R。
  2. 记录每次变换所用的Givens矩阵$G_i$,并将它们逆序相乘,得到一个正交矩阵Q。

《关于反对称矩阵的迹》学习笔记

这篇文章主要研究了反对称矩阵的迹的一些性质和不等式。反对称矩阵是指转置等于负的矩阵,它在矩阵理论和实际应用中都有重要的意义。迹是指矩阵的主对角线元素之和,它是矩阵的一个重要的数值特征,在许多领域中都有广泛的应用。

文章首先给出了反对称矩阵、Hermite矩阵和迹的定义,以及一些基本的引理。然后,文章给出了七个定理,分别讨论了反对称矩阵的迹与自身、可逆性、转置、乘积、特征值等方面的关系。最后,文章利用虚数单位将实反对称矩阵与Hermite矩阵联系起来,给出了实反对称矩阵与Hermite矩阵的迹的几个不等式。

下面我们分别介绍每个定理及其证明过程和解释。


定理1:设$A$是$n$阶方阵,那么:

(1)若$A$是反对称矩阵,则$\mathrm{tr}A=0$;

(2)若$A$是反对称矩阵且可逆,则$\mathrm{tr}A^{-1}=0$;

(3)$\mathrm{tr}(A-A^T)=0$。

证明:由定义1和定义2,易得(1);容易验证,若$A$是反对称矩阵且可逆,则$A$的逆矩阵也是反对称矩阵,由(1)知(2)成立;对于任意$n$阶矩阵$A$,$A-A^T$显然是反对称矩阵,由(1)可得:
$$
\mathrm{tr}A=\mathrm{tr}(A-A^T)=0.
$$

解释:这个定理说明了反对称矩阵的迹必为零,无论是否可逆。这是因为反对称矩阵的主对角线元素都为零,而迹就是主对角线元素之和。另外,这个定理还说明了任意方阵减去它的转置后得到的也是一个反对称矩阵,其迹也为零。


定理2:设$A$是$n$阶反对称矩阵,则对任意的$n$阶方阵$P$,有$\mathrm{tr}(A^TAP)=\mathrm{tr}(PAP^T)=0$。

证明:因为$A$是$n$阶反对称矩阵,即$A^T=-A$,所以
$$
(P^TAP)^T=P^TA^T(P^T)^T=P^T(-A)P=-P^TAP,
$$
即$P^TAP$是反对称矩阵,同理$PAP^T$也是反对称矩阵,由定理1得
$$
\mathrm{tr}(P^TAP)=\mathrm{tr}(PAP^T)=0.
$$

解释:这个定理说明了反对称矩阵与任意方阵相乘后再转置相乘得到的仍然是一个反对称矩阵,其迹为零。这可以看作是一种不变性或保持性质。


定理3:设$A,B\in C^{n\times n}$,其中有一为对称矩阵,另一为反对称矩阵,则$\mathrm{tr}AB=0$。

证明:不妨设

$$A=\begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{12} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots &\vdots \\ a_{1n} & a_{2n} & \cdots & a_{nn} \end{pmatrix}, $$

$$B=\begin{pmatrix} 0&b_{12}&\cdots&b_{1n}\\ -b_{12}&0&\cdots&b_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ -b_{1n}&-b_{2n}&\cdots&0 \end{pmatrix}$$

且$A^T=A,B^T=-B$,则
$$ AB=\begin{pmatrix} a_{11}b_{12}-a_{12}b_{12}&a_{11}b_{13}-a_{13}b_{12}&\cdots&a_{11}b_{1n}-a_{1n}b_{12}\\ -a_{11}b_{12}+a_{12}b_{11}&-a_{11}b_{13}+a_{13}b_{11}&\cdots&-a_{11}b_{1n}+a_{1n}b_{11}\\ \vdots&\vdots&\ddots&\vdots\\ -a_{11}b_{21}+a_{21}b_{11}&-a_{11}b_{31}+a_{31}b_{11}&\cdots&-a_{11}b_{n1}+a_{n1}b_{11} \end{pmatrix}.$$

记 $C=AB$,则
$$
\mathrm{tr}AB=\mathrm{tr}C=\sum^n_i=1c_ii=\sum^n_i=1(\sum^n_j=1 a_ij b_ji)=0.
$$

解释:这个定理说明了一个方阵与它的转置相等或相差一个负号时,它们相乘后得到的方阵的迹为零。这可以看作是一种正交性或互补性质。


定理4:设 $A,B,C $都是 $n $ 阶反对称矩阵,则
$$\mathrm{tr}(ABC)= \mathrm{tr}(BCA)= \mathrm{tr}(CAB)=- \mathrm{tr}(CBA)=- \mathrm{tr}(BAC)=- \mathrm{tr}(ACB)$$

证明:因为 $A,B,C $都是 $n $ 阶反对称矩阵,即 $A^T=- A,B^T=- B,C^T=-C $。
$$
\mathrm{tr}(ABC)= \mathrm{tr}(ABC)^T= \mathrm{tr}(C^TB^TA^T)= \mathrm{tr}[(-C)(-B)(-A)]= \mathrm{tr}{(-CBA)}= - \mathrm{tr}{(CBA)}.
$$
显然可得
$$
\mathrm{tr}(ABC)= \mathrm{tr}(BCA)= \mathrm{tr}(CAB),
$$

$$
\mathrm{tr}(CBA)= \mathrm{tr}(BAC)= \mathrm{tr}(ACB).
$$

所以,
$$
\mathrm{tr}(ABC)= \mathrm{tr}(BCA)= \mathrm{tr}(CAB)=- \mathrm{tr}(CBA)=- \mathrm{tr}(BAC)=- \mathrm{tr}(ACB).
$$

解释:这个定理说明了三个反对称矩阵相乘后得到的方阵的迹与它们相乘的顺序有关。当它们按顺时针或逆时针方向循环移动时,它们相乘后得到的方阵的迹不变;当它们交换其中两个时,它们相乘后得到的方阵的迹的符号相反。这可以看作是一种循环性或交换性质。


定理5:设$A,B$都是$n$阶反对称矩阵,则$\mathrm{tr}(AB-BA)=0$。

证明:由定理3,得
$$
\mathrm{tr}(AB-BA)=\mathrm{tr}AB-\mathrm{tr}BA=0-0=0.
$$

解释:这个定理说明了两个反对称矩阵相乘后再相减得到的方阵的迹为零。这可以看作是一种对称性或平衡性质。


定理6:设$A$是$n$阶反对称矩阵,则$A$的特征值都是纯虚数或零。

证明:设$\lambda$是$A$的一个特征值,$\alpha$是对应的特征向量,即

$
A\alpha=\lambda\alpha.
$

两边取共轭转置,得
$$
(A\alpha)^H=\lambda^H\alpha^H,
$$


$$
\alpha^HA^H=\lambda^H\alpha^H.
$$
因为$A$是反对称矩阵,即$A^T=-A$,所以
$$
\alpha^H(-A)=\lambda^H\alpha^H,
$$

$$
-A\alpha^H=\lambda^H\alpha^H.
$$
将上式与原式相乘,得
$$
-A^2(\alpha\alpha^H)=\lambda\lambda^H(\alpha\alpha^H).
$$
因为$\alpha\neq 0$,所以$\alpha\alpha^H\neq 0$,从而可得
$$
-A^2=\lambda\lambda^HI_n,
$$

$$
A^2=-\lambda\lambda^HI_n.
$$
取迹,得
$$
\mathrm{tr}(A^2)=-n\lambda\lambda^H.
$$
由引理4,得
$$
\mathrm{tr}(A^2)=-2n(\mathrm{tr}A)^2=0,
$$
所以$\lambda\lambda^H=0$,即$\lambda=0$或$\lambda$是纯虚数。

解释:这个定理说明了反对称矩阵的特征值都是纯虚数或零。这是因为反对称矩阵与它的转置相差一个负号,所以它们的特征值也要满足这样的关系,即$\lambda=-\lambda^H$,从而只能是纯虚数或零。

(注:在文中出现的$A^H$是指$A$的共轭转置,即$A^H=\bar{A}^T$)


定理7:设 $A,B $都是 $n $ 阶反对称矩阵,则 $\mathrm{tr}(AB) \leqslant 0 $。

证明:由定理6,知 $A,B $的特征值都是纯虚数或零。设 $\{\lambda_i\}_{i=1}^{n}$
是 $A $ 的特征值集合, $\{\mu_j \}_{j=1}^{n} $ 是 $B $ 的特征值集合,则有

$$ \begin{aligned}
& \mathrm{tr}(AB) = \sum^n_{i=1}\sum^n_{j=1}\langle Ae_i,Be_j\rangle \\
& = \sum^n_{i=1}\sum^n_{j=1}\langle \lambda_i e_i,\mu_j e_j\rangle \\
& = \sum^n_{i=1}\sum^n_{j=1}\lambda_i \mu_j \langle e_i,e_j\rangle \\
& = \sum^n_{i=1}\sum^n_{j=1}\lambda_i \mu_j \delta_{ij} \\
& = \sum^n_{i=1}\lambda_i \mu_i \\
& = \sum^n_{i=1}(-a_ib_i) \\
& \leqslant 0,
\end{aligned}
$$

其中$a_i,b_i$分别是$\lambda_i,\mu_i$的虚部,$\delta_{ij}$是克罗内克符号,$\langle e_i,e_j\rangle$是向量内积。

解释:这个定理说明了两个反对称矩阵相乘后得到的方阵的迹不大于零。这是因为反对称矩阵的特征值都是纯虚数或零,所以它们相乘后得到的方阵的特征值都是负实数或零,而迹就是特征值之和。

Your browser is out-of-date!

Update your browser to view this website correctly.&npsb;Update my browser now

×