矩阵论笔记

矩阵论就是线性代数Plus,然后线性代数就是把一堆矩阵分解为一些简单的矩阵

线性代数复习

Review of Linear Algebra

常见的分解

Basic

  • $A=CR=\left[ \begin{array}{c}\\\\\end{array} \right] \left[ \begin{matrix}&\\\end{matrix} \right]$ :将 A 分解为所有列都不相关的矩阵 C
  • $A=LU=\left[\begin{matrix}{}\diagdown\ 0\\\ \ \ \ \ \ \diagdown\\\end{matrix} \right]\left[ \begin{matrix}{}\diagdown \ \ \ \ \ \\0 \ \diagdown\\\end{matrix} \right]$ :将 A 分解为上三角矩阵 U 和下三角矩阵 L
  • $A=QR=\left[ \begin{matrix}|&|\\ \boldsymbol {q_1}&\boldsymbol{q_n} \\ |&|\end{matrix} \right]\left[ \begin{matrix}{}\diagdown \ \ \ \ \ \\0 \ \diagdown\\\end{matrix} \right]$ :将 A 分解为正交矩阵 Q ,其实跟第一个是一样的
  • $S=Q\Lambda Q^T,Q^T=Q^{-1}$ :将一个对称矩阵 S 分解为正交矩阵 Q 和特征值 $\Lambda$ 组成的矩阵
  • $A=X\Lambda X^T$:将方阵 A 分解为特征向量组成的矩阵 X 和特征值 $\lambda$ 组成的矩阵 $\Lambda$
  • $A=U\varSigma V^T$:将矩阵 A 分解为正交向量组组成的矩阵 $U,V$ ($U^TU=V^TV=I$)和奇异值 $\sigma=\sqrt{\lambda(A^TA)}$ 组成的矩阵 $\varSigma$

矩阵的列空间

The column space of Matrixes

A的列空间 $C(A)$ :A中所有列向量的线性组合

$A=CR$

举例

对于一个 $m\times n$ 的矩阵 A,如果 A 中有 r 个线性无关的列向量,则可以分解为 $m\times r,r\times n$ 的两个矩阵 C 和 R。

  • C 的列向量就是那 r 个线性无关的列向量

  • R 的行向量包含 $r\times r$ 的单位矩阵 $I$ -> R 也线性无关

对 $A\boldsymbol x=\boldsymbol 0$ 来说,有 $n-r$ 个线性无关的解

  • 秩为1的矩阵:如果 A 中所有的列都是第一列的倍数,那么 A 就可以分解为一个列向量和一个行向量

线性代数一览

The Big Picture of Linear Algebra

四个子空间

x 在 A 的零空间中,与 A 中的每一个行向量都不相关。$N(A)\perp C(A^T),N(A^T)\perp C(A)$

  • $N(A)$:所有使 $A\boldsymbol x=\boldsymbol 0$ 的向量张成的空间,$R^n$中维度为 $n-r$ 的空间

  • $C(A^T)$:A行向量张成的空间,$R^n$中维度为 $r$ 的空间

  • $N(A^T)$:所有使得 $\boldsymbol yA^T=\boldsymbol 0$ 的向量张成的空间,$R^m$ 中维度为 $m-r$ 的空间

  • $C(A)$:A列向量张成的空间,$R^m$ 中维度为 $r$ 的空间

矩阵乘法

有两种特殊的方法,有时候会算的快一些

$A=LU$

LU分解的一大作用就是解方程,这个分解只考虑行向量的加减和数乘运算,如果考虑行的交换,原式需要变为 $PA=LU$

这个分解来源于解方程 $Ax=b$

分解方法就是去逐行消元

求解$A\boldsymbol x=\boldsymbol b$

$A\boldsymbol x=\boldsymbol b$ 的通解可以分解为 $A\boldsymbol x =\boldsymbol 0$ 的通解加上 $A\boldsymbol x= \boldsymbol b$ 的特解

先求解 $A\boldsymbol x=\boldsymbol 0$ 的通解,初等行变换并不会改变矩阵的行空间, $N(A)=N(R)$

然后求解 $A\boldsymbol x=\boldsymbol b$ 的特解,$A\boldsymbol x =\boldsymbol b\Rightarrow R\boldsymbol x=\boldsymbol d$

正交向量

Orthogonal Vectors

  • $Q^T=Q^{-1}$,对于单位正交矩阵,有 $Q^TQ=I$,注意 $QQ^T\ne I$
  • $||Q\boldsymbol x||=\boldsymbol x^TQ^TQ\boldsymbol x=\boldsymbol x^T\boldsymbol x=||\boldsymbol x||$

应用:最小二乘法

当 $A\boldsymbol x=\boldsymbol b$ 无解,求解 $A^TA\boldsymbol x =A^T\boldsymbol b$ 可以得到最相近的

最小二乘法是数据很多时的一个曲线拟合,求解使 $\min(||A\boldsymbol x-\boldsymbol b||^2)$ 的 $\boldsymbol x$ ,其中 A 为 $m>n$ 的数据矩阵。然后可以将问题转化为求解 $\boldsymbol b$ 在 $ C(A)$ 上的投影 $\boldsymbol p$ 和 $A\boldsymbol x = \boldsymbol p$

  • 直线上的投影

    • $\hat x=(a^Tb)/(a^Ta)$: $a\perp(e=b-p)\Rightarrow a·(b-\hat xa)=0$
    • $p=a\hat x=(aa^Tb)/(a^Ta)$
    • $p=Pb\Rightarrow P=(aa^T)/(a^Ta)$
  • 子空间投影

    • $\hat x:A^T(b-A\hat x)=0\Rightarrow A^TAx=A^Tb$
    • $p:p=Ax=A(A^TA)^{-1}A^Tb$
    • $P:p=Pb\Rightarrow P=A(A^TA)^{-1}A^T$
  • 最小二乘法

$A=QR$:Grant-Schmidt法

这里是将一个可逆矩阵转化为正交矩阵的方法。

方法就是把一个个列向量(基向量)减去已经正交化的向量的投影

  • $a_1’=a_1,q_1=a_1’/||a_1’||$
  • $a_i’=a_i-\frac{a_1^Ta_i}{a_1^Ta_1}a_1-\dots-\frac{a_{i-1}^Ta_i}{a_{i-1}^Ta_{i-1}}a_{i-1},q_i=a_i’/||a_i’||$

分解如下

特征值与特征向量

Eigenvalue and Eigenvectors

线性代数解方程是一大块,特征值与特征向量就是另外一大块内容了。

$S=Q\Lambda Q^T$

概念

  • 对称矩阵:$S=S^T$

  • 特征值 $\lambda$ 与特征向量 $\boldsymbol x$ :$A\boldsymbol x=\lambda\boldsymbol x$

  • 所有特征值非负

对于对称矩阵 $S$,有

对称矩阵的特征向量是正交的,证明:

  • 假设有 $S\boldsymbol x=\lambda \boldsymbol x,S\boldsymbol y=\alpha \boldsymbol y,\lambda\ne\alpha$

  • $\boldsymbol x^TS\boldsymbol y=(S^T\boldsymbol x)^T\boldsymbol y=(S\boldsymbol x)^T\boldsymbol y=\lambda\boldsymbol x^T\boldsymbol y$,$\boldsymbol x^TS\boldsymbol y=\boldsymbol x^T\alpha\boldsymbol y=\alpha \boldsymbol x^T\boldsymbol y$ $\Rightarrow\boldsymbol x^T\boldsymbol y=0$

正定矩阵:对所有 $\boldsymbol x>0$ , $\boldsymbol x^TS\boldsymbol x>0$

$A=X\Lambda X^{-1}$

上面那个式子更一般的情况,这个对有 $n$ 个线性无关特征值的方阵

  • $A^n=X\Lambda^nX^{-1}$

  • $\text{All: }|\lambda_i|<1,\Lambda^n\rightarrow0,A^n\rightarrow0$

特征向量与特征根的求解

  • 设 $\lambda$ ,计算 $\det(A-\lambda I)$

  • 求解使 $\det(A-\lambda I)=0$ 的特征值 $\lambda$

  • 对每个 $\lambda$,求解使 $(A-\lambda I)\boldsymbol x=\boldsymbol 0$ 的特征向量 $\boldsymbol x$

其他的

  • 矩阵相似:特征值相同的两个矩阵相似 $\text{All } A=BCB^{-1}\sim C$

  • $\det(A)=\prod\lambda_i$

  • $\sum a_{ii}=\text{trace}=\sum\lambda_i$

奇异值与奇异矩阵

Singular values and Singular vectors

特征值和特征向量是对于方阵而言的,奇异值和奇异矩阵是对非方阵而言的。

$A=U\varSigma V^T$

  • $A^TA\boldsymbol v_i=\sigma_i^2\boldsymbol v_i,AA^T\boldsymbol u_i=\sigma^2_i\boldsymbol u_i,A\boldsymbol v_i=\sigma\boldsymbol u_i$

  • $A^TA=(V\varSigma^T U^T)U\varSigma V^T=V\varSigma^2$

  • $AA^T=U\varSigma V^T(V\varSigma^TU^T)=U\varSigma^2U^T$

  • $AV=U\varSigma,V^TV=U^TU=I$

线性空间与线性变换

线性空间

线性变换

矩阵的相似化简

特征多项式与最小多项式

Jordan标准型


2020©Fu_Qingchen, LearningBySharing


矩阵论笔记
https://fu-qingchen.github.io/2020/11/22/HUST/MatrixTheorem/
作者
FU Qingchen
发布于
2020年11月22日
许可协议