正交矩阵的凯莱公式表述
设 $R$ 是n维线性空间的方阵,若 $R$ 是不以 $-1$ 为特征值的正交矩阵,则存在反对称矩阵 $S$ ,使得
$$ R = (I-S)^{-1}(I+S) $$
证明思路
不妨从凯莱公式中反解S:
$$
\begin{align*}
R &= (I-S)^{-1}(I+S) \\
(I-S)R &= I+S \\
R-SR &= I+S \\
R-I &= S(R+I) \\
S &= (R-I)(R+I)^{-1}
\end{align*}
$$
因此,想要根据 $S=(R-I)(R+I)^{-1}$ 构造出 $S$,从而证明凯莱公式,只需证明以下三点:
- $R+I$ 是可逆矩阵
- $S$ 是反对称矩阵
- $I-S$ 是可逆矩阵
证明过程
若 $-1$ 不是 $R$ 的特征值,则 $-1$ 不是特征多项式 $det(R- \lambda I)=0$ 的根,即 $det(R+I) \neq 0$ ,所以 $R+I$ 是可逆矩阵。
已知 $S=(R-I)(R+I)^{-1}$ ,则
$$
\begin{align*}
S^T &= ((R+I)^{-1})^T(R-I)^T \\
&= ((R+I)^T)^{-1}(R^T-I) \\
&= (R^T+I)^{-1}(R^T-I)
\end{align*}
$$由于
$$
(R^T+I)(R-I)=R-R^T \\
(R^T-I)(R+I)=R^T-R
$$所以
$$
\begin{align*}
S+S^T &= (R-I)(R+I)^{-1}+(R^T+I)^{-1}(R^T-I) \\
&= (R^T+I)^{-1} \left[ (R^T+I)(R-I)+(R^T-I)(R+I) \right] (R+I)^{-1} \\
&= (R^T+I)^{-1} \left[ (R-R^T)+(R^T-R) \right] (R+I)^{-1} \\
&= 0
\end{align*}
$$由此我们证明了 $S$ 是反对称矩阵。
设 $x$ 是一个n维向量,满足 $(I-S)x=0$ ,则有
$$
\begin{align*}
Sx &= x \\
x^TS^T &= x^T \\
x^TS^Tx &= x^Tx \\
-x^TSx &= x^Tx \\
-x^Tx &= x^Tx \\
x^Tx &= 0
\end{align*}
$$
当且仅当 $x=0$ 时满足上式。
因此 $I-S$ 是可逆矩阵。
- 总结一下,任意给一个不以 $-1$ 为特征值的方阵 $R$ ,我们都能找到反对称矩阵 $S=(R-I)(R+I)^{-1}$ ,使得 $ R = (I-S)^{-1}(I+S) $ ,因此凯莱公式成立。
进一步讨论
如果 $R$ 是一个 $3×3$ 的矩阵,那么公式中的 $S$ 是一个 $3×3$ 的反对称矩阵,可以写成如下形式:
$$
S=\begin{bmatrix}
0 &-s_3 &s_2 \\
s_3 &0 &-s_1 \\
-s_2 &s_1 &0
\end{bmatrix}
$$
或者表示为:
$$
S_{ij} = -\sum_k \epsilon _{ijk}s_k
$$
其中 $\epsilon$ 是 Levi-Civita 符号,该符号定义为
$$
\epsilon_{ijk}=
\begin{cases}
1 &\text{i,j,k 是偶排列的} \\
-1 &\text{i,j,k 是奇排列的} \\
0 &\text{i,j,k 中有重复的} \\
\end{cases}
$$
从中可以看出 $S$ 具有三个自由度,所以 $R$ 也具有三个自由度。
如果用 $S$ 表示出 $R$,可以得到
$$
R= \frac{1}{s_1^2+s_2^2+s_3^2+1}
\begin{bmatrix}
s_1^2-s_2^2-s_3^2+1 &2s_1s_2-2s_3 &2s_1s_3+2s_2 \\
2s_1s_2+2s_3 &-s_1^2+s_2^2-s_3^2+1 &2s_2s_3-2s_1 \\
2s_1s_3-2s_2 &2s_2s_3+2s_1 &-s_1^2-s_2^2+s_3^2+1
\end{bmatrix}
$$
记向量 $\vec{s}=\begin{bmatrix}s_1 \\ s_2 \\ s_3 \end{bmatrix}$ ,$\vec{s}$ 的 2-范数为 $k=\sqrt{s_1^2+s_2^2+s_3^2}$
设存在一个角度 $\theta \in \left[0,\pi \right]$ ,$\tan\frac{\theta}{2}=k$,并且当$k \to \infty$ 时 $\theta = \pi$
于是 $\sin\theta=\frac{2k}{1+k^2}$, $\cos\theta=\frac{1-k^2}{1+k^2}$
将 $\vec{s}$ 归一化,令 $\vec{t}=\frac{\vec{s}}{k}$ ,$t_i=\frac{s_i}{k}(i=1,2,3)$ ,于是我们可以用 $t_i$ 和 $\theta$ 来表示 $R$ :
$$
R=\begin{bmatrix}
t_1^2(1-\cos\theta)+\cos\theta &t_1t_2(1-\cos\theta)-t_3\sin\theta &t_1t_3(1-\cos\theta)+t_2\sin\theta \\
t_1t_2(1-\cos\theta)+t_3\sin\theta &t_2^2(1-\cos\theta)+\cos\theta &t_2t_3(1-\cos\theta)-t_1\sin\theta \\
t_1t_3(1-\cos\theta)-t_2\sin\theta &t_2t_3(1-\cos\theta)+t_1\sin\theta &t_3^2(1-\cos\theta)+\cos\theta
\end{bmatrix}
$$
如果你对这样的矩阵形式熟悉的话,你会发现这恰好是绕单位向量 $\vec{t}$ 旋转 $\theta$ 角度对应的旋转矩阵。而 $\vec{t}$ 的方向与 $\vec{s}$ 相同,$\theta$ 的大小与 $\vec{s}$ 的模正相关, $\vec{s}$ 又和 $S$ 一一对应。由此我们也可以发现,在三维空间下,任意一个正交矩阵 $R$ ,如果 $-1$ 不是它的特征值,它就是一个纯粹的旋转矩阵,没有镜像的效果,那么它一定有一个确定的旋转轴和旋转角度,因此能够找到唯一的一个反对称阵 $S$ 与之对应。