Diagonalization#

У диагональной матрицы \(\boldsymbol \Lambda = \mathrm{diag}\{\lambda_1, \ldots, \lambda_n\}\) всё просто с собственными числами и векторами. На главной диагонали у неё стоят собственные значения, а собственные векторы — это векторы из стандартного базиса в \(\mathbb R^n\):

\[ \boldsymbol \Lambda e_i = \lambda_i \boldsymbol e_i, \quad i = 1, \ldots, n. \]

Если матрица \(\boldsymbol A \in\mathbb R^{n\times n}\) подобна диагональной, то она называется диагонализируемой. Диагонализация матрицы эквивалентна наличию базиса из собственных векторов.

In other words, \(\boldsymbol A\) is diagonalizable if there exist an invertible matrix \(M\) and a diagonal matrix \(\boldsymbol \Lambda\) such that \(\boldsymbol M^{-1}\boldsymbol {AM} = \boldsymbol \Lambda\).

Теорема. Если у матрицы \(\boldsymbol A \in \mathbb R^{n\times n}\) есть \(n\) линейно независимых собственных векторов \(\boldsymbol x_1, \ldots, \boldsymbol x_n\), то матрица \(\boldsymbol X = [\boldsymbol x_1 \ldots \boldsymbol x_n]\) диагонализирует матрицу \(\boldsymbol A\):

(57)#\[ \boldsymbol X^{-1} \boldsymbol A \boldsymbol X = \boldsymbol\Lambda = \mathrm{diag} \{\lambda_1, \ldots, \lambda_n\}.\]

Матрица \(\boldsymbol A\) имеет простой спектр, если

\[ \mathrm{spec}(\boldsymbol A) = \{\lambda_1, \ldots, \lambda_n\}, \]

т.е. \(\mu_{\boldsymbol A}(\lambda) = 1\) для всех \(\lambda \in \mathrm{spec}(\boldsymbol A)\).

Диагонализируемость матрицы с простым спектром вытекает из следующего утверждения.

Лемма. Пусть \(\lambda_1, \ldots, \lambda_m\) — различные собственные значения матрицы \(\boldsymbol A \in \mathbb R^{n\times n}\), и \(\boldsymbol A\boldsymbol x_k = \lambda_k\boldsymbol x_k\), \(k=1,\ldots, m\). Тогда собственные векторы \(\boldsymbol x_1, \ldots,\boldsymbol x_m\) линейно независимы.

Применяя лемму к матрице \(\boldsymbol A \in \mathbb R^{n\times n}\) с простым спектром, заключаем, что у неё есть \(n\) линейно независимых собственных векторов \(\boldsymbol x_1, \ldots,\boldsymbol x_n\), которые и образуют собственный базис. Следовательно, матрица \(\boldsymbol A\) диагонализируема.

Ну а что насчёт диагонализируемости, если спектр не простой? Бывает по-разному. Например, у единичной матрицы спектр отнюдь не простой (все \(\lambda = 1\)), однако, она уже диагональна. А вот у матрицы

(59)#\[\begin{split}\boldsymbol A = \begin{pmatrix} 1 & 1 \\ 0 & 1 \\ \end{pmatrix}\end{split}\]

есть одно собственное значение \(\lambda = 1\) кратности \(2\), но у него можно найти только один линейно независимый собственный вектор \((1, 0)\). Собственного базиса не построишь, матрица не диагонализируема.

Criterion of diagonalizability#

В общем случае собственный базис и диагонализируемость матрицы \(\boldsymbol A \in \mathbb R^{n\times n}\) могут отсутствовать по двум причинам:

  1. не хватает собственных значений:

    \[ \sum \limits_{ \lambda \in \mathrm{spec}(\boldsymbol A)}\mu_{\boldsymbol A}(\lambda) < n; \]
  2. не хватает собственных векторов:

    \[ \gamma_{\boldsymbol A}(\lambda) < \mu_{\boldsymbol A}(\lambda) \text{ для некоторого }\lambda \in \mathrm{spec}(\boldsymbol A). \]

Если же у матрицы нет проблем 1 и 2, то она диагонализируема.

Теорема. Матрица \(\boldsymbol A \in \mathbb R^{n\times n}\) диагонализируема, если

\[ \sum \limits_{ \lambda \in \mathrm{spec}(\boldsymbol A)}\mu_{\boldsymbol A}(\lambda) = n \]

и \(\gamma_{\boldsymbol A}(\lambda) = \mu_{\boldsymbol A}(\lambda)\) для всех \(\lambda \in \mathrm{spec}(\boldsymbol A)\).

Обратное утверждение тоже верно, поэтому данная теорема представляет собой критерий диагонализируемости матрицы.

Spectral theorem#

Если матрица симметричная, то все проблемы с комплексными собственными значениями улетучиваются.

Теорема. Если \(\boldsymbol A^\mathsf{T} = \boldsymbol A\) и \(\lambda\in\mathrm{spec}(\boldsymbol A)\), то \(\lambda \in \mathbb R\).

Итак, всякая симметричная матрица имеет \(n\) действительных собственных значений (с учётом кратности). Этим замечательные свойства собственных чисел и векторов таких матриц не исчерпываются. Оказывается, что любые два собственных вектора симметричной матрицы, отвечающие разным собственным значениям, ортогональны.

Теорема. Если \(\boldsymbol A^\mathsf{T} = \boldsymbol A\), \(\boldsymbol {Ax} = \lambda \boldsymbol x\), \(\boldsymbol {Ay} = \mu \boldsymbol y\), \(\lambda \ne \mu\), то \(\boldsymbol x^\mathsf{T}\boldsymbol y = 0\).

Как мы помним, матрица с простым спектром всегда может быть диагонализирована. Из предыдущей теоремы следует, что если матрица вдобавок ещё и симметрична, то у неё существует ортнонормированный собственный базис.

Theorem (Spectral theorem)

Если симметричная матрица \(\boldsymbol A\) имеет простой спектр

\[ \mathrm{spec}(\boldsymbol A) = \{\lambda_1, \ldots, \lambda_n\}, \]

то существует такая ортогональная матрица \(\boldsymbol Q\), что

(60)#\[ \boldsymbol Q^\mathsf{T}\boldsymbol{AQ} = \boldsymbol \Lambda = \mathrm{diag}\{\lambda_1, \ldots, \lambda_n\}.\]

Можно показать, что спектральная теорема справедлива для любой симметричной матрицы, а не только для матриц с простым спектром.

Exercises#

  1. Let \(\boldsymbol A\) be a diagonalizable matrix. Show that \(\lim\limits_{k\to\infty} \boldsymbol A^k = \boldsymbol 0\) iff \(\vert \lambda \vert < 1\) for all \(\lambda \in \mathrm{spec}(\boldsymbol A)\).

  2. Show that any symmetric matrix \(\boldsymbol A\) with eigenvalues \(\lambda_1, \ldots, \lambda_n\) can be written as

    \[ \boldsymbol A = \sum\limits_{i=1}^n \lambda_i \boldsymbol x_i\boldsymbol x_i^\mathsf{T},\quad \boldsymbol x_i^\mathsf{T}\boldsymbol x_j = \delta_{ij}. \]
  3. Let \(\boldsymbol A\) be a symmetric matrix, \( \mathrm{spec}(\boldsymbol A) = \{\lambda_1, \ldots, \lambda_n\}\). Prove that \(\mathrm{tr}(\boldsymbol A^\mathsf{T} \boldsymbol A) = \sum\limits_{i=1}^n \lambda_i^2\).