行列指数関数

数学 > 線型代数学 > 行列値関数 > 行列指数関数

線型代数学における行列の指数関数(ぎょうれつのしすうかんすう、英語: matrix exponential; 行列乗)は、正方行列に対して定義される行列値関数で、通常の(または複素変数の)指数関数に対応するものである。より抽象的には、行列リー群とその行列リー代数の間の対応関係(指数写像)を行列の指数函数が記述する。

nまたは複素正方行列 X の指数関数 eX または exp(X) は、冪級数

e X = k = 0 1 k ! X k {\displaystyle e^{X}=\textstyle \sum \limits _{k=0}^{\infty }{\dfrac {1}{k!}}X^{k}}

で定義される n次正方行列である。この級数は任意の X に対して収束するから、行列 X の指数関数は well-defined である。

X1次正方行列のとき、XeX1次正方行列であり、その唯一の成分は X の唯一の成分に対する通常の指数関数に一致する。これらはしばしば同一視される。この意味において行列の指数函数は、通常の指数函数の一般化である。

性質

X, Yn次複素正方行列、a, b を複素数とし、n単位行列In次正方零行列O でそれぞれ表すことにする。また、X転置XT共役転置X* と表すことにする。行列の指数関数は以下の性質を満たす:

  • eO = I
  • eaXebX = e(a+b)X
  • eXeX = I
  • XY = YX ならば eXeY = eYeX = e(X+Y).
  • Y正則ならば eYXY−1 = YeXY−1.
  • exp(XT) = (exp X)T. このことから X対称行列ならばその行列乗 eX もまた対称であり、X歪対称であるなら eX直交行列になる。
  • exp(X*) = (exp X)*. このことから Xエルミートならば eX もまたエルミートであり、X歪エルミートならば eXユニタリ行列になる。

線型微分方程式

詳細は「行列微分方程式(英語版)」を参照

行列の指数関数が重要であることの一つの理由として、常微分方程式系の解を求める際に使うことができることが挙げられる。以下の方程式

d d t y ( t ) = A y ( t ) , y ( 0 ) = y 0 {\displaystyle {\frac {d}{dt}}y(t)=Ay(t),\quad y(0)=y_{0}}

の解は、A を定行列として、次のように与えられる。

y ( t ) = e A t y 0 {\displaystyle y(t)=e^{At}y_{0}}

行列の指数関数はまた以下の様な非等質微分方程式に対しても有効である。

d d t y ( t ) = A y ( t ) + z ( t ) , y ( 0 ) = y 0 {\displaystyle {\frac {d}{dt}}y(t)=Ay(t)+z(t),\quad y(0)=y_{0}}

A' が定行列でないとき、

d d t y ( t ) = A ( t ) y ( t ) , y ( 0 ) = y 0 {\displaystyle {\frac {d}{dt}}y(t)=A(t)\,y(t),\quad y(0)=y_{0}}

の形の微分方程式は解を閉じた形の式として陽に表すことはできないが、マグヌス級数(英語版)が無限和の形で解を与える。

和に対する指数函数

実数(あるいはスカラー)x, y について、通常の指数関数が ex+y = exey を満たすことはよく知られている。同じことは可換な行列に対しても成り立つ。即ち、行列 X, Y が交換可能(XY = YX)ならば

e X + Y = e X e Y {\displaystyle e^{X+Y}=e^{X}e^{Y}}

が成り立つ。しかし可換でない行列については上記の関係は成り立たない。この場合、ベイカー=キャンベル=ハウスドルフの公式(英語版)eX+Y の計算に利用できる。

逆は一般には成り立たない。即ち、等式 eX+Y = eXeYXY が可換であることを意味しない。

エルミート行列について、行列指数関数の跡に関係する2つの注目すべき定理を挙げる。ゴールデン–トンプソン不等式(英語版) は以下の定理である。

定理 (Golden–Thompson)[1]
A, H がエルミートであるとき、次の不等式が成り立つ。
tr exp ( A + H ) tr ( exp ( A ) exp ( H ) ) . {\displaystyle \operatorname {tr} \exp(A+H)\leq \operatorname {tr} (\exp(A)\exp(H)).}
ここで可換性は要求されないことに注意する。

ゴールデン–トンプソン不等式を 3つの行列に対するものに拡張できないことを示す反例が知られている。そもそもエルミート行列 A, B, C に対して tr(exp(A)exp(B)exp(C)) が実になること自体が保証されないのだが、次に示すリーブの定理(エリオット・リーブに因む)はある意味でそのような保証を与える:

定理 (Lieb)
固定されたエルミート行列 H について、関数
f ( A ) = tr exp ( H + log A ) {\displaystyle f(A)=\operatorname {tr} \,\exp \left(H+\log A\right)}
正定値行列上の凹関数である[2][3]

指数写像

詳細は「リー環の指数写像」を参照

複素行列の指数関数が常に正則行列であるということに注意する(eX逆行列eX によって与えられる)。これは複素変数の指数関数が常に零でないことに対応する事実である。ゆえに、行列の指数関数 n次正方行列の全体の成す空間から n次元の一般線型群n次正則行列の群)への写像

exp : M n ( C ) G L ( n , C ) {\displaystyle \exp \colon M_{n}(\mathbb {C} )\to \mathrm {GL} (n,\mathbb {C} )}

を定めている。実は、この写像は全射、すなわちどんな正則行列も何らかの行列乗として書くことができる(ここで実数体 R でなく複素数 C 上で考えることが本質的に利いてくる)。

2つの行列 X, Y について

e X + Y e X Y e X e Y {\displaystyle \|e^{X+Y}-e^{X}\|\leq \|Y\|e^{\|X\|}e^{\|Y\|}}

が成り立つ。ここで || · || は任意の行列ノルムである。ここから、指数写像はコンパクト部分集合 Mn(C) 上で連続かつリプシッツ連続であることが従う。

写像

t e t X ( t R ) {\displaystyle t\mapsto e^{tX}\quad (t\in \mathbb {R} )}

t = 0単位元を通る、一般線型群内の滑らかな曲線を定義する。実は

e t X e s X = e ( t + s ) X {\displaystyle e^{tX}e^{sX}=e^{(t+s)X}}

が成り立つから、これらは一般線型群の1パラメータ部分群(英語版)を与えている。

この曲線の t 上の微分係数(あるいは接ベクトル)は

d d t e t X = X e t X = e t X X {\displaystyle {\frac {d}{dt}}e^{tX}=Xe^{tX}=e^{tX}X}
(1)

で与えられる。t = 0 での微分係数はまさに行列 X であり、これはつまり X がこの一径数部分群を生成することを示している。

より一般に[4]t に依存する生成的指数 X(t) に対して

d d t e X ( t ) = 0 1 e α X ( t ) d X ( t ) d t e ( 1 α ) X ( t ) d α {\displaystyle {\frac {d}{dt}}e^{X(t)}=\int _{0}^{1}e^{\alpha X(t)}{\frac {dX(t)}{dt}}e^{(1-\alpha )X(t)}\,d\alpha }

となる。右辺の eX(t) を積分記号の外へ出して、残った被積分関数をアダマールの補題を使って展開すれば、以下の有用な行列乗の微分係数の表示

( d d t e X ( t ) ) e X ( t ) = d d t X ( t ) + 1 2 ! [ X ( t ) , d d t X ( t ) ] + 1 3 ! [ X ( t ) , [ X ( t ) , d d t X ( t ) ] ] + {\displaystyle \left({\frac {d}{dt}}e^{X(t)}\right)e^{-X(t)}={\frac {d}{dt}}X(t)+{\frac {1}{2!}}[X(t),{\frac {d}{dt}}X(t)]+{\frac {1}{3!}}[X(t),[X(t),{\frac {d}{dt}}X(t)]]+\dotsb }

が得られる。この式における係数はもとの指数函数の成分に現れているものとは異なることに注意せよ。また閉じた形の式は指数写像の微分(英語版)を参照。

行列の指数関数の行列式

ヤコビの公式から、任意の複素正方行列について次のトレース恒等式(英語版)が成り立つ:

det ( e A ) = e tr ( A )   . {\displaystyle \det(e^{A})=e^{\operatorname {tr} (A)}~.}

計算に役立つだけでなく、上記の等式の右辺は常に非零であるから、左辺の行列式は非零 det(eA) ≠ 0 であり、したがって行列指数関数 eA は常に正則であることが分かる。

実行列の場合、上記の公式から写像

exp : M n ( R ) G L ( n , R ) {\displaystyle \exp \colon M_{n}(\mathbb {R} )\to \mathrm {GL} (n,\mathbb {R} )}

全射ではないことも分かる。なぜならば、実行列について公式の右辺は常に正であるが、行列式が負の正則行列は存在するからである。このことは先に触れた複素行列の場合とは対照的である。

指数函数の計算

一般の行列乗の計算を確度と精度を以って行うことは非常に難しく、現在においても数学、特に数値解析において重要な研究トピックの一つである。MATLABGNU Octaveパデ近似を使っている[5][6]

いくつかの行列のクラスに関しては、比較的容易に計算ができる。

対角行列の場合

対角行列

A = [ a 1 0 0 0 a 2 0 0 0 a n ] {\displaystyle A={\begin{bmatrix}a_{1}&0&\cdots &0\\0&a_{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &a_{n}\end{bmatrix}}}

に対して、行列 A乗は単に主対角成分のそれぞれを肩に載せた

e A = [ e a 1 0 0 0 e a 2 0 0 0 e a n ] {\displaystyle e^{A}={\begin{bmatrix}e^{a_{1}}&0&\cdots &0\\0&e^{a_{2}}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &e^{a_{n}}\end{bmatrix}}}

で与えられる。これは対角行列同士の行列の積は単に成分ごとの積に等しいということからの帰結である。特に通常の指数函数は「一次元」の場合の対角行列の指数函数とみなせる。

これを利用すれば対角化可能行列乗も計算できる。つまり A = UDU−1 かつ D が対角行列ならば

eA = UeDU−1

である。シルベスターの公式(英語版)を応用しても同じ結果が得られる。

正射影行列の場合

考える行列が射影行列ならば、これは冪等だから、行列乗は

eP = I + (e − 1)P

となることが指数函数の定義より容易に分かる。実際、冪等性により Pk = P(k ≥ 1) だから、

e P = I + k = 1 P k k ! = I + ( k = 1 1 k ! ) P = I + ( e 1 ) P {\displaystyle e^{P}=I+\textstyle \sum \limits _{k=1}^{\infty }{\dfrac {P^{k}}{k!}}=I+\left(\sum \limits _{k=1}^{\infty }{\dfrac {1}{k!}}\right)P=I+(e-1)P}

である。

冪零行列の場合

冪零行列 N は適当な正整数 q に対して Nq = 0 を満たす。NeN は指数函数の定義級数から直接に

e N = I + N + 1 2 N 2 + 1 6 N 3 + + 1 ( q 1 ) ! N q 1 {\displaystyle e^{N}=I+N+{\frac {1}{2}}N^{2}+{\frac {1}{6}}N^{3}+\cdots +{\frac {1}{(q-1)!}}N^{q-1}}

と計算できる(級数は有限項で終わる)。

より一般の場合

行列 X に対してその最小多項式が一次式の積に分解されるとき、行列 X

X = A + N {\displaystyle X=A+N}
  • A:対角化可能
  • N:冪零
  • AN は可換 (AN = NA)

なる形に書くことができる(ジョルダン分解)。このとき X乗の計算は

e X = e A + N = e A e N {\displaystyle e^{X}=e^{A+N}=e^{A}e^{N}}

により、先の対角化可能行列および冪零行列の計算に帰着される。後の等号で AN との可換性が必要であることに注意せよ。

同様の方法は、代数閉体上の行列に対してジョルダン標準形を取ることで与えられる。即ち JX のジョルダン標準形で X = PJP−1 と書くとき、

e X = P e J P 1 {\displaystyle e^{X}=Pe^{J}P^{-1}}

である。ジョルダン細胞の直和として

J = J a 1 ( λ 1 ) J a 2 ( λ 2 ) J a n ( λ n ) , {\displaystyle J=J_{a_{1}}(\lambda _{1})\oplus J_{a_{2}}(\lambda _{2})\oplus \cdots \oplus J_{a_{n}}(\lambda _{n}),}

と書けば、

e J = exp ( J a 1 ( λ 1 ) J a 2 ( λ 2 ) J a n ( λ n ) ) = exp ( J a 1 ( λ 1 ) ) exp ( J a 2 ( λ 2 ) ) exp ( J a k ( λ k ) ) . {\displaystyle {\begin{aligned}e^{J}&=\exp {\big (}J_{a_{1}}(\lambda _{1})\oplus J_{a_{2}}(\lambda _{2})\oplus \cdots \oplus J_{a_{n}}(\lambda _{n}){\big )}\\&=\exp {\big (}J_{a_{1}}(\lambda _{1}){\big )}\oplus \exp {\big (}J_{a_{2}}(\lambda _{2}){\big )}\oplus \cdots \oplus \exp {\big (}J_{a_{k}}(\lambda _{k}){\big )}.\end{aligned}}}

となるから、後はジョルダン細胞乗が計算できればよい。各ジョルダン細胞は特別な形をした冪零行列 N を用いて

J a ( λ ) = λ I + N {\displaystyle J_{a}(\lambda )=\lambda I+N}

なる形に書けるのだから、

e λ I + N = e λ e N {\displaystyle e^{\lambda I+N}=e^{\lambda }e^{N}}

が得られる。

ローラン級数による評価

ケイリー・ハミルトンの定理を考えれば、n次正方行列乗はその行列の高々次数 n − 1 の多項式として表示できるはずである。

非零な一変数多項式 P および QtP(A) = 0 なるものとする。有理型函数

f ( z ) = e t z Q t ( z ) P ( z ) {\displaystyle f(z)={\frac {e^{tz}-Q_{t}(z)}{P(z)}}}

整函数ならば

e t A = Q t ( A ) {\displaystyle e^{tA}=Q_{t}(A)}

が成り立つ。これを示すには上記等式において P(z) を掛けて zA で置き換えればよい。

さてこのような多項式 Qt(z) は以下のように見つけることができる(シルベスターの公式(英語版)参照)。aP の根として、 Qa,t(z)Pfa におけるローラン級数の主要部を掛けることで得られる。これは関連するフロベニウス共変行列(英語版)に比例する。aP の根を亙るときの Qa,t 全ての和 St が所期の Qt として取れる。他全ての QtSt(z)P の定数倍を加えることで得られる。特に、ラグランジュ–シルヴェスター多項式 St(z)P より次数が低くなる唯一の Qt である。

行列の行列乗

行列の指数函数と行列の対数函数が既知であるならば、正規かつ正則n次正方行列 Xn次複素正方行列 Y に対して、行列の行列乗 (matrix-matrix exponential)[7]

X Y = e log ( X ) Y , Y X = e Y log ( X ) {\displaystyle {\begin{aligned}X^{Y}&=e^{\log(X)\cdot Y},\\\!{}^{Y}\!\!X\,&=e^{Y\cdot \log(X)}\end{aligned}}}

と定義することができる。ここに、行列の乗法非可換であるから、行列の行列乗も左冪 YX と右冪 XY の別が生じることに注意せよ。さらに言えば、

  • X が正規かつ正則ならば、XYYX は固有値集合が一致する。
  • X が正規かつ正則で、Y が正規であり、かつ XY = YX が成り立つならば、XY = YX が成り立つ。
  • X が正規かつ正則で、X, Y, Z がどの2つも可換ならば、XY+Z = XYXZ, Y+ZX = YXZX が成り立つ。

応用

連立常微分方程式の数値解法であるexponential integratorの研究においては、行列指数関数は重要視されている[8]

脚注

  1. ^ Bhatia 1997.
  2. ^ Lieb 1973.
  3. ^ Epstein 1973.
  4. ^ Wilcox 1967.
  5. ^ “Matrix exponential - MATLAB expm - MathWorks Deutschland”. Mathworks.de (2011年4月30日). 2013年6月5日閲覧。
  6. ^ “GNU Octave - Functions of a Matrix”. Network-theory.co.uk (2007年1月11日). 2013年6月5日閲覧。
  7. ^ Ignacio Barradas and Joel E. Cohen (1994) (PDF), Iterated Exponentiation, Matrix-Matrix Exponentiation, and Entropy, Academic Press, Inc., http://www.rockefeller.edu/labheads/cohenje/PDFs/215BarrabasCohenalApp19941.pdf 
  8. ^ Hochbruck and Ostermann, (2010)

参考文献

  • Bhatia, R. (1997). Matrix Analysis. Graduate Texts in Mathematics. 169. Springer. ISBN 978-0-387-94846-1 
  • Lieb, E. H. (1973). “Convex trace functions and the Wigner–Yanase–Dyson conjecture”. Adv. Math. 11 (3): 267-288. doi:10.1016/0001-8708(73)90011-X. 
  • Epstein, H. (1973). “Remarks on two theorems of E. Lieb”. Commun Math. Phys. 31 (4): 317–325. doi:10.1007/BF01646492. 
  • Wilcox, R. M. (1967). “Exponential Operators and Parameter Differentiation in Quantum Physics”. Journal of Mathematical Physics 8 (4): 962-982. doi:10.1063/1.1705306. 
  • Horn, Roger A.; Johnson, Charles R. (1991). Topics in Matrix Analysis. Cambridge University Press. ISBN 978-0-521-46713-1 
  • Moler, Cleve; Van Loan, Charles F. (2003). “Nineteen Dubious Ways to Compute the Exponential of a Matrix, Twenty-Five Years Later”. SIAM Review 45 (1): 3-49. doi:10.1137/S00361445024180. ISSN 1095-7200. http://www.cs.cornell.edu/cv/researchpdf/19ways+.pdf. 

関連項目

外部リンク

  • 『行列の指数関数とその性質』 - 高校数学の美しい物語
  • Weisstein, Eric W. "Matrix Exponential". mathworld.wolfram.com (英語).
  • Module for the Matrix Exponential
連立一次方程式
ベクトル
ベクトル空間
計量ベクトル空間
行列線型写像
演算・操作
不変量
クラス
行列式
多重線型代数
数値線形代数
基本的な概念
ソフトウェア
ライブラリ
反復法・技法
人物
行列値関数
その他
カテゴリ カテゴリ