ベイジアンネットワーク

ベイズ統計学
統計学

理論
許容決定規則ベイズ効率性ベイズ確率確率の解釈ベイズの定理ベイズ因子ベイズ推定ベイジアンネットワーク事前確率事後確率尤度共役事前分布事後予測分布ハイパーパラメータハイパーパラメータの事前分布等確率の原理最大エントロピー原理経験ベイズ法クロムウェルの差止め規則ベルンシュテイン＝フォン・ミーゼス定理シュワルツ情報量規準信用区間最大事後確率推定根源的蓋然論
技法
ベイズ線形回帰ベイズ推定量近似ベイズ計算マルコフ連鎖モンテカルロ法
表話編歴

ベイジアンネットワーク（英: Bayesian network）は、因果関係を確率により記述するグラフィカルモデルの1つで、複雑な因果関係の推論を有向非巡回グラフ構造により表すとともに、個々の変数の関係を条件つき確率で表す確率推論のモデルである。ネットワークとは重み付けグラフのこと。

定義

確率分布は確率変数をノード、変数間関係をリンクとするグラフ/ネットワークで表現できる^[1]^[2]（確率的グラフィカルモデル^[3]）。このうちリンクが向きを持ち依存関係が巡回しないもの（有向非巡回グラフ）は次の名称で呼ばれる^[4]。

ベイジアンネットワーク（英: Bayesian networks）^[5]
有向グラフィカルモデル（英: directed graphical models）^[5]
有向確率モデル（英: directed probabilistic models）^[6]
有向確率的グラフィカルモデル（英: directed probabilistic graphical models）^[6]

その有向非巡回性から確率変数群の同時分布は次のように表現できる：

P(x_{1},...,x_{N})=\prod _{i=1}^{N}P(x_{i}|parent(x_{i}))

すなわち同時分布が親ノードで条件付けられた確率の積として記述できる^[7]。

特徴

確率分布を有向グラフと捉えることにより、グラフを用いた解析が可能になる。また有向グラフであるため変数間の因果関係をリンクで表現できる^[8]。ベイジアンネットワーク上で確率推論を行うことで、複雑でかつ不確実な事象の起こりやすさやその可能性を予測することができる。これまで蓄積された情報をもとに、起こりうる確率をそれぞれの場合について求め、それらを起こる経路に従って計算することで、複雑な経路を伴った因果関係の発生確率を定量的に表すことが可能となる。

ベイジアンネットワークは有向非巡回構造を仮定したモデルであり、（この構造を必要としない）同時分布を直接モデル化するのではなく、条件付き確率モデルの組み合わせで表現される場合が多い。

モデルの簡単な例

確率変数A、B、Cの間の条件付依存性をA→C、B→Cと表し、リンクの元となる親ノードをAやB、リンクの先にくる子ノードをCとする時、Aが起こる確率をP(A)、Aが既に起こったときにCとなる条件付確率をP(C|A)のように表すこととすると、Cが起こりうる確率は、P(A,B,C)=P(C|A,B)P(A)P(B)となる。

色々な因果関係に対し、グラフ上の各ノードに対応する確率変数として表現する方法やルールが定められている。複雑な系においても、各ノードにおける条件付確率表やベイズの定理等を用いながら、それぞれの確率を計算でき、確率的な依存関係をモデル化できる。

応用例

医者の診断^[9]、イメージ認識^[10]、言語認識^[11]、選択アルゴリズム^[12] など、1980年代から各種の応用例が報告されている。

最適化

分布 $p^{*}(\cdot )$ をベイジアンネットワークによってモデル化するための様々な最適化手法が存在する。

全観測モデル

全ての変数が観測変数である^[13]ベイジアンネットワークでは最尤推定が利用できる^[14]。

まず、このモデルは次の式で表現される：

$p_{\theta }(x_{1},...,x_{N})=\prod _{i=1}^{N}p_{\theta }(x_{i}|parent(x_{i}))$

最尤推定の目標関数である対数尤度を考えると、

$\log p_{\theta }(x_{1},...,x_{N})=\sum _{i=1}^{N}\log p_{\theta }(x_{i}|parent(x_{i}))$

すなわち条件付き確率分布の対数の和が対数尤度となる。

前提より全ての変数が観測変数であるため、 $p^{*}(\cdot )$ からサンプリングされた標本を用いて全ての条件付き確率分布値が計算できる。ゆえに対数と和で対数尤度が計算可能となり、分布が微分可能であれば勾配降下法により $\theta$ の最適化が実現する。

潜在変数モデル

「潜在変数#潜在変数モデル」も参照

ベイジアンネットワークを採用した潜在変数モデルの場合、全観測モデルの場合と異なり最適化は容易でない。

歴史

ジューディア・パールが1985年に命名した^[15]。ジューディア・パールはこの研究の功績によりチューリング賞を受賞した。人工知能の分野では、ベイジアンネットワークを確率推論アルゴリズムとして1980年頃から研究が進められ、既に長い研究と実用化の歴史がある。

脚注

^ "A graph comprises nodes ... connected by links ... . In a probabilistic graphical model, each node represents a random variable ... and the links express probabilistic relationships between these variables." PRML. p.360.
^ ネットワーク（重み付けグラフ）
^ "diagrammatic representations of probability distributions, called probabilistic graphical models." PRML p.359
^ "Directed graphical models are a type of probabilistic models where all the variables are topologically organized into a directed acyclic graph." Kingma. (2019). An Introduction to Variational Autoencoders. Foundations and Trends in Machine Learning.
^ ^a ^b "Bayesian networks, also known as directed graphical models" PRML. p.360.
^ ^a ^b "We work with directed probabilistic models, also called directed probabilistic graphical models (PGMs), or Bayesian networks." Kingma. (2019). An Introduction to Variational Autoencoders. Foundations and Trends in Machine Learning.
^ "The joint distribution over the variables of such models factorizes as a product of prior and conditional distributions" Kingma. (2019). An Introduction to Variational Autoencoders. Foundations and Trends in Machine Learning.
^ 逆（向きから因果関係を決定すること）は一般に成り立たない。
^ シュピーゲルハルター他、1989年
^ Booker、Hota、1986年
^ Charniak、Goldman、1989年
^ ハンソン、マイヤー、1989年
^ Fully Observed Models という
^ "If all variables in the directed graphical model are observed in the data, then we can compute and differentiate the log-probability of the data under the model, leading to relatively straightforward optimization." Kingma. (2019). An Introduction to Variational Autoencoders. Foundations and Trends in Machine Learning.
^ Pearl, Judea (8 1985). “Bayesian Networks: a Model of Self-Activated Memory for Evidential Reasoning”. Proceedings, Cognitive Science Society: 329-334. http://ftp.cs.ucla.edu/pub/stat_ser/r43-1985.pdf.

関連項目

グラフィカルモデル
- ベイジアンネットワーク: 確率的グラフィカルモデルのうち有向非巡回グラフを用いたもの
- マルコフネットワーク（英語版）^[1]: 確率的グラフィカルモデルのうち無向グラフを用いたもの
確率伝搬法
ベイズ確率
ベイズ推定

位置	平均算術幾何調和中央値分位数順序統計量最頻値階級値
分散	範囲偏差偏差値標準偏差標準誤差変動係数決定係数相関係数自己相関共分散自己共分散分散共分散行列百分率統計的ばらつき
モーメント	分散歪度尖度

カテゴリデータ

頻度
分割表

推計統計学

仮説検定

パラメトリック	t検定ウェルチのt検定 F検定 Z検定二項検定ジャック–ベラ検定シャピロ–ウィルク検定分散分析共分散分析
ノンパラメトリック	ウィルコクソンの符号順位検定マン・ホイットニーのU検定カイ二乗検定イェイツのカイ二乗検定累積カイ二乗検定フィッシャーの正確確率検定尤度比検定 G検定アンダーソン–ダーリング検定コルモゴロフ–スミルノフ検定カイパー検定マンテル検定コクラン・マンテル・ヘンツェルの統計量
その他	帰無仮説対立仮説有意棄却

区間推定

モデル選択基準

その他

ベイズ統計学

確率	主観確率ベイズ確率事前確率事後確率最大事後確率
その他	ベイズ推定ベイズ因子

相関

モデル

回帰

線形	リッジ回帰ラッソ回帰エラスティックネット
非線形	k近傍法回帰木ランダムフォレストニューラルネットワークサポートベクター回帰射影追跡回帰
時系列	自己回帰モデル自己回帰移動平均モデル ARCHモデル対移動平均比率法トレンド定常傾向推定共和分構造変化

分類

線形	線形判別分析ロジスティック回帰単純ベイズ分類器単純パーセプトロン線形サポートベクターマシン
二次	二次判別分析
非線形	k近傍法決定木ランダムフォレストニューラルネットワークサポートベクターマシンベイジアンネットワーク隠れマルコフモデル
その他	二項分類多クラス分類第一種過誤と第二種過誤

教師なし学習

クラスタリング	k平均法（k-means++法） DBSCAN
密度推定（英語版）	カーネル密度推定（カーネル）
その他	主成分分析独立成分分析自己組織化写像