新規作成:2015年11月30日
最終更新:2016年9月22日

ここでは、ベイズと統計モデルの関係を説明します。
両者の違い、そしてつながりについてご理解いただければ幸いです。

 

この記事はベイズ推定を応用して状態空間モデルを推定する一連の記事の一つです。
記事の一覧とそのリンクは以下の通りです。
ベイズ統計学基礎
ベイズと統計モデルの関係
ベイズとMCMCと統計モデルの関係
Stanによるベイズ推定の基礎
Stanで推定するローカルレベルモデル



スポンサードリンク

 

目次

1.ベイズとMCMC
2.ベイズと統計モデルの関係
3.「統計モデルを推定する」とは、どのような行為なのか
3-1.統計モデルの推定1:統計モデルの「型」を決める
3-2.統計モデルの推定2:統計モデルのパラメタを推定する
4.なぜ統計モデルの推定は2段階に分かれているのか
5.なぜ状態空間モデルの推定に、ベイズが使われるのか

 

1.ベイズとMCMC

今回の記事では頻繁に「ベイズ」といった表現がなされます。
しかし、これはあくまでもMCMCとセットになって使われているとご理解いただければ幸いです。

ベイズは統計学の「考え方」の一つです。
MCMCは、その考え方を実際のデータ解析に応用する際に使われる、アルゴリズムの一種です。

この2つを組み合わせているのですが、それをわざわざ書くと非常に冗長な表現となるので、ここでは「ベイズ」とひとまとめにして書きました。ご注意ください。

 

2.ベイズと統計モデルの関係

ベイズ統計学というキーワードとセットになって「統計モデル」という言葉がよくつかわれます。まずは、ベイズ統計学と統計モデルの関係を押さえましょう。

ベイズは、統計モデルを推定するために使われます。

ここに、明確な上下関係があることに注目してください。
統計モデルを推定する道具がベイズです。

ですので、例えば「ベイズという名前の統計モデルがある」という認識は誤りです。
ベイズは、統計モデルを推定するのにつかわれる道具です。

まずはこの上下関係を覚えてください。

 

3.「統計モデルを推定する」とは、どのような行為なのか

「統計モデルを推定する」という行為は、2つの作業に分けられます。

3-1.統計モデルの推定1:統計モデルの「型」を決める
3-2.統計モデルの推定2:統計モデルのパラメタを推定する

順番に説明します。

3-1.統計モデルの推定1:統計モデルの「型」を決める

統計モデルの「型」とは、正確な用語ではないのですが、そのココロはわかるんじゃないのかなと思います。
たとえば、線形回帰モデルという統計モデルの「型」があります。
これは例えば「気温が上がるとビールの売り上げが線形に変化する」という構造を持っています。この構造のことです。

数式を使いますと、以下のようになります。

ビールの売り上げ = 傾き×気温 + 切片

こちらの式の場合ですと、気温が1度上がると、ビールの売り上げは「傾き」の値だけ増えます。

こういうふうに、「興味のある値(ビールの売り上げなど)はどのような構造で変化するか」を決める作業が、統計モデルの「型」を決める作業となります。

3-2.統計モデルの推定2:統計モデルのパラメタを推定する

気温が1度上がると、ビールの売り上げは「傾き」の値だけ増えることがわかったとしましょう。
次に気になるのは「傾き」の値です。

こういった「傾き」や「切片」といった値が3になるのか、5になるのか、いくらになるのかを推定する行為を「パラメタの推定」と呼びます。

ベイズが関わるのは、こちらです。
ベイズは「統計モデルのパラメタを推定するための道具」だということです。
逆に言えば、ベイズ統計学は、統計モデルの「型」を決める際には(もちろん状況によりますが)あまり登場しません。

 

4.なぜ統計モデルの推定は2段階に分かれているのか

統計モデルを推定するソフトなりライブラリなりパッケージなりがあったとしましょう。そこにデータを入れれば、全自動で統計モデルが出来上がる……ということは、少なくとも現在、ありえません。
なぜでしょう。

統計モデルのパラメタを推定するのは、コンピュータの仕事です。
しかし、統計モデルの「型」を決めるのは、人間の仕事です。

ですので、コンピュータだけで、全自動で統計モデルを作成することは、現状ではできません。
コンピュータは統計モデルの「型」を自動で決めることができないからです。

想像してみてください。
ビールの売り上げ変動の構造に、どれくらいのパターンがあると思いますか。
「気温+気温の2乗」と2乗項が入ってくる、かもしれません。
加法モデルのように、非線形になる、かもしれません。
データが正規分布ではなく、ガンマ分布に従っている、かもしれません。
切片がランダムウォークしている、かもしれません。
傾きが時間によって変化している、かもしれません。
誤差の分散が時間によって変化している、かもしれません。

データが与えられたとき、私たちの目の前に現れるのは、無限ともいえる「かもしれない」です。
その無限のバリエーションの中から一つを選ぶ作業こそが、モデルを推定するという行為なのです。

コンピュータができるのは、「選択肢が与えられた状態で最善を選ぶこと」だけです。
そして、選択肢を与えるのは、人間です。
コンピュータに任せられるところ、人間が決めなければならないところ、これらを別々に作業しなくてはなりません。

なので、統計モデルを推定する際には、2段階のステップを踏む必要があるというお話でした。

 

5.なぜ状態空間モデルの推定に、ベイズが使われるのか

人間は、現象に対して、人間が理解できる「型」あるいは「構造」を決めなければなりません。
それは、人間の仕事です。
そして、状態空間モデルとは、統計モデルの「型」の一種です。

状態空間モデルはこちらで説明したように、非常に多くの種類のデータに適用することができる、柔軟なモデルの「型」です。
人間が理解しやすい構造で、直感に合うモデルを作ることのできる「型」は多くありません。
複雑な現象を扱う場合には特に、状態空間モデルはその威力を発揮します。

しかし、このような幅広く使えるモデルの場合、今度はパラメタを推定するのが難しくなります。
そこで、ベイズの出番です。
ベイズ統計学、そしてMCMCを使うと、今まで困難だった複雑なモデルであっても、パラメタを(ある程度)正しく推定してやることができます。

だから、ベイズ統計学は便利な道具なのだね、というお話でした。

 

まとめ

まずは、統計モデルとベイズの関係を理解してください。
ベイズは、統計モデルを推定するのにつかわれる道具です。

次に、統計モデルを推定する作業には次の2つのステップを踏む必要があることをぜひご銘記ください。

一つ目は、「型」を決める作業。
二つ目は、パラメタを推定する作業です

そして、状態空間モデルとは統計モデルの「型」の一種です。
ベイズとは、統計モデルのパラメタを推定するのにつかわれる道具です。

ここを明確に分けることができれば、統計モデルの見通しがずっと良くなりますよ。

 

参考文献

参考文献です。画像はAmazonへのリンクとなっています。

基礎からのベイズ統計学:
ハミルトニアンモンテカルロ法による実践的入門

 
ベイズ統計学基礎でも紹介した本です。
ベイズ推定と統計モデルについて学ぶならやはりこの本がよいと思います。
 

リンク

この記事はベイズ推定を応用して状態空間モデルを推定する一連の記事の一つです。
記事の一覧とそのリンクは以下の通りです。
ベイズ統計学基礎
ベイズと統計モデルの関係
ベイズとMCMCと統計モデルの関係
Stanによるベイズ推定の基礎
Stanで推定するローカルレベルモデル



スポンサードリンク