意思決定理論は色々の解釈の仕方があるでしょうが、ここでは平たく「何をするのかを決める方法」について考える理論とみなすことにします。
この記事ではなるべく数式を使わずに意思決定問題を整理し、意思決定理論の概観を述べます。

この記事では個人の意思決定を中心に説明します。
ゲーム理論や組織・社会の意思決定理論は扱いません。確率の定義や(哲学的な議論を含む)その解釈に関しても立ち入りません。
理論的な厳密さよりも、直感的な解釈を優先している点には留意してください。

『著者名(出版年)』で、参考にした本を示しています。参考文献は記事の末尾に入れてあります。
誤りや不備などありましたら、ご連絡いただけますと大変幸いです。



スポンサードリンク

目次

  1. 意思決定理論と向き合う
  2. 意思決定問題
    1. 選択肢の集合
    2. 状態の集合
    3. 結果の集合
    4. 「選択肢×状態」から「結果」への写像
    5. 「結果」の選好構造(好き嫌い)
    6. 状態の確率分布
    7. 確実性下の意思決定問題
    8. 社会的意思決定問題
  3. 選好構造が満たすべき条件
    1. 完備性
    2. 推移性
    3. まとめと若干の感想
  4. 効用関数を用いた選好関係の表現
    1. 効用関数
    2. 序数効用関数
    3. 序数効用関数と弱順序
    4. 基数効用関数
  5. リスク下の意思決定問題
    1. 今回扱う事例
    2. 確率くじ
    3. 期待値の考え方
    4. サンクトペテルブルクのパラドクスとリスク回避的な効用関数
    5. 期待効用最大化の原理
    6. フォンノイマン・モルゲンシュテルンの定理
    7. 効用関数の同定
  6. 不確実性下の意思決定問題
    1. 確率の公理主義的定義
    2. サヴェッジの定理
  7. 期待効用最大化の反例と新しい意思決定のモデル
    1. 確率の加法性に関する思考実験
    2. 確率(信念)の曖昧さを扱う応用的なモデル
  8. 参考文献

 

1.意思決定理論と向き合う

意思決定理論では、記述と規範という2つの観点から、意思決定という営みと向き合うことが多いです。
記述:人々はどのように意思決定を行っているのかを知る
規範:人々はどのように意思決定をするべきなのかを考える
記述的な側面から意思決定理論を学ぶと、意思決定の結果を見た時に「なぜ人々はこのような行動をとったのだろうか」という解釈を試みることができます。あるいは、行動の予測という点でも役に立ちます。
規範的な側面からは、もちろん、私たちがどのように行動するべきか、その方針を考えることができます。
両者の視点を共に含むこともあります。

理屈のはなしだけですと難しく感じられるかもしれないので、具体例を挙げながら、意思決定理論の概観を眺めていくことにします。
以下の問いを考えます。

■問
『500円のメモ帳があります。これを買いますか? 買わないでおきますか?』

残念ながら、この問題に即断することはできません。
例えば、百円均一のお店で買えるようなメモ帳が500円で売られていたならば、買わないのが正解でしょう。しかし、今から打ち合わせがあって、メモ帳を持ってくるのを忘れてしまっていた、というのなら、買うのが正解になるかもしれません。
先の問題は「合理的な意思決定を行うための情報が不足している」状況だと言えます。だから、どう行動すべきかを即断することは難しい。

情報の不足は、普段の生活の中でもしばしば起こります。「えいや!」と直感で決断することもあるでしょう。
メモ帳を買うかどうか、くらいならばたいしたことはないのですが、例えば「会社を辞めて起業するか否か」とか「家を買うべきか否か」など、難しい意思決定を迫られる場面では大問題です。
状況の指定をしないで、例えば「世の中の人はみんな起業するべきだ」と極端なことを主張する人もいます。こんなアドバイスを鵜呑みにしては、あとで後悔してしまいそうですね。

ギルボア(2013)では、合理性を以下のように定めています(合理性には様々な解釈がありますが、以下で示すものが、知りうる限り最も主観的で、最も直感に合う定義だと私は思いました)。

ある行動様式がある人にとって合理的であるとは、この人がたとえ自分の行動を分析されたとしてもその結果を心地よいものと感じ、困惑することがないような場合を言います

メモ帳を買った後に「同じメモ帳が、隣のお店ではもっと安く売っていたよ」と言われて、「しまったなー。買うんじゃなかったなー」と心が乱されるならば、合理的な意思決定はできなかったと言えるでしょう。逆に「私はメモ帳がどうしてもあのタイミングで必要だったんです。だから、多少高くても購入できてよかったです」と言えるならば、合理的な判断ができたと言えそうです。

いつも合理的な意思決定ができるとは限りません。でも、合理的な選択ができる状況を知っておくことは、意味の有ることでしょう。
では、意思決定を行うにあたって、どのような事を検討すればよいでしょうか。

 

2.意思決定問題

意思決定理論では、以下の5項目で「意思決定問題」を表現します。

  • 選択肢の集合
  • 状態の集合
  • 結果の集合
  • 「選択肢×状態」から「結果」への写像
  • 「結果」の選好構造(好き嫌い)

なお、上記の5つの項目で表現される問題を特に「不確実性下の意思決定問題」と呼びます。状態の確率分布が得られている場合は「リスク下の意思決定問題」と呼びます。
順番に見ていきます。

ここの議論は主に市川(1983)と竹村(2009)を参考にしています。

 

選択肢の集合

意思決定理論では「何をしたらいいのかな」と考えるのではなくて「どの選択肢を選ぶべきかな」と考えます。

例えば、明日が休日で、予定が無かったとします。
この時「何をやろうかな」ではなくて「選択肢の集合{ディズニーランド、映画、ハイキング、家で何もしない}の中で、どれを選ぼうかな」と考えるわけです。
漠然と「何をやろうかな」と考えても、なかなか結論は得られません。選択肢を列挙してからその優劣を比較していくのがセオリーです。

各々の選択肢のことを「代替案」と呼ぶこともあります。しかし、あまり聞きなれない用語ですので、竹村(2009)に従って、この記事では常に選択肢と呼ぶことにします。

 

状態の集合

状態というのは様々な解釈がありえますが、「自分で変えることができないものごと」と考えるとわかり良いです。

選択肢は自分で選べる。
状態は自分では選べない。
そう考えて分けると簡単です。

例えば、明日の天気を自分で決めることはできません。明日の天気は状態とみなすことになります。
状態の集合としては{晴れ、雨、曇り}を考えておきます。

 

結果の集合

最終的に得られる結果についても、やはり列挙しておきます。
例えば{とても楽しかった、それなりに楽しめた、楽しくなかった、ゆっくり休めた}などという結果が考えられます。

 

「選択肢×状態」から「結果」への写像

写像っていうとなんだか難しく聞こえるんですが、平たく言えば「何をした時(選択肢)、どういう状況(状態)だったら、どういう結果になるか」をまとめたものです(ちなみに×の記号は掛け算じゃなくて直積です)。
例えば「ディズニーランドに行く(選択肢)ことを選んだ時、晴れていれば(状態)、”とても楽しかった”という結果が得られる」というような感じです。

一方で「ディズニーランドに行く(選択肢)ことを選んだ時、雨だったら(状態)、”楽しくなかった”という結果が得られる」でしょう(屋内でも十分楽しめますが、意思決定者はジェットコースターに乗りたいようです)。

選択肢は4つあります{ディズニーランド、映画、ハイキング、家で何もしない}
状態は3つあります{晴れ、雨、曇り}
すると、12通りの組み合わせがあるので、これらをすべて整理します。

 

「結果」の選好構造(好き嫌い)

{とても楽しかった、それなりに楽しめた、楽しくなかった、ゆっくり休めた}という4つの結果を想定しましたが、この4つの中で好ましいと思う順番を決めます。これを選好構造と呼びます。

この選好構造は人によって変化するかもしれません。
例えば私なんかは出不精なので、「それなりに楽しめた VS ゆっくり休めた」の比較では、「ゆっくり休めた」の方が好ましいと感じます。
「とても楽しかった VS ゆっくり休めた」では「とても楽しかった」の方が好ましいのですが。

とりあえずここでは「2つの結果同士の比較において、どちらの方がより好ましいのか、あるいは同程度に好ましいと言えるのか」という好き嫌いの評価をしていくということです。
4種類あるすべての結果で「2択の問題にした時、どちらの方が好ましいか」を順番にすべて比較していきます。

以下の組み合わせすべてで比較をします。

  • とても楽しかった VS それなりに楽しめた
  • とても楽しかった VS 楽しくなかった
  • とても楽しかった VS ゆっくり休めた
  • それなりに楽しめた VS 楽しくなかった
  • それなりに楽しめた VS ゆっくり休めた
  • 楽しくなかった VS ゆっくり休めた

 

状態の確率分布

リスク下の意思決定において重要な役割を果たす確率分布の紹介もしておきます。
厳密ではありませんが、確率分布とは、「確率的に変化する値(確率変数)」とそれに対応する確率の一覧を示したもの、と考えるとわかり良いでしょう。
例えば状態の集合として{晴れ、雨、曇り}があった時、各々{30%、20%、50%}といった確率分布などが想定されます。
リスク下の意思決定問題では、この確率分布が与えられていると想定します。

リスク下の意思決定問題を整理すると、以下のようになります。

  • 選択肢の集合
  • 状態の集合
  • 結果の集合
  • 「選択肢×状態」から「結果」への写像
  • 「結果」の選好構造(好き嫌い)
  • 「状態」の確率分布

もしも客観的な確率が与えられていない場合は、意思決定者が主観で確率を評価する必要があります。これが不確実性下の意思決定問題となります。

 

確実性下の意思決定問題

状態を考慮しない意思決定問題を確実性下の意思決定問題と呼びます。
例えば、明日の天気が晴れだとわかりきっているならば、雨とか曇りとか言った状態を考慮する必要はなくなりますね。

確実性下の意思決定問題を整理すると、以下のようになります。

  • 選択肢の集合
  • 結果の集合
  • 「選択肢」から「結果」への写像
  • 「結果」の選好構造(好き嫌い)

 

社会的意思決定問題

高度な話題になるため、この記事では紹介しませんが、上記の意思決定問題をより発展させたものがいくつか知られています。

この記事では常に、意思決定者が一人であることを想定しています。しかし、複数人の利害を調整しつつ意思決定を行うこともあるでしょう。
この時には、選択肢の集合を、人数分用意しなければいけません。選好の構造も同様です。
今まで議論してきた意思決定問題は、最小限の要素を整理したものだとご理解ください。



スポンサードリンク

 

3.選好構造が満たすべき条件

意思決定理論において、しばしば問題となるのは選好の構造です。ここからは選好の構造を、より詳細に見ていきます。
意思決定を行う際、選好構造は、以下の2つの条件を満たすべきだ、ということが、しばしば指摘されます。

  • 完備性
  • 推移性

 

完備性

「どちらの方がより好ましいか、あるいは同程度に好ましいと言えるのか」の評価ができることを、選好を持つ、と呼びます。
完備性とは、「選択肢の集合の中の、任意の選択肢のペアが選好を持つ」ということです。

家でゲームをやるとしましょう。3つの選択肢があります。
{RPG、シューティング、格闘ゲーム}

「RPGとシューティングで比較すると、RPGの方が好きだ」という場合は、2つの選択肢で好ましさを評価できているのでOKです。
もしも「シューティングと格闘ゲームでの比較をすることは、俺様のゲーム哲学上許されない」というのでは、完備性を持ちません。

もしも「シューティングと格闘ゲームは同じくらい好ましい」と思っているならば、その通りに評価すればよいです。
「どちらの方がより好ましいか、あるいは同程度に好ましい」ということが評価できればOKです。

比較ができなければ、どれを選ぶかを決めることはできない、というのは当然とも言えますね。

ここで、記号を導入しておきます。複雑な数式を載せるつもりはありませんが、記号くらいは覚えておかれると、参考書を読む際に便利かと思います。

選択肢の集合をAとして、選択肢a、bがあったとします。
a、bは、集合Aの要素だよ、と示す記号は以下の通りです。「a,bはAに属する」と読みます。

$$a,b \in A$$

選択肢の集合Aに属する選択肢a,bにおける選好としては、
1.aの方がbより好ましい
2.bの方がaより好ましい
3.aとbは同程度に好ましい
の3種類がありえます。順に、以下のように表記します。

$$aの方がbより好ましい:a\succ b$$
$$bの方がaより好ましい:b\succ a$$
$$aとbは同程度に好ましい:a\sim b$$

大なり記号(>)と違って、クイッと曲がってる感じの記号を使います。同程度に好ましい場合はニョロニョロ記号です。

ちなみに、「aはbと同程度、あるいはそれ以上に好ましい」というのは以下のように表記します。「aの方がbより好ましい」と違って、同程度の好ましさであることも認めています。

$$a\succeq b$$

「RPGとシューティングで比較すると、RPGの方が好きだ」という選好構造は以下のように表記されます。
$$RPG \succ シューティング$$

 

推移性

選択肢の集合Aに属する3つの選択肢a,b,cがあった時

$$a\succ b かつ b \succ c \Rightarrow a\succ c$$

が成り立つ時、推移性を持つと呼びます。
日本語で書くと「aの方がbよりも好ましい、かつ、bのほうがcよりも好ましい、ならば、aの方がcよりも好ましい」ということです。

例えば
1.RPGとシューティングでは、RPGが好きだ
2.シューティングと格闘ゲームでは、シューティングが好きだ
でも、
3.RPGと格闘ゲームでは、格闘ゲームの方が好きだ
というじゃんけんのような三角関係になってしまっては、どれを選ぶべきか決められません。
1番と2番が正しいならば、「RPGが最も好きだ」にならないと困るわけです。

 

まとめと若干の感想

選好構造において、完備性と推移性が必要とされることは、覚えておかれるとよろしいかと思います。
完備性と推移性を共に満たす時に、選好関係は弱順序となります。
弱順序を持つことは、直感的に見ても大切なように見えますし、後ほど紹介するvNMの定理やサヴェッジの定理などでも必要とされます。

とはいえ、完備性は、日常生活の中で、満たされていないことがあるように感じます。
例えば、すごく忙しいタイミングで意思決定を迫られて「aとbのどちらの方が好ましいか、判断する余裕なんかないよ!!」と答えることもあるでしょう。比較ができていないので、これは完備性を満たしません。

推移性が満たされないような選好構造を持ってしまうこともありえそうですし、実際、いくつかの実験において推移性が満たされていないように思われる結果が観察されているようです。

 

4.効用関数を用いた選好関係の表現

選好構造に関する議論を続けます。
意思決定理論では、選好関係を表現する際に、効用関数を使うことが多いです。あくまでも一種の表現技法なのですが、意思決定理論において頻繁に現れるので、用語を整理しておきます。

ここでの議論は主に市川(1983)、竹村(2009)そして松原(2001)、ギルボア(2012)の補足を参考にしています。しかし、多くの書籍で似たような議論があります。

 

効用関数

効用関数を一言で述べると『選好関係を表現する実数値関数』となります。

例えば選択肢aとbがあったとします。
aの方が、bと同程度あるいはそれ以上に好ましかったとします。すなわち、以下の選好関係があります。
$$a\succeq b$$

これは、効用関数u()を使うことで、以下のように表現できます。

$$ u(a) \geq u(b) \iff a \succeq b$$

 
例えば選択肢aが「RPGをする」であり、選択肢bが「シューティングゲームをする」だったとします。
RPGは、シューティングと同程度あるいはそれ以上に好ましかったとします。

$$RPG \succeq シューティング$$

これは、効用関数u()を使うことで、以下のように表現できます。

$$ u(RPG) \geq u(シューティング) \iffRPG \succeq シューティング$$

 
イメージとしては「自分が、好ましいと感じる行動を選択する」を「自分が、効用が大きいと感じる行動を選択する」と表現しているようなところでしょうか。

 
大事なのは「効用関数だなんていう摩訶不思議なナニモノかが我々の心の中にあって、その表出としての行動という結果が得られる、というわけではない」ことです。
冷静に考えてください。ラーメンを食べるか焼き飯を食べるか、RPGをするかシューティングをするか、と言った普段の意思決定において、脳内で電卓をたたいて効用関数の出力(何らかの実数値)を得て、その大小を比較する、って、皆さんやってらっしゃいますか? 少なくとも私はしてません。
効用関数は、選好関係を表現するための手段に過ぎません。
好き嫌いという選好関係を、2とか3とかいった数値の大小で表現しなおそうよ、というのが効用関数です。

 

序数効用関数

選好の順序だけを気にして、実数値を出力する関数を、序数効用関数と呼びます。

以下が成り立っているとします。
$$RPG \succ シューティング$$

この時、序数効用関数は、以下が成り立っていれば良いです。

$$ u(RPG) \gt u(シューティング)$$

上記が成り立つことだけを考えると、色々な効用関数が想像できます。
u(RPG) = 1000
u(シューティング) = 10
でも良いですし、

u(RPG) = 1.2
u(シューティング) = 1
でも良いです。

順序関係さえ満たされていればOKなのが、序数効用関数です。

 

序数効用関数と弱順序

ところで、完備性と推移性が満たされている時、この選好構造を弱順序と呼ぶのでした。
選択肢の集合が、有限の集合であったとします。
完備性と推移性をみたす選好構造を持ち、最も好ましい選択肢を選ぶように行動している人は、「あたかも、序数効用関数の出力である数値を最大にするかのように振舞っている」とみなすことができます。
選好構造が弱順序を持つとき、好き嫌いという選好構造を、効用関数という表現形式で表すことの正当性が得られるわけです。
だから完備性と推移性は大切なんですね。

(以下補足)
上記の日本語の説明だけですと誤解を生みそうなので、弱順序に関する定理を竹村(2009)のp21より紹介しておきます。記号だけ、この記事にあうように修正しておきました。

有限集合A上の選好構造が弱順序であるならば、かつその時に限り、A上の実数値関数(序数効用関数)u:A→Reが存在して、

$$ \forall a,b \in A, a \succeq b \iff u(a) \geq u(b)$$

である。

ちなみに記号「∀」は「すべての」という意味です。「∀a,b∊A,~」は「集合Aに属するすべての要素a,bにおいて、~以下が成り立つよ」くらいの意味です。「u:A→Re」というのは「Aに属するなんらかの要素を入力すると、実数値を出力してくれる関数、その名もu」くらいの意味です。

日本語説明では、説明の都合上「選択肢の集合」という言葉を使いましたが、上記の定理そのものは、意思決定理論に限らずに成り立つ、数学的な定理です。証明は略します。

 

基数効用関数

序数効用関数では、関数の出力である実数値の「順序」だけが重要でした。その「差分」に関してはまったく気にしません。
例えばu(RPG) とu(シューティング)の差が1であろうが100万であろうが5000兆であろうがまったく関係はないことになります。
しかし、例えば「RPGとシューティング」の効用の差と「シューティングと格闘ゲーム」の効用の差、のどちらの差の方が大きいか、ということにも興味があるかもしれません。
この時に登場するのが基数効用関数です。

ここでは紹介しかしませんが、リスク下の意思決定問題では、こちらの基数効用関数の扱いが中心的な話題となります。

 

5.リスク下の意思決定問題

リスク下の意思決定について議論します。
私たちは、リスク下において、どのように意思決定をしているのか、あるいはするべきなのか。概観を述べます。

復習ですが、リスク下の意思決定問題を整理すると、以下のようになります。
『状態の確率分布(客観的な確率)』が得られていることに注意してください。

  • 選択肢の集合
  • 状態の集合
  • 状態の確率分布(客観的な確率)
  • 結果の集合
  • 「選択肢×状態」から「結果」への写像
  • 「結果」の選好構造(好き嫌い)

ここでの議論は主に西崎(2017)や市川(1983)、竹村(2009)を参考にしていますが、様々な教科書で類似の説明があります。ギルボア(2012)では、少し雰囲気は変わりますが様々な具体例を挙げて説明がなされています。
意思決定理論における重要な考え方となる期待効用最大化の理論が出てくるので、多くの教科書で取り扱われているようです。
期待値など確率統計の話題に関しては松原他(1991)『統計学入門』等の統計学の教科書も併せて読むと理解が深まります(この記事では直観的な説明にとどめています)。

 

今回扱う事例

具体例を挙げながら見ていきます。
明日は休日。意思決定者は、明日何をするかを検討しています。

リスク下の意思決定問題では『状態の確率分布(客観的な確率)』が分かっています。
例えば{晴れ、雨}の2つの状態があった時、各々{70%、30%}の確率で発生する、ということが明らかです。
「確実に晴れなのだ!」ということまではわかりませんが、確率が分かっているだけ、不確実性下の意思決定問題よりかは簡単です。
意思決定者は、選択肢として{映画館に行く、ハイキングに行く}を考えているとします。
選択肢を選んだ結果として{楽しい、普通、つまらない}が想定できるとします。

意思決定問題に照らし合わせて整理します。

―――――――――――――――――――

選択肢の集合
{映画館に行く、ハイキングに行く}

状態の集合
{晴れ、雨}

状態の確率分布(客観的な確率)
{P(晴れ)、P(雨)}={70%、30%}

ちなみにP(○○)で「○○の起こる確率」を表現しています。

結果の集合
{楽しい、普通、つまらない}

「選択肢×状態」から「結果」への写像
映画館  ・晴れ :普通
映画館  ・雨  :普通
ハイキング・晴れ :楽しい
ハイキング・雨  :つまらない

「結果」の選好構造(好き嫌い)
$$楽しい \succ 普通 \succ つまらない$$

―――――――――――――――――――

仮に、状態が明らかであれば、話は簡単なんですよね。
例えば「明日は晴れだ」とわかっていれば、ハイキングをするのが、最も好ましい選択となります。
逆に「明日は雨だ」とわかっていれば、映画館に行くのが、最も好ましい選択となります。
状態が明らかであり、これについて議論する必要が無い時を「確実性下の意思決定問題」と呼ぶのでした。

リスク下の意思決定問題では、状態の確率分布が与えられた状況で、意思決定を試みます。

 

確率くじ

「くじ引き」ってやったことありますでしょうか。例えば班のリーダーを決めようとか、飲み会の幹事を決めようと言った時に「あみだくじ」を引くことがあるかと思います。
ヘンな話かもしれませんが、あなたは飲み会の幹事を断りたかったとしましょう(私は絶対やりたくない)。
目の前に2つのあみだくじが用意されています。共に10本ずつあります。10本のくじは、すべて10分の1ずつの確率でランダムに選ばれます。
くじAは、10本中1本だけが「幹事になる」という結果を引き起こします。
くじBは、10本中2本だけが「幹事になる」という結果を引き起こします。
あなたは幹事になりたくない。というわけで「くじAを引く」ことを選ぶわけです。その方が、良い結果(幹事にならない)をもたらす確率が高いからですね。

リスク下の意思決定問題では、確率分布が固定されています。
これを、10本中、何本がハズレ(またはあたり)なのかが固定されている、という状況だとみなします。
これは固定で、変えられない。
しかし、私たちは「どちらのくじを選ぶか」を決めることができます。これこそがリスク下の意思決定です。

くじには、あらかじめ結果とそれに対応する確率が指定されています。意思決定問題の用語で言うと『状態の確率分布が与えられている』ことになります。
そのため、このくじを「確率くじ」と呼びます。
選択肢を選ぶというのは、どちらの「確率くじ」を選ぶかを決める、という作業にほかなりません。
確率くじを導入して、意思決定問題を見直すことで、リスク下の意思決定問題を整理しましょう。期待効用最大化の原理を理解するためには、確率くじの理解が必須です。

今回検討する意思決定問題を、簡略化したものを用意しました。
―――――――――――――――――――

選択肢の集合
{映画館に行く、ハイキングに行く}

状態の集合
{晴れ、雨}

状態の確率分布(客観的な確率)
{P(晴れ)、P(雨)}={70%、30%}

結果の集合
{楽しい、普通}
★「つまらない」を消しました。★

「選択肢×状態」から「結果」への写像
映画館  ・晴れ :普通
映画館  ・雨  :普通
ハイキング・晴れ :楽しい
ハイキング・雨  :普通

「結果」の選好構造(好き嫌い)
$$楽しい \succ 普通$$

―――――――――――――――――――
さて、映画館に行くか、ハイキングに行くかを選ぶという意思決定は、以下の2つの「確率くじ」を選ぶ意思決定と同じです。
映画館に行く  :{P(楽しい)、P(普通)}={ 0%、100%}の確率くじを引く
ハイキングに行く:{P(楽しい)、P(普通)}={70%、 30%}の確率くじを引く

これだったら、「楽しいことが起こる確率が高いので、ハイキングに行こう」と決められそうな感じがしますね。

 
しかし、今回扱う意思決定問題は、以下のようにやや複雑なものとなります。
映画館に行く  :{P(楽しい)、P(普通)、P(つまらない)}={ 0%、100%、 0%}の確率くじを引く
ハイキングに行く:{P(楽しい)、P(普通)、P(つまらない)}={70%、 0%、30%}の確率くじを引く

これが難しいのは「楽しい・普通・つまらない」の間に、どれくらいの開きがあるかを検討しないといけないからです。
このような課題があるため、序数効用関数ではなく、基数効用関数が、リスク下の意思決定問題では中心的な役割を果たすことになります。

 

期待値の考え方

期待効用の前に、期待値の説明をごく簡単に行います。
確率が出てくる中で何らかの評価を行う際、しばしば登場する指標が期待値です。
期待値とは何かと聞かれた時、様々な答え方がありますが、私は「未来の事象のことも考えた平均値のこと」と答えています。

期待値は『「確率×その時の値」の合計値』として計算されます。これは確率変数とその確率分布が得られていれば、計算することができます。

サイコロを投げることを考えます。イカサマでないサイコロの場合は、出る目とそれに対応する確率分布は以下のようになるはずです。
{P(1),P(2),P(3),P(4),P(5),P(6)}={1/6,1/6,1/6,1/6,1/6,1/6}

『「確率×その時の値」の合計値』を計算してみましょう。括弧は無くても式の上では問題ないですが、見やすさのため入れています。

$$(\frac{1}{6} \times 1) + (\frac{1}{6} \times 2) + (\frac{1}{6} \times 3) + (\frac{1}{6} \times 4) + (\frac{1}{6} \times 5) + (\frac{1}{6} \times 6) = 3.5$$

例えば、サイコロを1万回ほど投げて、出た目の平均値を計算すると、ほぼ3.5くらいになるかと思います。
では、これからサイコロを1万回投げるとした時、出る目の平均値はいかほどになるだろうか、ということを考える時に期待値を使います。これもやはり3.5になります。「未来の事象のことも考えた平均値」が期待値であるというイメージをつかんでいただけると幸いです。

例えば今日が2000年2月1日だとしましょう。2月2日の株価が上がって10万円得する確率が60%、逆に株が下がって10万円損する確率が40%とわかっていたとします。
まとめると以下の通りです。
{P(+10万円),P(-10万円)}={0.6,0.4}

『「確率×その時の値」の合計値』を計算してみます。

$$(\frac{6}{10} \times 10) – (\frac{4}{10} \times 10) = 2$$

期待値が+2万円でプラスの値になるようだから、株を買っておこう、という意思決定をするのが合理的であるように感じられます。
確率的に変化する状態を考慮する時、期待値は強力な武器となります。

確率分布が与えられていれば、期待値を計算できます。
例えば得られる金額の期待値が高くなるように行動を選択するのが合理的であるようにも見えます。
しかし、後述するように、このやり方ではうまくいきません。

 

サンクトペテルブルクのパラドクスとリスク回避的な効用関数

もらえる金額の期待値を最大化するように行動するべきだ、と考えると問題が発生することがあります。
有名な事例がサンクトペテルブルクのパラドクスです。
このパラドクスでは、以下の賭けを考えます。

  1. イカサマでない、表が出る確率が1/2のコインを使用する
  2. コインを何度も投げて、最初に表が出たのが何回目なのかを調べる。この回数をnとする
  3. 賭けの参加者は2のn乗のお金がもらえる

さて、この賭けに参加するとき、いくらまでならばお金を支払っても良いでしょうか。

1回目に表が出た場合は、2円しかもらえません。表が出る確率は1/2なので、1/2の確率で1回目に表が出ます。
2回目に表が出た場合は、4円しかもらえません。1/4の確率で4円もらえる計算になります。
3回目に表が出た場合は、8円しかもらえません。1/8の確率で8円もらえる計算になります。

「確率×その時にもらえるお金」の合計値、すなわち賭けで得られる金額の期待値を計算してみます。

$$\displaystyle \sum_{ n = 1 }^{ \infty } \frac{1}{2^n} \times 2^n = (\frac{1}{2} \times 2) + (\frac{1}{4} \times 4) + … = 1 + 1 + … = \infty $$

期待値は、1を無限回足し合わせた結果なので、無限大となります。
賭けに参加すると無限大のお金がもらえると期待できるわけです。

じゃあ、この賭けに参加するために100万円を出しますか、と言われたら、私は絶対に嫌です。
だって、1/2の確率でたったの2円しかもらえないんですよ。100万円支払って2円しか手に入らなかったら悲惨です。

というわけで、期待値を最大にするように行動する、というのは、あまり合理的な選択ではなさそうに思えます。

そこで登場するのが効用関数です。
基数効用を得る効用関数として、例えば対数関数(対数の底はe)を使用したとします。
2円もらった時の効用は「log2」で、およそ0.7ほどです。
20円もらった時の効用は「log20」で、およそ3ほどです。10倍の金額になっても、効用は10倍にはなりません。

期待効用を計算すると以下のようになります。

$$\displaystyle \sum_{ n = 1 }^{ \infty } \frac{1}{2^n} \times \log (2^n) = \log 4 $$

これは4円手に入れた時の効用の値と等しいため、この賭けに参加する費用が4円未満だった時に、賭けに参加するべき、ということになります。
参加費が5円なら、参加すべきではないと判断されるわけです。これは直観にも合う結果です。

以下のリンク先をたどると、対数関数のグラフを見ることができます。
logx,x=0から20,プロット
これを見ると、大きな金額になっても、効用があまり増加しないことが見て取れます。
このような関数を使うことで「たまに極端に多くのお金が手に入ったとしてもあまりうれしいとは感じない」という「リスク回避的」な意思決定を表現することができます。直観にもよく合う意思決定の結果が得られます。

期待値そのものを最大化するのではなく、意思決定者の選好構造を何らかの基数効用関数で表現し、そこから得られた期待効用を最大化すると、うまく意思決定ができそうです。

 

期待効用最大化の原理

まずは期待効用をもう少し丁寧に描写します。
リスク下の意思決定問題では『状態の確率分布』が与えられています。そして『「選択肢×状態」から「結果」への写像』も得られています。
というわけで、「どの選択肢を選んだら、どういう結果がどのような確率で発生するのか」がわかっている状況と言えます。
これは「どの”確率くじ”を選んだら、どういう結果がどのような確率で発生するのか」がわかっている状況だと言えます。リスク下の意思決定問題は、確率くじを選ぶ問題だと言えるのでしたね。

ある確率くじaを選んだとします。この時の結果の確率分布は与えられています。
ある結果を入力すると実数(基数的な効用)を出力してくれる基数効用関数uがあったとします。

期待効用は『「ある結果が得られる確率×その時の基数効用」の合計値』となります。

確率くじを選ぶと、その期待効用が計算できそうです。
その期待効用が最大となる確率くじを選ぶ、という意思決定の原理を、リスク下の意思決定問題における期待効用最大化の原理と言います。

 

フォンノイマン・モルゲンシュテルンの定理

公理1:弱順序(完備性と推移性)
公理2:連続性
公理3:独立性

上記3つの公理を満たすとき「私たちの行動は、正しく同定された効用関数において、あたかも、その期待効用を最大化するかのように振舞っている」とみなせるよ、という定理を、フォンノイマン・モルゲンシュテルンの定理、略してvNMの定理と呼びます。

公理というのは、平たく言うと「約束事」ですね。3つの約束を守っている限り、○○が成り立つよ、と言っているわけです。
記述的な側面から見ると「上記3つの公理を満たしている人は、期待効用を最大にするかのように振舞っているように記述できそうだ」ということになります。
規範的な側面から見ると「上記3つの公理について合意するならば、合理的な意思決定のために期待効用を最大化すべきだ」ということになります。

完備性と推移性くらいならば、まぁ納得はできるのですが、あと2つ、前提となる条件が追加されていることに注意が必要です。
特に独立性の公理は、記述的に見ても、規範的に見ても、疑問が残る公理だとしばしばいわれます。

 
以下では、やや数式が出てきますが、上記の定理をもう少し詳しく見ていきます。

 

記号の整理

数式を使ってvNMの定理を表記する前に、記号の整理だけしておきます。

選択肢の集合 :A
個別の選択肢 :a∊A
状態の集合  :Θ
個別の状態  :θ∊Θ
(じつは上記の記号は出てきません。サヴェッジの定理との比較をしたいので、載せておきました)

(ここからが大切)
結果の集合  :X
個別の結果  :x∊X
確率くじの集合:P
個別の確率くじ:p∊P

ちょっと紛らわしいので補足しておきます。リスク下の意思決定問題では「状態の確率分布」が与えられています。
選択肢を1つに決めると「結果の確率分布」が定まることになります。個別の確率くじpは「結果の確率分布」であると言えます。結果に対して「どのような確率分布がいいのかな」とか「やっぱり”楽しい結果”が起こる確率が高い確率分布がいいな」とかいうのを考える作業が、確率くじの選択です。

ある確率くじをpとします。ある結果をxとします。確率くじpを選んだ時に、結果xが生起する確率をp(x)とします。

X上の基数効用関数「u:X→Re」について、以下が期待効用となります。
$$E(u, p) = \displaystyle \sum_{ x \in X }^{ } u(x)p(x) $$

あんまり見かけない形のΣ記号かもしれませんが「集合Xに属するxをすべて足しあげた」ぐらいに読んでください。

さて、個別の結果や確率くじは、添え字を使って判断しても良いのですが、ちょっと数式が見ずらいかなと思ったので、以下のようにします。
確率くじが2つある時:  p,q∊P
確率くじが3つある時:  p,q,r∊P

最終的に、確率くじの選好を、期待効用の大小関係で表現したいわけです。

$$ E(u, p) \geq E(u, q) \iff p \succeq q, \forall p, q \in P$$

さて、確率くじの集合Pにおける選好構造が弱順序を持っていたとしましょう。
弱順序は説明済みなので、連続性の公理と独立性の公理を理解できれば、vNMの定理がなにを前提としているかがわかるはずです。

 

連続性の公理

連続性の公理は、任意の確率くじ「p,q,r∊P」において

$$ p \succ q \succ r $$

ならば

$$ \alpha p + (1-\alpha)r \succ q \succ \beta p + (1-\beta)r$$

となるα,β∊(0,1)が存在する。

という公理です。
実は別の表現形式もあるのですが、解釈がしやすいかと思うので、こちらだけを載せておきます。
開区間なので、例えばαは「0<α<1」であることに注意してください。0や1はダメです。

解釈の仕方として直観的にわかり良いかなと個人的に思うのは「ゼロリスク」にこだわってはいけないよ、という解釈です。
αやβを確率のように解釈しているんですね。

例えば運動をして健康の維持増進に努めたいが、けがをするリスクを一切許容できなかったとします。
pが「健康になる確率100%」の確率くじ
qが「何も起こらない確率100%」の確率くじ
rが「背骨が折れるなどの大けがをする確率100%」の確率くじだとします。

当然ですが、大けがはしたくないです。β=0.5くらいならば(大けがをする確率が50%ほどもあるならば)、何も起こらなかったとしても、まだこっちの方がましです。
一方で、大けがをする確率が0ではないにしても、大けがをする確率がものすごく小さいならば、例えば(1-α)=0.00001とかならば、これを許容できる、というイメージです。

家を出たら交通事故に合うかもしれない。どんなに低い確率であったとしても交通事故にあうのは嫌だから永遠に家からでないのよ(αp+(1-α)rの方が好ましいと感じられるα∊(0,1)が存在しない)、という人は、現実にあまりいないように思われます。
規範的な側面から見ても、連続性の公理を違反することは望ましくないように(少なくとも私には)思われます。けがをする0.00000001%のリスクを恐れて、部屋からまったくでないという行為を、私は望ましいと思わないからです。

 

独立性の公理

独立性の公理は、任意の確率くじ「p,q,r∊P」と、α∊(0,1)において

$$ p \succeq q \iff \alpha p + (1 – \alpha) r \succeq \alpha q + (1 – \alpha) r $$

が成立するという公理です。

⇔の右側をじーっと見ると「(1-α)r」がかぶっていますね、これを消してやってαで割れば、⇔の左側に一致します。
なんだか当たり前のように成立しそうに見えるのですが、弱順序や連続性に比べると、独立性の公理はしばしば批判の対象となるようです。

(インフォーマルな解釈だという批判もありますが)、独立性の公理は「複合くじ」という、確率くじを何度も引く行為を通して解釈できます。

pが、家で遊ぶことを選んだ時の、結果(楽しいとか、つまらないとか)の確率分布だとします。
qが、お出かけすることを選んだ時の、結果の確率分布です。

最近疲れているし、家で遊ぶ方がいいかなー、と普通に答えたとします。pの方が好ましいということです。

しかし、ある日曜日、休日出勤の危機が訪れました。
確率αで休めますが、確率(1-α)で休日出勤です。100%の確率で絶望が訪れるという結果の確率分布をrとします。

さて、この日曜日は、2つのくじを引くことになります。
まずは確率αでお休み、(1-α)で出勤となるくじです。
で、低い確率を乗り切って、金曜日に「やっぱり出なくていいよ」と上司に言われ、休日が訪れたとします。この時に「この解放感を味わうために、外出する(外出することによってもたらされる結果の確率分布)をより好む」と選好が変化すると、独立性が満たされないことになります。
すなわち「単純なpとqの比較ならばpを好む」のだけれども「(1-α)の確率でrが発生するというくじを事前に引いた後、その後に再度pとqの比較をしたならば、今度はqを好む」に変わるわけです。これが独立性の公理を満たしていない状況です。

ありえそうといえば、ありえそうですかね?
でも、休日出勤が回避された後の休みなのか、普通の休みなのかは、関係ないような気がします。金曜日にはもう結果がわかっている訳なので、スケジューリングにも影響は出ません。最近疲れてるのに、その場の勢いで外出したら、後悔するかもしれません。
独立性の公理が満たされているべきか(あるいは私の行動において満たされているか)は微妙だなと(私が主観的に)感じます。

まぁ、私の感想などはどうでもよくてですね、独立性の公理が満たされていないと考えられる実験の結果がいくつか出ていますので、興味がある方は参考文献をお読みください。竹村(2009)に詳しいです。

 

vNMの定理

結果の集合X上の基数効用関数「u:X→Re」が存在して

$$ E(u, p) \geq E(u, q) \iff p \succeq q, \forall p, q \in P$$

が成り立つのは、「弱順序・連続性の公理・独立性の公理」の3つの条件が満たされた時、かつ、その時に限る。
このような基数効用関数uは正の線形変換「αu+β, α>0」を含めて一意である。

というのがvNMの定理です。

 

vNMの定理のご利益

vNMの定理の最も大きなご利益は「(基数)効用関数というものを想定して、個人の行動を表現することの正当性」を与えてくれることでしょう。

また、確率くじ(あるいは確率分布)が与えられたとき、どの確率くじを選ぶべきか、どのような判断基準を使うべきかは自明ではありません。
例えば、統計学をかじっていると、分散や歪度、尖度などが気になることもあるでしょう。効用における「期待値÷分散-歪度」を最大化するように振舞う個人を想定したり、効用の中央値を最大にする個人を想定したり、と言ったことも可能です。
vNMの定理では「期待効用を最大化する個人」を想定することの正当性を述べてくれています。期待効用の最大化という単純な原理で、個人の行動を記述できたり、規範的な意思決定の枠組みを議論できたりすると便利ですね。

また、vNMの定理では3つの公理(約束事)が指定されています。これが満たされていないならば(そして独立性の公理は満たされているかが怪しい)、期待効用を最大化する個人を想定することは危ないかもね、ということも分かります。
ところで、独立性の公理を前提としているため、効用関数はいわゆる線形効用関数に限定されていることに注意が必要です。ここでは用語の紹介にとどめますが、平たく言えば「様々想定できる効用関数の中で、線形性という制限が付いた効用関数の存在についてのみ言及をしている」のがvNMの定理であると言えるかと思います。

 

合理性という言葉についての若干の補足

以下の内容は、この記事の書き手である私の意見が一部混じっています。ミスリーディングを誘わないように注意を払ったつもりですが、ご指摘があれば受け付けます。

 
たまに「期待効用を最大化するように振舞っていないから、この人の行動は非合理的だ」という記述が(教科書においても)見られますが、これは自明ではないと思います。合理的あるいは合理性という言葉の定義の問題ですね。

例えばミクロ経済学の標準的な教科書である、神取(2014)『ミクロ経済学の力』では、『「首尾一貫した好み(完備性と推移性を満たす選好)の下で、最も望ましいものを常に選択する」ことを合理的行動という』と紹介されています。複数人でのやり取りの結果に注目することが多いミクロ経済学では、(基数効用ではなく)序数効用を使って問題を定式化することが多いので、この定義は扱いやすいと思います。選好が弱順序であればよいので、連続性の公理も独立性の公理も気にしていません。

この記事の冒頭で紹介したギルボア(2013)の定義だとさらに緩いです。弱順序さえ必要としていません。
何をもって「合理的」というかは、教科書によっていくつかの立場に分かれているように思われます。

vNMの定理に戻ると、これは3つの公理を満たしている時に、期待効用を最大化しているかのように振舞う合理的な個人を想定できる、と言っているものです。
前提条件が指定されていることに注意が必要だと思います。
例えば、「弱順序・連続性の公理・独立性の公理」を、自身が納得したうえで受け入れている人が、期待効用を最大化するかのように振舞っていない、というのであれば、これは非合理的な意思決定といえそうです。
「弱順序・連続性の公理・独立性の公理」を、(特に独立性の公理を)自身が納得したうえで認めていない場合には、これを非合理的と呼ぶかどうかは、自明ではなく、議論の余地があると思います。

 

効用関数の同定

ハイキングに行くか、映画を観に行くかという意思決定の問題に戻ります。
vNMの定理が想定する「弱順序・連続性の公理・独立性の公理」を、自身が納得したうえで受け入れている個人に対して、意思決定を支援してあげたいと思ったとします。実務上の重要な作業が効用関数の同定となります。
いくつかの方法がありますが、「確実に発生する○○の結果 VS 各々が確率αと確率(1-α)で発生する最良・最悪の結果」のどちらの確率くじがより好ましいかを質問する、というのが一つの方法です。

 
Step1:最良の結果と、最悪の結果を挙げる

{楽しい、普通、つまらない}の3つならば、最良の結果は「楽しい」で最悪の結果は「つまらない」となりますね。

最良の結果がもたらす効用(実数値)を1
最悪の結果がもたらす効用(実数値)を0
とします。

 
Step2:確率くじの比較

「100%の確率で”普通”の結果が得られる」という確率くじと
「50%の確率で”楽しい”という結果が得られる、50%の確率で”つまらない”という結果が得られる」という確率くじを比較して、どちらの方が好ましいかを質問します。

ここで仮に「両方の確率くじは、私にとって同程度に好ましい」と言われたならば「”普通”という結果がもたらす効用は0.5である」と同定されます。

 
「100%の確率で”普通”の結果が得られる」という確率くじの方が好ましいというのであれば、もう一度質問をします。

「100%の確率で”普通”の結果が得られる」という確率くじと
「75%の確率で”楽しい”という結果が得られる、25%の確率で”つまらない”という結果が得られる」という確率くじを比較して、どちらの方が好ましいかを質問します。
ここで、「両方の確率くじは、私にとって同程度に好ましい」と言われたならば「”普通”という結果がもたらす効用は0.75である」と同定されます。

今回はあっという間に同定されましたが、「同程度に好ましい」と言ってくれない間は、これを何度も繰り返していく、というイメージです。

”普通”という結果がもたらす効用を同定できれば、期待効用を最大化する確率くじを選ぶ(ハイキングに行くか映画館に行くかという行動を選ぶ)ことができるようになります。

 
期待効用最大化の原理に基づく意思決定を行ってみます。

映画館に行く  :{P(楽しい)、P(普通)、P(つまらない)}={ 0%、100%、 0%}の確率くじを引く
ハイキングに行く:{P(楽しい)、P(普通)、P(つまらない)}={70%、 0%、30%}の確率くじを引く
であることに注意してください。
また、期待値は「確率×その時の値」の合計値として得られます。

 
「”普通”という結果がもたらす効用は0.5である」と同定されたならば、
映画館に行くときの期待効用  :0×1  + 1×0.5 + 0×0  = 0.5
ハイキングに行くときの期待効用:0.7×1 + 0×0.5 + 0.3×0 = 0.7

期待効用最大化の原理に従うならば、ハイキングに行くのが良いことになります。

 
「”普通”という結果がもたらす効用は0.75である」と同定されたならば、
映画館に行くときの期待効用  :0×1  + 1×0.75 + 0×0 = 0.75
ハイキングに行くときの期待効用:0.7×1 + 0×0.75 + 0.3×0 = 0.7

期待効用最大化の原理に従うならば、映画館に行くのが良いことになります。

効用関数は、個人によって異なることもあるでしょう。「オレにとって”普通”がもたらす効用は0.5なんだから、何があってもハイキングに行くんだ、オマエもそれに従え」じゃダメなわけです。
期待効用を最大化するかのように振舞う個人同士が、同じシチュエーションの時に異なる行動をとることは普通にありうるし、何ら矛盾することはありません。大切だと思うことが個人によって違うだけです。

 
今回は、あえて単純な事例を挙げたので面白みがないかもしれませんが、結果のバリエーション(結果の集合Xの要素数#X)が増えるとそれなりに大変な作業となります。
効用関数の関数の形をある程度固定して、関数のパラメタを推定するという方法など、やり方はたくさんあります。この辺りの実務的な課題は、後ほど別の記事などで紹介していこうと思います。

 

6.不確実性下の意思決定問題

続いて、不確実性下の意思決定問題に移ります。
不確実性下の意思決定問題を整理した内容を再掲します。

  • 選択肢の集合
  • 状態の集合
  • 結果の集合
  • 「選択肢×状態」から「結果」への写像
  • 「結果」の選好構造(好き嫌い)

今回は、状態の確率分布が与えられていません。
それでもなお、期待効用最大化の原理は、不確実性下の意思決定問題でもしばしば適用されます。
確率分布が与えられていないのに、どうやって期待値を得るのかと言うと、確率分布そのものも、意思決定者が想像して決めるんですね。天気の確率分布は与えられていないけれども「明日はきっと晴れるかなー」と思ったら、晴れになる確率を70%と見積もるような感じです。すでに与えられている客観的な確率と区別するために主観確率と呼ぶことにします。

不確実性下の意思決定問題では、基数効用関数の同定と、状態に関する確率の同定が必要となります。
リスク下の意思決定問題でさえ、独立性の公理の是非について議論の余地がありました。不確実性下の意思決定問題においては、これにさらに確率(あるいは状態の生起確率に関する信念)の問題も加わってきます。

不確実性下の意思決定問題を真剣に扱うと、非線形期待効用モデルなどの扱いなど、応用的な内容に突っ込まざるを得なくなります。
この記事では、応用・発展的な内容は扱わず、基本的な用語や概念の整理にとどめます。

 

確率の公理主義的定義

不確実性下の意思決定理論においては、確率の取り扱いが厄介な問題となります。
そこで、意思決定問題はいったん放置しておいて、確率の公理主義的定義を紹介します。ここでの議論は、標準的な数理統計学の教科書ならば、ほぼまったく同じことがどの本にも書かれているはずです。

用語を整理します。
起こりうるすべての結果の集合を標本空間と呼び、Ωと表記します。
事象は標本空間の部分集合と定義されます。事象という言葉を平たく解釈すると「起こりうることがら」くらいの意味になります。
あることがらを、仮に事象Aと呼ぶことにします。Aが起こる確率はP(A)と表記されます。

確率の公理主義的定義においては、以下の3つの公理(約束事)を満たしたものを確率と呼びます。

 
(1)
すべての事象Aに対して
$$ 0 \geq P(A) \geq 1 $$

 
(2)
$$ P(\Omega)=1 $$

 
(3)
互いに排反な事象 A1,A2,…に対して
$$ P(A_{1} \cup A_{2} \cup …) = P(A_{1}) + P(A_{2}) + … $$

排反な事象というのは「重なりがない事象」のことですね。「晴れていて、かつ、雨が降っている」なんていうのは基本的にはないので排反な事象といっても良いかと思います(狐の嫁入りは雨)。
晴れと雨だと、微妙に解釈の違いが生まれそうなので「雨が降っている天気」と「雨が降っていない天気」の2つだけを考えることにします。これが標本空間となります。
「雨が降っている」とか「雨が降っていない」という個別の天気を事象と呼びます。
ある事象が起こる確率は0~1の間で、標本空間全部を考えた時には、その確率は1になる、というのが公理(1)と(2)です。これはまぁ、合意できるかなと思います。

大事なのが(3)です。これを確率の加法性と呼びます。
「雨が降る、または、雨が降らない確率」は「雨が降る確率 + 雨が降らない確率」で計算できるだろう、というのが確率の加法性が意味するところですね。
一見あたりまえに見えるの(3)の確率の加法性ですが、不確実性下の意思決定問題においては、これがしばしば議論の対象となります。

 

サヴェッジの定理

いくつかの公理を満たしている場合、そしてその時に限り、主観確率と効用関数(少し正確に言うと、状態Θ上の確率測度Pと効用関数u:X→Re)が存在することを示したものがサヴェッジの定理です。
リスク下の意思決定問題におけるvNMの定理と同じような役割を持つ定理ですね。

効用関数だけでなく、主観確率に関してもそれが存在することを検討する必要があるため、vNMの定理よりもさらに条件が厳しくなります。独立性の公理が満たされているかどうかが怪しい上に、さらにいろいろの条件が加わるわけですから、不確実性下の意思決定問題において、期待効用最大化の原理をそのまま適用するのは、批判的に検証されるべきだろう、というイメージがつくかと思います。

サヴェッジの定理が満たすべき公理(7つもあります)は、例えば市川(1983)などを参照いただくとして、ここではvNMの定理との違いを簡単に述べるにとどめます。

まず、確率くじの選択と違って「結果の確率分布」が与えられていません。これを主観確率として評価するわけですが「楽しくなる確率はきっと70%だろう」と私たちが評価するのは難しいように感じられます。ここは「雨が降らない確率は70%だろう」のように「状態の確率分布」を評価したいところです。

vNMの定理と同様ですが、記号の整理だけしておきます。

選択肢の集合 :A
個別の選択肢 :a,b∊A
状態の集合  :Θ
個別の状態  :θ∊Θ

結果の集合  :X
個別の結果  :x∊X

効用関数uは「u:X→Re」であり、あくまでも「結果」から実数への関数となります。
結果の確率分布は得られていない(主観確率は、状態の確率分布で考えたい)です。
選択肢を「a:Θ→X」と、状態から結果への関数と考えます。「ハイキングに行く、という選択肢は『晴れならば楽しい、雨ならばつまらない』へと移す関数なのだ」と考えるイメージですかね。

というわけで、以下が成り立つことに興味があります。

$$ E(u(a(\theta)), p) \geq E(u(b(\theta)), p) \iff a \succeq b, \forall a, b \in A $$

確率くじの選択ではなく、文字通り、選択肢の選択になります。
この時の効用関数uだけでなく、Θ上の主観確率pの存在を検討しているわけです。

サヴェッジの定理は、意思決定理論だけでなく、主観確率に基づく統計学の基礎付けにおいても重要といえます。機会があれば、別の記事などでも内容を補足できればと思います。

 

7.期待効用最大化の反例と新しい意思決定のモデル

期待効用最大化原理に基づく意思決定を行っていないだろう、と思われる実験結果は多く存在します。
その中でも特に、不確実性下の意思決定問題における事例を紹介します。

 

確率の加法性に関する思考実験

エルスバーグのパラドクスと呼ばれる思考実験は、竹村(2009)、ギルボア(2012)など多くの文献で紹介されています。
単純化された事例がギルボア(2012)にありましたので、それを以下で紹介します。確実性原理と呼ばれる事例の紹介となります。

 

事例

■前提
1.壺が2つある。壺Aと壺Bとする。A,B共に、100個の玉が入っている。
2.壺Aには、赤玉・黒玉が各々50個ずつ入っている。
3.壺Bにも、赤玉・黒玉が入っているが、各々の個数は不明である(合計は100個)。
4.目を閉じて、ランダムに壺から玉を取り出す。

 
■賭けの方法
取り出されるボールの色を予想して、当たっていたら1万円もらえる。
外れたら、何ももらえない。

 
■問い1:以下の2つで、どちらを選ぶか?

選択肢a:壺Aから「赤玉」が出るのに賭ける
選択肢b:壺Aから「黒玉」が出るのに賭ける

 
■問い2:以下の2つで、どちらを選ぶか?

選択肢c:壺Bから「赤玉」が出るのに賭ける
選択肢d:壺Bから「黒玉」が出るのに賭ける

 
私自身は、問1でも問2でも、2つの選択肢に優劣は付けられない、すなわち「2つの選択肢は同程度に好ましい」と考えます。
「a~b」であるし「c~d」と判断するわけです。

問題は、次の質問です。

 
■問い3:以下の2つで、どちらを選ぶか?

選択肢a:壺Aから「赤玉」が出るのに賭ける
選択肢c:壺Bから「赤玉」が出るのに賭ける

 
■問い4:以下の2つで、どちらを選ぶか?

選択肢b:壺Aから「黒玉」が出るのに賭ける
選択肢d:壺Bから「黒玉」が出るのに賭ける

私は、aとcならば、aを好みます。理由は「少なくとも2分の1で、お金がもらえることがわかっているから」です。
どのくらいの確率で1万円がもらえるのかさっぱりわからない壺Bよりかは、確率がわかっている壺Aの方がまだ安心できるように感じます。

同様の理由で、bとdであれば、確率分布がわかっているので、選択肢bを好ましいと感じます。

もちろん、これは、このブログ記事を書いている私がそう感じるというだけのことではあります。
でも、いくつかのよく似たシチュエーションにおいて、同様の結果が観察されているようです。

 

解釈

人によって「お金がもらえない」や「1万円もらえる」がもたらす効用の大きさは異なるでしょう。
しかし、ここでは「お金がもらえない」よりも「1万円もらえる」ことの方が好ましい、ということに合意できていることを想定します。多くの人の場合は成り立つことかと思います。少なくとも私は、お金がもらえる方がうれしいです。

もらえるお金の額は固定なので「お金がもらえる確率」の大小関係によって、どちらの選択肢を選ぶべきかを判断することになります。
壺Aにおいては、どちらの色に賭けても、お金がもらえる確率が50%であるとわかっています。

壺Bにおいては、確率分布が与えられていないので、我々が想像するしかありません。
私なんかは単純な性格なので「よくわからんから、赤玉も黒玉も50%ずつの確率で得られるのかなー」とシンプルに考えました。この場合は、お金がもらえる確率が、選択肢c,dで変わらないので、選択肢cとdは同程度に好ましいと評価されることになります。

「主観的には」壺Bにおいて赤玉も黒玉も50%ずつの確率で得られると想定したのにかかわらず、なんとなく確率分布がわかっている壺Aを選びたくなる心情をここでは説明しているわけです。

ところで、『「お金がもらえる確率」の大小関係によって、どちらの選択肢を選ぶべきかを判断している』と想定できているとしましょう。
そうしたら、問3と問4における、選択肢の選好を踏まえると、私は
・壺Aで赤玉が出る確率(50%)よりも、壺Bで赤玉が出る確率の方が低いと想定している
・壺Aで黒玉が出る確率(50%)よりも、壺Bで黒玉が出る確率の方が低いと想定している
ことになります。

壺Bから玉を取り出すときにおける標本空間は{赤玉が出る、黒玉が出る}だけです。この確率は1になるはずです。
しかし、選択肢の選好からは「壺Bから赤玉が出る確率は50%よりも小さい」うえに「壺Bから黒玉が出る確率は50%よりも小さい」と判断せざるを得ません。

すなわち「壺Bから、赤玉、または、黒玉が出る確率」が、各々の確率を足した値になりません(0.5より小さいもの同士を足して、1になるというのは明らかにおかしい)。
これが、主観確率が確率の加法性を満たしていないだろう、と想定される事例となります。

エルズバーグという方の考えた思考実験には実はもう1つあり、そちらを見ることでも主観確率(あるいはサヴェッジの定理の想定している公理)に関する理解が深まるかと思います。

 

確率(信念)の曖昧さを扱う応用的なモデル

確率の公理主義的定義から見ると、もはや確率とは呼べないような信念が観測されることがあります。
このような事例に対しても適応できる意思決定モデルがいくつか提示されているので簡単に紹介します。
坂井 編(2014)やギルボア(2014)や田村他(1997)などに記載があります。ここではごく簡単な紹介だけにとどめます。

 

加法性を満たさない主観確率を想定する

1つ目がシンプルに「加法性の無い主観確率を使ってしまえ」という方針となります。
ショケ積分に基づくショケ期待効用はこれの1つのアイデアと言えます。

 

マキシミン期待効用仮説

主観確率は、その同定された値に対してさらに幅を設けよう、というのがマキシミン期待効用仮説だと言えるかと思います。

壺Bにおいて、主観確率として「赤玉が得られる確率は50%かな」と想定しました。しかし、これに幅を設けて「赤玉が得られる確率は40~60%くらいかな」と考えたとします。そうした時の”期待効用の最小値”は「40%の確率で1万円がもらえる」を想定したときの期待効用となりますね。このように『”期待効用の最小値”を最大化しよう」という意思決定の原理をとるのが、マキシミン期待効用仮説です。

 

8.参考文献

意思決定理論は、その応用範囲が広いため、ビジネス書から工学の専門書まで様々な分野の教科書があります。今後、分野別の文献リストなどを簡単に紹介できればと思います。

以下では、この記事を書くにあたって参考にした書籍のみを載せます。オペレーションズリサーチ(OR)系の書籍は少ないです。
ベイズ決定やゲーム理論を扱った教科書もほとんど載せていません。これらは意思決定理論のやや応用的なテーマかと思います。
この記事のように、純粋な基礎を扱った、という本は意外と少ない印象です。

 


市川(1983)『意思決定論 (エンジニアリング・サイエンス講座 33) 』

この記事を書くときに、最も多く参照した教科書となります。
古い本なので、書店で手に入れにくいのが難点ですが。


竹村(2009)『行動意思決定論―経済行動の心理学』

市川(1983)を引用しつつ、期待効用仮説では説明がつかない実験例も多く紹介されている書籍です。
いわゆる行動経済学関連の書籍は個人的に少し苦手なのですが、この本は数理的な側面も踏まえ丁寧な議論がなされていて、大変勉強になりました。


西崎(2017)『意思決定の数理 最適な案を選択するための理論と手法』

効用理論の基本から、(多属性)効用関数の同定問題、そしてAHPなどの実践的な内容まで扱った書籍です。


松原(2001)『意思決定の基礎 (シリーズ意思決定の科学) 』

vNMの定理などの説明は控えめですが、効用理論・確率論の基本・ベイズ決定・ゲーム理論・情報理論など、意思決定の分野にかかわる様々な内容が整理されています。
標準的な構成ともいえるもので、類書も多々ありますが、いわゆる広く浅くな本かと思います。
広く浅くと言うと、悪いイメージがあるかもしれませんが、こういう本を1冊読んでおくと、他の本を読んだ時に楽になります。定番書と言えるかどうかはわかりませんが、著名な先生が書かれた本なのでここで紹介しておきます。


ギルボア(2012)『意思決定理論入門』

ギルボア先生の3冊の著作の第1弾です。
理論よりも具体例が多く、「自分ならどのような意思決定をするだろうか」と自問自答しながら読む本となっています。
基本事項の整理~リスク下~不確実性下の意思決定問題へと進んでいきます。


ギルボア(2013)『合理的選択』

ギルボア(2012)と違って、集団選択にも立ち入っているため、ミクロ経済学の色が強くなっています。ゲーム理論なども扱っています。


ギルボア(2014)『不確実性下の意思決定理論』

上記2冊は数式がほとんど出てきませんでしたが、この本は大量に出てきます。哲学的な記述も多いです。
難易度はかなり高い本だと思います。私もこの本の内容を完全に理解できたという自信は無いです。


田村他(1997)『効用分析の数理と応用』

非線形期待効用モデルなど、応用的な事例も豊富に載っている、本格的な意思決定理論の教科書です。


坂井 編(2014)『メカニズムデザインと意思決定のフロンティア』

章ごとに個別の執筆者がテーマを変えて書いている、論文集のような体裁の本です。
第6章『危険と不確実性の下での意思決定』を参照しました。サヴェッジの定理以降の進展の概要を知りたくて読みました。


松原他(1991)『統計学入門 (基礎統計学Ⅰ)』

意思決定理論と直接の関係はありませんが、有名な統計学の入門書です。


神取(2014)『ミクロ経済学の力』

ミクロ経済学の標準的な中級テキストです。

 
更新履歴
2019年2月25日:新規作成
2019年3月16日:記事が長いので、目次とそれぞれの章・節をリンクさせた。本文に変更は無し



スポンサードリンク