意思決定論

HOME
６．計量社会科学
意思決定論
ビジネス意思決定における期待値最大化原理の適用についての諸課題

2021年7月4日 / 最終更新日時 : 2021年7月4日馬場真哉意思決定論

ビジネス意思決定における期待値最大化原理の適用についての諸課題

本記事では、意思決定の手続きについて、ビジネス適用を念頭において解説します。
意思決定の方法としては、期待値最大化に基づく方法を中心に解説します。

本記事は『機械学習とビジネスを橋渡しするものこそ評価指標であり, ”全てのビジネスは条件付期待値の最大化問題として書ける”仮説についての一考察』の内容を受けたものです。「先のブログ記事」と表現したら、それは常にこの記事を指します。
なお、当方は「期待値最大化の原理は、唯一絶対の意思決定の原理というわけではない」と考えています。それと同時に「期待値最大化の原理をもっと広めたい。これをスタート地点として、もっと多くの工夫を生みだしたい」とも思っています。
本記事においては、期待値最大化の原理を適用する際の諸課題について言及しますが、これは「期待値最大化という意思決定の原理を使うべきではない」ということを意味しません。「期待値最大化という意思決定の原理の、その先」に目を向けてもらえると、とても嬉しく思います。

本記事は、拙著『意思決定分析と予測の活用基礎理論からPython実装まで』の内容を参照しています。本文中で『拙著』という言葉が出てきた場合は常にこの本を指します。
記号などは都度導入しますが、意思決定分析における基本事項についての説明は完全に省略します。
拙著を除く参考文献は『人名(発行年)』で記載し、記事の最後に書籍のタイトルなどを紹介しています。

なお、拙著は多くの人が読むことを想定し、なるべく著者個人の意見に左右されないよう細心の注意をはらって執筆しました。しかし、本記事は著者独自の見解や意見がほとんどを占めます。この点は注意してください。本記事の内容は、コンセンサスが得られた内容であるとは限りません（拙著は本記事とはスタンスが大きく異なります）。

スポンサードリンク

要旨
定式化
1. リスク下の意思決定問題
2. 情報を用いたリスク下の意思決定問題
3. 決定方式
4. 決定方式の選択
5. 利得の期待値
6. 情報の価値（EVSI）
7. 家賃保証問題の事例
8. 定式化の意図
サンクトペテルブルクのパラドックス
1. サンクトペテルブルクのパラドックス
2. 期待効用最大化の原理
3. リスク態度から見た期待値最大化の原理の立ち位置
期待値最大化原理に関する実践的な諸課題
1. 在庫管理における表記と問題設定
2. 在庫管理における期待費用最小化問題
3. 在庫管理における期待クレーム数最小化問題
4. 在庫管理における安全在庫設定問題
5. 結果の観測可能性について
6. 確率分布の評価について
不確実性下の意思決定問題における、期待値最大化原理以外の決定基準
1. マキシミン基準
2. 期待値最大化の原理と感度分析
3. データを追加するべきか？
意思決定理論の役割
1. 期待値を最大にすべきとき、そうでないとき
2. トートロジーと新語の創出の誘惑
3. 意思決定理論という表現技法
意思決定の支援のカタチ
1. 意思決定問題の定式化
2. 行動の推薦

1．要旨

期待値最大化の原理に基づく意思決定は、広い場面で利用できる優れた手法だと思います。今までこの考え方を知らなかった人は、ぜひこの方法論をマスターしてほしいです。個人的にもこの考え方は積極的に普及していきたいです。
ただし、期待値最大化は、常に適用できる手法ではなく、また唯一の手法でもありません。データ活用は、期待値最大化の原理に基づく意思決定に資することもできるし、それ以外の場面でも役に立つと考えます。

また、当方の個人的な意見として（拙著でも言及しましたが）、意思決定理論は「意思決定の問題を表現する言語」としての有用性が大きいと思います。具体的な作業手続きとしての決定分析の果たす最も大きな役割は、意思決定問題の整理・表現だと思うのです。これはリスクや不確実性がある中でのコミュニケーションの技術と言い換えても良いと思います。
だからこそ、データ分析や決定分析は、期待値の最大化問題以外の問題に対しても役に立つはずですし、その可能性を捨てるのはもったいないように思うのです。

本記事では期待値最大化の原理を定式化したうえで、いくつかのシチュエーションで、この原理の適用の是非について検討します。
続いて期待効用最大化の原理について言及したうえで、意思決定の「理論」が果たす役割について、個人的な意見を述べます。

2．定式化

定式化においては、先のブログ記事とは異なった表記法を用います。この方が選択肢の数や自然の状態の数が増えたとしても対応がしやすいと思うからです。
（参照先のブログにあわせるため、拙著の表記法とも少し変えています。補足すると第3部第4章「標準型分析」の記法を若干修正したものになります）

リスク下の意思決定問題

我々はビジネスであれ個人の営みであれ、日々何らかの意思決定の問題に直面します。
意思決定の問題を数理的に取り扱うための定式化を試みます。

意思決定を行う人を意思決定者と呼ぶことにします。

自然の状態の確率分布が与えられている下での意思決定問題をリスク下の意思決定問題と呼びます。
リスク下の意思決定問題の構成要素を整理すると、以下のようになります。

選択肢の集合　$ A $
自然の状態の集合　$ \Theta $
「選択肢×自然の状態」から「結果」への写像　$ c:A \times \Theta \to \mathbb{ R } $
「自然の状態」の確率分布　$ P( \theta ) $

ポイントは、意思決定者が自らの意思で決めることができる選択肢と、意思決定者の意思とは関係なく決まる自然の状態に分けたことです。
しばしば言及されることですね「努力したからと言って成功するとは限らないが、成功したものはすべからく努力しているものだ」。努力の有無が選択肢です。努力が報われるかどうかは、意思決定者が置かれた自然の状態によって変わります。そして、自然の状態は確率的に変化する。だからこそ選択肢を決めることには若干の逡巡があるはずです。

以下、意思決定問題に関する若干の補足です。
選択肢と自然の状態は有限集合を仮定します。ただし、これは説明の簡単のためであり（あとでΣ記号を使いたい）、実際には可算無限集合や実数値の集合であっても（若干の留意事項がありますが）同様の議論が成り立ちます。
なお個別の選択肢は$ a_j \in A $と個別の自然の状態は$ \theta_i \in \Theta $とします。

「結果」については実数$ \mathbb{ R } $で表現できると想定しています。先のブログ記事でいてば、売上金額や何らかのビジネス上のKPIがこの結果に当たります。説明のためこの実数値をしばしば利得と呼びます。
たとえば自然の状態が$ θ_i $のときに選択肢$ a_j $を採用したときの利得は$ c(a_j, θ_i) $です。

情報を用いたリスク下の意思決定問題

機械学習と呼んでも統計モデルと呼んでも需要予測と呼んでも人工知能的なアレと呼んでもなんでもよろしいが、意思決定に資するであろう何らかの情報を$ z_k \in Z $とします。説明の簡単のため$ Z $も有限集合を仮定します。

ここで同時確率 $ P( \theta, z) $ が明らかであるとします。
情報$ z $が得られたからと言って自然の状態が完全に明らかとなるわけではありません。しかし自然の状態と独立ではない情報$ z $が得られたのであれば、それに基づいて自らの行動（採用する選択肢）を変化させることで、期待利得を増加できるかもしれません。

決定方式

情報から選択肢への写像　$ d:Z \to A $　を決定方式と呼びます。
決定方式は複数あり得ます。個別の決定方式を区別するために添え字エル（数値の1ではない）を添えて　$ d_l $　と表記します。

たとえば情報$ z_k $が得られたときに、選択肢$ a_j $を採用するという決定方式$ d_l $は$ d_l(z_k) = a_j $と表記できます。

決定方式の選択

情報が得られたら即座に取るべき行動が決まると考える人が思いのほか多いですが、これは誤りです。情報を得た際にどのような行動をとるかを考えるという問題を明示的に示すためにも、決定方式という概念は役に立ちます。

たとえば「情報を無視する」という選択肢の選び方も当然あり得ます。情報を得ても意思決定の役には立たない（むしろ不確かな情報を用いることで期待利得が下がるかもしれない）ということもあります。

一方で「情報に忠実に従う」という選択肢の選び方もあり得ます。たとえば「○○の株はこれから上がるのじゃ！」というオラクル様のご神託を鵜呑みにして株を購入するという手続きもあり得るでしょう。膨大なデータと理解不可能なほどに肥大化したニューラルネットワークから得られたご神託であれば、それに従いたくなる気持ちもわからなくはありません。
馬鹿馬鹿しく思われるかもしれませんが、意思決定の手続きが明確である（指示に従うだけなので）ため、運用が楽というメリットはあります。

さまざまな決定方式の選び方がありますが「ある特定の情報$ z_k $が得られたという条件付の期待値を最大にする選択肢を選ぶ」という方法もあります。これが先のブログにおける主題でしょう。

利得の期待値

期待値という言葉を使うとき、どのようなシチュエーションで何に対する期待値をとっているのかを明確にすることは大切です。
シチュエーション別に期待値をいくつか紹介します。

情報が得られていないときの期待値

情報を無視したときの期待値と言ってもよろしいです。これは下記の通りです。ただし$ \#\Theta $は自然の状態の要素の数です

$$ \mathbb{ E }_{P(\theta)}[c(a_j, θ)] = \displaystyle \sum_{i=1}^{\#\Theta} { P(θ_i) \cdot c(a_j, θ_i) } $$

なお、この期待値は、選択肢$ a_j $を「採用すると決めた」後では単なる期待値になります。

やや鬱陶しいですが、確率分布を明示するために$ \mathbb{ E }_{P(\theta)}[c(a, θ)] $としています。
余談ですが、拙著では期待金額(EMV)を対象としているので$EMV(a_j|P(\theta)) $と表記しています。これと同じです。ただ、先のブログとシチュエーションを合わせるためにEMVという表記は使わないようにしています。

ある特定の情報$ z_k $が得られたときの期待値

決定方式$ d_l $を採用すると決めたとします。このとき、ある特定の情報$ z_k $が得られたときの期待値は下記の通りです。

$$ \mathbb{ E }_{P(\theta|z_k)}[c(d_l(z_k), \theta)] = \displaystyle \sum_{i=1}^{\#\Theta} { P(θ_i|z_k) \cdot c(d_l(z_k), θ_i) } $$

なお、この期待値$ \mathbb{ E }_{P(\theta|z_k)}[c(d_l(z_k), \theta)] $は、決定方式$ d_l $を「採用すると決めた」後でも、どのような情報が得られるかまだ分かってないので、情報$ z_k $に対する条件付きの期待値になります。

これを最大にするように選択肢を選ぶというのが、おそらく先のブログの骨子かと思います。

情報が得られる前の期待値

決定方式$ d_l $を採用すると決めたとします。このとき、情報が得られる前（まだどんな情報が得られるかわかってない）ときの期待値は下記の通りです。

$$ \begin{eqnarray}
\mathbb{ E }_{P(θ,z)}[c(d_l(z), \theta)] &=& \displaystyle \sum_{k=1}^{\#Z} { P(z_k) \cdot \mathbb{ E }_{P(\theta|z_k)}[c(d_l(z_k), \theta)] } \\
&=& \displaystyle \sum_{k=1}^{\#Z} { P(z_k) \cdot \displaystyle \sum_{i=1}^{\#\Theta} { P(θ_i|z_k) \cdot c(d_l(z_k), θ_i) } } \\
&=& \displaystyle \sum_{i=1}^{\#\Theta} \sum_{k=1}^{\#Z} { P(θ_i, z_k) \cdot c(d_l(z_k), θ_i) }
\end{eqnarray}$$

これは決定方式$ d_l $を「採用すると決めた」後ならば、単なる期待値ですね。
これを明示するために「総体的期待利得」と呼ぶこともあります。

情報の価値（EVSI）

情報の価値にはいくつかの定義があるのですが、広く使われるEVSIの定義を紹介します。これは、情報を使ったときの総体的期待利得と、情報を使わないときの期待利得との差です。
情報を使うことによって得られた追加の期待利得を情報の価値とみなします。

$$ EVSI = \mathbb{ E }_{P(θ,z)}[c(d_l(z), \theta)] – \mathbb{ E }_{P(\theta)}[c(a_j, θ)] $$

なお、EVSIを定義するときは、$ d_l $ は条件付き期待値を最大にする決定方式であり、$ a_j $ は期待値を最大にする選択肢を想定します。
情報があるとき・ないときにおいて、期待値を最大にするという意味で最善を尽くしたと想定し、その際の差額をEVSIと定義します。

家賃保証問題の事例

先のブログで上がっていた家賃保証問題を対象として定式化を試みます。

自然の状態には2つあります。
$ \theta_1 = 問題のないユーザーである $
$ \theta_2 = 問題のあるユーザーである（この人は家賃を滞納する） $

選択肢も2つあります。
$ a_1 = 家賃保証契約をする $
$ a_1 = 家賃保証契約をしない $

結果は以下の通りです。
$ c(a_1, \theta_1) = S $ 問題ない人に家賃保証をして、売り上げ$ S $を得る
$ c(a_1, \theta_2) = D $ 問題ある人に家賃保証をして、損失$ D $を被る
$ c(a_2, \theta_1) = 0 $ 家賃保証しないので、売り上げ0
$ c(a_2, \theta_2) = 0 $ 家賃保証しないので、売り上げ0

定式化の意図

先のブログ記事のように定式化するのは、決して悪いやり方ではありません。本記事は、当方が考えて定式化したものではなく、既存の知識を整理しただけのものです。当方と比べると、ゼロからの定式化を試みた先のブログ記事の著者の方の方が数段優れていることは疑いようがありません。車輪の再発名を馬鹿にする文化はこの世から滅びればよいと思います。

もしかすると本記事の定式化はあまりにまじめすぎて面白みがないかもしれません。
ただし、歴史のある方法で定式化をすることにもいくつかのメリットがあります。
まず、本記事のように定式化することで、選択肢の数が2を超えても対応ができるようになります。理論的には選択肢や自然の状態が実数値をとる場合でも同様の定式化が可能です。

正直なところ（個人的には）、期待値最大化の原理を採用する場合には、PrecisionやRecallといった指標を使う必要性はないと思います。適用範囲を狭くするという弊害があるからです。また、意思決定者の利得行列によって登場する指標が変わる（Recallが登場しなくなるなど）のも、場合分けが必要となるため、汎用性という観点から見るとやや不満があるように思います。

また、決定方式を導入することで「情報を手に入れた際、私たちはどのような選択肢を選ぶべきだろうか」という疑問を明確にモデルに含めることができます。しばしば「情報が得られたら、とるべき行動が一意に定まる」と想定されることがありますが、これは根拠がないことです。モデルの定式化を工夫することで、意思決定のやり方についてもいろいろな工夫があることを明示的に織り込むことができるというのは便利な特徴だと思います。

最後に、地味ですが「意思決定に必要となる要素」について考察ができるのも便利なところだと思います。リスク下の意思決定問題では、$ A,\Theta, P, c, Z $で意思決定問題を定義しました。「いま私たちが直面している意思決定の問題を定式化するとき、抜けや漏れはないだろうか」というのはしばしば疑問に思うことです。これに対する一つの回答を提示できるという意味で、本記事の定式化は優れた方法だと感じます。
たとえば因果推論や効果検証の技術は、利得$ c $を評価するのに役立つはずです。分析の技術をどこに適用するかを検討する際、意思決定問題を一般的に定式化しておくと便利です。

先述のように、本記事での定式化の方法を用いると、2カテゴリー分類に限らず、Nカテゴリー分類や実数値予測問題に対しても同様の定式化が可能です。
ただし、自然の状態も選択肢も2つしかない場合の意思決定については、コスト/ロスモデル（拙著第3部第2章）を用いることで、その性質がかなり詳細に明らかとなります。コスト/ロスモデルを用いることで、たとえば意思決定者がPrecisionの改善を検討すべきかRecall（のようなもの）の改善を検討すべきかを判別する閾値を、解析的に、人間が解釈可能な指標を用いて導出できます。こういった既存の意思決定モデルを利用することも検討の余地があると思います。

3．サンクトペテルブルクのパラドックス

期待値最大化の原理が否定される理由としてしばしば登場する、サンクトペテルブルクのパラドックスを紹介し、（かなり端折った説明になりますが）期待効用理論を導入します。

サンクトペテルブルクのパラドックス

もらえる金額の期待値を最大化するように行動するべきだ、と考えると問題が発生することがあります。
有名な事例がサンクトペテルブルクのパラドックスです。別の記事にも書きましたが、ここでも導入しておきます。

このパラドックスでは、以下の賭けを考えます。

イカサマでない、表が出る確率が1/2のコインを使用する
コインを何度も投げて、最初に表が出たのが何回目なのかを調べる。この回数をnとする
賭けの参加者は2のn乗のお金がもらえる

さて、この賭けに参加するとき、いくらまでならばお金を支払っても良いでしょうか。

1回目に表が出た場合は、2円しかもらえません。表が出る確率は1/2なので、1/2の確率で1回目に表が出ます。
2回目に表が出た場合は、4円しかもらえません。1/4の確率で4円もらえる計算になります。
3回目に表が出た場合は、8円しかもらえません。1/8の確率で8円もらえる計算になります。

「確率×その時にもらえるお金」の合計値、すなわち賭けで得られる金額の期待値を計算してみます。

$$\displaystyle \sum_{ n = 1 }^{ \infty } \frac{1}{2^n} \times 2^n = (\frac{1}{2} \times 2) + (\frac{1}{4} \times 4) + … = 1 + 1 + … = \infty $$

期待値は、1を無限回足し合わせた結果なので、無限大となります。
賭けに参加すると無限大のお金がもらえると期待できるわけです。

じゃあ、この賭けに参加するために100万円を出しますか、と言われたら、私は絶対に嫌です。
だって、1/2の確率でたったの2円しかもらえないんですよ。100万円支払って2円しか手に入らなかったら悲惨です。

期待効用最大化の原理

そこで登場するのが効用関数です。
基数効用を得る効用関数として、例えば対数関数（対数の底はe）を使用したとします。
2円もらった時の効用は「log2」で、およそ0.7ほどです。
20円もらった時の効用は「log20」で、およそ3ほどです。10倍の金額になっても、効用は10倍にはなりません。

期待効用を計算すると以下のようになります。

$$\displaystyle \sum_{ n = 1 }^{ \infty } \frac{1}{2^n} \times \log (2^n) = \log 4 $$

これは4円手に入れた時の効用の値と等しいため、この賭けに参加する費用が4円未満だった時に、賭けに参加するべき、ということになります。
参加費が5円なら、参加すべきではないと判断されるわけです。これは直観にも合う結果です。

以下のリンク先をたどると、対数関数のグラフを見ることができます。
『logx，x=0から20，プロット』
これを見ると、大きな金額になっても、効用があまり増加しないことが見て取れます。
このような関数を使うことで「たまに極端に多くのお金が手に入ったとしてもあまりうれしいとは感じない」という「リスク回避的」な意思決定を表現できます。直観にもよく合う意思決定の結果が得られます。

期待値そのものを最大化するのではなく、意思決定者の選好構造を何らかの効用関数で表現し、そこから得られた期待効用を最大化すると、うまく意思決定ができそうです。
なお、今回は効用関数として対数関数を使いましたが、本来は意思決定者にアンケートをとって効用関数を同定する必要があります。

リスク態度から見た期待値最大化の原理の立ち位置

お金がもらえたりもらえなかったりするというリスクがあるときには、意思決定者の「リスクに対する態度」が重要になります。
期待値最大化の原理は、「リスク中立」であることを意思決定者に要求します。

リスク中立的な態度を要求するのは、現実離れした仮定でしょうか？
個人の意見になりますが、期待効用最大化を、単なる期待値の最大化で近似をしても大きな問題が発生しない状況は（もちろんすべてではないけれども）しばしばあるのではないかと思います。
たとえば、何度も似たような意思決定を行う機会があり「平均的な利益」を最大にしたいという目標を立てることが妥当である状況はあり得るはずです。

4．期待値最大化原理に関する実践的な諸課題

サンクトペテルブルクのパラドックス以外でも、期待値最大化の原理を適用できるかどうか悩む事態にはしばしば陥ります。
意思決定理論の教科書的な内容からは外れますが、オペレーションズリサーチで登場する新聞売り子問題を通して、期待値最大化（あるいは期待費用最小化）という意思決定原理に向き合ってみます。

在庫管理における表記と問題設定

大野(2011)を参考にして、在庫管理問題を定式化します。

新聞は、翌日になると販売が難しくなります。そのため仕入れ量が需要を上回ると、余った分は廃棄せざるを得なくなります。
ただし、仕入れ量が少なすぎると、売り切れてしまいます。需要量は確率的に変化すると想定します。
このような在庫管理の問題を新聞売り子問題と呼びます。

新聞売り子問題の記号を整理します。

仕入れ量（これが選択肢）　$ siire $
需要量（自然の状態）　$ juyo $
仕入れ価格（結果の計算に必要）　$ tanka $
廃棄費用（結果の計算に必要）　$ haiki $　
品切れ費用（結果の計算に必要）　$ sinagire $

在庫管理における期待費用最小化問題

ここで総費用を仕入れ量の関数として$ TC(siire) $とします。

$$ \begin{eqnarray}
&& TC(siire) = \\
&& tanka \times siire + \mathbb{ E }[haiki \times \max(siire – juyo, 0) + sinagire \times \max(juyo – siire, 0)]
\end{eqnarray} $$

廃棄量は「仕入れ量－需要量」であり、品切れ量は「需要量－仕入れ量」なので、上記のようになりますね。

費用が最小である状況を利得が最大である状況だと考えると、上記も一種の期待値最大化問題とみなせます。
費用を最小にする仕入れ量を求めるというのはオペレーションズリサーチの課題となりますが、詳細は参考文献に譲ります。

在庫管理における期待クレーム数最小化問題

ここで、あえて課題が残る問題設定をしてみます。
KPIとしては、売上だけではなく、顧客満足度などさまざまな指標が検討できます。
そこで顧客満足度を最大にすることを目指し、売り切れがもたらすクレーム数をKPIとし、期待クレーム数を最小にすることを試みたとします。

どのような結果になるのかは予想ができますね。
売り切れが発生すると、顧客からクレームが来る可能性があります。そのため在庫量をありったけ増やすことが最適な選択となります。

在庫管理における安全在庫設定問題

もちろん「在庫量をありったけ増やす」という方法が採用されることは普通ありません。大量の廃棄費用が出るはずですから。
そこでしばしば登場するのが安全在庫設定問題です。
これは「売り切れが発生する確率を〇％に収めるために必要な仕入れ量」を計算するというものです。売り切れに関して許容できる確率の大きさを指定して、その確率を達成する仕入れ量を求めます。
需要量の確率分布を評価することで、これも計算できるはずです。

私たちは、期待費用最小化問題を解くべきでしょうか？
それとも任意の売り切れ確率を設定したうえで、安全在庫設定問題を解くべきでしょうか？

結果の観測可能性について

期待クレーム数最小化問題について言及した時、しばしば受けるご指摘が「売り切れ費用を大きくすることで、顧客満足度を勘案できるはずだ。この方式で総期待費用最小化問題として定式化すべきだ」というものです。
大変ごもっともなご指摘で、その通りだと思います。
問題は「顧客満足度を加味した売り切れ費用」の算出です。どうやってこれを求めるかは簡単な問題ではないと思います。
もちろん「絶対に計算ができないぞ」と脅しているわけではありません。いくつかの仮定を置けば似たようなものは計算できると思います。

ここでの主張は、意思決定の「結果」について直接の観測が難しい事例があり、その場合に期待費用最小化や期待利得最大化を目指すのは、実務的に難しい場面があるということです。
（絶対にできないといっているわけではありません）
このような場合だと、安全在庫設定問題に落ち着かせる方が、簡便に（ある程度受け入れやすいと思われる）仕入れ量の決定ができます。

確率分布の評価について

結果の評価だけではなく、確率分布の評価についても注意が必要です。
予測や分類を行った際、テストデータを対象にして予測の評価を行い、その結果として得られた分割表などに基づいて確率分布を評価することがあります。
このとき、予測が外れることがあるのと同様に「予測精度の評価が信用できるとは限らない」というのは気を付ける必要があります。テストデータでは予測精度が良かったのに、実データに適用したら精度が下がったということはしばしば起こります。
この意味で、データから評価された確率分布をそのまま使って期待費用の最小化や期待利得の最大化を試みることには若干の危険性もあります（これは期待値最大化の原理特有の課題ではなく、データに基づく予測全般の課題ですが）。

5．不確実性下の意思決定問題における、期待値最大化原理以外の決定基準

自然の状態の確率分布が得られていない状況を、不確実性下の意思決定問題と呼びます。

期待値の最大化（期待費用最小化や、期待効用の最大化も同様）は、唯一の意思決定の方法ではありません。他の意思決定基準もいくつか紹介します。

マキシマックス基準とマキシミン基準

決定基準にはたくさんの種類があります。期待値の最大化は唯一の方法ではありません。
個人的にはミニマックスリグレット基準を理解するのも重要だと思いますが、ちょっと難しい原理です。ここでは簡単な割にはしばしば用いられるマキシマックス基準とマキシミン基準を対象にします。

マキシマックス基準は「最も好都合な自然の状態」になると仮定して、その時に最も大きな利益をもたらす選択肢を採用するというものです。
家賃保証問題を対象にします。
「家賃保証する」という選択肢を選んだ場合の最高のシナリオは「ユーザーが家賃滞納をしない」です。このときは正の利得$ S $を得ます。
「家賃保証しない」という選択肢を選んだ場合は、自然の状態に依らず利得は0です。
マキシマックス基準を採用するならば、意思決定者は「家賃保証をする」を選択することになります。イケイケどんどんでビジネスを展開するイメージですね。

マキシミン基準は「最悪の自然の状態」になると仮定して、その時に最もマシな結果をもたらす選択肢を採用するというものです。
「家賃保証する」という選択肢を選んだ場合の最悪のシナリオは「ユーザーが家賃滞納をする」です。損失として負の利得$ D $が発生します。
「家賃保証しない」という選択肢を選んだ場合は、自然の状態に依らず利得は0です。
マキシミン基準を採用するならば、意思決定者は「家賃保証をしない」を選択することになります。とても慎重な意思決定者ということですね。

マキシミン基準はしばしばあまりにも悲観的過ぎると批判を受けます。しかし、たとえば人命にかかわるような意思決定であれば、人の命が失われることが無いように安全第一で悲観的な意思決定を行うことが正当化されることもあるでしょう。

期待値最大化の原理と感度分析

「マキシミン基準なんて使わないよ」「俺は期待値を求めるから不要だ」というご批判もあろうかと思います。
ここではマキシミン基準（あるいはそれに類似する基準）を使っていると思われるシチュエーションを述べます。

期待費用最小化問題において、たとえば売り切れ費用というパラメータについて、不確実性があるのではないかと疑問を持ったとします。
パラメータの推定値に不安がある場合は、感度分析を行うことが多いです。「モデルの前提となった数値の変化が，意思決定の結果にどれほど影響を与えるか」を調べる手法です。たとえば売り切れ費用を「〇円～×円」と範囲を示して、そのうえで期待費用を最小にする仕入れ量を再計算し、最適仕入れ量がどのように変化するかを評価します。

仮にこの感度分析を行ったとしましょう。そして最適仕入れ量の下限と上限を見積もったとします。
このとき「売り切れが発生することに対して、安全のため、感度分析を実施した結果に基づいて、仕入れ量の上限値を採用しよう」と判断したとします。これはもはや「純粋なる」期待値最大化ではありません。

データを追加するべきか？

感度分析やらマキシミン基準やらを持ち出すと「確率を評価していないのが問題なのだ」「これはデータの不足が原因だ」「データを集めよ」と批判にさらされることがあります。
次の話題に移ります。我々は、追加の調査を行い、データを取得するべきでしょうか？

期待値最大化の原理を適用するとします。どちらを選ぶべきでしょうか？

選択肢1：10万円の調査費をかけて、データを取得する
選択肢2：10万円の調査費がもったいないので、データの取得はあきらめる

ここでは下記のように2段階の意思決定が行われることになります。ただし、データが得られないときはマキシミン基準を用いることにします。
1段階目：データをとるか取らないかを意思決定
2段階目：（データありなら）期待値最大化、（データなしなら）マキシミンの基準で意思決定

生粋の期待値最大化原理を適用する意思決定者であるならば、2段階の最終結果に基づいて期待値最大化の原理を適用するはずです。
すなわち期待値最大化の原理を適用する場合「あえてデータを取得しない」という判断がなされることがあり得ます。情報の価値（EVSI）が10万円を下回るならば、データを取得することで期待金額が下がってしまうからです。

あなたが一貫して「期待値を最大にしたい」と願うのであるならば、あなたはデータを取得するか否かを、期待値の最大化という原理に基づいて判断することになります。
ただし「データを取得するか否か」を判断するとき、あなたの手元にデータはありません。「期待値の最大化を試みたいので、何も考えずにデータを取得します」では筋が通りません。なぜならば、データを取得するという判断を、期待値の最大化ではない別の意思決定原理に基づいて行っているからです。

上記のシチュエーションにおいて期待値最大化の原理を使う直接的な方法は、判断確率（主観確率）を導入することです。これは有力な方法かもしれませんが、批判が多いことも事実です。これは後ほど統計的決定理論についての解説記事を上げる際に紹介できればと思います。
（この話は、拙著の第3部第4章「標準型分析」で若干の議論があります）

6．意思決定理論の役割

期待値最大化の原理は、良い面も悪い面もありそうです。じゃあこの原理を採用するかどうかは勘と経験と度胸で決めるしかないのでしょうか？　理論は、この問題に対して無力なのでしょうか？

期待値を最大にすべきとき、そうでないとき

期待値を最大化するというのは、サンクトペテルブルクのパラドクスのように、極端な状況設定にしない限り、広範囲に適用できるように思います。頻繁に繰り返し行われる意思決定であれば特にそうです。意思決定をデータでサポートし、期待値最大化の原理を適用して選択肢を推薦するのはとても妥当な方法であるように思います。
けれども、なぜ期待値を最大にするという原理は「妥当」なのでしょうか？

また、データが得られていないとき、データが少ないとき、パラメータがわからないとき、パラメータの推定の精度が悪いのではないかと思われるとき、意思決定のシチュエーションは無数にあります。意思決定問題が明確に提示されていることは現実的にはありません。私たちが直面するほぼすべての意思決定は、リスク下でも不確実性下でもなく、無知下での意思決定です。すなわち選択肢が列挙されておらず、自然の状態のとりうる結果が不明確であり、利得行列も明らかとなっていません。意思決定分析にかかる工数のほとんどは意思決定問題の特定に費やされ、大量のノイズと仮定が入り混じった理論と実践的配慮と努力と妥協の産物に基づいて物事を決めることになります。
私たちの無知さの加減についてはグラデーションがあり「この状況なら期待値を最大化すべきだ。この状況ではすべきではない」と断定することは実践的には困難だと個人的に思います。

個人的にはマンスキー(2020)が、「意思決定に関するほかの仮説を排除して効用仮説のみを推奨し、人々の行動を予測しようと試みたこと」に対する以下の批判に完全に同意します。
『妥当性があり、入手可能なデータと整合的なほかの仮説をことごとく退け、たった1つの仮説の下で予測を行うべきだと科学者が主張する理由が、私にはわからない』

繰り返しになりますが念のため述べておきます。当方は期待効用最大化の原理、あるいはその近似としての期待値最大化の原理を「用いるべきではない」と主張していません！　むしろこの方法は積極的に普及していきたいです。
あくまでもその原理「だけを用いる」ということに対する危惧を述べているのみです。
他の仮説を排除すべきではないという提案です。

トートロジーと新語の創出の誘惑

馬鹿馬鹿しいQ&Aを例示します。
Q: 良い意思決定とは、どのような意思決定でしょうか
A: 状況に即して適宜適切に対応し、総合的俯瞰的な観点から最適な選択肢を選ぶこと

で、次に「状況に即して適宜適切に対応し、総合的俯瞰的な観点から最適な選択肢を選ぶこと」とは具体的にどういう意味でしょうかと質問すると「それこそが、良い意思決定なのです」と回答します。
こういうのをトートロジーと言います。脈絡のない文章を揶揄してポエムと呼ぶことがありますが、ポエムの多くはトートロジーになっていて、情報量がありません。

トートロジーであることをばれないようにする簡単な方法は、新しい言葉を創出することです。
たとえば「ジャッジメンタルフンゲー」という新語を創出し「良い意思決定とは、ジャッジメンタルフンゲーの法則を適用した意思決定のことだ」と主張します。「ジャッジメンタルフンゲー」の定義はこの世界のだれも知らないので、まぁ何とかごまかせるときもあります。なんか都合の悪い状況になったら「君はまだ、ジャッジメンタルフンゲーの本質を理解しておらぬようだな、フフフフ、フンゲー」みたいな言い逃れができます。

止めましょう。こういうの。

期待効用最大化の原理について持ち出すとしばしば強烈な批判を受けます。大きな理由は、前節で紹介した通りで「ほかの意思決定の原理もあり得るはずなのに、それを無視するなよ」ということです。あるいは「多くの人は、期待効用最大化の原理に従っていないじゃないか」という批判もあります（この批判は、規範に対するものではないので、個人的にはあまり重視していません。みんながそれをやっていなかったとしても、それが正しい方法ではないということの根拠にはなりません）。
ただ、期待効用最大化の原理にはとても素晴らしい特徴があります。それは「期待効用最大化の原理に従っている/いないことが、第三者からみて観察できる」ことです。期待効用最大化の原理は、良い意思決定という言葉とは独立に観測することが可能であるため、トートロジーの関係にはありません。この理論は、間違えることができるのです。

意思決定理論という表現技法

当方は意思決定理論を「意思決定の問題を整理・表現する道具」だと考えています。意思決定に関わるコミュニケーションを行う際に、意思決定理論、あるいは具体的な作業手続きとしての決定分析を知っていると、単純にまずは語彙が増えます。選択肢と自然の状態を分けるというただそれだけでも世界が広がります。「努力したからと言って成功するとは限らないが、成功したものはすべからく努力しているものだ」という表現は美しいけれども、私はこの先に行きたい。
私たちに与えられた選択肢は、努力する・しないの2つだけなのだろうか。選択肢に抜けや漏れはないだろうか。自然の状態にはどのようなバリエーションがあり得て、それらが発生する確率は見積もることができるだろうか。あるいは自然の状態と独立ではない何らかの情報を得ることができるのではないか。そもそも欲しい結果とは何で、それは別の結果と比べて本当に好ましいと言えるのだろうか、それらの優劣を比較できるだろうか。がむしゃらに努力する前に、できることは無数にあるはずです。

「合理性」という言葉はしばしば誤解され、あるいは意図的に捻じ曲げられて用いられます。
当方はGilboa(2013, p19)の提案した合理性の定義を採用したいと思います。

ある行動様式がある人にとって合理的であるとは，この人がたとえ自分の行動を分析されたとしてもその結果を心地よいものと感じ，困惑することがないような場合を言います

合理的かどうかは主観的なものであり「当人にとって」筋が通っているかどうかが重要だと考えます。
意思決定を支援するというのなら、それは「意思決定者当人にとって」納得できるものかどうかが重要です。「当人がやりたいと思っていること」と「実際にやっていること」の一貫性をサポートすることが、意思決定分析の最も大きな目標の1つです。これを達成するために「意思決定者がやりたいと思っていること」や「意思決定者が置かれた状況」を整理・表現します。

ここでは詳しくは述べませんが、「期待効用最大化原理に従って意思決定をしている人は、どのような事柄を大切にして選択をしているのだろうか」という点については、vNMの定理によってとても大きな示唆を得ることができます。「期待効用を最大化しようと試みることは、いかなる意味において”良い”のだろうか、あるいはいかなる意味においては”良い”と言えないのか」ということを考えるツールとして、理論が役に立つと思います。

7．思決定の支援のカタチ

データに基づく意思決定の支援についてまとめます。

意思決定問題の定式化

意思決定問題の整理・表現をすることで意思決定を支援することができるはずです。
たとえば因果推論や効果検証の技術は、意思決定者の置かれた意思決定問題を定式化するのに役立つはずです。利得行列の評価にとどまらず、データについての解釈・理解が深まることで、検討から漏れていた選択肢を見出すことにもつながるかもしれません。
因果推論や効果検証は、期待効用最大化の原理に基づく意思決定支援と矛盾したり対立したりするものではまったくないと考えます。

行動の推薦

たとえば期待値の最大化や、マキシミンの基準に基づいてとるべき行動を推薦できます。
意思決定問題が複雑で大規模であり、ありうる選択肢が膨大であるならば、この推薦には、人間の労力の多くを軽減するだけでなく、狭い視野から脱却することにも役立つはずです。

データ分析や意思決定分析は、「あなたは○○の行動をするべきだ」と提案すること以外にもできることがたくさんあります。複雑なモデル化を試みなくても、データを集計してダッシュボードとして提示するだけでも、意思決定の支援と呼べることもあると思います。
集計処理を行った結果をダッシュボードとして提示するだけというのはとても原始的な方法ですし、これで満足してここから先へ至る工夫を怠るのはもったいないことだと思います。ただし、こういった原始的な方法を排除することもまた建設的な提案ではないと思います。
極端な話、具体的なアドバイスをするのではなく、相手の話を聞いてあげるだけでも、相手の考えの整理に役立つため、意思決定の支援と言えるはずです。地味ですが、こういうやり取りが功を奏することもあるはずです。

期待値や期待効用を最大化する選択肢を提案するのは、（意思決定の理由を説明できるという意味で）洗練された方法であるように思えます。
他の方法を排除する必要はまったくないけれども、期待値や期待効用を最大化する選択肢を提案することは、個人的には、積極的にお勧めしたいと思います。少なくとも、問題に取り組む際のスタート地点にはなるのではないかなと思いますが、どうでしょう。

参考文献

意思決定分析と予測の活用基礎理論からPython実装まで

当方が書いた意思決定分析の入門書です。本記事とは異なり、当方の意見は余り述べないようにしています。言葉の定義やPythonによる分析事例などを丁寧に解説しています。

大野(2011)「Excelによる生産管理―需要予測、在庫管理からJITまで」

タイトルの通り、Excelで生産管理の基礎理論を学べる教科書です。

マンスキー(2020)「マンスキーデータ分析と意思決定理論不確実な世界で政策の未来を予測する」

不確実性下における政策立案についての教科書です。この分野の書籍は少ないので貴重だと思います。著者の「意見」も強く出ているように思います。

Gilboa(2013)「合理的選択」

意思決定理論の入門書です。

コメントを残すコメントをキャンセル

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください。