統計的決定理論の考え方

―― ある意思決定戦略 ――


失敗の損失は最小限に

次のような「不確実性のもとでの決定」(decision-making under uncertainty) を、わかりやすい日常的例で説明しよう。ある町に電気の工事請負業があり、各家から配線工事の注文をうけ商売している。その町の各家はその最大負荷において 3 つの状態
   θ1:最大負荷は 15A、 θ2:最大負荷は 20A、 θ3:最大負荷は 30A
のどれかの可能性があるとしよう。一方、配線用ワイヤー(電線)は、次の 3 通りの容量(規格)のものがあり、そのどれかを配線することになる。
   a1:15A を配線、 a2:20A を配線、 a3:30A を配線
配線費用は適当な単位で、1, 2, 3 とする。

意思決定問題
    この状況の中で最適な行動を選び出すこと。

ところで、ふつう注文主の家がどの状態θ(負荷)にあるか工事屋には事前にはわかっていない。わかっていればどの行動aをとるかは、全く明らかである。これがわからないから問題が起こってくる。注文を断ることはできない。だから、状態の分らないまま、最適な行動を決定をしなくてはならない。
つまり、意思決定問題もいろいろあるうち、いわゆる「不確実性のもとでの決定」のタイプの問題ということになる。事故、火災が起こり、工事代金がもらえないことはもちろん、損害賠償、倒産も全く考えられないわけではない。失敗はを完全に避けることができないとすれば、損失を極力小さくせねばならない。損失は以下のようになるとしよう。

配線容量 a
(15A) (20A) (30A)
(15A) 1 2 3
(20A) 5 2 3
θ (30A) 7 6 3

電気工事屋の損失表 L(θ, a )

今後はこの関数 L(θ, a) が最小化すべき目的関数となる。

データと統計的情報

しかし、状態θはある程度統計的情報として知ることができる。なぜなら、その家へ行ってたずねればよい。データをとるのである。
   Q.「お宅は何A 使いますか」
とたずねる。答えは 4 種類可能であるとしよう。
   z1:「10A」,  z2:「12A」, z3:「15A」,  z4:「20A」

ところで自家の電力最大使用量を正確に知っている人はあまりいないであろう。本来,データ----この質問に対する答え----は真実を寸分違わず映し出すものではなく、真実に近くはあるが、回答が出たとしてもぼやけや疑いをさしはさむ余地のあるあいまいなものである。例えば、真実の状態は 15A であっても、回答は 10A, 12A がそれぞれ確率 1/2, 1/2 とぼやけて出てくるものとしよう。この確率を応答確率 (response probability)、または、単に観測値(データといっても同じ)の確率分布とよぼう。この表は、過去の経験やデータから得られるであろうし、サンプル調査を行ってもよい。

データ
(10A) (12A) (15A) (20A)
(15A) 1/2 1/2 0 0
(20A) 0 1/2 1/2 0
(30A) 0 0 1/3 2/3

応答確率(データ確率分布)

データによる決定方式

結局、データ z に基づいて、行動 a を最適に決定するという考えが自然に出てくる。

例えば、あらかじめ、指針あるいはきまりとして
   「10A」 と答えれば 15A、「12A」ならば 15A、「15A」ならば 20A、「20A」ならば 30A のワイヤーを配線する
と決めておくようにする。この「決定方式」(やや大げさだが、「戦略」)を
   d:「10A」⇒15A, 「12A」⇒20A, 「15A」⇒20A  「20A」⇒30A
とあらわそう。d は「決定」decisionの意味である。

組み合わせとしては3×3×3×3=81通り考えられるが、もちろんこれは、文字通り全部数学的に数え上げれば、という意味で
   「10A」⇒30A, 「12A」⇒20A, 「15A」⇒20A,  「20A」⇒10A
というナンセンスなもの、あるいは
   「10A」⇒10A, 「12A」⇒10A, 「15A」⇒10A,  「20A」⇒10A
とか
   「10A」⇒30A, 「12A」⇒30A, 「15A」⇒30A,  「20A」⇒30A
のように、全く無頓着・無責任あるいは危険極まりないものまで、すべて含んでいる。

統計的決定問題

さて、いったいこの電気工事屋は、彼の損失表に基づきかつデータ確率分布を知って、どの決定方式をとれば「合理的」であろうか?またどんな意味で「合理的」なのか。
経営学の組織理論中「標準作業手続」(Standard Operating Procedure, S. O. P.) というのもこれであろう。

[答] 81 通りから、次の 4 通りの決定方式が選出される:

  d6 : 「10A」⇒10A, 「12A」⇒10A, 「15A」⇒20A,  「20A」⇒30A
  d9 : 「10A」⇒10A, 「12A」⇒10A, 「15A」⇒30A,  「20A」⇒30A
  d15: 「10A」⇒10A, 「12A」⇒20A, 「15A」⇒20A,  「20A」⇒30A
  d18: 「10A」⇒10A, 「12A」⇒20A, 「15A」⇒30A,  「20A」⇒30A
   注) 番号は辞書式順序による。

それはこれらが「ベイズ決定方式」(「ベイズ戦略」)をなす、という理由による。たとえば、事前確率分布が等確率
     P(θ1)=P(θ2)=P(θ3)=1/3
を持つ意思決定者は、 データをもとに自己の事後確率分布を求め、その確率で平均損失(事後期待損失)を計算すれば、d18 に従って行動するのが最適であることはすぐ証明できる。

これ以外の一般的な事前確率分布に対しても、結局上の 4 通り以外の方式(戦略)は用いられないことがわかる。

これら方式の共通の特徴

  1. 情報と反応の間の順序関係に矛盾がなく合理的。
       情報内容の強度(「 」のA数)に応じて採られる反応行動の内容(A数)が増加しており、反応に逆転箇所がない。
  2. 反応の全範囲が採用されている。
       高い方あるいは低い方へ偏っているものは出現しない。ただし、d9 におけるように中間 20A が抜けることは可能。
  3. ただし、以上は必要条件で十分条件ではない。

参考:『意思決定の基礎』p.110, 133