人気ブログランキング |

ミクロな合理性を積み上げると、マクロな不合理が生まれるとき

二人組の強盗がいた。彼らはあちこちの現場で盗みを働き、世の中を荒らし回ってきたが、最後の仕上げとばかりに、「一世一代の大仕事」に取り組んだ。銀行強盗である。二人は大胆にも白昼、覆面姿で銀行に押し入り、大金を奪って逃げた。

だが、警察もメンツを潰されたまま黙ってはいない。草の根を分けて二人を追いかけ、とうとう別々の場所でほぼ同時期に、二人を逮捕した。でも二人とも、銀行から奪った大金は身につけておらず、どこかに隠してしまったらしい。二人が銀行強盗の犯人だという、客観的な証拠は見つからないのだ。

警察は彼らを勾留したものの、証拠があがっているのは別の微罪だけ。いわば、別件逮捕の形になった。とはいえ、なんとか二人に銀行強盗の罪を白状させたい。警察は、二人を別々の独房に入れ、お互いに相談できない状態にした上で、取り調べを続けた。だが、なかなか二人は自白しない。そこで、ある日、一人にこう持ちかけた。

「お前さん、このまま銀行強盗の件でシラを切り続けたら、どうなるか分かっているな? すでに証拠の上がっている窃盗罪で、確実に1年は刑務所暮らしだ。しかしな、ここで取引しよう。お前さんが、相棒と組んでやった銀行強盗の罪を、自分から認めるなら、反省して警察に協力してくれたということで、無罪放免にしてやる。」

「えっ、無罪放免。」

「そうだ。司法取引ってやつだ。銀行強盗の罪とくれば、ふつうはまず、二人とも刑期5年だろうな。だがもしお前が自分から、この銀行事件の捜査に積極的に協力してくれたら、別件の窃盗も含めて、全部チャラにしてやろう。そのときは、非協力的で反省の色がないお前の相棒は、まあ7年は食らい込むことになるだろう。」

「取調官の旦那。前にも言いましたが、そんな相棒なんてヤツのことは知りませんぜ。」

「ふっ、まだ、とぼけるつもりかよ。まあ、よく考えろ。この取引が成立するのは、お前の相棒が否認し続けた場合のことだ。お前より先に、あいつが銀行強盗の件を自白したら、どうなると思う? まるきり逆の立場になる。お前は7年の刑務所ぐらし、あいつは無罪放免だ。はやく本当のことを白状するほうが身のためだぞ。さあ、どうする?」

その国には司法取引の制度があった。だから、取調官のいうことは単なるハッタリではなさそうだ。では、この強盗は、どうすべきか。否認を続けるか、自白するか。あなたなら、どうするだろうか?

この問題が難しいのは、相方がどう出るかが、分からないためだ。ふつうのビジネス問題に置き換えれば、相手の行動は自分が決められないから、自分にとってのビジネス環境に相当する。つまり、環境条件において、リスクが有るのである。そこで、こういうときは次のような表を作って、場合分けして考えてみる方が良い。

ミクロな合理性を積み上げると、マクロな不合理が生まれるとき_e0058447_21183593.jpg
横軸は、自分の行動だ。否認と自白の二つがある。そして縦軸は、相方の行動である。これも、否認と自白がある。マス目の中の数字は、それぞれの行動を自分と相手が取ったときに、結果として自分が刑務所に入る年数が入っている(年数が長いほうが損なので、マイナスの数字になっている)。

こういう表を、『利得表』Pay-off matrix と呼ぶ。利得表で考えるときは、縦に見比べてはいけない。それは、自分の行動を中心にした、いわば自己中の見方だ。横に見て、比較するのである。相手がとる行動ごとに、自分はどちらをとるべきかを考える。

まず、相手が否認し続けたら、どうなるか。その場合、自分も否認すれば、銀行強盗の罪は証拠不十分で問われないけれど、別件の窃盗罪で1年の刑期となる。だが、自分が自白すれば、司法取引が成立して、無罪放免になる。

では、相手が自白したら、どうなるか。自分も自白した場合、二人そろって5年ずつ、刑務所生活を送ることになる。だが、自分が否認したら? そうなると、相棒の側に司法取引が成立し、自分は反省の色がないということで7年間のムショ暮らしになってしまう。

結局、相手が否認した場合も自白した場合も、自分は自白する方が、被害は少ないことが分かる。前者の場合は、−1年(否認) > −5年(自白) だし、後者では、0年(否認) > -7年(自白) である。

したがって、このようなケースでは、相手がどう出ようとも、自分は自白する方が合理的であることが分かる。リスクのある不確実な環境下では、自分の被害を最小化する行動が良い。これを『リスク最小化の原理』と呼ぶ。

これで意思決定の問題は解決した。一件落着。・・と、言いたいが、じつはこの話は、まだ先がある。

よく考えてみてほしい。自分と相棒の置かれた条件は、鏡に写したように、まったく同じなのである。だとしたら、相棒も同じように考えて、「自白」を選ぶはずではないか? そして、二人が「自白」を選んだら、どうなるか。二人そろって、5年間ずつ、刑務所の塀の中で過ごすのである。

次の表を見てほしい。これは、利得表の中に、二人組が課せられる刑期の年数の合計値が書いてある。
ミクロな合理性を積み上げると、マクロな不合理が生まれるとき_e0058447_21194282.jpg

これを見る限り、二人にとって一番良いのは、そろって否認し続けるケース(合計マイナス2年)である。そして最悪なのは、二人とも自白するケースで、合計マイナス10年になってしまう。

二人組は、構成員わずか2名ながら、小さな組織だと考えることができる。この表が示しているのは、組織の構成員がそれぞれ、もっとも合理的だと考える行動をとると、組織全体としては最悪の結果を生んでしまうケースが有る、という事実だ。

ミクロな最適化を積み上げても、マクロな最適は生まれない。あるいは、各人がその持ち場で最善を尽くせば、全体で最善の結果が得られる保証はない。そういう事を、この事例は示している。このようなケースを、ゲーム理論では『囚人のジレンマ』と呼んでいる。

ゲーム理論は、物理学者のフォン・ノイマンと経済学者のモルゲンシュテルンが確立した、戦略研究に関する応用数学の分野で、現在では主に経済学の中に組み入れられている。ゲーム理論では、「全プレイヤーが最適行動をとっており、かつ、どのプレーヤーも自分の戦略を変更すると期待利得が減ってしまうような、戦略の組み合わせ」を『ナッシュ均衡』と呼ぶ。ナッシュ均衡からずれた行動を選ぶと不利益が生じるので、ある種の安定した状態を示す。上の例では、二人が「自白する」ことがナッシュ均衡になっている。

ところで経済学では、「全体の利益が最大化された状態」(全体の利益を更に上げるためには、誰かを犠牲にしなければならない状態)を、『パレート最適』とよぶ。この名称は、イタリアの経済学者パレートの名前からきている。上のケースでのパレート最適は、二人が否認することである。

囚人のジレンマが「ジレンマ」と呼ばれている理由は、ミクロな合理性を積み上げるとマクロにも合理的な結果を得るはずだ、というわたし達の直感を裏切るからだ。いいかえると、ナッシュ均衡がパレート最適に一致しないので、ジレンマと感じられるのである。

囚人のジレンマに似たような例は、現実世界でも、いろいろと起こりうる。たとえば、競合する商店や企業間の、値引き競争を考えよう。同等な商品をめぐって、A社はB社よりも安値で売って、販売をあげ、利潤を出そうとする。でもB社だって、同じことを考える。そして両社はどんどんと安い価格で販売していくので、全体としてはさっぱり利益の上がらない構図になる。

あるいは、軍拡競争なども、似たような構図がある。戦争に負けるリスクを最小化しようと、お互いに仮想敵国よりも軍備を増強する。だが戦争がなければ、軍備費用など社会的コスト以外の何者でもない。そして軍事費ばかり大きくなって、国家の経済的発展が止まってしまう。

最近の例で言えば、昨年春のマスクをめぐる混乱なども、典型的な囚人のジレンマ状況である。マスクが品薄だ。マスクがないと感染症リスクが高まる。だからリスク最小化の原理にしたがって、皆がマスクの買いだめに走った。結果として、国内のサプライチェーン全体から、マスクの在庫が払底し、もっとも必要とした医療機関などが入手困難になってしまった。どうみても、社会全体のマクロな最適からは程遠い。

では、どうしたら良いのか? 囚人のジレンマを防ぐ方法はあるのか?

答えは簡単である。二人が協力すれば良いのだ。この問題の根源にある障害は、二人が別々の独房に入れられていて、お互いにコミュニケーションできないことにある。もし二人が何らかの手段で話し合えれば、互いに協力してパレート最適点、すなわち「そろって否認する」行動を取るに違いない。

つまり囚人のジレンマを避けたければ、コミュニケーションを活性化して、お互いに協力できる状況を作るべきである。

同じ一つの会社の中でさえ、縦割りでサイロ化の進んだ組織では、囚人のジレンマ状態が起きうる。たとえば営業部門は売上高を上げるために安値競争に走り、製造部門は製造コストを下げるために大ロットで生産する。これは、商品種類が少なく、作れば売れた昭和の高度成長時代には、良い戦略だったかもしれない。

だが、需要が多様化し、多品種少量生産化した現代で、こんな方策を続けたら、在庫と納期のミスマッチが多発し、利益どころでなくなってしまう。だからこそ、生産と販売の間のコミュニケーションをつなぐ、需給調整機能を確立することが、多くの企業のサプライチェーン・マネジメントで急務になっているのだ。

部門間が互いに不信感を持ち、口もきかぬ状態になっていたら、組織全体が最大のパフォーマンスを果たすことなど、望みようもない。これが、囚人のジレンマの示す明確な教訓である。

しかし、それと同時に、もう一つ大切な条件がある。それは、「たとえコミュニケーションが取れなくても、互いに協力的に行動するはずだ」、という相互信頼のネットワークをつくることだ。

コミュニケーションといっても、緊急の場合などでは取れないこともあるし、あるいはプロジェクトの中の異なるフェーズのように、そもそも違う時期に動くこともある。そんなときでも、お互いに相手が、相互利益を最大化するように動く、自己利益のために裏切らない、という信頼を持てることである。

最初の二人組の例で言えば、互いに独房に閉じ込められて連絡が取れなくても、「自分が損がするリスクも承知で、だがお互いに相手を裏切らず、全体で一番良い結果となることを目指す」ような信頼関係が二人の間にあれば、ともに否認して、たしかに組織で一番望ましい結果におちつくはずである。

このようなことは、いくつかの部署や拠点に分かれて、リモートで分散遂行していくプロジェクトなどの場合も、とても大切な条件になる。つまり、良きプロジェクト・マネジメントとは、相互信頼のある組織・人脈のネットワークの上に成り立つのだ。

コミュニケーション・チャネルの確立と、相互信頼のネットワークの維持。わたし達が社会全体で最悪の事態に陥りたくなければ(そして、パンデミック禍の今は、そのリスクが非常に高まっている訳だが)、この二つを誰もが明確に意識することが望まれるのである。


<関連エントリ>


by Tomoichi_Sato | 2021-01-31 22:48 | サプライチェーン | Comments(0)
<< 書評:「囚人のジレンマ―フォン... リスク回避か、リスク追求か、そ... >>