ジョン・フォン・ノイマンの人生と研究の概略
ジョン・フォン・ノイマンの『ゲーム理論』
ハンガリー出身のアメリカの数学者ジョン・フォン・ノイマン(John Ludwig von Neumann, 1903-1957)は、ノイマン型コンピューターの基礎原理を考案して『コンピューターの父』とも呼ばれている天才的な科学者である。ジョン・フォン・ノイマンは理系分野のみならず歴史・哲学・文学といった文系分野の基本教養にも優れた『知の巨人』でもある。ノイマンは、非常に広範多岐にわたる分野で様々な功績を残したことで、20世紀で最も重要な科学者の一人に数えられている。
父が弁護士をしているユダヤ系ドイツ人の家庭に、3人兄弟の長男として生まれたノイマンは、幼少期から英才教育を受けた。ノイマンは当時の知識人の基本言語であるラテン語とギリシャ語の覚えが早く、6歳の頃には6桁の暗算をこなしており、筆算では8桁の掛け算まで出来るようになっていたという逸話が残されている。8歳になると微分積分の高等数学を理解できるようになり、数学だけではなくウィルヘルム・オンケンの『世界史(全44巻)』やゲーテの小説を読破して暗誦するなど、歴史・文学の分野にも強い関心・能力を見せるようになった。
数学に圧倒的な才能を見せるノイマンは、ギムナジウムに通っている17歳の頃に、数学者ミヒャエル・フェケテと共著で数学論文『ある種の最小多項式の零点と超越直径について』を書き上げており、運動・音楽は苦手であったがギムナジウムを主席で卒業している。ギムナジウムを卒業してからは、ブダペスト大学、ベルリン大学、チューリヒ工科大学で数学・物理学・化学などを精力的に学んで実績を残し、23歳で数学・物理・化学の博士号を取得している。ノイマンは24歳という若さでベルリン大学の講師となったが、これは当時の最年少記録であり、アメリカにわたってからもプリンストン高等研究所で上級職員・数学教授として厚遇されることになった。
数学の分野では、数学基礎論、集合論や測度論、作用素環論、エルゴード理論などで功績を残しているが、物理学でもコペンハーゲン解釈によって量子力学の数学的な基礎づけを行ったり流体力学の理論を構想したりしている。気象学でも数理モデルとコンピューターを使った画期的な天気予報のシステムを提案している。
計算機科学の分野では、アラン・チューリングやクロード・シャノンらと共に、現在のコンピュータにつながる『ノイマン型コンピューター』の基礎理論を確立している。コンピューター開発を目的とする『EDVACプログラム』のチームでは、ジョン・エッカートとジョン・モークリーが技術面を担当して、ジョン・フォン・ノイマンは数学的・プログラム的な理論面で大きな貢献をしたという。
ノイマンの卓越した数学的才能は、軍事分野の大砲の軌道計算や核兵器開発にも利用されるようになり、ノイマンは原子爆弾開発の『マンハッタン計画』にも参加している。アメリカ合衆国空軍のコンサルティング業務を長年引き受けており、広島・長崎に投下された原子爆弾開発においても、長崎に投下されたプルトニウム型原子爆弾『ファット・マン』に使われた爆縮レンズの開発を主導している。
ノイマンは第二次世界大戦中のアメリカの『原爆投下作戦』において、広島・長崎よりも日本人にとって『文化的・歴史的な価値』が大きい京都に落として壊滅させるべきだという提言も行っており、軍事・戦争の分野においても積極的な発言をする人物だったようである。1940年代に爆轟波面の構造に関する『ZND理論』を考案したが、この理論を元にした10ヶ月にわたる数値解析で、爆薬を32面体に配置することで原子爆弾が実用化できることを数学的に証明している。
ジョン・フォン・ノイマンは、どちらがより多くの利益を得るかという戦略的意思決定に関する『ゲーム理論』の成立に貢献しているが、1944年には経済学者オスカー・モルゲンシュテルンと一緒に『ゲーム理論と経済行動』という論文を発表している。
ゲーム理論は数学の分野以外にも、企業経営における戦略的選択の理論(その後の行動経済学の基礎理論)、軍事戦略の基礎理論(オペレーションズ・リサーチ)、一定のパイを奪い合うゼロサムゲームの戦略、将棋・チェスなどのコンピュータプログラムのシミュレーションなどに幅広く応用されることになった。
『ゲーム理論』は現在では行動経済学における人間の意思決定を説明する理論として研究されているが、ゲーム理論はミクロ経済学やマクロ経済学とも並ぶ重要な分野に成長することになった。ゲーム理論が解明した人間の行動原理や選択基準は、哲学・倫理学・科学哲学などの“人文科学”、政治学・経済学・経営学・社会学などの“社会科学”、情報工学・統計学・制御理論などの“理数系・工学系”にも大きな影響を与えることになった。
ジョン・フォン・ノイマンのゲーム理論に共通する条件設定は、代表的なゲームである『囚人のジレンマ』に見られるように、『複数の意思決定主体が相互依存の関係にある時に、どのような意思決定を行うかの統計的・合理的予測』というものである。数学の確率は、『一人の意思決定主体が偶然的な事象に直面した時の意思決定の統計的・合理的予測』という条件設定になっており、『二人以上の複数の意思決定主体』を想定しているゲーム理論とは異なっている。
ゲーム理論は、それ以前の時代のマクロ経済学における『完全情報・完全競争』といった非現実的な前提を否定することで、現実の不確実かつ不確定な経済活動(競争状況)における人間の意思決定を合理的・統計的な根拠に基づいて説明するものである。
最もポピュラーな二者間の利害関係が伴うゲームとして、『囚人のジレンマ』と呼ばれるものがある。ある重大事件で逮捕された二人の容疑者に対してそれぞれ、『黙秘するか自白するかの意思決定の選択肢』を提示して、『自分だけが自白すれば量刑が軽くなる(相手も自白すればそれなりの量刑になる)』という条件を伝える。
自分だけが自白して相手(共犯者)が黙秘した時には、懲役1年となり最も量刑は軽くなるが、相手の懲役は10年で最も重くなってしまう。反対に、相手が自白して自分だけが黙秘した時には、懲役10年となり最も量刑は重くなるが、相手の懲役は1年で最も軽くなる。自分も相手も自白した場合には二人とも懲役5年で、自分も相手も黙秘した場合には二人とも懲役3年となる。ゲーム理論では『自白=裏切り』、『黙秘=協調』という戦略的な意思決定として解釈されている。
囚人のジレンマにおける『自白=裏切り・黙秘=協調の戦略的な選択』と『その結果(利得)』を表にすると以下のようになる。
囚人Bの自白(裏切り) | 囚人Bの黙秘(協調) | |
---|---|---|
囚人Aの自白(裏切り) | AもBも懲役5年 | Aは懲役1年・Bは懲役10年 |
囚人Aの黙秘(協調) | Aは懲役10年・Bは懲役1年 | AもBも懲役3年 |
こういった『自白=裏切り』と『黙秘=協調』の利得の条件設定がある時に、囚人AとBはどちらの行動を選択するほうが良いだろうか。合理的に考えれば、相手を十分に信用できない限りは(あるいは相手のために自分が損をしても良いと思っていない限りは)、自分が相手のために黙秘を続けても、相手から自白されてしまえば、自分だけが懲役10年になってしまうから、二人とも『自白(裏切り)』を選択しやすいということになる。ゲーム理論が導く合理的帰結は、囚人AとBは二人とも自白することによって、懲役5年の刑罰を受けるということである。
しかし、もう一つの合理的選択として、自分も相手もお互いのために協調して黙秘するならば、懲役3年で済むという考え方もある。二人とも自白してしまえば懲役5年になってしまうが、お互いが更に深読みして『相手も自分と同じように懲役5年よりも懲役3年のほうがマシと考えるはずだ』と思って黙秘すれば、懲役3年となって刑期を短縮できるからである。故に総合的に考えれば、利害関係が対立していて相互に相手の選択に依存し合っている囚人AとBが、自白して裏切るのか、黙秘して協調するのかは不確実な要素が残る。『お互いの信頼の度合い・利得の結果の読みの深さ』によって、意思決定(選択)は変わる可能性があるということである。
この囚人のジレンマのように、ゲーム理論では結果(利得)が各プレイヤーの相互依存的な選択(意思決定)によって決まる構造があり、結果(利得)を選択(意思決定)の関数(評価関数・利得関数)として予測するモデルが仮定されている。ゲーム理論における複数の意思決定者の相互依存的な選択の結果(利得)から得られる効用のことを、『フォン・ノイマン=モルゲンシュテルン効用』という概念で表現している。
ゲーム理論における複数の意思決定者の相互依存的なゲームは、以下の5つの要素から成り立つと定義されている。
1.プレイヤー
2.選択可能な行動……自然法則や社会的・対人的状況の中で選択できる複数の行動があり、プレイヤーは戦略的な行動計画を立てることができる。
3.時間の要素と初期状態(デフォルト)……プレイヤーの初期状態が定まっており、ゲームが1回限りなのか複数回にわたって繰り返されるのかなどの条件設定が行われている。
4.利得と利得関数……自分の戦略的な意思決定や選択の結果として得られる利得があり、自分と相手のそれぞれの相互依存的な選択が利得の関数として機能している。
5.協力・協調する可能性……複数のプレイヤー間の交渉・納得によって、お互いに協力・協調することができるゲームのことを『協力ゲーム』、そういった協力・協調の可能性がないゲームのことを『非協力ゲーム』と呼ぶ。