「ピータースのコイントス」について

はじめに
ピータースのコイントス
パラドキシカルな点
メカニズム：大雑把な説明
メカニズム：正確な説明

はじめに

この文章では以下の記事(以下では「元記事」と呼ぶ)について解説する。

この解説では、元記事は読んでいるものとして進めるが、念のため次のセクションで簡単に要点を振り返る。

元記事では、ピータースのコイントスという賭けのモデルについて、シミュレーションの結果をいくつか並べ、何かしらパラドキシカルなことが起こっていることを示している。しかし、それが結局どういうメカニズムで生じているかは説明していない。この文章ではその部分を整理し説明する。メカニズムを数学的に厳密に説明するには大学レベルの確率論の知識が必要になる。恐らくこれは多くの人にはハードルが高いため、ここでは、

それほど前提知識を必要としない大雑把でやや非厳密な説明
数学的に厳密な説明

の2つに分けて説明する。

ピータースのコイントス

次の賭けを考える。

最初は1ドルを持った状態からスタートする。¹
公平なコイン、つまり表裏がそれぞれ1/2で出るコインを投げ、表が出れば、所持金が1.5倍に、裏が出れば所持金は0.6倍になる。
賭けは好きな回数行うことができる。

問題とするのは、この賭けに参加すべきか、すべきでないかである。そしてこれを素朴に考えると、パラドキシカルなことが起こるのを示していたのが元記事である。その内容を振り返る。

パラドキシカルな点

賭けへの参加・不参加の判断には何らかの基準が必要で、その基準として「期待値」は最も一般的に知られたものだろう。そこで期待値を計算する。確率変数 $X$ は $\mathbb{P}(X = 1.5) = \mathbb{P}(X = 0.6) = 1/2$ を満たすとする。これの期待値は $\mathbb{E}(X) = \frac{1}{2} \cdot 1.5 + \frac{1}{2} \cdot 0.6 = 1.05$ になる。
これは1を超えているから、期待値から見ると有利な賭で、1回の賭けで平均的には所持金は1.05倍になることが期待できそうである。

しかし、元記事の中のシミュレーションで示されていたように、賭けを何回も繰り返すと所持金は減っていく。この記事の後半で説明するように、実は賭けを繰り返すと確実に所持金はどこまでも0に近づいてしまう。 ここにピータースのコイントスの奇妙な点がある。つまり、期待値でみると所持金は増大しそうなのに、実際には所持金は減ってしまう。

ただし一方で、所持金が減っていくのは当たり前という見方もある。それは、この賭けでは1度勝って、1度負けると、所持金は $1.5 \cdot 0.6 = 0.9$ 倍になるからである。この賭けは公平なコインで決まるから、何度も繰り返せば勝率は大体1/2に近づく。だから大まかにいって、1回賭けをする毎に所持金は $\sqrt{0.9}$ 倍になり、所持金が減っていくことはこれで説明がつく。以上から、次のような結論を導けそうである：

この賭けは期待値でみると、有利な賭けに見えるけれども実は不利な賭けである。また、この賭けに対して期待値で有利・不利を判断するのは間違っている。

しかし、こう結論するのは早計である。というのは元記事の別のシミュレーションでは、賭けの参加者数を増やして賭けを何度も行うと、参加者の平均所持金は増えていくことが示されている。この記事の後半で説明するように、実は平均所持金は各回の賭けで概ね $1.05$ 倍となる。この1.05という数字はもちろん先ほど計算した1回の賭けの期待値に由来するものである。

よって、賭けの参加者数を増やした場合には、期待値を基準として賭けが有利だと判断することは正しい。

これらの結果に基づき、元記事では、期待値を基準とした判断は、多数の参加者数の平均を考えるには適切だが、個々人に対しては不適切な場合があることが説明されていた。

なぜ、このようなことが起こるのか？

以上で説明した内容から、以下の2つの観察が得られている：

1人で賭けを繰り返すと、所持金は確実に0に近づく --- (観察A)
参加者が多い場合、平均所持金は概ね $1.05$ 倍のスピードで増えていく --- (観察B)

しかし、この2つは両立しえない。なぜなら、賭けを繰り返すとどの参加者も所持金が0に近づくのなら、どれだけ参加者数を増やしても、その全員の所持金が0に近づき、結局、平均所持金も0に近づくはずだからである。

というわけで、少なくともどちらかの観察は間違っている。ただしこれら2つの観察は、一定の近似のもとでは両立し、元記事のシミュレーションはそのような場合を扱っているため、この相反する事象が観察された。その近似とは何か、そしてその近似の下では何が成り立っているかを説明する。

メカニズム：大雑把な説明

ここではまず大雑把な説明をする。厳密に説明するとややこしくなる部分は少し誤魔化している。まず観察AとBは両立しえないのだから、どちらかが間違っている。実は、観察Bが間違っている。

ただし完全に間違っているわけでなく、次のように修正すれば正しい。

参加者が多い場合、賭けの回数がある程度小さい間は、平均所持金が概ね $1.05$ 倍のスピードで増える確率が高い --- (観察B')

また、(観察A)は正しい。理由は既に上に述べたように、賭けを繰り返すと、大体各回毎に所持金は $\sqrt{0.9}$ 倍になるからである。数学的に厳密な説明は次のセクションで行う。

(観察B')が正しい理由は、参加者数を増やすことで、賭けの後の平均所持金が大数の法則によって期待値に近づくからである。もう少し具体的に言うと、参加者がN人いるとして、そのN人のn回目の賭けの後の所持金をそれぞれ $M_n^{(1)}, M_n^{(2)}, \dots, M_n^{(N)}$ とする。このとき、n回目の賭けの後の平均所持金は $\frac{ M_n^{(1)} + M_n^{(2)} + \cdots + M_n^{(N)} }N$ である。大数の法則より、参加者数Nを無限大とした極限をとると、n回目の賭けの後の所持金の期待値に収束する。つまり、次が成り立つ：

$\lim_{N \to \infty} \frac{ M_n^{(1)} + M_n^{(2)} + \cdots + M_n^{(N)} }N = (1.05)^n.$

この式が示しているのは、参加者数Nを大きくすればn回目の賭けの後の平均所持金は大体 $(1.05)^n$ となるということ。これは(観察B')が成り立つことを示している。

なぜ「賭けの回数がある程度小さい間」という制限が必要かというと、大数の法則による近似を使うためにはNが大きくなければならず、どれだけNを大きくとる必要があるかはnによって異なるからである。 nが大きくなれば、 $M_n^{(i)}$ の分散も大きくなるため、Nもそれに応じて大きくしなくてはならない。そのため、参加者数を事前に大きくとっておいても、ある回数以降の賭けでは近似は機能しなくなる。よって、賭けの回数に制限がつく。

メカニズム：正確な説明

ここでは、上で説明した内容を数学的に説明していく。大学レベルの確率論の知識が必要となる。

まず、賭けの各回の結果を表す確率変数列を定める。 $X_1,X_2, …$ を独立同分布で $P(X_1 = 1.5) = P(X_1 = 0.6) = 1/2$ となる確率変数列とする。
そして、 $M_n = X_1 X_2 \cdots X_n$ と定めると、 $M_n$ は目的通り、賭けのn回目の後の所持金を表す確率変数となることがわかる。

まず観察Aを証明する。 $Y_n := log X_n$ と定めると、やはり $Y_1, Y_2, …$ は独立同分布な確率変数列であり、 $S_n := log M_n$ と定めると、 $S_n = Y_1 + Y_2 + \cdots + Y_n$ となる。つまり、 $S_n$ は独立同分布な確率変数のn個の和なので、ランダムウォークである。1ステップの期待値は $E Y_1 = (1/2) log 1.5 + (1/2) log 0.6 = (1/2) log 0.9$ であり、これは負の数である。よって、大数の強法則から確率1で、 $\lim_{n \to \infty} S_n / n = (1/2) \log 0.9$ 。特に、

$\lim_{n → ∞} S_n = -∞$ .

ここで、 $M_n = \mathrm{e}^{ S_n}$ であることを思い出すと、これは確率1で、 $lim_{ n \to \infty} M_n = 0$ となることを示している。よって、観察Aが示せた。

次に観察B'を示す。参加者が $N$ 人いるとして、各nに対し、 $M_n$ の独立なN個のコピー $M_n^{(1)}, \dots, M_n^{(N)}$ をとる。 n回目の賭けの後の平均所持金 $\bar{M}_{n} := \frac{M_n^{(1)} + \cdots + M_n^{(N)}}N$ と定める。 $\varepsilon, \delta > 0$ を小さくとる。大数の弱法則より、各nに対し、 $N$ によらないある自然数 $k_n$ が存在し、 $N > k_n$ なら、