【確率の定義】「同様に確からしい」について考える
今回は、確率に関する話題として「同様に確からしい」なる文言について考えていきます。
中学・高校で学ぶ確率=古典的確率
早速、議論の対象となる「確率の定義」について整理しておきます。
中学・高校では、起こりうる全事象(標本空間U,要素数N)を考え、その要素(根源事象ω)をランダムに取り出す操作を「試行」と呼びます。
任意の根源事象ωが起こる確率P(ω)というのは、すなわち、ωがUから取り出される確率であり、「同様に確からしい」という仮定の下で、P(ω)=1/Nと定義します。
そして、任意の試行結果(=事象)は、標本空間Uの部分空間Eで表現されます。取り出されるωがEの要素であれば、「事象Eが起こる」と表現するのです。Eに含まれる根源事象の数(=Eの要素数)nから、Eが起こる確率P(E)は、P(E)=n/Nで定義されます。
この定義の中で重要なのは、「同様に確からしい」という仮定です。もし、この仮定がなければ、個々の根源事象は異なる確率をもつことになり、事象Eの確率は、単純に要素を数えるだけでは計算できなくなってしまいます。
注)中学・高校では、確率を上記のように定義していますが、実は「同様に確からし」くない根源事象をもつ標本空間について考える問題も存在します。裏表の出る確率が異なるコイン、勝敗の確率に偏りがあるゲーム、などを考えるときです。
この確率の定義は、古典的確率(あるいは、理論的確率、数学的確率)と呼ばれるものになります。
さて今回の議論の的は、確率の定義にあった「同様に確からしい」という言葉です。この言葉、よく考えると(考えなくても)気持ちの悪い表現なのです。
「同様に確からしい」とは、どの根源事象も同程度に起こりやすい(同程度起こると期待される)ということなのですが、それは取りも直さず個々のωが「等確率」で起こるということを意味します。ストレートにそう表現したほうが簡潔で良いと思うのですが、なぜかそうはなっていない。
それは、やはり「確率」を定義するための記述に「等確率」という言葉を含ませてしまっては、循環論法となってしまう問題があるからでしょう。
「同様に確からしい」は確率の定義に不要!
上の注にも述べたように、ある種の試行では、必ずしも「同様に確からしい」なる仮定が成り立たない場合があります。それでもご存じの通り、適当な方法で確率を計算することは可能です。このことから、確率にとって「同様に確からしい」という仮定は必ずしも本質的ではないと予想されます。
それでは、確率の定義をどう修正すればよいでしょうか。結論から言うと、確率は次の2つの性質を満たす"関数"として抽象的に定義し直せます(ここでは、Uを有限集合として、有限加法的な事象Eの確率を考えます)。
- 任意の事象Eに対してP(E)≧0
- 互いに交わらないUの部分空間(同時に起こらない事象)E1とE2に対して、P(E1∪E2) = P(E1) + P(E2)
- P(U) = 1
このたった3つの条件を満たすPを、確率と定義するのです。この定義は、(根源)事象の起こりやすさについて何も言及していないことに注意してください。
2.では、「同時に起こらない事象たちの和事象を考えるとき、それが起こる確率は、個々の事象が起こる確率の和になる」ということを要請しています。
3.では、「全事象の確率が1である」ことを要請しています。
(Uが無限集合である場合を考慮に入れた確率が、いわゆる公理論的確率というもので、現代的な確率論の出発点になっています。)
上の定義によって、「同様に確からしい」とはどういうことか?といった問いは必要なくなりました。しかし、新たに大きな問題が生じてしまいます。すなわち、具体的に確率を計算するにはどうすればよいのか?という問いです。
私も初めてこの定義に出会ったとき、そのような疑問をもち、こんな定義は不完全じゃないかと思ったものです。
確率の定義と計算を切り離そう
確率を勉強するうちに、果たしてその疑問は解消されたのでしょうか。結論から言えば、解決はしました。そもそも解消する必要がないという形で決着するのです。
そもそも「確率論」というのは、私が当初期待したような(高校までの数学の延長として捉えると当然そう期待すると思いますが)確率を計算するための学問ではなかったのです。
中学、高校で確率を勉強するときには、9割9分「~である確率を求めなさい」という形で問題が与えられます。その延長で確率論を勉強しようとすると、どうしても何か具体的な事象に確率を定めるという作業を想像してしまいます。
現代的な数学の中では、確率論は、事象や確率そのものがもつ性質を突き詰めることを目的とする分野であって、どうやら、具体的に確率をどう決定するかということはその主題ではないらしいのです。
ある試行について考えるとき、実は「確率をどう計算するか」という問題より先に、そもそも「それぞれの事象に確率が存在するのか(定義できるか)」ということを考えねばなりません。高校までは前者が主要な問題であって、後者は考慮する必要がありませんでした。確率論はどちらかと言えば、後者ような問題や、多数の試行を繰り返したときにどのような規則性が現れるのかという問題(大数の法則や極限定理)を考えるような分野だということがわかってきました。
確率の定義に「確率をどう計算するか」ということが示されていないのは、確率論のモチベーションを鑑みれば当然と言えます。
では、何が確率の計算に関する道しるべになるのでしょうか。
個人的な意見ですが、私は統計学こそがその役割を担っているのだと思います。統計的推定や検定といった手法が、具体的に確率を定めるための道具として使われるのです。
最後に、再び「同様に確からしい」という文言について考えてみます。
「等確率」とも換言されるべきこの回りくどい言葉は、具体的計算を切り離して確率を定義することで、無事に消し去ることができます。確率の存在が保証された後で、根源事象に具体的な確率を割り振る際に、その仮定を用いることができるのです。
余談ですが、「等確率」のようなシンプルな仮定は、何らかのモデルを推定する際、まだ手元に情報のない状態で自然に用いることができます。