このコインの表が出る確率は1/2ですよね?
そうね。
でもコインが奇跡的にまっすぐ立つことだってあり得ますよね? これだと1/2じゃなくないですか?
その通りね。
でもそれは、コインの表と裏が出る確率が「同様に確からしい」と定義できるかどうかの問題なの。
こんにちは、Yunです!
仕事をするなかで「数学的思考ができればもっと仕事がはかどるのに」「確率ってどうやって計算するんだっけ」と感じることはありませんか?
そんな悩みをお持ちの方に、こちらの記事では仕事に役立つ「確率」と、つまづきやすい確率用語について解説します!
この記事を読めば、確率の計算が役立つ具体例がわかります!
確率とはなにか
確率の定義(やさしい表現)
ある事柄Aとそのほかの事柄が同じくらい起きやすいとき、Aが起こる確率は以下のように表すことができます。
\(Aが起こる確率 = \dfrac{Aが起こる場合の数}{すべての場合の数}\)
上の式は、言葉を数学用語に変えると次のようになります。
確率の定義(かたい表現)
1つの試行においてすべての根元事象の起こり方が同様に確からしいとき、事象Aの起こる確率P(A)は、全事象をUとすれば以下のように表すことができます。
\(P(A) = \dfrac{事象Aの根元事象の個数}{全事象Uの根元事象の個数}\)
確率の基本用語
用語 | 意味 |
---|---|
試行(trial) | 「さいころを投げる」「コインを投げる」のような、同じ条件で何回も繰り返せる行為のこと。 |
事象(event) | 「さいころの3の目がでる」「コインの表が出る」のような、試行をおこなった結果起こること。 |
全事象 | 「さいころの1〜6の目」「コインの表と裏」のような、1つの試行の結果起こりうるすべての場合の集合のこと。 |
根元事象 | 「さいころの3の目がでる」「コインの表が出る」のような、全事象をつくる要素1つだけの集合のこと。 |
たとえば、1個のさいころを投げる試行の全事象は以下のとおりです。
全事象……\(\{1, 2, 3, 4, 5, 6 \}\)
根元事象……\(\{1\}, \{2\}, \{3\}, \{4\}, \{5\}, \{6\}\)
また、事象Aの根元事象の個数は、事象Aの場合の数と等しくなります。
全事象は統計学では標本空間とも呼び、しばしば「Ω」で表されます。標本空間Ωの要素を標本点といいます。
「同様に確からしい」とはどういうことか
確率とは事実ではなく仮説である
確率は、その起きやすさが「同様に確からしく」ないと計算することができません。しかし、それが同様に確かなのかどうかを事前に断言することはできません。つまり、「○○は同様に確からしい」というのは仮定であり、仮定をもとに計算する以上、「確率」は人がつくりだした一種の仮説であるということになります。
たとえば、じゃんけんで相手がグーを出す確率は一般に\(\frac{1}{3}\)と考えられていますが、それは相手に「グーを出しやすい癖」や「チョキを好む傾向」などはないと仮定し、3種の手が出やすさが同様に確からしいと仮定しなければ求めることはできません。
確率って人間が決めてつくってるものだったんですか?
「同様に確からしい」の循環
確率は「同様に確からしい」という条件によって支えられていると説明しましたが、この「同様に確からしい」という言葉はつまり「確率が同じである」と言っていると考えられます。しかしそうだとすると、「確率」という用語の定義に「確率」の語を用いていることになり、同義反復(トートロジー)となってしまって結局よくわかりません。
実は確率における「同様に確からしい」という概念は、幾何学における「点」や「線」と同じくはっきりと定義はされておらず、それがなにかは深く考えないというのが共通見解になっています。
なんかモヤっとしてるんですね。
どこか釈然としないところもありますが、確率については経験的にわかっている部分も多くあります。たとえば、コインを投げて表が出る確率は\(\frac{1}{2}\)であるとか、じゃんけんで相手がグーを出す確率は\(\frac{1}{3}\)であるというのは、経験的に考えて自然なことと言えます。
われわれがなにを「同様に確からしい」と考えるかについては、経験的に知った確率に基づくことも多いのですが、このような経験的確率と、相対度数、理論的確率それぞれの違いというのも混同されやすくなっています。
確率と相対度数の違い
相対度数とはなにか
コインを\(n\)回投げて「表」が出た回数を\(r\)回とするとき、
\(\dfrac{r}{n}\)
の値を「表」が出た相対度数という。
相対度数と古典的確率の違い
上の説明を見ると、「相対度数って確率と同じってこと?」と感じられるかもしれません。しかし、確率と相対度数は似て非なるものなので、その違いを見ていきましょう。
まずは、確率がどのようなものだったかを再確認します。ちなみにここでの確率とは、古典的確率・理論的確率・数学的確率などと呼ばれるもののことです。
これから起きるかもしれない注目したい事柄Aを含む、すべての場合の数Uについて以下のように仮定する。
- U通りのどれかが起きる。
- U通りのうち、起きるのは1通りである。
- U通りのどれもが同じくらい起きやすい。
また、注目したい事柄Aが起きる場合の数をaとする。
全部でU通りあるうち、事柄Aが起きる確率は以下の式で表すことができる。
\(Aが起こる確率 = \dfrac{a}{U}\)
どちらも結果を分数で表すのは同じですが、違いを見比べると、相対度数はすでに起きた結果を表しているのに対して、確率はこれから起こることを仮定をもとに計算していることがわかります。
相対度数(Relative Frequency)はすでに起こった事象を階級(表、裏など)ごとに分類し、それを度数(回数など)で割ったものです。
コインの表と裏が出る確率が\(\frac{1}{2}\)だからといって、実際に100回投げて表50回、裏50回になるとは限りません。
確率は「これからどのような頻度でそれが起こるか」を見ますが、相対度数は「実際にどれくらいの頻度でそれが起こったか」を見ます。
また、データ分析では仮定を立てて確率を計算するよりも、すでに収集してあるデータをもとに相対度数を求めたほうが傾向がつかみやすい場合もあります。このように相対度数は「すでに起きていることの傾向をつかむ」という目的で用いられることも多くあります。
相対度数と経験的確率の違い
相対度数は過去に関するものですが、実はそこから未来を推測することもできます。
一定の条件のもとでは、試行回数を増やせば増やすほど、相対度数は理論的な確率に近づくことがわかっています。これをヤコブ・ベルヌーイの大数の法則といいます。
「成功か失敗」「表か裏か」「サイコロの目が6かそれ以外か」のような結果が2種類しかないタイプの試行をベルヌーイ試行といいます。大数の法則は、このベルヌーイ試行であれば当てはまります。
ふつうの確率(古典的確率)が仮定からはじまって計算していたのに対し、試行結果から求められた確率は経験的確率(または統計的確率)と呼ばれます。
これは過去の天気データをもとにした気象予報や、過去の販売データをもとにした売上予測などビッグデータの存在するさまざまなビジネスで活用されています。
歴史から未来を予測できるんですね!
確率の計算における「区別する」「区別しない」とは?
場合の数は区別しないこともある
2個のサイコロを振ったときに出る目の数は、ゾロ目も合わせて21通りの組み合わせがあります。このとき「12」と「21」は区別しません。どちらも1と2の目が出た同じものとカウントします。
11 | 21 | 31 | 41 | 51 | 61 |
12 | 22 | 32 | 42 | 52 | 62 |
13 | 23 | 33 | 43 | 53 | 63 |
14 | 24 | 34 | 44 | 54 | 64 |
15 | 25 | 35 | 45 | 55 | 65 |
16 | 26 | 36 | 46 | 56 | 66 |
組み合わせが21通りなら、たとえば1のゾロ目である「11」が出る確率は\(\frac{1}{21}\)になるのでしょうか。実はそうではありません。以下で確率における「区別」の重要性を確認しましょう。
確率の計算は区別する
確率は、注目したい事象Aがほかの事象と「同様に確からしい」起こりやすさである必要があります。
下の表を見れば、2個のサイコロを振ったとき「11」「12」「21」はどれも同じ確率(\(\frac{1}{36}\,\))で起こることがわかります。
11 | 21 | 31 | 41 | 51 | 61 |
12 | 22 | 32 | 42 | 52 | 62 |
13 | 23 | 33 | 43 | 53 | 63 |
14 | 24 | 34 | 44 | 54 | 64 |
15 | 25 | 35 | 45 | 55 | 65 |
16 | 26 | 36 | 46 | 56 | 66 |
それでは先ほどのように「組み合わせは21通り」を分母にしてしまうことは、どのような点で間違っているのでしょうか。
2個のサイコロを区別せず「12」と「21」を同じものだとすると、1と2の組み合わせは2通りあるのに「11」は1通りしかないために、1のゾロ目が出るという事象とほかの目の出る事象の起こりやすさが「同様に確か」ではなくなってしまっています。
すべての事象の起こりやすさが「同様に確からしい」ことを保証できないとき、確率の公式\(Aが起こる確率 = \dfrac{Aが起こる場合の数}{すべての場合の数}\,\)は成立しません。
だから、複数のものをあつかう確率の問題では組み合わせの個数ではなく、それぞれを区別して考えるべきだということになります。これは複数のものの見た目やかたちに差がないときも同様です。
区別があると考えるからCを使って計算できる
\({}_n \mathrm{C}_r\,\)のような組合せ(C)を使った公式はn個の異なるものから、r個を取り出してつくるときに用いることができます。
「n個の異なるものから」というときには、同じに見えるサイコロやコイン、玉、くじなどもすべて区別されていなければいけません。
たとえば以下の例題で考えてみましょう。
10本のくじの中に当たりくじが4本ある。この中から同時に2本のくじを引くとき、2本とも当たりくじである確率を求めなさい。
このとき、根元事象それぞれを区別しないと「くじは当たりかはずれかの2種類だから、確率はつねに\(\frac{1}{2}\,\)」といったありがちな間違いをしてしまいます。
実際は10本のくじそれぞれを異なるものとして区別しないといけません。そこから2本のくじを引くときの引き方は\({}_{10} \mathrm{C}_2\,\)通りとなります。これらは同様に確からしいものとします。このうち、2本とも当たりくじとなる引き方は\({}_4\mathrm{C}_2\,\)通りです。
したがって、求める確率は以下のとおりです。
\(\dfrac{{}_4\mathrm{C}_2}{{}_{10} \mathrm{C}_2} = \dfrac{6}{45} = \dfrac{2}{15}\)
最初に10本中4本、2回目で9本中3本当たりがあるから、
4/10 × 3/9 = 2/15 でも一緒ね。
条件つき確率
「○○が起こったとき…」というのが条件つき確率
事象Aが起こったときに、事象Bが起こる確率を\(P(B\mid A)\)または\(P_A(B)\)と表し、これをAが起こったときのBの条件つき確率といいます。
なんか説明が難しいんですが……。
\(P(B\mid A)\)は、事象Aが起こったときに事象Bが起きる確率です。
\(P(B\cap A)\)は、「AかつB」を意味し、事象Aと事象Bが両方起きる確率を表しています。
この2つの確率は、異なるものとして計算されます。
順番に起こるか、同時に起こるかで確率が変わるんですか?
条件つき確率\(P(B\mid A)\)は次のように定義されています。
\(P(B\mid A) = \dfrac{P(A \cap B)}{P(A)}\)
コインを2枚投げて2枚とも表である確率を求めよ。
\(A = \{表, 裏\}\)
\(B = \{表, 裏\}\)
であるとき、\( | A \cap B | = \{表表\} \)であるので、AかつBは1通りです。全体集合Uは表表、表裏、裏表、裏裏の4通りなので、
\( P(A \cap B) = \dfrac{| A \cap B |}{|U|} = \dfrac{1}{4}\)
となります。
コインを投げて表が出たあとに、別のコインを投げて新たに表が出る確率を求めよ。
条件つき確率の公式を再確認しましょう。
\(P(B\mid A) = \dfrac{P(A \cap B)}{P(A)}\)
\( P(A \cap B) = \dfrac{1}{4}\)であることは先ほど確認ずみです。…①
分母の\(P(A)\)にとっての全事象は表・裏の2通りであり、そこから表が出る確率なので\(\frac{1}{2}\)です。…②
①を②で割るので、\(P(B\mid A)\)は以下のとおりです。
\(P(B\mid A) = \dfrac{\frac{1}{4}}{\frac{1}{2}} = \dfrac{1}{2} \)
本当に順番に起こるか同時に起こるかで確率が変わっちゃった!
ヒントをもらうことは、条件が追加されること
条件つき確率の身近な例は、クイズでヒントを出してもらったときの状態です。
たとえば、次の問題を出されたとします。
トランプの絵札12枚から1枚引いて、ハートのキングが出る確率を求めよ。
この場合、絵札のなかでハートのキングは1枚しかないので、\(\frac{1}{12}\)でよいことになります。
それでは次はどうでしょうか。
太郎がトランプの絵札12枚から1枚引いて「赤のカードが出た」と言った。このときそのカードがハートのキングである確率を求めよ。
この問題では赤のカードが出たことがわかっているので、トランプの絵札12枚中赤のカードはハートとダイヤの6通り、そのなかでハートのキングは1枚なので確率は\(\frac{1}{6}\)となります。
この2つの問題の違いを数学的に説明すると、ヒントなしのときは全事象Uが12個の要素からなっているのに対して、ヒントをもらったあとはカードの全事象U’が赤色だけの6個の要素に減っています。ハートのキングはつねに1枚ですが、全事象が変化しているので起こる確率も変化しています。
確率を計算するときは、このように「基準となる全体がいくつか」が重要になります。
「少なくとも…」は余事象を考える
余事象の確率
全事象Uのなかで事象Aに対して「Aが起こらない」という事象を「Aの余事象」といい、\(\overline{A}\)で表します。
余事象\(\overline{A}\)は「『Aが起こらない』が起こる事象」とも言えますし、「A以外が起こる事象」ということもできます。
余事象が起こる確率は全体1から事象Aが起こる確率を引いて求めます。
\( P(\overline{A}) = 1 – P(A) \)
「少なくとも」の言葉があれば、余事象の確率を利用する
2個のさいころを同時に投げるとき、少なくとも1つの目は偶数である確率を求めよ。
「少なくとも1つの目が偶数である」事象は「2つとも奇数の目である」事象の余事象といえます。
2つとも奇数の目が出る確率は\( \dfrac{3}{6} \times \dfrac{3}{6} = \dfrac{1}{4} \)…①
全体1から①を引けばいいので、求める確率は
\( 1 – \dfrac{1}{4} = \dfrac{3}{4} \)
ガチャやパチンコの当たり計算も余事象を用いる
身近なガチャやパチンコなど、ギャンブル性のあるものの当たりが出る確率を求めるときは余事象を用います。
当たりの確率が1%のガチャを100回まわしたとき、当たりが出る確率を求めよ。
縁日のくじ引きのように引いたくじを戻さないタイプであれば、(当たりくじが入っていれば)いつかは必ず当たりがでますが、ガチャは引いたはずれくじを戻して再度引き直すのと同じことをしているのがポイントです。
この場合、「100回まわしてすべてはずれが出る」事象の余事象を求めれば、100回まわして少なくとも1回当たりがでる確率が求められます。
1回まわしてはずれる確率は\( \dfrac{99}{100}\)なので、それを100回繰り返した\( P(A)\)は以下のとおりです。
\( P(A) = (\dfrac{99}{100})^{100} \simeq 0.366\)
上記「100回まわしてすべてはずれが出る確率」を全体1から引くと、求めたい確率になります。
\( P(\overline{A}) = 1 – P(A) = 0.634 \)
当たりが出る確率1%のガチャを100回まわしたときに当たりが出る確率は約63.4%です。
大当たり確率\(\frac{1}{320}\)のパチンコで320回転させたときに大当たりが出る確率も同じく約63.4%です。
\(\frac{1}{n}\)の確率で当たるものを\(n\)回試行したときに当たりが出る確率はすべて約63.4%となるので、この数字は覚えておくと便利です。
数学的思考がビジネスに役立つ
確率の理解は、場合の数と並びビジネスで特に役立つ機会の多い数学分野です。
データ分析などの専門的な領域に限らず、確率はかなり日常的な場面にも存在しています。どういう条件か、同様に確かなことがなにかなどによって計算方法・計算結果が変わってくることを知っておくだけでも大切なことと言えます。