超幾何分布とは (1) ~期待値・分散の導出まで~

自己研鑽

超幾何分布とは?

超幾何分布は、二項分布とポアソン分布の基礎となるものです。

「超幾何分布」って名前は知らないけど、高校数学でやったことある!っていう人が多いと思います

では早速、超幾何分布をお見せします!

これは3個の不良品が含まれている10個の中から3個取り出すとき、

含まれる不良品の個数を確率で示したものです。

つまり、 10個 (不良品3個を含む)からピッキングした3個のボルトの中に不良品が

0個となるのは 29.2 % (0.292)

1個となるのは 52.5%(0.525)

2個となるのは 17.5%(0.175)

取り出した3個が全部不良品となるのは 0.8% (0.008)

ということになります!

じゃあ、ここでクイズです!

不良品の個数が4個となるのは何%でしょう???

取り出したの3個だけですので、0%ですね笑

ここで、すでにお気づきの人がいるかもしれませんが、「超幾何分布」は高校数学でやってます。

確率(順列・組合せ)みたいな項目だったと思います。

えっ、もう覚えてないや… って方も分かるように深掘りしていきます。

超幾何分布は、離散分布の仲間です。上の図でも示したようにx軸に1.1個とか存在しないですからね!

要素の数N個(不良品a個)の中からb個取り出すとき、そのb個の中に不良品x個含まれている確率は

と表すことができます。これが、超幾何分布と呼ばれています。

期待値の導出方法について

超幾何分布の期待値は、

で表すことができます。

では、期待値を導出していきましょう。

期待値は、それぞれの不良個数の場合のときの、(個数)×(その個数となる確率)の和で求められます。

つまり、式で表すと以下のようになります!

ここで、超幾何分布の式を代入することを考えてください。なんかΣが消える予感しないですよね…

実は、ここでキレイさっぱりΣを消す方法があります。

要素の数 N-1 個(不良品 a-1 個)から、b-1 個 取り出す時、

取り出したb-1個の中に不良品が0個、1個、2個、…、b-1個となる確率をそれぞれ足したら1になる

ことを使います!

これを数式で表すと、次ようになりますね!

さて、では準備していきましょう。Pxの中の項を変換していきます。

このような形で、Pxの分母を書き換えられますね!

この調子で、残り二つも書き換えます!

準備が整いました。では、代入しましょう!

すっきり消えてきれいになりましたね!

分散の導出方法について

超幾何分布の分散は、

とあらわすことができます。

分散の導出方法は、期待値の導出を理解できれば簡単にわかります。

分散は、各値から期待値を引いた2乗の期待値です。

ここで、”期待値”と”平均値”を混同する方がいると思いますが、厳密にいえば異なります。

ただし、標本が母集団と一致するときは等しくなります。

この式を、書き換えると次のようになります。

変形した意図は、先ほど求めた期待値E(X)を利用して楽して分散を求めるためです。

ここで、分からない項はE(X^2)ですよね。なので、 E(X^2)を求めていきます。

途中で(x-1)×全体から1を引いた個数の超幾何分布の式の形を作りにいっています。

これは、期待値のときと同様Σ内をキレイに計算するためです。

ここまで変形できたらあとは簡単です。

E(X^2)を求めることができました。

これで、分散は導出できそうですね。

分散導出できました。

少し煩雑に見えますが、1個1個たどれば難しいことはしてないので理解できると思います。

超幾何分布と二項分布、ポアソン分布との関係については超幾分布とは(2)で取り上げます。

プロフィール
そのべ

国立大学機械学科に入学。
機械工学の勉強をし、大学院では魚の泳ぎ方について研究して修士卒業。
現在は、メーカーで品質管理の仕事に携わる。
QC検定準1級を取得。現在は1級取得を目指す。

将来の夢
「本を執筆して一人でも多くの”わからない”を”わかった”に変えること」

そのべの備忘録では「統計学」「アプリ作り方」「自分の人生で得た教訓」など幅広く役立つ備忘録を配信しています。

そのべをフォローする
自己研鑽
そのべをフォローする
【そのべの備忘録】

コメント

タイトルとURLをコピーしました