Top > 二項検定

二項検定 binomial test

母比率が p である母集団から n 個の標本を抽出したときに,対象とする特性を持つ標本の数 x は二項分布 Pr{x}=nCx p^i(1-p)^(n-x) に従う。二項分布に基づく検定は二項検定と呼ばれる。

n が大きい場合の二項検定は,正規分布で近似される「母比率の検定」と等価である。
また,n が小さい場合には F 分布を用いて正確な検定が行える。
符号検定,マクネマーの検定,カテゴリーが 2 個の場合の一様性の検定なども,実際には二項検定である(後者の 2 つの検定は正規分布と カイ二乗分布の関係に基づく)。

ベルヌーイ試行と二項分布

ある試行の結果起こる事象をA、Aが起こらない事象をnotAとします。一般に、この試行を繰り返した場合最初の事象がAになるかnotAになるかによって2回目にAが起こる確率は、最初にAが起こる確率とは異なります。サイコロを振った場合は、最初に出た目の数がなんであっても2回目に振った場合に1の目が出る確率は1/6です。このように2回目の事象の確率が、最初の事象に関係ない場合、1回目の事象と2回目の事象は「独立である」といいます。ある試行をn回繰り返した場合、次の条件
各回の事象は、その他の回の事象と独立
各回の事象は、ある事象AとAが起こらないnotAのみ考える

を満たすとき、この試行を「n回のベルヌーイ(Bernoulli)試行」といいます。このとき、Aの起こる確率P(A)=p とするとP(notA)=1-p となります。確率変数Xを、n回のうちAの起こる回数とすると、X=k(k=0,1,....,n)となる確率 P(X=k) は次のようになります。

nCkは二項係数とよばれている定数で、二項のn乗の展開式に出てくることからこの名前がついています。Binomial(二項)なのにCを使うところが面白いのですが、これは組み合わせ(Combination) の数からきているのですが、これは日本だけの記号で一般には

という記号を使います。二項分布の平均E(X)と分散V(X)は次の式であたえられます。

E(X)=np,  V(X)=np(1-p)

集団の不良率と二項分布

集団のなかにある属性をもったものがあり、その数の割合がpであるとします。大量の製品のなかの不良品を考えるとpは不良率を表します。説明を簡単にするために、製品と不良率pの場合を考えることにします。この集団から大きさ(個数)nのサンプルをとり、X=不良品の個数、とします。一般には X=kとなる確率は集団の大きさに依存し簡単にはなりません。集団の大きさ(個数)をNとすると、最初に取り出した製品が不良ならば、のこりはN-1個、不良品はpN-1となり、この比はpにはなりません。しかし、Nが十分大きければこの比はpとほとんど変わりません。従って、Nが十分大きければn個のサンプルを取り出す場合 A=不良品が出る とすることにより、n回のベルヌーイ試行とみることができます。

説明

日本人の左利きの割合は 10%程度と言われています。ある小学校のクラスを調べたところ 30人中 6人が左利きでした。このクラスの左利きの子供の出現率が、10%より有意に大きいといえるか検定してみましょう。Excelなら次のように式を入力するだけです。

=1-BINOMDIST(5,30,0.1,TRUE)

式中の BINOMDIST(5,30,0.1,TRUE) は、左利きの割合が 0.1(10%)の母集団から 30人を抽出して、左利きが 5人以下の組み合わせになる確率です。1からこの確率を引いた残りは、左利きが 10%の集団から 30人を調べて偶然で 6人以上になる確率を意味し、そのまま片側二項検定の p値になります。結果は 0.07319。有意水準を 0.05 としていたなら有意に大きいとはいえません。

二項検定を利用できるのは、この例のような左利きと右利きとか、コインの表か裏かとかいうような二項分布に従うケースです。F分布や正規分布を用いた母比率の検定と異なり正確な確率を計算できるので、n が大きくないときは二項検定を利用した方が賢明です。

Tag: 統計学  Wikipedia:二項検定


リロード     ホーム 一覧 検索 最終更新 バックアップ リンク元   ヘルプ   最終更新のRSS
Last-modified: Fri, 11 Feb 2011 15:48:28 JST (2494d)