asukaの勉強備忘録

学びをアウトプットするためのブログ

確率母関数・モーメント母関数【統計検定準1級】

引き続き「日本統計学会公式認定 統計検定準1級対応  統計学実践ワークブック 日本統計学会 編」の学習内容をまとめていきます。
今回はp.9~11の母関数に関する内容です。
統計検定2級では出てこなかった内容なので、ようやく準1級の勉強をしている実感が出てきました。

確率分布の意味と確率関数(密度関数)の役割

母関数の話をする前に、確率分布の意味を考えてみましょう。
辞書を引くと”分布”の意味は「分かれて広くあちこちにあること。また、あちこちに置くこと。」となっています。
そして、確率の総和が1であることを考慮すると、確率分布を以下のように解釈することができます。
「確率分布とは、1という確率全体を取り得る値(離散型)あるいは実数全体(連続型)に広くわけること、またその分けられた状態である。」

では次に、この確率分布を一意に定めるにはどのようにすれば良いでしょうか?
結論としては、前々回に定義した確率関数あるいは確率密度関数で確率分布を定めることができます。
確率関数は確率変数 X が値 x をどのような確率で取るのかを定めています。
つまり、確率全体の1を取り得る値に分けるルールを定めており、確率分布を定めていることになります。
連続型の場合は1点の確率が0のため、厳密には異なりますが、直感的な解釈としては同じです。(ここでは省略)

母関数

確率分布やそれを定める確率関数(あるいは密度関数)の性質を調べる道具に母関数というものがあります。
以下では、整数値を取る確率変数に主に使用される確率母関数と、連続型の確率変数に主に用いられるモーメント母関数積率母関数)を導入します。

確率母関数

X を整数値を取る確率変数とし、その確率関数を p(x) とします。また、s を任意の実数とすると、確率母関数

G(s)=E(s^X)=\sum_x s^xp(x)

と定義されます。
ただし、1を含むある開区間のすべての s に対して、右辺の和が収束すると仮定します。
G(s) を1階微分、2階微分するとそれぞれ

G'(s)=E(Xs^{X-1})

G''(s)=E(X(X-1)s^{X-2})

となり、s=1 とおくと

G'(1)=E(X), G''(1)=E(X(X-1))

となります。これらに加えて、確率変数の和の期待値が期待値の和となることを用いて

E(X)=G'(1), V(X)=E(X^2)-(E(X))^2=G''(1)+G'(1)-(G(1))^2

と表すことができます。

モーメント母関数(積率母関数

先程の確率母関数において s=e^\theta とおいたものがモーメント母関数であり

m(\theta)=E(e^{\theta X})=G(e^\theta)

と定義されます。同様にモーメント母関数を微分すると

m'(\theta)=E(Xe^{\theta X}), m''(\theta)=E(X^2e^{\theta X}),...,m^{(k)}(\theta)=E(X^ke^{\theta X})

となります。\theta=0 を代入すると

m'(0)=E(X), m''(0)=E(X^2),...,m^{(k)}(0)=E(X^k)

となり、原点まわりのモーメントが得られます。
ただし、モーメント母関数を使用する際には、0を含むある開区間のすべての \theta について m(\theta) を定める広義積分あるいは無限和が収束することを仮定します。

母関数の性質

母関数には以下の2つの重要な性質があります。

  1. 確率分布との1対1の対応
  2. 独立な変数の和が母関数の積に対応

1つ目の性質は、確率分布が異なれば、母関数も異なることを表しています。
この性質より、分布が不明なある確率変数 X のモーメント母関数が正規分布のモーメント母関数に一致することを示せば、X正規分布に従うことが導けます。

次に X_1X_2 を独立な確率変数とし、それらのモーメント母関数をそれぞれ m_1(\theta), m_2(\theta) とすると、X_1+X_2 のモーメント母関数は以下のように求めることができます。

m(\theta)=E(e^{\theta(X_1+X_2)})=E(e^{\theta X_1}e^{\theta X_2})=E(e^{\theta X_1})E(e^{\theta X_2})=m_1(\theta)m_2(\theta)

なお、最後から2つ目の等号では、独立な確率変数の関数の積の期待値が各関数の期待値の積となることを用いています。
上式から、独立な確率変数の和のモーメント母関数は、それぞれのモーメント母関数の積となることが分かります。

これらの母関数は、様々な種類の確率分布間の性質を示す際に後々使用されます。

今回のまとめ

  • 確率分布は、確率全体を取り得る値に広く分けることである。
  • 確率関数(密度関数)により分布を定めることができる。
  • 母関数を用いると、確率変数が従う分布が分かる。