asukaの勉強備忘録

学びをアウトプットするためのブログ

確率母関数・モーメント母関数【統計検定準1級】

引き続き「日本統計学会公式認定 統計検定準1級対応  統計学実践ワークブック 日本統計学会 編」の学習内容をまとめていきます。
今回はp.9~11の母関数に関する内容です。
統計検定2級では出てこなかった内容なので、ようやく準1級の勉強をしている実感が出てきました。

確率分布の意味と確率関数(密度関数)の役割

母関数の話をする前に、確率分布の意味を考えてみましょう。
辞書を引くと”分布”の意味は「分かれて広くあちこちにあること。また、あちこちに置くこと。」となっています。
そして、確率の総和が1であることを考慮すると、確率分布を以下のように解釈することができます。
「確率分布とは、1という確率全体を取り得る値(離散型)あるいは実数全体(連続型)に広くわけること、またその分けられた状態である。」

では次に、この確率分布を一意に定めるにはどのようにすれば良いでしょうか?
結論としては、前々回に定義した確率関数あるいは確率密度関数で確率分布を定めることができます。
確率関数は確率変数 X が値 x をどのような確率で取るのかを定めています。
つまり、確率全体の1を取り得る値に分けるルールを定めており、確率分布を定めていることになります。
連続型の場合は1点の確率が0のため、厳密には異なりますが、直感的な解釈としては同じです。(ここでは省略)

母関数

確率分布やそれを定める確率関数(あるいは密度関数)の性質を調べる道具に母関数というものがあります。
以下では、整数値を取る確率変数に主に使用される確率母関数と、連続型の確率変数に主に用いられるモーメント母関数積率母関数)を導入します。

確率母関数

X を整数値を取る確率変数とし、その確率関数を p(x) とします。また、s を任意の実数とすると、確率母関数

G(s)=E(s^X)=\sum_x s^xp(x)

と定義されます。
ただし、1を含むある開区間のすべての s に対して、右辺の和が収束すると仮定します。
G(s) を1階微分、2階微分するとそれぞれ

G'(s)=E(Xs^{X-1})

G''(s)=E(X(X-1)s^{X-2})

となり、s=1 とおくと

G'(1)=E(X), G''(1)=E(X(X-1))

となります。これらに加えて、確率変数の和の期待値が期待値の和となることを用いて

E(X)=G'(1), V(X)=E(X^2)-(E(X))^2=G''(1)+G'(1)-(G(1))^2

と表すことができます。

モーメント母関数(積率母関数

先程の確率母関数において s=e^\theta とおいたものがモーメント母関数であり

m(\theta)=E(e^{\theta X})=G(e^\theta)

と定義されます。同様にモーメント母関数を微分すると

m'(\theta)=E(Xe^{\theta X}), m''(\theta)=E(X^2e^{\theta X}),...,m^{(k)}(\theta)=E(X^ke^{\theta X})

となります。\theta=0 を代入すると

m'(0)=E(X), m''(0)=E(X^2),...,m^{(k)}(0)=E(X^k)

となり、原点まわりのモーメントが得られます。
ただし、モーメント母関数を使用する際には、0を含むある開区間のすべての \theta について m(\theta) を定める広義積分あるいは無限和が収束することを仮定します。

母関数の性質

母関数には以下の2つの重要な性質があります。

  1. 確率分布との1対1の対応
  2. 独立な変数の和が母関数の積に対応

1つ目の性質は、確率分布が異なれば、母関数も異なることを表しています。
この性質より、分布が不明なある確率変数 X のモーメント母関数が正規分布のモーメント母関数に一致することを示せば、X正規分布に従うことが導けます。

次に X_1X_2 を独立な確率変数とし、それらのモーメント母関数をそれぞれ m_1(\theta), m_2(\theta) とすると、X_1+X_2 のモーメント母関数は以下のように求めることができます。

m(\theta)=E(e^{\theta(X_1+X_2)})=E(e^{\theta X_1}e^{\theta X_2})=E(e^{\theta X_1})E(e^{\theta X_2})=m_1(\theta)m_2(\theta)

なお、最後から2つ目の等号では、独立な確率変数の関数の積の期待値が各関数の期待値の積となることを用いています。
上式から、独立な確率変数の和のモーメント母関数は、それぞれのモーメント母関数の積となることが分かります。

これらの母関数は、様々な種類の確率分布間の性質を示す際に後々使用されます。

今回のまとめ

  • 確率分布は、確率全体を取り得る値に広く分けることである。
  • 確率関数(密度関数)により分布を定めることができる。
  • 母関数を用いると、確率変数が従う分布が分かる。

累積分布関数と生存関数【統計検定準1級】

前回に引き続き「日本統計学会公式認定 統計検定準1級対応  統計学実践ワークブック 日本統計学会 編」の学習内容をまとめていきます。
今回の内容はp.7に対応します。

 

積分布関数

確率変数 X積分布関数(あるいは単に分布関数)は以下のように定義されます。

F(x)=P(X\leq x)

定義の通り、累積分布関数は確率的に変動する確率変数 X がある値 x 以下になる確率を表しています。
前回の記事の後半で紹介した確率関数(あるいは確率密度関数)を用いると、離散型と連続型それぞれに対して、累積分布関数は以下のように表されます。

F(x)=\sum_{x'\leq x}p(x')

F(x)= \int_{-∞}^{x}f(x')dx'

また、累積分布関数が連続型の場合、その導関数確率密度関数となることも重要です。

生存関数

ここでは、確率変数 X が寿命を表すとします。そして、以下の図のような確率密度関数 f(x) が得られたとします。

f:id:axsxuxkxa:20210409113200p:plain

直感的な説明として、確率密度関数は各値の相対的な起こりやすさを表しています。
そのため図は、80歳前後で寿命を迎える人が最も多く(右の峰)、その次に子ども(0~5歳くらい?)が多く(左の峰)、20~30代で寿命を迎える人は相対的に少ない(中央の谷)ことを意味しています。
この時、累積分布関数 F(a)a 歳までに亡くなる確率(a 歳までに亡くなる人の割合)を表しています。
一方で、S(a)=1-F(a)a 歳で生存している確率(a 歳で生存している人の割合)を表し、生存関数と呼ばれます。
また、生存関数を用いて以下のハザード関数が定義されます。

 h(a)=\frac{f(a)}{1-F(a)}=\frac{f(a)}{S(a)}=\frac{-S'(a)}{S(a)}=(-\log S(a))'

この関数は、a 歳で生存している人(a 歳までに寿命を迎えていない人)の内、a 歳で寿命を迎える人の割合、つまりその後短時間で寿命を迎える人の割合を表しています。
生存関数やハザード関数は生存時間解析で使用されるようです。時間に余裕ができれば、学習してみようと思います。

事象と確率【統計検定準1級】

今回は統計検定準1級について学習した内容をまとめていきます。

資料としては以下の「日本統計学会公式認定 統計検定準1級対応  統計学実践ワークブック 日本統計学会 編」を使用しています。

これは昨年の5月に出版された本で、準1級に対応したテキストがあまりなかったことを考慮すると、待望の1冊だと思います。
私自身も2019年の末に統計検定2級に合格した後、準1級の勉強を始めようと思った時に公式のテキストが無く、困っていた所の出版だったので即購入しました。
統計検定準1級の範囲を網羅しているという点では非常に良い本だと思いますが、要点を簡潔にまとめている印象を受けたので、必要に応じて他の書籍も活用しようと思います。

 

それでは早速内容に移っていきます。
今回はP.1~4の内容です。

一部、以下の「統計学基礎改訂版 日本統計学会公式認定統計検定2級対応 日本統計学会 編」の内容も引用しています。

 

事象と確率

まずは用語の定義から始めますが、「”事象”と”集合”を対応させて考えること」がここではポイントとなります。

  • 試行:1回ずつの個別の結果が偶然に左右される実験や観測
  • 根元事象(素事象):試行により起こりうる個々の結果
  • 事象:根源事象の集合
  • 全事象:すべての根元事象の集合 

少し分かりにくいので、具体例を交えてイメージを膨らませていきます。

 

「すべての目が等確率で出るサイコロを1回振る」ことを考えると、先ほど定義した用語は以下のように対応します。

  • 試行:サイコロを1回振ること
  • 根元事象:「1の目が出る」,「2の目が出る」, ...,「6の目が出る」
  • 事象:例えば「偶数の目が出る」「4以上の目が出る」など
  • 全事象:「1~6のいずれかの目が出る」

ここで、「x の目が出る」という根元事象を"x"という風に表現すると、事象は根元事象の集合で定義されるので、事象A(偶数の目が出る)は

A=\left\{2, 4, 6\right\}

と表現することができます。
同様に、事象B(4以上の目が出る)を

B=\left\{4, 5, 6\right\}

と表現することができます。
このように"事象"を根元事象の"集合"とすることで、集合論の表記で事象を表現でき、集合論の概念・用語に対応付けることができます。
AB の和集合は和事象、積集合は積事象と呼ばれ、それぞれ A\cap B, A\cup B と表します。
空集合 \varnothing は起きえない事象を表し、空事象と呼ばれます。
A の補集合は全事象の内、A に含まれていない根元事象からなる事象に対応し、余事象と呼ばれ、A^c と表されます。
そして、事象 A が起きる確率を P(A) と表します。

条件付き確率

事象  A が起きるという条件の下で事象 B が起きる条件付き確率は以下のように定義されます。

P(B|A)=\frac{P(A\cap B)}{P(A)}

P(A) が全事象に対する事象 A の比率であるのに対して、P(B|A) は事象 A に対する事象 A\cap B の比率であることを意味しています。

この条件付き確率の定義を利用すると、独立のイメージがつかみやすくなると思います。
一般的に、独立は以下のように定義されます。

事象 AB が独立である \Leftrightarrow P(A\cap B)=P(A)\times P(B) 

先程の条件付き確率の定義を利用すると

事象 AB が独立である \Leftrightarrow P(B|A)=P(B) 

となり、「条件付き確率が無条件の確率と等しい」すなわち、「事象 B が起きる確率は事象 A という条件に依らない」という風に独立の概念を捉えることができます。

ベイズの定理

ベイズの定理は以下のように定義されます。

P(A|B)=\frac{P(B|A)P(A)}{P(B)}=\frac{P(B|A)P(A)}{P(B|A)P(A)+P(B|A^c)P(A^c)}

 これを用いると、B という結果が得られた条件の下での A という原因の確率を求めることができます。
少し分かりづらいので、例を交えて説明していきます。
ここでは、事象 A を「検査対象者がウイルスに感染している」とし、事象 B を「検査結果が陽性」とします。
P(A)事前確率と呼ばれ、ここではウイルスに感染している人の割合となり、標本調査によって推定することができます。(同時に P(A^c) も推定される。)
P(B|A) はウイルスに感染している条件の下で陽性となる確率を表し、実験を通して推定することができます。(同様に P(B|A^c) も推定される。)
これらの推定値とベイズの定理を用いると、陽性という結果が得られた下で、検査対象者がウイルスに感染しているという原因の確率(事後確率)を計算することができます。

確率変数

 サイコロの出る目や明日の降水量のように確率的に変動する変数は確率変数と呼ばれます。
一般的に、確率変数は大文字で表され、取り得る値は小文字で表されます。
サイコロの例の場合、サイコロを1回振って出る目は X であり、x=1, 2, 3, 4, 5, 6 となります。
サイコロの例のように、離散的な値を取る確率変数を離散型確率変数と呼びます。
離散型確率変数 X が値 x を取る確率を p(x)=P(X=x) と表し、確率関数と呼びます。
一方で、降水量の例のように、連続的な値を取る確率変数は連続型確率変数と呼ばれます。連続型の場合は、確率関数の代わりに以下の確率密度関数が定義されます。

f(x)=\lim_{\epsilon\rightarrow0}\frac{P(x\lt X\leq x+\epsilon)}{\epsilon} 

期待値・分散

確率変数を評価する指標として、期待値・分散というものがあります。
期待値 E(X) は「確率変数がどんな値を取ることが期待されるか」を表し、分散 V(X) は「確率変数の散らばりの程度」を表す指標です。
離散型と連続型で定義が異なり、それぞれ以下のように定義されます。

離散型

E(X)=\sum_x xp(x)
V(X)=E(X^2)-(E(X))^2

連続型

E(X)=\int_{-∞}^{∞}xf(x)dx
V(X)=\int_{-∞}^{∞}(x-E(X))^2f(x)dx

ブログを始めてみた

ブログを始めた経緯

以前から興味のある事を独学で勉強していましたが、インプットのみではなかなか知識として定着しないと感じていました。

そこで学んだ事のアウトプットの場として、ブログを始めました。

 

 

ブログの内容

ブログの内容としては、以下のようなものを検討しています。

  • 統計検定 準1級
  • 機械学習
  • プログラミング
  • 読んだ論文の紹介
  • 趣味(お酒、ゲーム、お城巡り、ライブ、野球観戦)

 

 

最後に

 1番の目的は、自身の学びのアウトプットですが、同じ勉強をしている誰かの役に立ったり、議論ができると良いなと思っています。

是非、気軽にコメントしてください。