順序統計量に関する備忘録.
ここでは単に確率変数と言えば実数値をとるものとし, 確率変数 \(X\) に対して, その分布関数(distribution function)とは
\[F_X(x)=\mathrm{Pr}[X\leq x]\]
で定義される \(F_X:\mathbb{R}\to[0,1]\) のこととします.
独立同分布な確率変数 \(X_1,\ldots,X_n\) が与えられたとき, それらを小さい順に並べ替えたもの
\[X_{(1)}\leq X_{(2)}\leq \cdots\leq X_{(n)}\]
を順序統計量(order statistics)と言います. 特に各 \(1\leq i\leq n\) について, \(X_{(i)}\) を 第 \(i\) 順序統計量 ( \(i\) th static order) と言います.
主に重要な定理は次です.
定理
独立同分布な確率変数 \(X_1,\ldots,X_n\) が与えられており, それらの分布関数が \(F:\mathbb{R}\to[0,1]\) であるとする. すると, 第 \(i\) 順序統計量 \(X_{(i)}\) の分布関数は
\[F_{X_{(i)}}(x)=\sum_{j=i}^n\binom{n}{j}F(x)^j(1-F(x))^{n-j}\]
で与えられる. 特に \(X_1\) が密度関数 \(f\) をもてば, 各 \(X_{(i)}\) も密度関数 \(f_{X_{(i)}}\) をもち,
\[f_{X_{(i)}}(x)=i\binom{n}{i} F(x)^{i-1}(1-F(x))^{n-i}f(x)\]
が成立する.
証明
各 \(1\leq i\leq n\) と \(x\in\mathbb{R}\) について,
\(\begin{align}\Pr[X_{(i)}\leq x]&=\Pr[X_1,\ldots,X_n の中のすくなくとも i 個が x 以下]\\&=\sum_{j=i}^n\Pr[X_1,\ldots,X_n の中のちょうど j 個が x 以下]\\&=\sum_{j=i}^n\binom{n}{j}F(x)^j(1-F(x))^{n-j}\end{align}\)
より前半が従う. 後半は絶対連続性が積や和で保たれることから \(F\) が絶対連続であれば, \(F_{X(i)}\) もそうであり,
\(\begin{align}f_{X(i)}(x)&=\frac{d}{dx}\sum_{j=i}^n\binom{n}{j}F(x)^j(1-F(x))^{n-j}\\&=\sum_{j=i}^{n-1}\left(j\binom{n}{j}F(x)^{j-1}(1-F(x))^{n-j}f(x)\right.\\&\left.-(n-j)\binom{n}{j}F(x)^j(1-F(x))^{n-j-1}f(x)\right)\\&+nF(x)^{n-1}f(x)\\&=i\binom{n}{i}F(x)^{i-1}(1-F(x))^{n-i}f(x)\\&+\sum_{j=i}^{n-1}\left((j+1)\binom{n}{j+1}F(x)^{j}(1-F(x))^{n-j-1}f(x)\right.\\&\left.-(n-j)\binom{n}{j}F(x)^j(1-F(x))^{n-j-1}f(x)\right)\\&=i\binom{n}{i} F(x)^{i-1}(1-F(x))^{n-i}f(x)\end{align}\)
となるので, 示したいことが得られる.
コメントを残す