ぎるばーとのノート

もっともっと遠くへ行きたい 空が広く見える場所まで

一様分布の上限推定【ときどき分布・5記事目】

一様分布の上限推定

上限未知の一様分布

 一様分布で、下限が0(既知)、上限がb(未知)の場合を考えます。

 X \sim \text{Uniform}(0,\ b)

 このときX/bは標準一様分布に従います。

 \frac{X}{b} \sim \text{Uniform}(0,\ 1)

 bが未知母数なので、実際には構成できません。(その値を知っていれば推定の必要もないわけで…。)

 標準一様分布の標本最大値の分布はベータ分布で表されました。
 上限がbの場合も、

 \frac{X_\text{max}}{b} \sim \text{Beta}(n,\ 1)

となります。(補足。(X/b)max = Xmax/bにより。)

上限の推定量

 前節を踏まえて、推定方法(推定量)を考えていきます。

標本最大値に係数をかけて補正

 標本最大値Xmaxをそのまま推定量とするのはどうでしょうか?
 Xmaxは常にb以下の値しかとらないので、推定が過小になってしまいそうです。実際、Xmaxの期待値はbより小さく、偏りをもちます。

 \text{E}(X_\text{max}) = \frac{n}{n + 1} \times b

 その偏りを補正すればいいということで、Xmaxに補正係数をかける方向で考えます。上の式で右辺がbにnの式をかけた形になっているのは好都合です。nの式の部分の逆数をかければ相殺できそうですね。

 \hat{b} = \frac{n + 1}{n} \times X_\text{max}

 これは不偏推定量、つまり期待値が母数に等しい推定量です。

標本最大値に標本最小値を加えて補正

 別の補正方法も考えられます。
 標本最小値Xminを偏りの推定量として用いて、Xmaxに加えたもの

 \hat{b} = X_\text{max} + X_\text{min}

も不偏推定量になります。

 Xminの利用はわりと盲点的な感じでしょうか。

母平均・上限の関係を利用する

 Xmaxの補正とは異なる方向でも考えます。
 母平均と上限の関係を利用します。

 2\mu = b

 左辺中の母平均を標本平均X̄に置き換えることで、bの推定量が得られます。

 \hat{b} = 2\bar{X}

乱数実験

 3つの推定量について、分布の形状や性質を乱数実験で見てみます。

 サンプリングを繰り返して推定量の値を計算します。

  • 繰り返し回数は1万回
  • 標本サイズn = 3, 5, 7, 9, 15, 25
  • 上限b = 10

 推定対象のbの値は10としましたが、これにどんな値を選んでもスケールが変わるだけで、一般性は失われません。

方法1:標本最大値に係数をかけて補正
乱数実験結果1

 分布のピークは10より大きいところにあります。n = 3, 7, 9で、右端より少し内側に分布のピークがあるように見えますが、階級の取り方による「偽のピーク」です。

mean sd median
n = 5 10.00797 1.689505 10.47474
n = 15 10.01684 0.6192549 10.20452
n = 25 9.996876 0.3957555 10.11519

 推定量の不偏性と母数への収束が確認できました。
 推定量の中央値はnが小さいうちは母数よりやや大きく、nが大きくなるにつれて漸近しています。

方法2:標本最大値に標本最小値を加えて補正
乱数実験結果2

 分布のピークは10で、そこを中心として左右対称の山型分布です。

mean sd median
n = 5 10.01039 2.167676 10.01575
n = 15 9.992123 0.8520115 9.994197
n = 25 10.00162 0.5398454 9.998594

 推定量の不偏性と母数への収束が確認できました。標準偏差については、方法1と比較して大きくなっています。
 推定量の中央値も母数に一致しています。なお、このような推定量は中央値不偏推定量(median-unbiased estimator)と呼ばれます。

方法3:母平均・上限の関係を利用する
乱数実験結果3

 方法2と同じく、10を中心として左右対称の山型分布です。分布の広がりはやや大きめです。

mean sd median
n = 5 10.01 2.578272 10.04284
n = 15 10.04683 1.486722 10.04395
n = 25 10.00019 1.167872 10.01244

 推定量の不偏性と中央値不偏性、母数への収束が確認できました。方法2よりもさらに標準偏差が大きくなっています。

最小分散不偏推定量

 不偏推定量のうち分散が最小のものを最小分散不偏推定量(MVUE; minimum-variance unbiased estimator)といいます。

 今回のケースでは、方法1の推定量が最小分散不偏推定量だと知られています。言い換えれば、分散(標準偏差)がより小さい不偏推定量をうまい方法で構成できたりはしないということです。