一様分布の上限推定
上限未知の一様分布
一様分布で、下限が0(既知)、上限がb(未知)の場合を考えます。
このときX/bは標準一様分布に従います。
bが未知母数なので、実際には構成できません。(その値を知っていれば推定の必要もないわけで…。)
標準一様分布の標本最大値の分布はベータ分布で表されました。
上限がbの場合も、
となります。(補足。(X/b)max = Xmax/bにより。)
上限の推定量
前節を踏まえて、推定方法(推定量)を考えていきます。
標本最大値に係数をかけて補正
標本最大値Xmaxをそのまま推定量とするのはどうでしょうか?
Xmaxは常にb以下の値しかとらないので、推定が過小になってしまいそうです。実際、Xmaxの期待値はbより小さく、偏りをもちます。
その偏りを補正すればいいということで、Xmaxに補正係数をかける方向で考えます。上の式で右辺がbにnの式をかけた形になっているのは好都合です。nの式の部分の逆数をかければ相殺できそうですね。
標本最大値に標本最小値を加えて補正
別の補正方法も考えられます。
標本最小値Xminを偏りの推定量として用いて、Xmaxに加えたもの
も不偏推定量になります。
Xminの利用はわりと盲点的な感じでしょうか。
乱数実験
3つの推定量について、分布の形状や性質を乱数実験で見てみます。
サンプリングを繰り返して推定量の値を計算します。
- 繰り返し回数は1万回
- 標本サイズn = 3, 5, 7, 9, 15, 25
- 上限b = 10
推定対象のbの値は10としましたが、これにどんな値を選んでもスケールが変わるだけで、一般性は失われません。
方法1:標本最大値に係数をかけて補正
分布のピークは10より大きいところにあります。n = 3, 7, 9で、右端より少し内側に分布のピークがあるように見えますが、階級の取り方による「偽のピーク」です。
mean | sd | median | |
---|---|---|---|
n = 5 | 10.00797 | 1.689505 | 10.47474 |
n = 15 | 10.01684 | 0.6192549 | 10.20452 |
n = 25 | 9.996876 | 0.3957555 | 10.11519 |
推定量の不偏性と母数への収束が確認できました。
推定量の中央値はnが小さいうちは母数よりやや大きく、nが大きくなるにつれて漸近しています。
方法2:標本最大値に標本最小値を加えて補正
分布のピークは10で、そこを中心として左右対称の山型分布です。
mean | sd | median | |
---|---|---|---|
n = 5 | 10.01039 | 2.167676 | 10.01575 |
n = 15 | 9.992123 | 0.8520115 | 9.994197 |
n = 25 | 10.00162 | 0.5398454 | 9.998594 |
推定量の不偏性と母数への収束が確認できました。標準偏差については、方法1と比較して大きくなっています。
推定量の中央値も母数に一致しています。なお、このような推定量は中央値不偏推定量(median-unbiased estimator)と呼ばれます。
方法3:母平均・上限の関係を利用する
方法2と同じく、10を中心として左右対称の山型分布です。分布の広がりはやや大きめです。
mean | sd | median | |
---|---|---|---|
n = 5 | 10.01 | 2.578272 | 10.04284 |
n = 15 | 10.04683 | 1.486722 | 10.04395 |
n = 25 | 10.00019 | 1.167872 | 10.01244 |