ぎるばーとのノート

もっともっと遠くへ行きたい 空が広く見える場所まで

一様分布のレンジ推定【ときどき分布・6記事目】

一様分布のレンジ推定

下限・上限未知の一様分布

 前回は、下限が0と知っている前提で、上限未知の一様分布を仮定しました。
 そういう場合もありえるけれど、どちらかといえば下限も上限も未知なのが普通の状況ではないでしょうか。

 一様分布で、下限がa(未知)、上限がb(未知)とします。

 X \sim \text{Uniform}(a,\ b)

 このとき次の変数変換により標準一様分布になります。

 \frac{X - a}{b - a} \sim \text{Uniform}(0,\ 1)

 また、標本レンジの母レンジに対する比は次の分布に従います。

 \frac{X_\text{max} - X_\text{min}}{b - a} \sim \text{Beta}(n - 1,\ 2)

 未知母数であるaとbは、b − aの形で式に現れています。なので、標本レンジの分布は母レンジを通してのみaとbに依存します。

レンジの推定量

 ここからは、b − a = Rとします。標本レンジXmax − Xminは常にR以下の値しかとらないので、Xmax − Xminの期待値はRより小さくなります。

 \text{E}(X_\text{max} - X_\text{min}) = \frac{n - 1}{n + 1} \times R

 前回のように補正係数をかけるやり方で偏りを補正できそうです。
 標本レンジに、上の式の右辺の係数をひっくり返してかけたもの

 \hat{R} = \frac{n + 1}{n - 1} \times (X_\text{max} - X_\text{min})

は、期待値がRに等しくなるので不偏推定量です。

乱数実験

 乱数実験で分布を見てみます。

  • 繰り返し回数は1万回
  • 標本サイズn = 3, 5, 7, 9, 15, 25
  • 下限a = 50
  • 上限b = 60
  • 母レンジ(推定対象)R = 10
乱数実験結果

 n = 3では、左右対称の山型分布です。(これはBeta(2, 2)をスケールしたもの。)
 n = 5からは、左(下側)に裾が長い歪んだ山型分布で、ピークは10より大きいところにあります。

mean sd median
n = 5 10.05336 2.661344 10.36774
n = 15 9.980649 0.9286946 10.16732
n = 25 10.00017 0.5570673 10.11207

 推定量の不偏性と母数への収束が確認できました。
 推定量の中央値は、n = 3では母数に一致し、その後母数よりやや大きくなったあと、また近づいていく感じです。