ぎるばーとのノート

もっともっと遠くへ行きたい 空が広く見える場所まで

条件付き分布 - 確率分布チートシート

自サイト(HTML版)からの転載です。



条件付き分布

★は条件付き分布も同じ種類の分布となることを表す。

指数分布

  •  X \text{Exp}(\lambda)にしたがうとき、 tを非負の実数として、 (X - t \mid X \geq t) \text{Exp}(\lambda)にしたがう。〔無記憶性★〕1
    無記憶性は \text{P}(X \gt s + t \mid X \gt t) = \text{P}(X \gt s)のように表される。(条件が X \gt tでも X \geq tでも実質的な違いはない。)この性質は、ある出来事が起こるまでにかかる時間の分布が時間経過によって変化しないことを意味する。

一様分布

  •  X \text{U}(a,\ b)にしたがうとき、 a', b'を実数( a \leq a' \lt b' \leq bを満たす)として、 (X \mid a' \leq X \leq b') \text{U}(a',\ b')にしたがう。〔値を制限★〕証明

パレート分布

  •  X \text{Pareto}(x_\mathrm{m},\ \alpha)にしたがうとき、 sを実数( s \geq x_\mathrm{m}を満たす)として、 (X \mid X \geq s) \text{Pareto}(x_\mathrm{m} = s,\ \alpha)にしたがう。〔値を制限★〕証明

二項分布

  •  X \text{B}(n_X,\ p)に、 Y \text{B}(n_Y,\ p)に独立にしたがうとき、 (X \mid X + Y = w) \text{Hyper}(n = w,\ N = n_X + n_Y,\ K = n_X)にしたがう。〔和を固定〕証明
  •  X_1, \ldots, X_nがそれぞれ \text{B}(n_i,\ p)に独立にしたがうとき、 W = \sum_i X_iとすると、 (X_1, \ldots, X_n \mid W = w) \text{Hyper}(n = w,\ N = n_1 + \cdots + n_n,\ \boldsymbol{K} = (n_1, \ldots, n_n))にしたがう。〔総和を固定〕証明

ポアソン分布

  •  X \text{Poisson}(\lambda_X)に、 Y \text{Poisson}(\lambda_Y)に独立にしたがうとき、 (X \mid X + Y = w) \text{B}\!\left(n = w,\ p = \frac{\lambda_X}{\lambda_X + \lambda_Y}\right)にしたがう。〔和を固定〕証明
  •  X_1, \ldots, X_nがそれぞれ \text{Poisson}(\lambda_i)に独立にしたがうとき、 W = \sum_i X_iとすると、 (X_1, \ldots, X_n \mid W = w) \text{Mult}\!\left(n = w,\ \boldsymbol{p} = \left(\frac{\lambda_1}{\lambda_1 + \cdots + \lambda_n}, \ldots, \frac{\lambda_n}{\lambda_1 + \cdots + \lambda_n}\right)\right)にしたがう。〔総和を固定〕証明

負の二項分布

  •  X \text{NB}(r_X,\ p)に、 Y \text{NB}(r_Y,\ p)に独立にしたがうとき、 (X \mid X + Y = w) \text{BetaBin}(n = w,\ \alpha = r_X,\ \beta = r_Y)にしたがう。※ \text{BetaBin}(n,\ \alpha,\ \beta)はベータ二項分布を表す。〔和を固定〕証明
  •  X_1, \ldots, X_nがそれぞれ \text{NB}(r_i,\ p)に独立にしたがうとき、 W = \sum_i X_iとすると、 (X_1, \ldots, X_n \mid W = w) \text{DirichletMult}(n = w,\ \boldsymbol{\alpha} = (r_1, \ldots, r_n))にしたがう。※ \text{DirichletMult}(n,\ \boldsymbol{\alpha})はディリクレ多項分布を表す。〔総和を固定〕証明

幾何分布

  •  X, Yが同一の \text{Geom}(p)に独立にしたがうとき、 (X \mid X + Y = w) \text{DiscreteUnif}(0,\ b = w)にしたがう。※ \text{DiscreteUnif}(a,\ b)は離散一様分布を表す。〔和を固定〕証明
  •  X_1, \ldots, X_nが同一の \text{Geom}(p)に独立にしたがうとき、 W = \sum_i X_iとすると、 (X_1, \ldots, X_n \mid W = w) \text{DirichletMult}(n = w,\ \boldsymbol{\alpha} = (1, \ldots, 1))にしたがう。※ \text{DirichletMult}(n,\ \boldsymbol{\alpha})はディリクレ多項分布を表す。〔総和を固定〕証明
  •  X \text{Geom}(p)にしたがうとき、 nを非負の整数として、 (X - n \mid X \geq n) \text{Geom}(p)にしたがう。〔無記憶性★〕1
    離散確率分布の無記憶性は \text{P}(X \gt m + n \mid X \geq n) = \text{P}(X \gt m)または \text{P}(X \gt m + n \mid X \gt n) = \text{P}(X \gt m)のように表される。この性質は、試行が初めて成功するまでの失敗回数(試行回数)の分布が履歴によって変化しないことを意味する。「失敗回数を数える」幾何分布は条件 X \geq nの無記憶性を満たす。
  •  X \text{Geom}_\text{[number-of-trials]}(p)にしたがうとき、 nを非負の整数として、 (X - n \mid X \gt n) \text{Geom}_\text{[number-of-trials]}(p)にしたがう。〔無記憶性(試行回数)★〕証明
    「試行回数を数える」幾何分布は条件 X \gt nの無記憶性を満たす。

多変量正規分布

  • 多変量正規分布で成分を部分的に固定した条件付き分布は多変量正規分布になる。 \boldsymbol{X} = (X_1, \ldots, X_l, \ldots, X_m) \text{N}(\boldsymbol{\mu},\ \boldsymbol{\Sigma})にしたがうとき、 \boldsymbol{X}_1 = (X_1, \ldots, X_l),\ \boldsymbol{X}_2 = (X_{l + 1}, \ldots, X_m)とすると、 (\boldsymbol{X}_1 \mid \boldsymbol{X}_2 = \boldsymbol{x}_2) \text{N}(\boldsymbol{\mu}_{1 \mid 2},\ \boldsymbol{\Sigma}_{1 \mid 2})にしたがう。
条件付き分布の平均
 \boldsymbol{\mu}_{1 \mid 2} = \boldsymbol{\mu}_1 + \boldsymbol{\Sigma}_{12}\,{\boldsymbol{\Sigma}_{22}}^{-1}\,(\boldsymbol{x}_2 - \boldsymbol{\mu}_2)
条件付き分布の共分散行列
 \boldsymbol{\Sigma}_{1 \mid 2} = \boldsymbol{\Sigma}_{11} - \boldsymbol{\Sigma}_{12}\,{\boldsymbol{\Sigma}_{22}}^{-1}\,\boldsymbol{\Sigma}_{21}

ただし、 \boldsymbol{\mu}_1 = (\mu_1, \ldots, \mu_l),\ \boldsymbol{\mu}_2 = (\mu_{l + 1}, \ldots, \mu_m)であり、 \boldsymbol{\Sigma}_{11}, \boldsymbol{\Sigma}_{12}, \boldsymbol{\Sigma}_{21}, \boldsymbol{\Sigma}_{22} \boldsymbol{\Sigma} \left[\begin{smallmatrix}\boldsymbol{\Sigma}_{11} & \boldsymbol{\Sigma}_{12} \\ \boldsymbol{\Sigma}_{21} & \boldsymbol{\Sigma}_{22}\end{smallmatrix}\right]のように区分けしたブロック行列を表す。〔成分を固定★〕2
変換§多変量正規分布#成分の並べ替えによって任意の成分を固定する場合に一般化できる。

多項分布

  • 多項分布で成分を部分的に固定した条件付き分布は多項分布になる。 \boldsymbol{X} = (X_1, \ldots, X_l, \ldots, X_m) \text{Mult}(n,\ \boldsymbol{p})にしたがうとき、 \boldsymbol{X}_1 = (X_1, \ldots, X_l),\ \boldsymbol{X}_2 = (X_{l + 1}, \ldots, X_m)とすると、 (\boldsymbol{X}_1 \mid \boldsymbol{X}_2 = (k_{l + 1}, \ldots, k_m)) \text{Mult}\!\left(n - (k_{l + 1} + \cdots + k_m),\ \frac{\boldsymbol{p}_1}{1 - (p_{l + 1} + \cdots + p_m)}\right)にしたがう。ただし、 \boldsymbol{p}_1 = (p_1, \ldots, p_l)である。〔成分を固定★〕3
    変換§多項分布#成分の並べ替えによって任意の成分を固定する場合に一般化できる。

多変量超幾何分布

  • 多変量超幾何分布で成分を部分的に固定した条件付き分布は多変量超幾何分布になる。 \boldsymbol{X} = (X_1, \ldots, X_l, \ldots, X_m) \text{Hyper}(n,\ N,\ \boldsymbol{K})にしたがうとき、 \boldsymbol{X}_1 = (X_1, \ldots, X_l),\ \boldsymbol{X}_2 = (X_{l + 1}, \ldots, X_m)とすると、 (\boldsymbol{X}_1 \mid \boldsymbol{X}_2 = (k_{l + 1}, \ldots, k_m)) \text{Hyper}(n - (k_{l + 1} + \cdots + k_m),\ N - (K_{l + 1} + \cdots + K_m),\ \boldsymbol{K}_1)にしたがう。ただし、 \boldsymbol{K}_1 = (K_1, \ldots, K_l)である。〔成分を固定★〕4
    変換§多変量超幾何分布#成分の並べ替えによって任意の成分を固定する場合に一般化できる。

周辺分布

多変量正規分布

  •  \boldsymbol{X} = (X_1, \ldots, X_m) \text{N}(\boldsymbol{\mu},\ \boldsymbol{\Sigma})にしたがうとき、 X_i \text{N}(\mu_i,\ {\sigma_i}^2)にしたがう。〔周辺分布〕5
  • 多変量正規分布の多次元周辺分布は多変量正規分布である。たとえば X_mを消去した (X_1, \ldots, X_{m - 1})は、 \boldsymbol{\mu}から \mu_mを取り除いたものを \boldsymbol{\mu}' \boldsymbol{\Sigma}から m行目・ m列目を取り除いたものを \boldsymbol{\Sigma}'で表すと、 \text{N}(\boldsymbol{\mu}',\ \boldsymbol{\Sigma}')にしたがう。一般の場合も、消去する成分の添字の集合を Aで表すと、 \boldsymbol{\mu}から Aに属する添字の成分を、 \boldsymbol{\Sigma}から Aに属する添字の行・列を取り除けばよい。〔多次元周辺分布★〕5

ディリクレ分布

  •  \boldsymbol{X} = (X_1, \ldots, X_m) \text{Dirichlet}(\boldsymbol{\alpha})にしたがうとき、 X_i \text{Beta}(\alpha_i,\ \alpha_1 + \cdots + \alpha_m - \alpha_i)にしたがう。〔周辺分布〕証明
  • ディリクレ分布で成分をグループに分けて、グループごとに集約(成分を合計)した分布はディリクレ分布になる。成分の添字の集合 \{1, \ldots, m\}を部分集合に分割したものを A_1, \ldots, A_lで表し、 Y_1, \ldots, Y_lをそれぞれ Y_j = \sum_{i \in A_j} X_iとすると、 (Y_1, \ldots, Y_l) \text{Dirichlet}(\boldsymbol{\alpha} = (\alpha_{Y_1}, \ldots, \alpha_{Y_l}))にしたがう。ただし、 \alpha_{Y_j} = \sum_{i \in A_j} \alpha_iである。〔グループ化★〕証明

多項分布

  •  \boldsymbol{X} = (X_1, \ldots, X_m) \text{Mult}(n,\ \boldsymbol{p})にしたがうとき、 X_i \text{B}(n,\ p_i)にしたがう。〔周辺分布〕3
  • 多項分布で成分をグループに分けて、グループごとに集約(成分を合計)した分布は多項分布になる。成分の添字の集合 \{1, \ldots, m\}を部分集合に分割したものを A_1, \ldots, A_lで表し、 Y_1, \ldots, Y_lをそれぞれ Y_j = \sum_{i \in A_j} X_iとすると、 (Y_1, \ldots, Y_l) \text{Mult}(n,\ \boldsymbol{p} = (p_{Y_1}, \ldots, p_{Y_l}))にしたがう。ただし、 p_{Y_j} = \sum_{i \in A_j} p_iである。〔グループ化★〕3

カテゴリ分布

  •  \boldsymbol{X} = (X_1, \ldots, X_m) \text{Cat}(\boldsymbol{p})にしたがうとき、 X_i \text{Bernoulli}(p_i)にしたがう。〔周辺分布〕3
  • カテゴリ分布で成分をグループに分けて、グループごとに集約(成分を合計)した分布はカテゴリ分布になる。成分の添字の集合 \{1, \ldots, m\}を部分集合に分割したものを A_1, \ldots, A_lで表し、 Y_1, \ldots, Y_lをそれぞれ Y_j = \sum_{i \in A_j} X_iとすると、 (Y_1, \ldots, Y_l) \text{Cat}(\boldsymbol{p} = (p_{Y_1}, \ldots, p_{Y_l}))にしたがう。ただし、 p_{Y_j} = \sum_{i \in A_j} p_iである。〔グループ化★〕3

多変量超幾何分布

  •  \boldsymbol{X} = (X_1, \ldots, X_m) \text{Hyper}(n,\ N,\ \boldsymbol{K})にしたがうとき、 X_i \text{Hyper}(n,\ N,\ K_i)にしたがう。〔周辺分布〕4
  • 多変量超幾何分布で成分をグループに分けて、グループごとに集約(成分を合計)した分布は多変量超幾何分布になる。成分の添字の集合 \{1, \ldots, m\}を部分集合に分割したものを A_1, \ldots, A_lで表し、 Y_1, \ldots, Y_lをそれぞれ Y_j = \sum_{i \in A_j} X_iとすると、 (Y_1, \ldots, Y_l) \text{Hyper}(n,\ N,\ \boldsymbol{K} = (K_{Y_1}, \ldots, K_{Y_l}))にしたがう。ただし、 K_{Y_j} = \sum_{i \in A_j} K_iである。〔グループ化★〕4

合成分布(無条件分布)

★は合成分布(無条件分布)も同じ種類の分布となることを表す。

正規分布

  •  (X \mid \mu) \text{N}(\mu,\ \sigma^2)に、 \mu \text{N}(\mu_\mu,\ {\sigma_\mu}^2)にしたがうとき、条件なしの X \text{N}(\mu_\mu,\ \sigma^2 + {\sigma_\mu}^2)にしたがう。〔正規分布合成★〕6
  •  (X \mid \sigma^2) \text{N}(0,\ \sigma^2)に、 \sigma^2 \chi^{-2}(\nu)にしたがうとき、条件なしの X \frac{1}{\sqrt{\nu}}倍された t(\nu)にしたがう。※ \chi^{-2}(\nu)は逆カイ2乗分布を表す。〔逆カイ2乗分布合成〕7
     \sigma^2 \chi^{-2}(\nu)にしたがうの部分は、 \tau = \frac{1}{\sigma^2} \chi^2(\nu)にしたがうと言い換えても同じである。

二項分布

  •  (X \mid n) \text{B}(n,\ p)に、 n \text{B}(n_n,\ p_n)にしたがうとき、条件なしの X \text{B}(n_n,\ pp_n)にしたがう。〔二項分布合成★〕6
  •  (X \mid n) \text{B}(n,\ p)に、 n \text{Poisson}(\lambda_n)にしたがうとき、条件なしの X \text{Poisson}(p\lambda_n)にしたがう。〔ポアソン分布合成〕6
  •  (X \mid n) \text{B}(n,\ p)に、 n \text{NB}(r_n,\ p_n)にしたがうとき、条件なしの X \text{NB}\!\left(r_n,\ \frac{p_n}{p + p_n - pp_n}\right)にしたがう。〔負の二項分布合成〕6
  •  (X \mid p) \text{B}(n,\ p)に、 p \text{U}(0,\ 1)にしたがうとき、条件なしの X \text{DiscreteUnif}(0,\ b = n)にしたがう。※ \text{DiscreteUnif}(a,\ b)は離散一様分布を表す。〔標準一様分布合成〕1
  •  (X \mid p) \text{B}(n,\ p)に、 p \text{Beta}(\alpha,\ \beta)にしたがうとき、条件なしの X \text{BetaBin}(n,\ \alpha,\ \beta)にしたがう。※ \text{BetaBin}(n,\ \alpha,\ \beta)はベータ二項分布を表す。〔ベータ分布合成〕1

ベルヌーイ分布

  •  (X \mid p) \text{Bernoulli}(p)に、 p \text{Beta}(\alpha,\ \beta)にしたがうとき、条件なしの X \text{Bernoulli}\!\left(p = \frac{\alpha}{\alpha + \beta}\right)にしたがう。〔ベータ分布合成★〕証明

ポアソン分布

  •  (X \mid \lambda) \text{Poisson}(\lambda)に、 \lambda \text{Exp}(\lambda)にしたがうとき、条件なしの X \text{Geom}\!\left(p = \frac{\lambda}{1 + \lambda}\right)にしたがう。〔指数分布合成〕8
  •  (X \mid \lambda) \text{Poisson}(\lambda)に、 \lambda \text{Gamma}(\alpha,\ \beta)にしたがうとき、条件なしの X \text{NB}\!\left(r = \alpha,\ p = \frac{\beta}{1 + \beta}\right)にしたがう。〔ガンマ分布合成〕8

多項分布

  •  (\boldsymbol{X} \mid \boldsymbol{p}) \text{Mult}(n,\ \boldsymbol{p})に、 \boldsymbol{p} \text{Dirichlet}(\boldsymbol{\alpha})にしたがうとき、条件なしの \boldsymbol{X} \text{DirichletMult}(n,\ \boldsymbol{\alpha})にしたがう。※ \text{DirichletMult}(n,\ \boldsymbol{\alpha})はディリクレ多項分布を表す。〔ディリクレ分布合成〕9

カテゴリ分布

  •  (\boldsymbol{X} \mid \boldsymbol{p}) \text{Cat}(\boldsymbol{p})に、 \boldsymbol{p} \text{Dirichlet}(\boldsymbol{\alpha})にしたがうとき、条件なしの \boldsymbol{X} \text{Cat}\!\left(\boldsymbol{p} = \frac{\boldsymbol{\alpha}}{\alpha_1 + \cdots + \alpha_m}\right)にしたがう。〔ディリクレ分布合成★〕証明



  1. Leemis and McQueston. Univariate Distribution Relationships.
  2. Joram Soch. "Conditional distributions of the multivariate normal distribution". The Book of Statistical Proofs.
  3. Kyle Siegrist. "The Multinomial Distribution". Random.
  4. Kyle Siegrist. "The Multivariate Hypergeometric Distribution". Random.
  5. Joram Soch. "Marginal distributions of the multivariate normal distribution". The Book of Statistical Proofs.
  6. Villa and Escobar. Using Moment Generating Functions to Derive Mixture Distributions.
  7. John D. Cook. "Student-t as a mixture of normals" (PDF).
    〈注意〉証明に現れる逆ガンマ分布をスケーリングしたものが逆カイ2乗分布にあたる。
  8. John D. Cook. "Notes on the negative binomial distribution" (PDF).
    〈注意〉文書中、ガンマ分布の \betaをスケールパラメータ(このチートシートでの \betaの逆数)としている。
  9. Thomas P. Minka. "Estimating a Dirichlet distribution" (PDF).