吉布斯采样方法
概述
本文介绍Gibbs采样方法, 处理高维数据的采样问题. 在处理的过程中,高维数据的联合分布已知但不方便直接采样,而相应的条件分布比较好采样.那么可以根据条件分布采样来得到符合联合分布的多维数据的样本.
二维的Gibbs采样
回顾细致平稳条件:
在二维的情况下上式中状态i或j,都变成一个二维的向量,记为 $(x_1,x_2)$. 注意上式中P(i,j)不是联合概率分布,正确的表述应该是条件概率分布. 对于联合概率分布一次采样得到n维向量,往往很难. Gibbs采样的思路为1次采样1维数据.
令
代入细致平稳条件得到
化简得到
最后得到,
上式就是一次采样一维变量的细致平稳条件.
$\pi$与P是一致的.也就是说 $\pi(x_1^t, x_2^t) = P(x_1^t,x_2^t) = P(x_1^t) P(x_2^t \vert x_1^t)$ .
细致平稳条件就可以写成
很好,上式左右两边恒等. 结论为 $\pi$ 与P一致时满足细致平稳条件. 无需再考虑接受率的问题.
具体的操作步骤为
- 随机初始化初始状态值 $x_1^1,x_2^1$
从条件概率分布 $P(x_2 x_1^t)$ 中采样得到样本 $x_2^{t+1}$ - 从条件概率分布 $P(x_1^{t+1} \vert x_2^{t+1})$ 中采样得到样本 $x_1^{t+1}$
- 重复2,3步得到足够的样本 { $(x_1^1,x_2^1),(x_1^2,x_2^2),…,(x_1^t,x_2^t)$ }
二维的Gibbs采样例子
从二维正态分布$Norm(\mu,\Sigma)$,用Gibbs采样方法进行采样.
均值 $\mu = (\mu_1,\mu_2) = (5,-1)$
协方差矩阵 $\Sigma = \left( \begin{array}{ccc} \sigma_X^2&\rho\sigma_X\sigma_Y \ \rho\sigma_X\sigma_Y &\sigma_Y^2 \end{array} \right) = \left( \begin{array}{ccc} 1&1 \ 1&4 \end{array} \right)$
联合概率密度函数为
$\rho$ 为相关系数
在例子中相应的就有
参考
刘建平的博客 http://www.cnblogs.com/pinard/p/6645766.html