깁스 표집

위키백과 ― 우리 모두의 백과사전.

수학물리학에서 깁스 표집([Gibbs sampling])은 두개 이상의 확률 변수의 결합 확률 분포로부터 일련의 표본을 생성하는 알고리즘이다. 이것은 히스토그램을 생성하기 위해 결합 분포를 근사하거나 예측치와 같은 적분 값을 계산하기 위한 목적으로 사용된다. 깁스 표집은 메트로폴리스-해스팅스 알고리즘의 특별한 예이며, 마르코프 연쇄 몬테 카를로 알고리즘의 한 예이다. 이 알고리즘은 물리학자 깁스의 이름을 따서 명명되었다.

[편집] 구현

표본 X가 길이가 d이며, 사전 분포  g(\theta_1, \ldots , \theta_d)를 갖는 모수 벡터 \theta \in \Theta \,\!에 의한 분포로부터 얻어진 표본이라고 하자. d가 매우 커서 θi의 경계 분포를 구하기 위해 수치 적분을 하기 어려울 수 있다. 그럴 경우 경계 분포를 계산하는 대안은 다음과 같은 두 단계를 반복함으로서 공간 Θ에서의 마르코프 연쇄를 생성하는 것이다.

  1. 임의의 지수 1 \leq j \leq d를 선택한다.
  2. g(\theta_1, \ldots , \theta_{j-1} , \, \cdot \, , \theta_{j+1} , \ldots , \theta_d )에 따라 새로운 값 θj를 선택한다.

이러한 단계는 원하는 불변 분포 g를 갖는 가역 마르코프 연쇄를 정의한다.

[편집] 둘러보기

[편집] 참고문헌

  • George Casella and Edward I. George. "Explaining the Gibbs sampler". The American Statistician, 46:167-174, 1992. (Basic summary and many references.)
  • A.E. Gelfand and A.F.M. Smith. "Sampling-Based Approaches to Calculating Marginal Densities". J. American Statistical Association, 85:398-409, 1990.
  • Andrew Gelman, John B. Carlin, Hal S. Stern, and Donald B. Rubin. Bayesian Data Analysis. London: Chapman and Hall. First edition, 1995. (See Chapter 11.)
  • S. Geman and D. Geman. "Stochastic Relaxation, Gibbs Distributions, and the Bayesian Restoration of Images". IEEE Transactions on Pattern Analysis and Machine Intelligence, 6:721-741, 1984.
  • C.P. Robert and G. Casella. "Monte Carlo Statistical Methods" (second edition). New York: Springer-Verlag, 2004.
이 문서는 토막글입니다. 서로의 지식을 모아 알차게 문서를 완성해 갑시다.