Description
이 책은 통계학 분야에서 직면하게 되는 많은 계산 문제들을 해결하는 EM 알고리즘, 마르코프체인몬테카를로(Markov chain Monte Carlo, MCMC) 및 변분추론(Variational Inference, VI)인 세 가지 방법들을 소개한다. 이들을 기본적으로 해결하는 몬테카를로 방법을 먼저 설명한다.
첫 번째로, 주로 빈도주의자(frequentist) 관점에서 최대우도추정량을 구하기 위하여 사용되는 EM 알고리즘으로 널리 알려진 기대-최대화(Expectation-Maximization) 알고리즘을 다룬다. 이것은 불완전-자료(incomplete-data) 문제로 가장 잘 설명되는 다양한 상황들에서 최대우도추정을 위한 범용 알고리즘이다.
두 번째로, 지난 30년 동안 또는 그 이상 베이지안통계학자들에게 가장 영향력을 미친 마르코프체인몬테카를로 방법들은 통계계산을 혁신하였으며, 여기서 이를 다루고자 한다. 그들은 복잡한 모형들을 가정하고 수산과학 및 경제학과 같은 다양한 놀라운 분야들에서도 사용을 허용함으로써 심오하게 베이지안통계학의 응용에 상당한 영향을 미쳤다. 물론 베이지안들만이 MCMC를 사용하여 혜택을 볼 수 있는 유일한 것들이 아니고, 다른 통계 설정에서도 MCMC의 사용들이 계속 증가하고 있다. MCMC의 실질적인 중요성은 또한 근본적인 마르코프체인 이론에 대한 광범위하고 심층적인 조사를 촉발시켰다. 마르코프체인몬테카를로 방법들은 통계계산을 더욱더 혁신하였다. MCMC 방법의 사용이 성숙함에 따라 더 깊은 이론적 질문들이 해결되고, 더 복잡한 응용 프로그램이 수행되며, 그 사용이 새로운 연구 분야로 확산되어 간다. 이 책은 광범위한 청중을 위한 참고 자료가 되고 MCMC 방법론의 개발자와 사용자 모두에게 사용될 수 있다. 이 장은 기본 이론, 알고리즘 및 응용 프로그램에 익숙하기를 원하는 MCMC에 대한 새로운 연구원들뿐만이 아니라 대학원생의 이해를 돕기 위한 입문 내용들이 있다. 이 책은 또한 새롭고 진보된 MCMC 방법들의 개발 또는 응용에 관련된 사람들에게 특별한 관심이 있다.
마지막으로, 현대 통계학의 핵심 문제 중 하나는 계산하기 어려운 확률밀도를 근사하는 것이다. 이 문제는 알 수 없는 정량들에 대한 모든 추론을 사후밀도와 관련된 계산으로 구성하는 베이지안통계학에서 특히 중요하다. 변분추론(variational inference, VI)은 최적화를 통해 확률밀도를 근사하는 기계학습 방법이다. 변분추론은 MCMC 알고리즘에 대한 대안적 전략으로 베이즈 모형들에 대한 사후밀도를 근사하는 데 널리 사용된다. VI는 많은 응용 분야에서 사용되며, 고전적 방법인 MCMC의 정확도를 일부 희생시키지만 계산 속도 측면에서는 엄청난 개선을 제공한다. 대규모 문서의 해석, 전산 신경과학 및 컴퓨터 비전과 같은 문제들에 잘 적용되었다. 또한 동기 부여가 되는 예로는 확률적 그래프 모형, 은닉 마르코프 모형, 계통수(phylogenetic trees) 등이 포함된다. VI의 아이디어는 먼저 밀도들의 족을 가정하고, 목표 밀도에 가까운 족의 성분을 찾는 것이다. 가까움은 쿨백-라이블러 발산에 의해 측정된다. 평균장(mean-field)의 변분추론 배후에 있는 아이디어를 복습하고, 지수-족 모형에 적용되는 VI의 특별한 경우에 대해 논의하고, 베이지안 가우시안 혼합분포들을 예제들로 제시하고, 확률적 최적화를 사용하여 대규모 자료로 확장하는 변형을 도출한다. VI는 현대 연구에서 강력하지만 아직도 해결하지 못한 중요한 문제들이 많이 있음을 강조한다.
이 책은 학부 통계학전공 심화과정 및 대학원생을 대상으로 한 교과서이다. 독자가 몬테카를로 기법(예: 확률변수 생성) 또는 마르코프체인 이론에 익숙하다고 가정하지 않는다.
첫 번째로, 주로 빈도주의자(frequentist) 관점에서 최대우도추정량을 구하기 위하여 사용되는 EM 알고리즘으로 널리 알려진 기대-최대화(Expectation-Maximization) 알고리즘을 다룬다. 이것은 불완전-자료(incomplete-data) 문제로 가장 잘 설명되는 다양한 상황들에서 최대우도추정을 위한 범용 알고리즘이다.
두 번째로, 지난 30년 동안 또는 그 이상 베이지안통계학자들에게 가장 영향력을 미친 마르코프체인몬테카를로 방법들은 통계계산을 혁신하였으며, 여기서 이를 다루고자 한다. 그들은 복잡한 모형들을 가정하고 수산과학 및 경제학과 같은 다양한 놀라운 분야들에서도 사용을 허용함으로써 심오하게 베이지안통계학의 응용에 상당한 영향을 미쳤다. 물론 베이지안들만이 MCMC를 사용하여 혜택을 볼 수 있는 유일한 것들이 아니고, 다른 통계 설정에서도 MCMC의 사용들이 계속 증가하고 있다. MCMC의 실질적인 중요성은 또한 근본적인 마르코프체인 이론에 대한 광범위하고 심층적인 조사를 촉발시켰다. 마르코프체인몬테카를로 방법들은 통계계산을 더욱더 혁신하였다. MCMC 방법의 사용이 성숙함에 따라 더 깊은 이론적 질문들이 해결되고, 더 복잡한 응용 프로그램이 수행되며, 그 사용이 새로운 연구 분야로 확산되어 간다. 이 책은 광범위한 청중을 위한 참고 자료가 되고 MCMC 방법론의 개발자와 사용자 모두에게 사용될 수 있다. 이 장은 기본 이론, 알고리즘 및 응용 프로그램에 익숙하기를 원하는 MCMC에 대한 새로운 연구원들뿐만이 아니라 대학원생의 이해를 돕기 위한 입문 내용들이 있다. 이 책은 또한 새롭고 진보된 MCMC 방법들의 개발 또는 응용에 관련된 사람들에게 특별한 관심이 있다.
마지막으로, 현대 통계학의 핵심 문제 중 하나는 계산하기 어려운 확률밀도를 근사하는 것이다. 이 문제는 알 수 없는 정량들에 대한 모든 추론을 사후밀도와 관련된 계산으로 구성하는 베이지안통계학에서 특히 중요하다. 변분추론(variational inference, VI)은 최적화를 통해 확률밀도를 근사하는 기계학습 방법이다. 변분추론은 MCMC 알고리즘에 대한 대안적 전략으로 베이즈 모형들에 대한 사후밀도를 근사하는 데 널리 사용된다. VI는 많은 응용 분야에서 사용되며, 고전적 방법인 MCMC의 정확도를 일부 희생시키지만 계산 속도 측면에서는 엄청난 개선을 제공한다. 대규모 문서의 해석, 전산 신경과학 및 컴퓨터 비전과 같은 문제들에 잘 적용되었다. 또한 동기 부여가 되는 예로는 확률적 그래프 모형, 은닉 마르코프 모형, 계통수(phylogenetic trees) 등이 포함된다. VI의 아이디어는 먼저 밀도들의 족을 가정하고, 목표 밀도에 가까운 족의 성분을 찾는 것이다. 가까움은 쿨백-라이블러 발산에 의해 측정된다. 평균장(mean-field)의 변분추론 배후에 있는 아이디어를 복습하고, 지수-족 모형에 적용되는 VI의 특별한 경우에 대해 논의하고, 베이지안 가우시안 혼합분포들을 예제들로 제시하고, 확률적 최적화를 사용하여 대규모 자료로 확장하는 변형을 도출한다. VI는 현대 연구에서 강력하지만 아직도 해결하지 못한 중요한 문제들이 많이 있음을 강조한다.
이 책은 학부 통계학전공 심화과정 및 대학원생을 대상으로 한 교과서이다. 독자가 몬테카를로 기법(예: 확률변수 생성) 또는 마르코프체인 이론에 익숙하다고 가정하지 않는다.
통계계산 이론 및 응용
$55.65