R 시뮬레이션 (빅데이터와 샘플 데이터를 연결하다)

R 시뮬레이션 (빅데이터와 샘플 데이터를 연결하다)

$35.55
Description
석사 또는 박사 과정에서 공부한 경험이 있다면 대게 샘플 데이터를 이용해서 모집단을 추정하고 예측하는 전통적 연구 방법에 익숙할 것이다. 샘플 데이터로 분석한다는 것은 많은 가정이 요구되는 작업이기도 하며 샘플 데이터의 질에 따라 예측 결과가 달라지기도 하지만, 시간과 돈이라는 현실적인 한계 앞에서 계속해서 데이터만 모을 수도 없는 노릇이다. 전통적 샘플링-추론 방식에 익숙한 분들에게 시뮬레이션이라는 용어는 어쩌면 항공기 모의실험실이나 기상관측 연구소에서나 사용되는 것으로 자신과는 동떨어진 작업이라고 생각할 수도 있다. 하지만 학위과정에서 해결해야 하는 연구과제, 시장분석이나 정치환경과 같은 사회조사, 그리고 샘플이 부족한 연구 환경에서 시뮬레이션 기법은 훌륭한 해결책이 될 수 있다. 이 책은 수학공식을 최소화해서 시뮬레이션 기초 이론을 설명하고 다양한 시뮬레이션 방법을 책에서 제시된 R 코딩을 따라 하면서 이해할 수 있도록 구성됐다. 책을 다 읽고 난 후에는 여러분이 진행하는 프로젝트에서 높은 신뢰성을 가진 결과를 제시하도록 어떻게 시뮬레이션을 적용할 것인지 흥미롭게 고민하고 R에서 과감히 실현해 볼 수 있을 것이다.
저자

마티아스템플

오스트리아비엔나공과대학교경제학과소속통계수학방법론연구소부교수로재직중이다.오스트리아통계국의방법론학자로활동하고있으며,두명의동료연구자와함께파트너십형태로데이터분석data-analysisOG를운영중이다.주요연구분야는대체(imputation),응답자정보의통계적노출통제,시각화,구성데이터분석,전산통계,통계적강건성,다변량방법론등이다.유명과학저널에45편이상의논문을게재했으며,누락값시각화와대체를위한패키지인VIM,합성집단시뮬레이션패키지simPop,구성데이터강건분석패키지robCompositions등여러패키지의저자이자관리자로도활동하고있다.대중들이무료로볼수있는「AustrianJournalofStatistics」의편집장이기도하다.여가시간에는산정상에서그를만날가능성이매우크다.

목차

1장.서론
__시뮬레이션이란무엇이며,어디에적용되는가?
__왜시뮬레이션을사용하는가?
__시뮬레이션과빅데이터
__올바른시뮬레이션방법선택하기
__요약
__참고문헌

2장.R과고성능컴퓨팅
__R통계환경
____R기초
____R에대한아주기본적인내용들
____설치및업데이트
____help
____R작업공간및작업디렉토리
____데이터유형
____누락값
__일반함수,메소드,클래스
__R에서의데이터전처리
____apply와기본R의친구들
____패키지dplyr로하는기본데이터전처리
____패키지data.table을이용한데이터전처리
__고성능컴퓨팅
____코딩에서계산속도가느린함수를찾기위한분석법
____병렬컴퓨팅
____C++인터페이스
__정보시각화
____R의그래픽시스템
____graphics패키지
____ggplot2패키지
__참고문헌

3장.연필기반이론과데이터기반전산솔루션의불일치
__기계수반올림문제
____예제:수를64비트형식으로나타내기
____결정론적케이스에서수렴
____예제:수렴
__문제의상태
__요약
__참고문헌

4장.난수시뮬레이션
__진성난수
__의사난수시뮬레이션
____합동생성기
____선형합동생성기및승산합동생성기
____지연피보나치수열생성기
____그밖의의사난수생성기
__비균등하게분포되는임의변수시뮬레이션
____역함수변환방법
____에일리어스방법또는대체법
____로그선형모델을이용한테이블상의빈도수추정
____기각샘플링
____절단분포
____메트로폴리스-헤이스팅스알고리즘
____깁스샘플링
____MCMC샘플진단
__난수테스트
____난수평가:테스트예제
__요약
__참고문헌

5장.최적화문제를위한몬테카를로기법
__수치최적화
____경사상승/하강탐색방법
____뉴턴-라프슨방법
____범용성을가진최적화방법들
__확률적최적화다루기
____간편한절차(스타트렉,스페이스볼,스페이스볼프린세스)
____메트로폴리스-헤이스팅스분석기법다시보기
____경사기반확률최적화
__요약
__참고문헌

6장.시뮬레이션으로보는확률이론
__확률이론에대한기본내용
__확률분포
____이산확률분포
____연속확률분포
__복권당첨
__대수의약법칙
____황제펭귄과여러분의상사
__중심극한정리
__추정량의속성
____추정량의속성
____신뢰구간
____강건추정량에대한고찰
__요약
__참고문헌

7장.리샘플링방법
__부트스트랩
____오즈비에대한흥미로운예제
____부트스트랩이작동하는이유
____부트스트랩자세히살펴보기
____플러그인원칙
__부트스트랩으로표준오차추정
____부트스트랩을이용한복잡추정의예
__모수부트스트랩
__부트스트랩으로편향추정하기
____부트스트랩으로구하는신뢰구간
__잭나이프
____잭나이프의단점
____관측치d개가제거된잭나이프
____부트스트랩후잭나이프
__교차검증
____고전선형회귀모델
____교차검증의기본개념
____고전적교차검증:70/30방법
____LOO교차검증
____k배교차검증
__요약
__참고문헌

8장.리샘플링방법과몬테카를로테스트의적용
__회귀분석에서의부트스트랩
____부트스트랩을사용해야하는동기
__누락값을포함한적절한분산추정
__시계열분석에서부트스트랩하기
__복합샘플링디자인에서사용되는부트스트랩
__몬테카를로테스트
____흥미로운예제
____몬테카를로테스트의특별한종류인순열테스트
____복수의그룹에대한몬테카를로테스트
____부트스트랩을사용한가설테스트
____다변량정규성테스트
____몬테카를로테스트크기의적합성
____검증력비교
__요약
__참고문헌

9장.EM알고리즘381
__기본EM알고리즘
____전제조건
____EM알고리즘의공식적정의
____EM알고리즘을이해하기위한간단한예
__k평균클러스터링예로보는EM알고리즘
__누락값대체를위한EM알고리즘
__요약
__참고문헌

10장.복합데이터로하는시뮬레이션
__다양한종류의시뮬레이션및소프트웨어
__복합모델을사용해데이터시뮬레이션하기
____모델기반의간단한예제
____혼합데이터를가진모델기반예제
____데이터를시뮬레이션하기위한모델기반접근법
____고차원데이터를시뮬레이션하는예제
____클러스터또는계층구조의유한모집단시뮬레이션하기
__모델기반시뮬레이션연구
____잠재모델예제
____모델기반시뮬레이션의간단한예제
____모델기반시뮬레이션연구
__디자인기반시뮬레이션
____복합설문조사데이터의예
____합성모집단시뮬레이션
____관심있는추정량
____샘플링디자인정의하기
____층화샘플링사용하기
____오염추가
____다른영역에대해별도의시뮬레이션실행
__누락값삽입
__요약
__참고문헌

11장.시스템다이내믹스와에이전트기반모델
__에이전트기반모델
__사랑과증오의역동성
__생태모델링의다이내믹시스템
__요약
__참고문헌

출판사 서평

★이책에서다루는내용★
■데이터에서통찰력을이끌어내기위한데이터시뮬레이션과리샘플링
■고성능컴퓨팅과고도의데이터처리방법등R의고급기능
■분포,데이터,집단시뮬레이션에사용하는난수시뮬레이션
■에이전트기반마이크로시뮬레이션과모델및디자인기반시뮬레이션을기준으로현실과가까운데이터시뮬레이션
■과학적이며현실적인문제를해결할수있도록R을사용한통계솔루션
■boot,simPop,VIM,data.table,dplyr,cvTools,deSolve등다양한R패키지이해
■R만을사용한난수생성방법및시뮬레이션예제와실행방법

★이책의대상독자★
전산방법론과R에익숙한사용자를위한책이다.컴퓨터기반몬테카를로방법과통계시뮬레이션도구로R의고급기능을배워보고싶다면이책은여러분의것이다.

★이책의구성★
1장‘서론’에서는데이터과학과통계분야에서사용되는시뮬레이션실험의일반적인목적인“시뮬레이션은왜필요하며,어디에적용되는가?”라는질문에답을하고,빅데이터를다루는특별한케이스를논의한다.
2장‘R과고성능컴퓨팅’에서는R을이용해할수있는고급컴퓨팅,데이터전처리,시각화작업을종합적으로다룬다.
3장‘연필기반이론과데이터기반전산솔루션의불일치’에서는결정론적환경에서발생할수있는수치정확성,반올림,수렴과관련된이슈를다룬다.
4장‘난수시뮬레이션’에서는균등난수시뮬레이션과여러종류의분산으로전환하기위한변형방법으로시작해다양한종류의마르코프체인몬테카를로난수생성방법을논의한다.
5장‘최적화문제를위한몬테카를로기법’에서는결정론적최적화방법과확률론적최적화방법을소개한다.
6장‘시뮬레이션으로보는확률이론’에서는통계학에서필요한기본이론에집중한다.예로는대수의법칙그리고중심극한정리가시뮬레이션을통해소개된다.
7장‘리샘플링방법’에서는부트스트랩,잭나이프,교차타당성검증을종합적으로설명한다.
8장‘리샘플링방법과몬테카를로테스트의적용’에서는회귀분석,대체(imputation),시계열분석등다양한분야에서사용할수있는적용방법을제시한다.추가로,몬테카를로테스트와함께순열테스트및부트스트랩같은변형된형태를소개한다.
9장‘EM알고리즘’에서는반복을통해최적값을얻는기대극대화법을소개한다.누락값을묶고대체하는애플리케이션을제시한다.
10장‘복합데이터로하는시뮬레이션’에서는일반적으로방법간비교를위해사용되고에이전트기반마이크로시뮬레이션의투입데이터로활용될인구데이터와합성데이터를시뮬레이션하는방법을소개한다.
11장‘시스템다이내믹스와에이전트기반모델’에서는에이전트기반마이크로시뮬레이션모델을논의하고복잡한변화시스템을공부하기위해시스템다이내믹스에서사용되는기본모델을제시한다.