컴퓨터 시대의 통계적 추론 : 연습문제 포함 - 에이콘 데이터 과학 시리즈 (양장)

컴퓨터 시대의 통계적 추론 : 연습문제 포함 - 에이콘 데이터 과학 시리즈 (양장)

$40.00
Description
베이즈 규칙이 발견된 1763년부터 지금까지, 250년이 넘는 시간 동안의 수많은 알고리듬의 개발과 각 알고리듬의 정확도에 관여된 추론의 발전에 관해 설명하는 책이다. '추론'이 '단순히 알고리듬의 정확도를 말하는 것' 이상의 것임을 보여주며, 빅데이터 시대의 여러 경험적 기법을 세세히 알려준다. 또한 전통적 기법의 시대인 베이즈, 빈도주의, 피셔주의 시대와 컴퓨터가 등장한 초기 시대인 1950년에서 1990년, 그리고 그 이후부터 현재까지의 세 가지 연대를 나눠, 각 시대에 있어 알고리듬과 추론의 발전에 대해 설명한다. 각 장은 서로 연관돼 있으면서도 독립적으로 읽을 수 있도록 구성돼 있다.
학생판에는 130개의 연습문제를 추가했다. 연습문제는 문제 해결 및 책에 제시된 아이디어와 방법론의 구현을 통해 자료에 대한 이해를 향상시킬 것이다.

◈ 이 책에서 다루는 내용 ◈
21세기는 그 영역과 영향 모두에서 통계적 기법이 숨막힐 정도로 확장돼 왔다. 통계적 기법이 현대 과학과 상거래의 방대한 데이터 집합을 다루게 되면서, 이제 ‘빅데이터’, ‘데이터 과학’, ‘머신러닝’이라는 말은 신문 지상에서 흔히 접하는 용어가 됐다. 어떻게 여기까지 오게 됐을까? 그리고 어디로 향하고 있는 것일까? 이 모든 것은 어떻게 통합될 것인가?
이 책은 현대 통계 사상의 집약 과정을 보여준다. 전통적 추론 이론인 베이즈, 빈도주의, 피셔에서 출발해 각 장은 일련의 영향력 있는 주제를 다룬다. 생존 분석, 로지스틱 회귀, 경험적 베이즈, 잭나이프와 부트스트랩, 랜덤 포레스트, 신경망, 마르코프 체인 몬테 카를로, 모델 선정 후 추론 등 수십 가지 주제가 있으며, 현대적 기법을 통해 방법론과 알고리듬을 통계적 추론과 통합한다. 각 장은 수업에서 검증된 연습문제로 끝나며 데이터 과학의 미래 방향을 예측하는 것으로 결론을 내린다.

◈ 이 책의 구성 ◈
이 책은 크게 세 가지 부분으로 나눠서 관련 역사에 따라 전개된다. 1부에서 이야기할 전통적 추론의 위대한 주제인 베이즈, 빈도주의, 피셔주의는 전자식 컴퓨터 시대가 도래하기 전까지는 제 역할을 했으며, 현대에 와서는 그 기본 윤곽을 변형시키지 않고도 방대한 확장을 하고 있다(전통적 방식과 현대적 방식의 유사점을 살펴볼 수도 있다). 2부에서는 컴퓨터 시대 개발의 초기인 1950년부터 1990년대까지를 알아본다. 이 시기는 전환기로, 이전보다 빨라진 연산이 통계적 기법의 발전에 실제로 기여했는지 없는지를 이론과 실제에서 가장 쉽게 파악해볼 수 있다. 3부에서는 ‘21세기 주제’라는 제목으로 현시대를 다룬다. 현시대는 놀라울 만큼 대단한 알고리듬의 시대다(‘머신러닝’은 다소 불안감을 조성하는 선전 문구다). 이를 정당화하는 것은 현대의 통계적 추론에서 지속적으로 수행되는 과제이기도 하다.
학생판에는 130개의 연습문제를 추가했다. 연습문제는 문제 해결 및 책에 제시된 아이디어와 방법론의 구현을 통해 자료에 대한 이해를 향상시킬 것이다. 연습문제는 대학원 수준에서 직접 강의했던 자료로부터 추출한 것이다.
2019년 4월 출간한 양장본과 동일한 내용의 도서로 각 챕터 마지막에 연습문제가 추가됐습니다
저자

브래들리에프론,트레버헤이스티

BradleyEfron
스탠퍼드대학교의통계학과생물의학데이터과학교수이다.하버드,버클리,임페리얼컬리지의방문교수로임명됐다.통계적추론에대해심도있는연구를수행했고부트스트랩표본기법을발명했다.2005년국가과학상(NationalMedalofScience)을수상했고2014년왕립통계학회(RoyalStatisticalSociety)의가이메달(GuyMedal)금상을수상했으며,2019년에통계학에서국제상을받았다.

목차


1부.전통적인통계적추론

01장.알고리듬과추론
__1.1회귀예제
__1.2가설검정
__1.3주석및상세설명
__1.4연습문제

02장.빈도주의추론
__2.1실제에서의빈도주의
__2.2빈도주의최적성
__2.3주석및상세설명
__2.4연습문제

03장.베이즈추론
__3.1두가지예제
__3.2불충분정보사전분포
__3.3빈도주의추론의결함
__3.4베이즈/빈도주의비교리스트
__3.5주석및상세설명
__3.6연습문제

04장.피셔추론과최대우도추정
__4.1우도와최대우도
__4.2피셔정보와MLE
__4.3조건부추론
__4.4순열과랜덤화
__4.5주석및상세설명
__4.6연습문제

05장.모수적모델과지수패밀리
__5.1일변량패밀리
__5.2다변량정규분포
__5.3다모수패밀리의피셔정보경계
__5.4다항분포
__5.5지수패밀리
__5.6주석및상세설명
__5.7연습문제

2부.초기컴퓨터시대기법

06장.경험적베이즈
__6.1로빈의공식
__6.2누락된종문제
__6.3의학예제
__6.4간접증거1
__6.5주석및상세설명
__6.6연습문제

07장.제임스-스타인추정과리지회귀
__7.1제임스-스타인추정기
__7.2야구선수들
__7.3리지회귀
__7.4간접증거2
__7.5주석및상세설명
__7.6연습문제

08장.일반화된선형모델과회귀트리
__8.1로지스틱회귀
__8.2일반화선형모델
__8.3포아송회귀
__8.4회귀트리
__8.5주석및상세설명
__8.6연습문제

09장.생존분석과EM알고리듬
__9.1생명표와위험률
__9.2검열된데이터와카플란-마이어추정
__9.3로그순위검정
__9.4비례적위험모델
__9.5누락데이터와EM알고리듬
__9.6주석및상세설명
__9.7연습문제

10장.잭나이프와부트스트랩
__10.1표준오차에대한잭나이프추정
__10.2비모수적부트스트랩
__10.3재표본추출계획
____극소잭나이프
____다표본부트스트랩
____이동블록부트스트랩
____베이즈부트스트랩
__10.4모수적부트스트랩
__10.5영향함수와안정적추정
__10.6주석및상세설명
____부트스트랩패키지
__10.7연습문제

11장.부트스트랩신뢰구간
__11.1단일모수문제에대한네이만의구성
____변환불변성
__11.2퍼센타일기법
__11.3편향수정신뢰구간
__11.42차정확성
__11.5부트스트랩-t구간
__11.6객관적베이즈구간과신뢰분포
__11.7주석및상세설명
__11.8연습문제

12장.교차검증과Cp예측오차추정
__12.1예측규칙
__12.2교차검증
__12.3공분산페널티
__12.4훈련,검증,단기예측변수
__12.5주석및상세설명
__12.6연습문제

13장.객관적베이즈추론과마르코프체인몬테카를로
__13.1객관적사전분포
____범위매칭사전분포
__13.2켤레사전분포
____객관적베이즈추론에대한비평
__13.3모델선택과베이즈정보기준
__13.4깁스표본과MCMC
__13.5예제:개체군혼합물모델링
__13.6주석및상세설명
__13.7연습문제

14장.전후시대의통계적추론과기법

3부.21세기주제

15장.대규모가설검정과거짓발견율
__15.1대규모검정
__15.2거짓발견율
__15.3경험적베이즈대규모검정
__15.4지역거짓발견율
__15.5귀무분포의선택
____경험적귀무추정
__15.6연관성
____요약
__15.7주석및상세설명
__15.8연습문제

16장.희소모델링과라소
__16.1전방단계별회귀
__16.2라소
__16.3라소모델적합화
__16.4최소각회귀
____라소와자유도
__16.5일반화된라소모델적합화
__16.6라소를위한선택-후추론
__16.7연결과확장
____라소로지스틱회귀와SVM
____라소와부스팅
____라소의확장
__16.8주석및상세설명
__16.9연습문제

17장.랜덤포레스트와부스팅
__17.1랜덤포레스트
____OOB오차추정
____표준오차
____변수중요도그래프
__17.2제곱오차손실함수를사용한부스팅
____트리깊이와상호작용복잡도
____축소
__17.3그래디언트부스팅
__17.4에이다부스트:원래의부스팅알고리즘
__17.5연결과확장
____일반화가첨모델
____부스팅과라소
__17.6주석및상세설명
__17.7연습문제

18장.신경망과딥러닝
__18.1신경망과필기체숫자문제
__18.2신경망적합화
____그래디언트계산:역전파
____그래디언트하강
____다른튜닝모수들
__18.3오토인코더
__18.4딥러닝
__18.5딥네트워크학습
__18.6주석및상세설명
__18.7연습문제

19장.서포트벡터머신과커널기법
__19.1최적분리초평면
__19.2소프트마진분류기
__19.3손실플러스페널티로서의SVM기준
__19.4계산과커널트릭
__19.5커널을이용한함수적합화
__19.6예제:단백질분류에대한문자열커널
__19.7SVM:결론
__19.8커널평활화와지역회귀
__19.9주석및상세설명
__19.10연습문제

20장.모델선택후의추론
__20.1동시신뢰구간
__20.2모델선택후정확도
__20.3선택편향
__20.4병합된베이즈-빈도주의추정
__20.5주석및상세설명
__20.6연습문제

21장.경험적베이즈추정전략
__21.1베이즈디컨볼루션
__21.2g-모델링과추정
__21.3우도,정규화,정확도
__21.4두가지예제
__21.5일반적선형혼합모델
__21.6디컨볼루션과f-모델링
__21.7주석및상세설명
__21.8연습문제

출판사 서평

이책에서다루는내용

21세기는그영역과영향모두에서통계적기법이숨막힐정도로확장돼왔다.통계적기법이현대과학과상거래의방대한데이터집합을다루게되면서,이제‘빅데이터’,‘데이터과학’,‘머신러닝’이라는말은신문지상에서흔히접하는용어가됐다.어떻게여기까지오게됐을까?그리고어디로향하고있는것일까?이모든것은어떻게통합될것인가?

이책은현대통계사상의집약과정을보여준다.전통적추론이론인베이즈,빈도주의,피셔에서출발해각장은일련의영향력있는주제를다룬다.생존분석,로지스틱회귀,경험적베이즈,잭나이프와부트스트랩,랜덤포레스트,신경망,마르코프체인몬테카를로,모델선정후추론등수십가지주제가있으며,현대적기법을통해방법론과알고리듬을통계적추론과통합한다.각장은수업에서검증된연습문제로끝나며데이터과학의미래방향을예측하는것으로결론을내린다.

이책의구성

이책은크게세가지부분으로나눠서관련역사에따라전개된다.1부에서이야기할전통적추론의위대한주제인베이즈,빈도주의,피셔주의는전자식컴퓨터시대가도래하기전까지는제역할을했으며,현대에와서는그기본윤곽을변형시키지않고도방대한확장을하고있다(전통적방식과현대적방식의유사점을살펴볼수도있다).2부에서는컴퓨터시대개발의초기인1950년부터1990년대까지를알아본다.이시기는전환기로,이전보다빨라진연산이통계적기법의발전에실제로기여했는지없는지를이론과실제에서가장쉽게파악해볼수있다.3부에서는‘21세기주제’라는제목으로현시대를다룬다.현시대는놀라울만큼대단한알고리듬의시대다(‘머신러닝’은다소불안감을조성하는선전문구다).이를정당화하는것은현대의통계적추론에서지속적으로수행되는과제이기도하다.

학생판에는130개의연습문제를추가했다.연습문제는문제해결및책에제시된아이디어와방법론의구현을통해자료에대한이해를향상시킬것이다.연습문제는대학원수준에서직접강의했던자료로부터추출한것이다.

지은이의말

통계적추론(StatisticalInference)은광범위한학문분야며수학,경험적과학,철학이삼각지점을이루며만나는곳에위치하고있다.이분야는베이즈규칙이발표된1763년부터비롯됐다고말할수도있다(이는이주제의철학적부분을의미하는데,베이즈규칙의초기신봉자들은이것이야말로신이존재한다는증거라고치켜세우기까지했다).이250년의역사중가장최근1/4에해당하는1950년부터지금까지는이책의제목처럼‘컴퓨터시대(ComputerAge)’며,이시대에는통계적응용의전통적인병목부분인연산능력에서수백만배이상더빠르고간편한계산이가능해졌다.

이책은과거60년동안통계학이어떻게발전해왔는지개괄적으로조망한다.제트기나인공위성처럼까마득히높은곳에서살펴보는것이아니라,경비행기정도의높이에서비교적자세히조망해본다.개별장은각핵심기법의발달과그추론적정당성에대해설명하는일련의주요주제를다룬다.여기에는일반화선형모델,생존율분석,잭나이프와부트스트랩,오발견율,경험적베이즈,MCMC,신경망등과같은수십가지주제가있다.

두말할필요도없이,전자식컴퓨터계산은이이야기전체의핵심요소다.그렇다고해서모든발전이컴퓨터와연계돼있다는뜻은아니다.신대륙을향해해상을가로지르는다리가건설됐지만,모두가그다리를건너고자하지는않는법이다.경험적베이즈나제임스-스타인추정등의주제는기계적계산이라는제약속에서도충분히등장할수있었다.한편부트스트랩이나비례적위험등은순전히전자식컴퓨터시대의산물이다.21세기통계학과관련된대부분의주제는이제컴퓨터에의존하고있지만,우리의경비행기가새로운시대를맞이할때까지는다소시간이걸릴것이다.

이책의주제들은연산기법과추론이론간의상호작용에대한실례를위해선정했으며,목록이나백과사전식나열을추구하지않았다.몇몇주제는이책에담긴사례만큼이나중요하지만생략됐다.예를들어시계열,일반추정식,인과추론,그래픽모델,경험적디자인등이다.어떤경우에도이책에나열된주제만이연구가치가있다고암시하는것은절대아니라는점을밝혀둔다.

옮긴이의말

이책은전통적추론의핵심주제인베이즈,빈도주의,피셔주의로부터현대적컴퓨터시대의빅데이터에이르기까지시대별흐름과추론의발전을마치장편역사책처럼조명한다.단순한이론적설명에그치지않고전체의흐름을통해여러기법의유기적관계와상대성에관해깊은인식을가질수있게해준다.

특히이책의저자중한명인브래들리에프론은추론에서표준적방법으로자리잡은부트스트래핑을비롯한수많은경험적추론을발명한대가로,각종추론에대한심도있는설명을직접듣는짜릿한경험을할수있다.이책한권으로알고리듬과추론사이의관계,서로의역할에대해명쾌히정립할수있으리라믿는다.