통계학으로 배우는 머신러닝 (스탠퍼드대학교 통계학과 교수에게 배우는 머신러닝의 원리 | 2 판 | 양장본 Hardcover)

통계학으로 배우는 머신러닝 (스탠퍼드대학교 통계학과 교수에게 배우는 머신러닝의 원리 | 2 판 | 양장본 Hardcover)

$60.00
Description
머신러닝을 통한 모델 학습을 통계학적 체계 내에서 설명한다. 다양한 통계 이론을 살펴보고, 회귀에서 신경망에 이르는 머신러닝 알고리즘에서 이들이 어떠한 의의가 있는지 배울 수 있다. 단순히 머신러닝 모델을 적용하는 것을 넘어 모델의 이론적 배경을 이해함으로써 데이터에서 더욱 깊은 인사이트를 얻고자 하는 사람에게 도움이 될 것이다.
선정 및 수상내역
2021년 대한민국학술원 우수학술도서 선정도서
저자

트레버헤이스티

TrevorHastie
스탠퍼드대학교통계학과교수이며,이분야의저명한연구자다.일반화가법모델을개발했으며이제목으로인기있는책을저술했다.R/S-PLUS에서상당한통계적모델링소프트웨어및환경을공동개발했으며주곡선과주표면을창안했다.

목차

1장.소개

2장.지도학습의개요
__2.1소개
__2.2변수타입과용어
__2.3예측을위한단순한두접근법:최소제곱과최근접이웃
____2.3.1선형모델과최소제곱42
____2.3.2최근접이웃방법
____2.3.3최소제곱에서최근접이웃까지
__2.4통계적결정이론
__2.5고차원에서의국소적방법
__2.6통계적모델,지도학습및함수근사60
____2.6.1결합분포Pr(X,Y)를위한통계적모델
____2.6.2지도학습
____2.6.3함수근사
__2.7구조화된회귀모델
____2.7.1문제의어려움
__2.8제한된추정량의종류
____2.8.1조도벌점과베이즈방법
____2.8.2커널법과국소회귀
____2.8.3기저함수와딕셔너리방법
__2.9모델선택과편향-분산상반관계
__참고문헌
__연습문제

3장.회귀를위한선형법
__3.1소개
__3.2선형회귀모델과최소제곱
____3.2.1예제:전립선암
____3.2.2가우스-마코프정리
____3.2.3단순일변량회귀로부터의다중회귀
____3.2.4다중출력
__3.3부분집합선택
____3.3.1최량부분집합선택
____3.3.2전진및후진스텝별선택
____3.3.3전진-스테이지별회귀
____3.3.4전립선암데이터예제(계속)
__3.4수축법
____3.4.1릿지회귀
____3.4.2라쏘
____3.4.3논의:부분집합선택,릿지회귀그리고라쏘
____3.4.4최소각회귀
__3.5유도된입력방향을사용하는방법들
____3.5.1주성분회귀
____3.5.2부분최소제곱
__3.6논의:선택법과수축법비교
__3.7다중결과수축및선택
__3.8라쏘및관련된경로알고리즘에관한추가내용
____3.8.1증가적전진스테이지별회귀
____3.8.2조각별-선형경로알고리즘
____3.8.3댄치그선택자
____3.8.4그룹화라쏘
____3.8.5라쏘의추가적인속성
____3.8.6경로별좌표최적화
__3.9연산적고려사항
__참고문헌
__연습문제

4장.분류를위한선형법
__4.1소개
__4.2지시행렬의선형회귀
__4.3선형판별분석
____4.3.1정칙판별분석
____4.3.2LDA를위한연산
____4.3.3축소된랭크선형판별분석
__4.4로지스틱회귀
____4.4.1로지스틱회귀모델적합
____4.4.2예제:남아프리카인심장병
____4.4.3이차근사및추론
____4.4.4L1정칙화로지스틱회귀
____4.4.5로지스틱회귀아니면LDA?
__4.5분리초평면
____4.5.1로젠블랫의퍼셉트론학습알고리즘
____4.5.2최적분리초평면
__참고문헌
__연습문제

5장.기저전개와정칙화
__5.1소개
__5.2조각별다항식과스플라인
____5.2.1자연삼차스플라인
____5.2.2예제:남아프리카심장질환(계속)
____5.2.3예제:음소인식
__5.3필터링과특성추출
__5.4평활스플라인
____5.4.1자유도와평활자행렬
__5.5평활화매개변수의자동적선택
____5.5.1자유도고정하기
____5.5.2편향-분산상반관계
__5.6비모수적로지스틱회귀
__5.7다차원스플라인
__5.8정칙화및재생커널힐베르트공간
____5.8.1커널에의해생성된함수의공간
____5.8.2RKHS예시
__5.9웨이블릿평활화
____5.9.1웨이블릿기저와웨이블릿변환
____5.9.2적응적웨이블릿필터링
__참고문헌
__연습문제
__부록:스플라인연산
____B-스플라인
____평활스플라인의연산

6장.커널평활법
__6.11차원커널평활자
____6.1.1국소선형회귀
____6.1.2국소다항회귀
__6.2커널의너비선택하기
__6.3Rp에서의국소회귀
__6.4Rp에서의구조적국소회귀모델
____6.4.1구조화커널
____6.4.2구조화회귀함수
__6.5국소가능도및다른모델
__6.6커널밀도추정및분류
____6.6.1커널밀도추정
____6.6.2커널밀도분류
____6.6.3단순베이즈분류기
__6.7방사기저함수와커널
__6.8밀도추정과분류를위한혼합모델
__6.9연산고려사항
__참고문헌
__연습문제

7장.모델평가및선택
__7.1소개
__7.2편향,분산,모델복잡도
__7.3편향-분산분해
____7.3.1예제:편향-분산상반관계
__7.4훈련오류율에관한낙관도
__7.5표본-내예측오차의추정값
__7.6매개변수의유효개수
__7.7베이즈접근법과BIC
__7.8최소설명길이
__7.9밥닉-체브넨키스차원
____7.9.1예제(계속)
__7.10교차검증
____7.10.1K-겹교차검증
____7.10.2교차검증을하는잘못된그리고옳은방법
____7.10.3교차검증은정말로작동하는가?
__7.11부트스트랩법
____7.11.1예제(계속)
__7.12조건부혹은기대테스트오차
__참고문헌
__연습문제

8장.모델추론과평균화
__8.1소개
__8.2부트스트랩과최대가능도방법
____8.2.1평활화예제
____8.2.2최대가능도추정
____8.2.3부트스트랩대최대가능도
__8.3베이즈방법
__8.4부트스트랩과베이즈추정사이의관계
__8.5EM알고리즘
____8.5.12-성분혼합모델
____8.5.2일반적인EM알고리즘
____8.5.3최대화-최대화과정으로써의EM
__8.6사후분포로부터표본추출을위한MCMC
__8.7배깅
____8.7.1예제:시뮬레이션데이터로된트리
__8.8모델평균화와스태킹
__8.9확률적검색:범핑
__참고문헌
__연습문제

9장.가법모델,트리및관련방법들
__9.1일반화가법모델
____9.1.1가법모델적합시키기
____9.1.2예제:가법로지스틱회귀
____9.1.3요약
__9.2트리기반방법
____9.2.1배경
____9.2.2회귀트리
____9.2.3분류트리
____9.2.4다른문제들
____9.2.5스팸예제(계속)
__9.3PRIM:범프헌팅
____9.3.1스팸예제(계속)
__9.4MARS:다변량적응적회귀스플라인
____9.4.1스팸데이터(계속)
____9.4.2예제(시뮬레이션된데이터)
____9.4.3다른문제들
__9.5전문가계층혼합
__9.6결측데이터
__9.7연산고려사항
__참고문헌
__연습문제

10장.부스팅과가법트리
__10.1부스팅법
____10.1.1개요
__10.2부스팅적합과가법모델
__10.3전진스테이지별가법모델링
__10.4지수손실과에이다부스트
__10.5왜지수손실인가?
__10.6손실함수와로버스트성
__10.7데이터마이닝을위한“기성품”같은과정
__10.8예제:스팸데이터
__10.9부스팅트리
__10.10경사부스팅을통한수치적최적화
____10.10.1최급하강
____10.10.2경사부스팅
____10.10.3경사부스팅의구현
__10.11부스팅을위한적절한크기의트리
__10.12정칙화
____10.12.1수축
____10.12.2부표집
__10.13해석
____10.13.1예측변수의상대중요도
____10.13.2부분의존도도표
__10.14삽화
____10.14.1캘리포니아주택
____10.14.2뉴질랜드물고기
____10.14.3인구통계데이터
__참고문헌
__연습문제

11장.신경망
__11.1소개
__11.2사영추적회귀
__11.3신경망
__11.4신경망적합시키기
__11.5신경망을훈련시킬때의문제
____11.5.1시작값
____11.5.2과적합
____11.5.3입력변수의척도화
____11.5.4.은닉유닛과층의개수
____11.5.5복수의최솟값들
__11.6예제:시뮬레이션데이터
__11.7예제:우편번호데이터
__11.8논의
__11.9베이즈신경망과NIPS2003챌린지
____11.9.1베이즈,부스팅,배깅
____11.9.2성능비교
__11.10연산고려사항
__참고문헌
__연습문제

12장.서포트벡터머신과유연한판별식
__12.1도입
__12.2서포트벡터분류기
____12.2.1서포트벡터분류기연산하기
____12.2.2혼합예제(계속)
__12.3서포트벡터머신과커널
____12.3.1분류를위한SVM연산
____12.3.2벌점화방법으로서의SVM
____12.3.3함수추정과재생커널
____12.3.4SVM과차원성의저주
____12.3.5SVM분류기를위한경로알고리즘
____12.3.6회귀를위한서포트벡터머신
____12.3.7회귀와커널
____12.3.8논의
__12.4선형판별분석일반화
__12.5유연한판별분석
____12.5.1FDA추정값계산하기
__12.6벌점화판별분석
__12.7혼합판별분석
____12.7.1예제:파형데이터
__12.8연산고려사항
__참고문헌
__연습문제

13장.프로토타입방법과최근접이웃법
__13.1개요
__13.2프로토타입법
____13.2.1K-평균군집화
____13.2.2학습벡터양자화
____13.2.3가우스혼합
__13.3K-최근접이웃분류기
____13.3.1예제:비교연구
____13.3.2예제:K-최근접이웃과이미지장면분류
____13.3.3불변계량과탄젠트거리
__13.4적응적최근접이웃법
____13.4.1예제
____

출판사 서평

★이책의대상독자★

통계학,인공지능,공학,금융등다양한분야의연구자와학생을위해썼다.이책을읽는독자가선형회귀를포함한기본주제를다루는통계학의기초강의를적어도하나는수강했기를기대한다.
학습법의포괄적인안내서를쓰기보다는가장중요한기술몇가지를설명하고자했다.또한하부개념과고려사항을설명해연구자가학습법을판단할수있게했다.수학적세부사항보다는개념을강조해직관적인방식으로작성했다.
우리는자연스럽게통계학자로서의배경과전문분야를반영하게될것이다.그러나과거8년동안신경망,데이터마이닝과머신러닝에관한콘퍼런스에참여했으며,이러한흥미진진한분야에크게영향을받았다.


★이책의구성★

복잡한방법을완전히파악하려하기전에반드시간단한방법부터이해해야한다.따라서2장에서지도학습문제에관한개요를제공한다음3장과4장에서회귀와분류를위한선형방법을논의한다.5장에서는단일예측변수를위한스플라인(spline),웨이블렛(wavelet)과정칙화/벌점화법을설명하며,6장에서는커널방법과국소회귀(localregression)를다룬다.이들방법모두고차원학습기법의중요한기본토대가된다.모델평가와선택이7장의주제이며,편향과분산의개념,과적합및모형선택을위한교차검증과같은방법을다룬다.8장은최대가능도,베이지안추론과부트스트랩,EM알고리즘,깁스샘플링,배깅(bagging)의개요를포함해모형추론과평균화에관해논의한다.부스팅(boosting)이라부르는과정은10장에서집중적으로다룬다.
9장부터13장까지는지도학습을위한일련의구조적방법을설명한다.특히9장과11장에서는회귀를다루며12장과13장에서는분류에집중한다.14장에서는비지도학습을위한방법에관해설명한다.최근에알려진기법인랜덤포레스트와앙상블학습은15장과16장에서논의한다.무방향그래프모델은17장에서설명하며,마지막으로18장에서고차원문제를공부한다.
각장의마지막에서는관측치와예측자의개수에따라어떻게연산이확장되는지등을포함해데이터마이닝응용법에중요한연산적고려사항에관해논의한다.각장은자료를위한배경참조를제공하는참고문헌으로마무리된다.
먼저1장부터4장까지순서대로읽기를추천한다.7장또한모든학습법에관련된핵심개념을다루므로의무적으로읽어야한다.책의나머지는독자의흥미에따라순서대로읽거나혹은선택해서읽을수있다.

★옮긴이의말★

이책은Springer에서출간된『ElementsofStatisticalLearning,SecondEdition』을번역한것입니다.원서의공동저자3인은모두스탠퍼드대학교통계학과교수들로탁월한학문적성과로명성이높은분들이며,이책또한여러논문에서많이인용되고있습니다.
이책의서문을펴볼정도로머신러닝에관심이많은독자분이라면통계학을포장해머신러닝이라고부른다는내용의재미있는밈(meme)을보신적이있을것입니다.이러한밈이단순히농담으로만보이지않는것은비단저뿐만이아닐것입니다.머신러닝을더잘알기위해서는통계학을피할수없다는점이야말로제가이책의번역을맡기로한근본적인이유가아닐까합니다.
요즘은문제를무조건딥러닝으로해결하려는분위기가강합니다.하지만저자들이1장에서언급한바와같이저또한복잡한방법을시도하기전에단순한방법을이해하는것이중요합니다.물론통계적,수학적지식이부족하더라도데이터에머신러닝모델을적용하는것은어려운일이아닙니다.그러나이책은더나아가모델의밑바탕에깔린개념을폭넓게이해함으로써,주어진문제를해결하고데이터로부터더욱깊은통찰을얻을수있는실질적인힘을기르도록도와줄것입니다.이책과함께통계적이론및회귀와분류,커널과기저,정칙화,가법적모델등여러주제에대해더깊이공부할수있다면향후다양한주제를학습하는데큰도움이되리라생각합니다.
저자들은적어도독자들이기본적인통계학을수강했기를기대하고있지만,이책을잘이해하는데그정도로충분하다고하기에는힘든것이사실입니다.책과함께하면서미적분학,선형대수학,확률론,통계학등부족하다고생각하는부분을함께학습하시기를권해드립니다.원서의정오표(https://web.stanford.edu/~hastie/ElemStatLearn/)는웹사이트의‘Errataforthe2ndEdition,after12thprinting(January2017)andnotyetreflectedinonlineversion’을기준으로반영돼있습니다.용어는한국통계학회(http://www.kss.or.kr/)및대한수학회(http://www.kms.or.kr/main.html)의용어집을표준으로삼고자했으며,그밖의용어는인터넷검색을통해가장빈번하게쓰이는용어를사용하고자노력했습니다.