머신 러닝과 통계 (파이썬과 R로 배우는 머신 러닝)

머신 러닝과 통계 (파이썬과 R로 배우는 머신 러닝)

$35.61
Description
통계와 머신 러닝의 관계에 대해 기초적인 개념을 정립할 수 있도록 돕는다. 또한 지도학습, 비지도학습, 강화학습에 이르기까지 머신 러닝에서 주로 사용되는 대부분의 기법에 대해 파이썬과 R 예제를 제공한다.
책의 초반에 통계와 머신 러닝의 전반적인 관계에 대해 설명한 다음, 지도학습, 비지도학습, 강화학습 순으로 각각의 기법에서 통계적 방법과 머신 러닝 기법을 비교하며 설명한다. 거의 대부분의 예제에 대해서 파이썬과 R 코드를 같이 제공하기 때문에 코드를 직접 실행해 가면서 책을 읽을 수 있다.
저자

프라탑단게티

프라탑단게티(PratapDangeti)
방갈로TCS혁신연구소의‘분석과통찰’부서에서구조화이미지및텍스트솔루션개발과관련된머신러닝과딥러닝솔루션을개발하고있다.분석학과데이터과학분야에폭넓은경험을갖고있으며,봄베이IIT에서산업공학과오퍼레이션리서치로석사학위를받았다.인공지능에큰관심을갖고있으며,쉬는날에는차세대기술과혁신적기법과관련된책을즐겨읽는다.

목차

1장.통계학에서머신러닝으로의여행

__모델구축과검증을위한통계용어
____머신러닝
____통계모델링과머신러닝의주요차이점
____머신러닝모델개발과배치를위한단계
____통계학기초및모델구축과검증에관련된용어
____편향과분산의트레이드오프
____훈련데이터와테스트데이터
__모델구축과검증을위한머신러닝용어
____선형회귀vs기울기하강법
____머신러닝손실
____머신러닝모델튜닝을멈추는시점
____훈련,검증,테스트데이터
____교차검증
____그리드검색
__머신러닝모델개관
__요약


2장.통계학과머신러닝의유사점

__회귀와머신러닝모델의비교
__머신러닝모델의보상요인들
____선형회귀의가정들
____선형회귀모델링에적용된단계들
____기본원리로해결하는간단한선형회귀예제
____와인품질데이터를이용한단순선형회귀예제
____다중선형회귀예제-모델구축을위한단계별기법
________후진제거법과전진선택법
__머신러닝모델-리지와라소회귀
____리지회귀분석머신러닝예
____라소회귀분석머신러닝모델
____선형회귀와리지/라소회귀의매개변수정규화
__요약


3장.로지스틱회귀vs랜덤포레스트

__최대우도추정
__로지스틱회귀-소개및장점
____로지스틱회귀에서사용되는용어
____로지스틱회귀모델링의적용단계
____독일신용데이터를이용한로지스틱회귀예
__랜덤포레스트
____독일신용데이터를이용한랜덤포레스트예
________랜덤포레스트에서의그리드검색
__변수중요도그래프
__로지스틱회귀와랜덤포레스트비교
__요약


4장.트리기반머신러닝모델
__결정트리분류기소개
____결정트리에사용되는용어들
____기본원리로본결정트리의작동원리
__로지스틱회귀와결정트리비교
__다양한모델형식간의오차항비교
__이상적인영역으로가는개선책
__HR퇴직율데이터예제
__의사결정트리(DT)분류기
__트리분류기의가중값튜닝
__배깅분류기
__랜덤포레스트분류기
__랜덤포레스트-그리드검색
__에이다부스트분류기
__기울기부스팅분류기
__에이다부스팅과기울기부스팅의비교
__극단기울기부스팅-XG부스트분류기
__앙상블들의앙상블-모델스태킹
__서로다른분류기형태간의앙상블들의앙상블
__동일형식분류기를사용한부트스트랩표본을통한앙상블들의앙상블
__요약


5장.K-최근접이웃과나이브베이즈

__K-최근접이웃
____KNN투표예제
____차원의저주
________차원의저주1차,2차,3차원예제
__위스콘신유방암진단데이터를이용한KNN분류기
__KNN분류기에서K값튜닝
__나이브베이즈
__확률기초
____결합확률
__조건부확률과베이즈정리의이해
__나이브베이즈분류기
__라플라스계산
__나이브베이즈SMS스팸분류예
__요약


6장.서포트벡터머신과신경망

__SVM동작원리
____최대마진분류기
____서포트벡터분류기
____서포트벡터머신
__커널함수
__SVM다중레이블분류기를사용한문자인식예제
____최대마진분류기-선형커널
____다항커널
____RBF커널
__인공신경망
__활성함수
__순전파와역전파
__신경망의최적화
____확률경사하강법(SGD)
____모멘텀
____NAG
____에이다그래드
____에이다델타
____RMS프랍
____적응모멘트계산-Adam
____L-BFGS최적화알고리즘
__신경망에서의드롭아웃
__scikit-learn을사용해필기체숫자인식에적용한ANN분류기
__딥러닝소개
____해결기법
____딥러닝소프트웨어
____필기체숫자인식을위해케라스를사용한딥신경망분류기
__요약


7장.추천엔진

__내용기반필터링
____코사인유사도
__협업필터링
____내용기반필터링대비협업필터링의장점
____협업필터링을위한교대최소자승법에의한행렬인수분해
__추천엔진모델의평가
____그리드검색을사용한추천엔진의초매개변수선택
____무비렌즈데이터에적용한추천엔진
________사용자-사용자유사도행렬
________영화-영화유사도행렬
________ALS를사용한협업필터링
________협업필터링에서의그리드검색
__요약


8장.비지도학습

__K-평균군집화
____K-평균군집화기본작동원리362
____최적클러스터개수와클러스터평가
________엘보기법
____붓꽃데이터예제를이용한K-평균군집화
__주성분분석-PCA
____기본원리로본PCA작동기법
____scikit-learn를활용한필기체숫자인식에PCA적용
__특이점분해-SVD
________scikit-learn를사용한필기체숫자에SVD적용
__딥오토인코더
__인코더-디코더구조를이용한모델구축기법
__케라스를이용한필기체숫자인식에딥오토인코더적용
__요약


9장.강화학습

__강화학습소개
__지도?비지도?강화학습의상세비교
__강화학습의특성
__강화학습기초
____범주1-가치기반
____범주2-정책기반
____범주3-액터크리틱
____범주4-비모델기반
____범주5-모델기반
____순차적의사결정의기본범주
__마르코프결정프로세스와벨만방정식
__동적프로그래밍
____동적프로그래밍으로최적정책을계산하는알고리즘
__파이썬으로격자세상에가치와정책반복알고리즘구현
__몬테카를로기법
____동적프로그래밍과몬테카를로기법의비교
____DP기법대비MC기법의핵심우위점
____몬테카를로예측
____그리드문제에적용한몬테카를로예측의적합성
____파이썬을사용해블랙잭게임을몬테카를로기법으로모델링
__시간차학습
____몬테카를로기법과시간차학습의비교
____TD예측
____TD학습을위한회사까지운전예제
____SARSA온-폴리시TD제어
__Q-러닝오프-폴리시TD제어
__절벽걷기예제에적용한온-폴리시와오프-폴리시TD제어
__머신러닝과딥러닝을통합한강화학습의응용
____자율운행제어-자율주행차량
____구글딥마인드의알파고
____로봇축구
__참고문헌
__요약

출판사 서평

★이책에서다루는내용★

■모델구축에필요한머신러닝과통계학기초이해
■문제해결을위한통계적방식과머신러닝방식사이의차이점및유사점이해
■데이터를준비하는방법및준비된데이터로R과파이썬패키지의머신러닝알고리즘을사용해모델을직접구축하는방법
■결과를분석하고목적에맞게끔모델을튜닝하는방법
■머신러닝을위해필요한통계학개념이해
■지도학습과딥러닝비지도학습모델에필요한필수기초지식
■강화학습과인공지능응용분야


★이책의대상독자★

이책은머신러닝을시스템에구현하려는사람이라면통계학지식의유무와상관없이읽을수있다.R과파이썬프로그래밍에관한사전지식은많은도움이된다.

★이책의구성★

1장,‘통계로부터머신러닝으로의여행’에서는통계와머신러닝의기초및기본요소를소개한다.모든기초지식은전체장에걸쳐파이썬과R코드를통해설명한다.
2장,‘통계학과머신러닝의유사점’에서는선형회귀와라소/리지회귀예제를통해통계모델링과머신러닝사이의차이점과유사점을비교해본다.
3장,‘로지스틱회귀와랜덤포레스트’에서는분류예제를통해로지스틱회귀와랜덤포레스트의세부단계를상세히설명하면서비교한다.이장이끝날때쯤에는통계학과머신러닝두주류학문에관한큰그림을그릴수있을것이다.
4장,‘트리기반머신러닝모델’에서는실제현업에서많이사용되고있는다양한트리기반머신러닝모델을알아본다.HR퇴사자데이터예제를통해의사결정트리(decisiontrees),배깅(bagging),랜덤포레스트(randomforest),에이다부스트(AdaBoost),기울기부스팅(gradientboosting),XG부스트X(GBoost)를파이썬과R언어를사용해배운다.
5장,‘K-최근접이웃과나이브베이즈’에서는간단한머신러닝기법인k-최근접이웃을유방암데이터와함께설명한다.나이브베이즈모델은다양한자연어전처리기술,메시지분류예제와함께설명한다.
6장,‘서포트벡터머신과신경망’에서는서포트벡터머신과관련한다양한기능에관해기술하고커널함수사용법을알아본다.그런다음,신경망을소개하고딥러닝의기초에관한모든것을다룬다.
7장,‘추천엔진’에서는사용자-사용자유사도행렬로부터찾아낸‘유사한사람’의정보에서‘유사한영화’를찾는방법을알아본다.두번째절에서는코사인유사도(cosinesimilarity)를계산한후영화-영화유사도행렬을구성해추천시스템을직접만들어본다.마지막으로최종추천을위해사용자와영화간에교대최소자승법을활용한협업필터링(collaborativefiltering)기술을사용한다.
8장,‘비지도학습’에서는K-평균군집화(k-meansclustering),주성분분석(principalcomponentanalysis),특이값분해(singularvaluedecomposition),딥러닝기반의딥오토인코더(deepautoencoders)같은다양한기술을소개한다.마지막부분에서는딥오토인코더가전통적인PCA기법과비교했을때갖고있는장점을알아본다.
9장,‘강화학습’에서는에피소드상태를통해최적경로를학습하는마르코프결정프로세스(Markovdecisionprocess),동적프로그래밍(dynamicprogramming),몬테카를로기법(MonteCarlomethods),시간차학습(temporaldifferencelearning)과같은완전탐색기법(exhaustivetechniques)에관해알아본다.
마지막에는머신러닝과강화학습을사용한좋은응용사례몇가지를소개한다.