저자

세바스찬라시카,유시(헤이든)류,바히드미자리리

저자:세바스찬라시카,유시(헤이든)류,바히드미자리리

역자:박해선

목차


1장.컴퓨터는데이터에서배운다
1.1데이터를지식으로바꾸는지능적인시스템구축
1.2머신러닝의세가지종류
__1.2.1지도학습으로미래예측
__1.2.2강화학습으로반응형문제해결
__1.2.3비지도학습으로숨겨진구조발견
1.3기본용어와표기법소개
__1.3.1이책에서사용하는표기법과규칙
__1.3.2머신러닝용어
1.4머신러닝시스템구축로드맵
__1.4.1전처리:데이터형태갖추기
__1.4.2예측모델훈련과선택
__1.4.3모델을평가하고본적없는샘플로예측
1.5머신러닝을위한파이썬
__1.5.1파이썬과PIP에서패키지설치
__1.5.2아나콘다파이썬배포판과패키지관리자사용
__1.5.3과학컴퓨팅,데이터과학,머신러닝을위한패키지
1.6요약

2장.간단한분류알고리즘훈련
2.1인공뉴런:초기머신러닝의간단한역사
__2.1.1인공뉴런의수학적정의
__2.1.2퍼셉트론학습규칙
2.2파이썬으로퍼셉트론학습알고리즘구현
__2.2.1객체지향퍼셉트론API
__2.2.2붓꽃데이터셋에서퍼셉트론훈련
2.3적응형선형뉴런과학습의수렴
__2.3.1경사하강법으로손실함수최소화
__2.3.2파이썬으로아달린구현
__2.3.3특성스케일을조정하여경사하강법결과향상
__2.3.4대규모머신러닝과확률적경사하강법
2.4요약

3장.사이킷런을타고떠나는머신러닝분류모델투어
3.1분류알고리즘선택
3.2사이킷런첫걸음:퍼셉트론훈련
3.3로지스틱회귀를사용한클래스확률모델링
__3.3.1로지스틱회귀의이해와조건부확률
__3.3.2로지스틱손실함수의가중치학습
__3.3.3아달린구현을로지스틱회귀알고리즘으로변경
__3.3.4사이킷런을사용하여로지스틱회귀모델훈련
__3.3.5규제를사용하여과대적합피하기
3.4서포트벡터머신을사용한최대마진분류
__3.4.1최대마진
__3.4.2슬랙변수를사용하여비선형분류문제다루기
__3.4.3사이킷런의다른구현
3.5커널SVM을사용하여비선형문제풀기
__3.5.1선형적으로구분되지않는데이터를위한커널방법
__3.5.2커널기법을사용하여고차원공간에서분할초평면찾기
3.6결정트리학습
__3.6.1정보이득최대화:자원을최대로활용
__3.6.2결정트리만들기
__3.6.3랜덤포레스트로여러개의결정트리연결
3.7k-최근접이웃:게으른학습알고리즘
3.8요약

4장.좋은훈련데이터셋만들기:데이터전처리
4.1누락된데이터다루기
__4.1.1테이블형태데이터에서누락된값식별
__4.1.2누락된값이있는훈련샘플이나특성제외
__4.1.3누락된값대체
__4.1.4사이킷런추정기API익히기
4.2범주형데이터다루기
__4.2.1판다스를사용한범주형데이터인코딩
__4.2.2순서가있는특성매핑
__4.2.3클래스레이블인코딩
__4.2.4순서가없는특성에원-핫인코딩적용
4.3데이터셋을훈련데이터셋과테스트데이터셋으로나누기
4.4특성스케일맞추기
4.5유용한특성선택
__4.5.1모델복잡도제한을위한L1규제와L2규제
__4.5.2L2규제의기하학적해석
__4.5.3L1규제를사용한희소성
__4.5.4순차특성선택알고리즘
4.6랜덤포레스트의특성중요도사용
4.7요약

5장.차원축소를사용한데이터압축
5.1주성분분석을통한비지도차원축소
__5.1.1주성분분석의주요단계
__5.1.2주성분추출단계
__5.1.3총분산과설명된분산
__5.1.4특성변환
__5.1.5사이킷런의주성분분석
5.2선형판별분석을통한지도방식의데이터압축
__5.2.1주성분분석vs선형판별분석
__5.2.2선형판별분석의내부동작방식
__5.2.3산포행렬계산
__5.2.4새로운특성부분공간을위해선형판별벡터선택
__5.2.5새로운특성공간으로샘플투영
__5.2.6사이킷런의LDA
5.3비선형차원축소와시각화
__5.3.1비선형차원축소를고려하는이유는무엇인가요?
__5.3.2t-SNE를사용한데이터시각화
5.4요약

6장.모델평가와하이퍼파라미터튜닝의모범사례
6.1파이프라인을사용한효율적인워크플로
__6.1.1위스콘신유방암데이터셋
__6.1.2파이프라인으로변환기와추정기연결
6.2k-겹교차검증을사용한모델성능평가
__6.2.1홀드아웃방법
__6.2.2k-겹교차검증
6.3학습곡선과검증곡선을사용한알고리즘디버깅
__6.3.1학습곡선으로편향과분산문제분석
__6.3.2검증곡선으로과대적합과과소적합조사
6.4그리드서치를사용한머신러닝모델세부튜닝
__6.4.1그리드서치를사용한하이퍼파라미터튜닝
__6.4.2랜덤서치로하이퍼파라미터설정을더넓게탐색하기
__6.4.3SH방식을사용한자원효율적인하이퍼파라미터탐색
__6.4.4중첩교차검증을사용한알고리즘선택
6.5여러가지성능평가지표
__6.5.1오차행렬
__6.5.2분류모델의정밀도와재현율최적화
__6.5.3ROC곡선그리기
__6.5.4다중분류의성능지표
__6.5.5불균형한클래스다루기
6.6요약

7장.다양한모델을결합한앙상블학습
7.1앙상블학습
7.2다수결투표를사용한분류앙상블
__7.2.1간단한다수결투표분류기구현
__7.2.2다수결투표방식을사용하여예측만들기
__7.2.3앙상블분류기의평가와튜닝
7.3배깅:부트스트랩샘플링을통한분류앙상블
__7.3.1배깅알고리즘의작동방식
__7.3.2배깅으로Wine데이터셋의샘플분류
7.4약한학습기를이용한에이다부스트
__7.4.1부스팅작동원리
__7.4.2사이킷런에서에이다부스트사용
7.5그레이디언트부스팅:손실그레이디언트기반의앙상블훈련
__7.5.1에이다부스트와그레이디언트부스팅비교
__7.5.2그레이디언트부스팅알고리즘소개
__7.5.3분류를위한그레이디언트부스팅알고리즘
__7.5.4그레이디언트부스팅분류예제
__7.5.5XGBoost사용하기
7.6요약

8장.감성분석에머신러닝적용
8.1텍스트처리용IMDb영화리뷰데이터준비
__8.1.1영화리뷰데이터셋구하기
__8.1.2영화리뷰데이터셋을더간편한형태로전처리
8.2BoW모델소개
__8.2.1단어를특성벡터로변환
__8.2.2tf-idf를사용하여단어적합성평가
__8.2.3텍스트데이터정제
__8.2.4문서를토큰으로나누기
8.3문서분류를위한로지스틱회귀모델훈련
8.4대용량데이터처리:온라인알고리즘과외부메모리학습
8.5잠재디리클레할당을사용한토픽모델링
__8.5.1LDA를사용한텍스트문서분해
__8.5.2사이킷런의LDA
8.6요약

9장.회귀분석으로연속적타깃변수예측
9.1선형회귀
__9.1.1단순선형회귀
__9.1.2다중선형회귀
9.2에임스주택데이터셋탐색
__9.2.1데이터프레임으로에임스주택데이터셋읽기
__9.2.2데이터셋의중요특징시각화
__9.2.3상관관계행렬을사용한분석
9.3최소제곱선형회귀모델구현
__9.3.1경사하강법으로회귀모델의파라미터구하기
__9.3.2사이킷런으로회귀모델의가중치추정
9.4RANSAC을사용하여안정된회귀모델훈련
9.5선형회귀모델의성능평가
9.6회귀에규제적용
9.7선형회귀모델을다항회귀로변환
__9.7.1사이킷런을사용하여다항식항추가
__9.7.2에임스주택데이터셋을사용한비선형관계모델링
9.8랜덤포레스트를사용하여비선형관계다루기
__9.8.1결정트리회귀
__9.8.2랜덤포레스트회귀
9.9요약

10장.레이블되지않은데이터다루기:군집분석
10.1k-평균알고리즘을사용하여유사한객체그룹핑
__10.1.1사이킷런을사용한k-평균군집
__10.1.2k-평균++로초기클러스터센트로이드를똑똑하게할당
__10.1.3직접군집vs간접군집
__10.1.4엘보우방법을사용하여최적의클러스터개수찾기
__10.1.5실루엣그래프로군집품질을정량화
10.2계층적인트리로클러스터조직화
__10.2.1상향식으로클러스터묶기
__10.2.2거리행렬에서계층군집수행
__10.2.3히트맵에덴드로그램연결
__10.2.4사이킷런에서병합군집적용
10.3DBSCAN을사용하여밀집도가높은지역찾기
10.4요약

11장.다층인공신경망을밑바닥부터구현
11.1인공신경망으로복잡한함수모델링
__11.1.1단일층신경망요약
__11.1.2다층신경망구조
__11.1.3정방향계산으로신경망활성화출력계산
11.2손글씨숫자분류
__11.2.1MNIST데이터셋구하기
__11.2.2다층퍼셉트론구현
__11.2.3신경망훈련루프코딩
__11.2.4신경망모델의성능평가
11.3인공신경망훈련
__11.3.1손실함수계산
__11.3.2역전파알고리즘이해
__11.3.3역전파알고리즘으로신경망훈련
11.4신경망의수렴
11.5신경망구현에관한몇가지첨언
11.6요약

12장.파이토치를사용한신경망훈련
12.1파이토치와훈련성능
__12.1.1성능문제
__12.1.2파이토치란?
__12.1.3파이토치학습방법
12.2파이토치처음시작하기
__12.2.1파이토치설치
__12.2.2파이토치에서텐서만들기
__12.2.3텐서의데이터타입과크기조작
__12.2.4텐서에수학연산적용
__12.2.5chunk(),stack(),cat()함수
12.3파이토치입력파이프라인구축
__12.3.1텐서에서파이토치DataLoader만들기
__12.3.2두개의텐서를하나의데이터셋으로연결
__12.3.3셔플,배치,반복
__12.3.4로컬디스크에있는파일에서데이터셋만들기
__12.3.5torchvision.datasets라이브러리에서데이터셋로드
12.4파이토치로신경망모델만들기
__12.4.1파이토치신경망모듈(torch.nn)
__12.4.2선형회귀모델만들기
__12.4.

출판사 서평

명확한설명,수학,실용적인예제로
밑바닥원리까지완벽하게이해한다!

이론과코드를균형있게설명한다!
코드실행만으로는머신러닝과딥러닝을충분히이해할수없다.머신러닝과딥러닝을제대로이해하고싶다면코드외에도관련이론과알고리즘의뒤편에있는수학개념을알아야한다.이책은명확한설명,머신러닝과딥러닝핵심알고리즘의작동방식과사용방법,그밑바탕이되는수학,실용적인예제,빠지기쉬운함정을피하는방법까지어느한쪽에치우치지않고이론과코드를균형있게설명한다.

핵심알고리즘부터최신기술까지!
파이썬기반의핵심라이브러리(SciPy,NumPy,Scikit-Learn,Pandas등)를사용해머신러닝을,파이토치를사용해딥러닝을설명한다.파이토치는파이썬방식으로학습하기때문에더쉽게배우고간단하게코딩할수있다.책에서는파이토치핵심개념은물론이고,GAN과강화학습에대해서도자세하게다룬다.또한,기존『머신러닝교과서개정3판』에서다룬내용외에트랜스포머,파이토치라이트닝,XGBoost,그래프신경망등최신동향까지추가했다.

실용적인예제로배운다!
책의모든예제가머신러닝/딥러닝전문가인저자가오랫동안강의하고현장에서일한경험을바탕으로한다.단순히개념만익히는것이아닌실용적이고확장가능한예제들로구성했다.이예제들을학습하면서머신러닝과딥러닝의개념,핵심알고리즘,활용팁등을확실하게이해할수있으며,학습한후모델과애플리케이션을직접구축할수있는원리까지익힐수있다.