Do it! 데이터 과학자를 위한 실전 머신러닝 : 13가지 핵심 머신러닝 모델을 직접 구현하며 레벨 업!

Do it! 데이터 과학자를 위한 실전 머신러닝 : 13가지 핵심 머신러닝 모델을 직접 구현하며 레벨 업!

$30.00
Description
10년 차 데이터 분석가의 실력 상승 비법을 담았다!
13가지 핵심 머신러닝 모델을 직접 구현하면서
머신러닝 입문자를 실무의 세계로 안내하는 책
이 책은 저자가 데이터 분석가로 10년 동안 일하며 깨달은 실력 상승의 비법을 예비 실무자에게 전하고자 집필한 책이다. 그 비법은 바로 기본으로 돌아가 선형 모델, 트리 모델 등 13가지 핵심 머신러닝 모델을 집중적으로 공부하는 것이다. 먼저 각 모델의 밑바탕에 있는 알고리즘 기초과 수리 이론을 살펴보고, 간단한 형태로 모델을 직접 구현해 본다. 그리고 최적화된 파이썬 패키지로 다시 모델링한 다음, 둘 사이에 어떤 차이가 발생하는지를 비교해 보며 머신러닝의 작동 원리를 탐구한다.
머신러닝은 이론만 공부하던 입문자가 처음 실무를 맞닥뜨릴 때 큰 어려움을 겪는 분야이다. 이때 겪는 어려움은 결국 실력이 쌓여야만 근본적으로 극복할 수 있다. 기본 모델을 깊이 이해할수록 다양한 모델들이 서로 동떨어져 있지 않고 기본 모델과 이론적으로 많은 부분을 공유한다는 사실을 깨달을 것이다. 그러고 나면 실제 업무나 연구에서 전보다 더 유연하고 효율적으로 머신러닝 모델링을 수행할 수 있을 것이다.

저자

배기웅

저자:배기웅
카이스트수리과학과에서학사와석사학위를받은후실제사회현상에대한머신러닝모델링에관심이생겨카이스트기술경영학부에서박사과정으로머신러닝을활용한계량마케팅을전공했다.영화나드라마등의엔터테인먼트산업에서제품의제목과소비자리뷰등의텍스트정보를이용해매출을모델링하는연구로박사학위를취득했다.이후삼성SDS에서데이터분석가로일하고있다.데이터분석교육,검정,인력양성에관심이많아현재관련업무를담당하고있다.

목차

첫째마당머신러닝준비하기

1장머신러닝과파이썬
__1.1머신러닝알아보기
____1.1.1머신러닝은왜생겨났을까?
____1.1.2이책에서배우는머신러닝모델한눈에보기
____1.1.3이책의학습구성한눈에보기
__1.2머신러닝에쓰는알고리즘개념이해하기
__1.3실습환경설정하기
____1.3.1이책에서사용하는파이썬패키지살펴보기
__1.4머신러닝절차빠르게체험하기
____1.4.1데이터셋준비하기
____1.4.2데이터셋분할하기
____1.4.3데이터전처리
____1.4.4학습데이터를이용한모델학습
____1.4.5학습데이터와검증데이터쌍을이용한하이퍼파라미터튜닝
____1.4.6테스트데이터셋에대한최종성능측정과평가

둘째마당선형모델을이용한지도학습
__선형모델준비하기

2장최소제곱법모델
__2.1최소제곱법모델이란?
____2.1.1최소제곱법모델의정의
__2.2정규방정식으로최소제곱법모델구현하기
____2.2.1정규방정식을이용한풀이이론
____2.2.2정규방정식으로풀이구현하기
____2.2.3정규방정식구현의단점
__2.3특잇값분해를이용한최소제곱법모델구현하기
____2.3.1SVD-OLS를이용한풀이이론
____2.3.2정규방정식풀이의단점과SVD-OLS풀이의장점
____2.3.3SVD-OLS를이용한풀이구현하기
__2.4TSVD-OLS를이용한모델구현하기
____2.4.1TSVD-OLS를이용한풀이이론
____2.4.2TSVD-OLS를이용한풀이구현하기
__2.5패키지로표현하기
__2.6최소제곱법모델보충수업
____2.6.1통계모델로서의OLS
____2.6.2결정계수
____2.6.3화이트박스모델과블랙박스모델
__되새김문제

3장로지스틱회귀모델
__사전지식훑어보기
__3.1로지스틱회귀모델이란?
__3.2로지스틱회귀모델구현하기
____3.2.1로지스틱회귀모델의기본이론
____3.2.2로지스틱회귀모델의심화이론
____3.2.3로지스틱회귀모델구현하기
__3.3패키지로표현하기
__3.4로지스틱회귀모델보충수업
____3.4.1피처스케일링과파이프라인
____3.4.2통계모델로서의로지스틱회귀기법
____3.4.3교차검증법
____3.4.4피처선택법
__되새김문제

4장라쏘모델
__사전지식훑어보기
__4.1라쏘모델이란?
__4.2라쏘모델구현하기
____4.2.1라쏘모델의이론
____4.2.2라쏘모델구현하기
__4.3패키지로표현하기
__4.4라쏘모델보충수업
____4.4.1LARS기반라쏘모델
____4.4.2모델선택법
__되새김문제

5장릿지회귀모델
__사전지식훑어보기
__5.1릿지회귀모델이란?
__5.2릿지회귀모델구현하기
____5.2.1릿지회귀모델의기본이론
____5.2.2릿지회귀모델의심화이론
____5.2.3릿지회귀모델구현하기
__5.3패키지로표현하기
__5.4릿지회귀모델보충수업
____5.4.1편향-분산상충관계와릿지회귀의분산
____5.4.2릿지분류모델
____5.4.3엘라스틱넷회귀모델
__되새김문제

셋째마당트리모델을이용한지도학습
__트리모델준비하기

6장결정트리모델
__사전지식훑어보기
__6.1결정트리모델이란?
__6.2결정트리모델구현하기
____6.2.1결정트리분류모델의이론
____6.2.2결정트리분류모델구현하기
__6.3패키지로표현하기
__6.4결정트리모델보충수업
____6.4.1회귀트리
____6.4.2그리드서치
____6.4.3피처중요도
__되새김문제

7장랜덤포레스트모델
__사전지식훑어보기
__7.1랜덤포레스트모델이란?
__7.2랜덤포레스트모델구현하기
____7.2.1랜덤포레스트모델의이론
____7.2.2랜덤포레스트분류모델구현하기
__7.3패키지로표현하기
__7.4랜덤포레스트모델보충수업
____7.4.1랜덤포레스트회귀모델
____7.4.2OOB점수
____7.4.3ExtraTrees
____7.4.4피처중요도
__되새김문제

8장그레이디언트부스팅트리모델
__사전지식훑어보기
__8.1그레이디언트부스팅트리모델이란?
__8.2그레이디언트부스팅트리모델구현하기
____8.2.1그레이디언트부스팅트리모델의이론
____8.2.2부스팅트리회귀모델구현하기
__8.3패키지로표현하기
__8.4그레이디언트부스팅트리모델보충수업
____8.4.1설명가능인공지능
____8.4.2GBT모델이후의부스팅기법
__되새김문제

넷째마당기타지도학습모델

9장K-최근접이웃모델
__사전지식훑어보기
__9.1K-최근접이웃모델이란?
__9.2K-최근접이웃모델구현하기
____9.2.1KNN모델의기본이론
____9.2.2KNN모델의심화이론
____9.2.3KNN분류모델구현하기
__9.3패키지로표현하기
__9.4K-최근접이웃모델보충수업
____9.4.1KNN회귀모델
____9.4.2결정경계
____9.4.3고정반지름근접이웃모델
____9.4.4KNN이상값모델
__되새김문제

10장서포트벡터머신모델
__10.1서포트벡터머신모델이란?
__10.2서포트벡터머신모델구현하기
____10.2.1서포트벡터머신모델의이론
____10.2.2SVM모델구현하기
__10.3패키지로표현하기
____10.3.1다른패키지로구현하기
__10.4서포트백터머신모델보충수업
____10.4.1서포트벡터회귀로확장하기
____10.4.2클래스분류의확률판정법
__되새김문제

11장다층퍼셉트론모델
__사전지식훑어보기
__11.1다층퍼셉트론모델이란?
__11.2다층퍼셉트론모델구현하기
____11.2.1다층퍼셉트론모델의이론
____11.2.2다층퍼셉트론모델구현하기
__11.3패키지로표현하기
__11.4다층퍼셉트론모델보충수업
____11.4.1MLP회귀모델
__되새김문제

다섯째마당비지도학습모델

12장K-평균군집화모델
__12.1K-평균군집화모델이란?
__12.2K-평균군집화모델구현하기
____12.2.1K-평균군집화모델의이론
____12.2.2K-평균군집화모델구현하기
__12.3패키지로표현하기
__12.4K-평균군집화모델보충수업
____12.4.1K-평균군집화모델적용이부적절한데이터셋
____12.4.2군집화결과평가하기
__되새김문제

13장계층적군집화모델
__13.1계층적군집화모델이란?
__13.2계층적군집화모델구현하기
____13.2.1계층적군집화모델의이론
____13.2.2계층적군집화모델구현하기
__13.3패키지로표현하기
__13.4계층적군집화모델보충수업
____13.4.1덴드로그램으로군집계층시각화하기
__되새김문제

14장주성분분석모델
__사전지식훑어보기
__14.1주성분분석모델이란?
__14.2주성분분석모델구현하기
____14.2.1주성분분석모델의이론
____14.2.2PCA모델구현하기
__14.3패키지로표현하기
__14.4주성분분석모델보충수업
____14.4.1다양한차원축소기법
__되새김문제

[부록]한눈에보는머신러닝용어지도
되새김문제풀이
참고문헌

찾아보기

출판사 서평

머신러닝에입문하고실무에서막혔다면?
실무에필요한역량을기를때!

머신러닝은입문과실무의간극이매우넓은분야이다.입문서에나오는패키지사용법과실습코드는실제연구나업무환경에맞춰적용하기쉽지않고,상황에따라그때그때구글링으로코드를찾아사용하려해도환경이나조건이조금만바뀌는순간먹통이되기일쑤다.
이책의저자또한머신러닝을처음공부하기시작할때비슷한문제를겪었다.십여년동안현장에서머신러닝과씨름하면서진짜실력을기르려면모든머신러닝기법의기본이되는주요모델의이론과사용법을완벽하게터득하는데에집중해야한다는것을깨달았다.이책은머신러닝에입문한뒤실무에서헤매는과거의저자와같은분들에게조금힘겹지만지나고보면가장빠른실력향상의정도이자지름길을알려준다.

13가지핵심모델을직접구현해보면서
진짜업무에곧바로쓸수있는응용력을갖춘다

그렇다면어떻게해야기본모델을완벽하게이해할수있을까?이책에서는핵심머신러닝모델13가지를소개하고,이를간단한형태로직접구현해보는방법을제안한다.단순히다양하고복잡한모델을만들어문제를풀어보는경험은현재내실력으로온전히체화되지않을수있다.또한실전에서는언제나주어진환경이달라지기마련이므로,그에따라모델의형태를자신이원하는대로변형할줄알아야한다.
주요한기본모델의이론과사용법을깊이알아갈수록다른모델을쉽게이해할수있고,나아가어떤머신러닝모델이든핵심부분은대부분기본모델과이론적으로공유한다는사실을깨달을수있다.이렇게학습하다보면실제업무나연구에서머신러닝모델링을수행할때변화에유연해지며불필요한시도를줄일수있다.

알고리즘이론부터하이퍼파라미터분석까지
머신러닝의처음부터끝까지철저하게파헤친다

이책에서는머신러닝을다음순서대로학습한다.먼저각머신러닝모델의밑바탕에있는알고리즘기초이론을다시살펴보고,수리이론과함께작동원리를깊이이해한다.그리고간단한형태로모델을직접코딩하여구현해본다.그다음사이킷런에내장된해당모델에최적화된파이썬패키지를활용해모델링하고,앞서직접만든모델과비교하며그차이점을탐구한다.마지막으로파이썬패키지에사용한하이퍼파라미터를알아보며패키지의동작을더자세히이해해본다.
머신러닝을처음공부하거나공부한지오래되었다면'사전지식훑어보기'를읽으며각장에서다루는모델을이해하는데필요한지식을미리살펴볼수있다.또한각장의마지막에는머신러닝전문가가되고자하는사람이알아두면좋을양질의지식을'보충수업'으로소개한다.

머신러닝의세계를한눈에조망할수있는
'머신러닝용어지도'수록!

머신러닝의다양한분야와종류,개념을한눈에파악할수있는‘용어지도’를부록으로제공한다.이지도를살펴보면서머신러닝의세계는어떻게구성되어있는지,그중에이책을통해어떤부분을배웠는지알아보자.앞으로머신러닝의어떤곳을탐험할지도즐겁게고민해보자.

함께배우고,나누고,성장하는‘Doit!스터디룸’으로오세요!

혼자계획을세우고공부하다보면금방지치기마련이다.나와비슷한고민을하는독자를만나어려운내용을공유해보자.서로도움을주고받으며공부하다보면더보람차다.멀리가려면친구와함께해보자.
-Doit!스터디룸

예제소스파일은이지스퍼블리싱홈페이지자료실또는저자깃허브에서제공합니다