파이썬 라이브러리를 활용한 머신러닝 : 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서 (번역개정2판)

파이썬 라이브러리를 활용한 머신러닝 : 사이킷런 핵심 개발자가 쓴 머신러닝과 데이터 과학 실무서 (번역개정2판)

$33.00
Description
사이킷런 핵심 개발자에게 배우는 머신러닝 이론과 구현
현업에서 머신러닝을 연구하고 인공지능 서비스를 개발하기 위해 꼭 학위를 받을 필요는 없습니다. 사이킷런(scikit-learn)과 같은 훌륭한 머신러닝 라이브러리가 복잡하고 난해한 작업을 직관적인 인터페이스로 감싸주는 덕분이죠. 이 책에서는 사이킷런의 핵심 개발자가 복잡한 수학을 동원하지 않고 실용적으로 머신러닝을 구축하는 모든 단계를 설명합니다. 미적분, 선형대수, 확률 이론을 공부하지 않았어도 이 책을 통해 머신러닝을 활용할 수 있게 될 것입니다.

※ 본 번역개정2판은 scikit-learn 업데이트에 따라 전반적으로 내용을 갱신한 원서 4쇄를 기반으로 합니다. 오탈자를 바로잡고, 시각적 편의를 위해 풀컬러로 인쇄했습니다.

저자

안드레아스뮐러,세라가이도

저자:안드레아스뮐러(AndreasMu?ller)
독일본(Bonn)대학교에서머신러닝으로박사학위를받았습니다.1년간아마존의컴퓨터비전응용부서에서머신러닝연구자로일한뒤뉴욕대학교의데이터과학센터에합류했고,현재는컬럼비아대학교에서‘AppliedMachineLearning’과목을가르치고있습니다.지난4년동안학계와산업계에서널리사용하는머신러닝툴킷인사이킷런의핵심기여자와관리자로활동했습니다.또잘알려진여러머신러닝패키지를직접만들거나개발에참여했습니다.뮐러의소망은머신러닝애플리케이션개발의진입장벽을낮추고,수준높은머신러닝알고리즘을손쉽게사용할수있는공개툴을만드는것입니다.

저자:세라가이도(SarahGuido)
오랫동안스타트업에서일해온데이터과학자이자뛰어난콘퍼런스발표자입니다.파이썬,머신러닝,대량의데이터와기술세계를좋아합니다.미시간대학교의대학원에입학했으며,지금은뉴욕에거주하고있습니다.

역자:박해선
기계공학을전공했지만졸업후엔줄곧코드를읽고쓰는일을했습니다.텐서플로블로그(tensorflow.blog)를운영하고있고,머신러닝과딥러닝에관한책을집필하고번역하면서소프트웨어와과학의경계를흥미롭게탐험하고있습니다.
『혼자공부하는머신러닝+딥러닝』(한빛미디어,2020),『Doit!딥러닝입문』(이지스퍼블리싱,2019)을집필했습니다.『머신러닝파워드애플리케이션』(한빛미디어,2021),『머신러닝교과서with파이썬,사이킷런,텐서플로(개정3판)』(길벗,2021),『파이토치로배우는자연어처리』(한빛미디어,2021),『딥러닝일러스트레이티드』(시그마프레스,2021),『GAN인액션』(한빛미디어,2020),『핸즈온머신러닝(2판)』(한빛미디어,2020),『미술관에GAN딥러닝』(한빛미디어,2019),『파이썬을활용한머신러닝쿡북』(한빛미디어,2019),『머신러닝교과서with파이썬,사이킷런,텐서플로』(길벗,2019),『케라스창시자에게배우는딥러닝』(길벗,2018),『핸즈온머신러닝』(한빛미디어,2018),『텐서플로첫걸음』(한빛미디어,2016)을우리말로옮겼습니다.

목차

CHAPTER1소개
1.1왜머신러닝인가?
__1.1.1머신러닝으로풀수있는문제
__1.1.2문제와데이터이해하기
1.2왜파이썬인가?
1.3scikit-learn
__1.3.1scikit-learn설치
1.4필수라이브러리와도구들
__1.4.1주피터노트북
__1.4.2NumPy
__1.4.3SciPy
__1.4.4matplotlib
__1.4.5pandas
__1.4.6mglearn
1.5파이썬2vs.파이썬3
1.6이책에서사용하는소프트웨어버전
1.7첫번째애플리케이션:붓꽃의품종분류
__1.7.1데이터적재
__1.7.2성과측정:훈련데이터와테스트데이터
__1.7.3가장먼저할일:데이터살펴보기
__1.7.4첫번째머신러닝모델:k-최근접이웃알고리즘
__1.7.5예측하기
__1.7.6모델평가하기
1.8요약및정리

CHAPTER2지도학습
2.1분류와회귀
2.2일반화,과대적합,과소적합
__2.2.1모델복잡도와데이터셋크기의관계
2.3지도학습알고리즘
__2.3.1예제에사용할데이터셋
__2.3.2k-최근접이웃
__2.3.3선형모델
__2.3.4나이브베이즈분류기
__2.3.5결정트리
__2.3.6결정트리의앙상블
__2.3.7(한국어판부록)배깅,엑스트라트리,에이다부스트
__2.3.8커널서포트벡터머신
__2.3.9신경망(딥러닝)
2.4분류예측의불확실성추정
__2.4.1결정함수
__2.4.2예측확률
__2.4.3다중분류에서의불확실성
2.5요약및정리

CHAPTER3비지도학습과데이터전처리
3.1비지도학습의종류
3.2비지도학습의도전과제
3.3데이터전처리와스케일조정
__3.3.1여러가지전처리방법
__3.3.2데이터변환적용하기
__3.3.3(한국어판부록)QuantileTransformer와PowerTransformer
__3.3.4훈련데이터와테스트데이터의스케일을같은방법으로조정하기
__3.3.5지도학습에서데이터전처리효과
3.4차원축소,특성추출,매니폴드학습
__3.4.1주성분분석(PCA)
__3.4.2비음수행렬분해(NMF)
__3.4.3t-SNE를이용한매니폴드학습
3.5군집
__3.5.1k-평균군집
__3.5.2병합군집
__3.5.3DBSCAN
__3.5.4군집알고리즘의비교와평가
__3.5.5군집알고리즘요약
3.6요약및정리

CHAPTER4데이터표현과특성공학
4.1범주형변수
__4.1.1원-핫-인코딩(가변수)
__4.1.2숫자로표현된범주형특성
4.2OneHotEncoder와ColumnTransformer:scikit-learn으로범주형변수다루기
4.3make_column_transformer로간편하게ColumnTransformer만들기
4.4구간분할,이산화그리고선형모델,트리모델
4.5상호작용과다항식
4.6일변량비선형변환
4.7특성자동선택
__4.7.1일변량통계
__4.7.2모델기반특성선택
__4.7.3반복적특성선택
4.8전문가지식활용
4.9요약및정리

CHAPTER5모델평가와성능향상
5.1교차검증
__5.1.1scikit-learn의교차검증
__5.1.2교차검증의장점
__5.1.3계층별k-겹교차검증과그외전략들
__5.1.4(한국어판부록)반복교차검증
5.2그리드서치
__5.2.1간단한그리드서치
__5.2.2매개변수과대적합과검증세트
__5.2.3교차검증을사용한그리드서치
5.3평가지표와측정
__5.3.1최종목표를기억하라
__5.3.2이진분류의평가지표
__5.3.3다중분류의평가지표
__5.3.4회귀의평가지표
__5.3.5모델선택에서평가지표사용하기
5.4요약및정리

CHAPTER6알고리즘체인과파이프라인
6.1데이터전처리와매개변수선택
6.2파이프라인구축하기
6.3그리드서치에파이프라인적용하기
6.4파이프라인인터페이스
__6.4.1make_pipleline을사용한파이프라인생성
__6.4.2단계속성에접근하기
__6.4.3그리드서치안의파이프라인속성에접근하기
6.5전처리와모델의매개변수를위한그리드서치
6.6모델선택을위한그리드서치
__6.6.1중복계산피하기
6.7요약및정리

CHAPTER7텍스트데이터다루기
7.1문자열데이터타입
7.2예제애플리케이션:영화리뷰감성분석
7.3텍스트데이터를BOW로표현하기
__7.3.1샘플데이터에BOW적용하기
__7.3.2영화리뷰에대한BOW
7.4불용어
7.5tf?idf로데이터스케일변경하기
7.6모델계수조사
7.7여러단어로만든BOW(n-그램)
7.8고급토큰화,어간추출,표제어추출
__7.8.1(한국어판부록)KoNLPy를사용한영화리뷰분석
7.9토픽모델링과문서군집화
__7.9.1LDA
7.10요약및정리

CHAPTER8마무리
8.1머신러닝문제접근방법
__8.1.1의사결정참여
8.2프로토타입에서제품까지
8.3제품시스템테스트
8.4나만의추정기만들기
8.5더배울것들
__8.5.1이론
__8.5.2다른머신러닝프레임워크와패키지
__8.5.3랭킹,추천시스템과그외다른알고리즘
__8.5.4확률모델링,추론,확률적프로그래밍
__8.5.5신경망
__8.5.6대규모데이터셋으로확장
__8.5.7실력기르기
8.6마치며

출판사 서평

실제문제에대한해법을찾는머신러닝기술자를위한본격머신러닝입문서
사이킷런1.x버전을반영하고구글코랩에서실습가능한번역개정2판

이책은머신러닝알고리즘을밑바닥부터만드는법을다루지는‘않으며’,대신사이킷런과다른라이브러리에이미구현된방대한양의모델을사용하는법에집중합니다.머신러닝과인공지능에대한사전지식이필요없는입문서로,파이썬과사이킷런을중심으로머신러닝애플리케이션을성공적으로만드는모든단계를밟아갑니다.여기서소개하는방법들은상용애플리케이션을만드는데이터전문가는물론연구자와과학자에게도도움이될것입니다.파이썬과NumPy,matplotlib라이브러리에친숙하다면이책의대부분을이해할수있습니다.

★번역개정2판의특징
본번역개정판은원서4쇄를기반으로하며,초판발행이후알려진오탈자를모두바로잡았습니다.또한scikit-learn1.x버전릴리스에따라전반적으로내용을업데이트했습니다.나아가구글코랩에서실습이가능하도록전반적으로수정했습니다.

★주요내용
● 머신러닝의기본개념과응용
● 널리사용되는머신러닝알고리즘의장점과단점
● 머신러닝으로처리한데이터를표현하는방법
● 모델평가와매개변수튜닝을위한고급방법
● 체인모델과워크플로캡슐화를위한파이프라인
● 텍스트데이터를다루는기술
● 머신러닝과데이터과학기술향상을위한조언

<추천사>
이책은사이킷런이제공하는핵심알고리즘들의사용법을알려줍니다.여기에정성가득한역자주까지더해져서,머신러닝에입문하는파이썬개발자에게는더할나위없는선물입니다.
오동권,니트머스CTO

이책은복잡한수식은걷어내고사이킷런을기반으로각머신러닝알고리즘의원리와구현방법을다양한예제로설명합니다.약간의프로그래밍지식만있다면복잡한이론적배경없이도혼자학습하기좋은책입니다.
이상훈,삼성생명DALab
‘한국스파크사용자모임’운영자,『실시간분석의모든것』역자

머신러닝시장을선도하는라이브러리의핵심개발자가쓰고,‘텐서플로코리아그룹’에서한국인공지능개발자들을위해애써주시는박해선님이우리말로옮겼습니다.중간중간받아본번역원고에서느껴지는저자와역자의내공과정성에감명받았습니다.
개앞맵시,『밑바닥부터시작하는딥러닝』역자

파이썬으로머신러닝을시작하려는사람을위한환상적인안내서입니다.제가사이킷런을시작했을때이책이없던게한스러울따름입니다!
해나월릭,마이크로소프트리서치선임연구원