주머니 속의 머신러닝 (파이썬으로 구조적 데이터 다루기)

주머니 속의 머신러닝 (파이썬으로 구조적 데이터 다루기)

$15.87
Description
머신러닝의 길잡이가 되어줄 Quick Reference!

인공지능을 구현하는 방법론 중 하나인 머신러닝에 대해 알아야 할 수학 공식이나 통계 지식이 너무 많아 압도될 때가 있습니다.
이 책은 이런 고민을 해결해 주는 책입니다. 너무 복잡하고 어려운 과정을 추상화해서 쉽게 사용하고 싶다거나, 알고리즘의 복잡한 내부를 바닥까지 이해하지는 못하더라도 머신러닝 알고리즘을 가져와 내 데이터에 바로 적용해 보고 싶을 때 사용할 수 있는 도구들을 소개하고 그 활용 방법을 알려줍니다.

다양한 데이터 분석기법 및 시각화 방법을 함축적 내용으로 소개하여, 옆에 두고 보면서 궁금한 것이 생겼을 때 찾아보는 용도로도 좋습니다.
저자

맷해리슨

맷해리슨은파이썬과데이터과학을위한교육및컨설팅회사인MetaSnake를운영중이다.2000년부터데이터과학,BI,스토리지,테스트및자동화,오픈소스스택관리,금융,검색등다양한도메인에서파이썬을활용한경험이많다.

목차

CHAPTER1소개
1.1사용된라이브러리2
1.2Pip을이용한설치5
1.3Conda를이용한설치7

CHAPTER2머신러닝과정에대한개요

CHAPTER3분류문제둘러보기:타이타닉데이터셋
3.1프로젝트구조의제안11
3.2필요한패키지12
3.3질문을하자13
3.4데이터에관한용어14
3.5데이터의수집15
3.6데이터의정리16
3.7특징의생성24
3.8샘플데이터27
3.9데이터의대치27
3.10데이터의표준화29
3.11리팩터링30
3.12베이스라인모델31
3.13다양한알고리즘32
3.14스태킹34
3.15모델만들기35
3.16모델의평가36
3.17모델의최적화37
3.18오차행렬38
3.19ROC곡선40
3.20학습곡선41
3.21모델의배포42

CHAPTER4누락된데이터
4.1누락된데이터의분석46
4.2누락된데이터의삭제50
4.3데이터의대치51
4.4지시자열의추가52

CHAPTER5데이터의정리
5.1열의이름53
5.2누락된값의교체54

CHAPTER6탐색
6.1데이터의크기57
6.2요약통계58
6.3히스토그램59
6.4산점도60
6.5조인트플롯61
6.6쌍격자63
6.7박스플롯과바이올린플롯65
6.8두순서형값의비교66
6.9상관관계68
6.10라드비즈72
6.11평행좌표74

CHAPTER7데이터전처리
7.1표준화77
7.2범위조정79
7.3더미변수80
7.4레이블인코더82
7.5프리퀀시인코딩83
7.6문자열에서범주가져오기83
7.7그밖의범주형인코딩85
7.8날짜형데이터의특징공학88
7.9col_na특징의추가89
7.10수동적특징공학90

CHAPTER8특징의선택
8.1공선성을가진열94
8.2라소회귀97
8.3재귀적특징제거99
8.4상호정보량100
8.5주성분분석102
8.6특징중요도102

CHAPTER9불균형범주의문제
9.1다른평가지표사용하기103
9.2트리기반알고리즘과앙상블103
9.3모델에페널티부과하기104
9.4소수집단데이터업샘플링하기105
9.5소수집단데이터생성하기106
9.6과반수집단데이터를다운샘플링하기106
9.7업샘플링후다운샘플링하기108

CHAPTER10분류
10.1로지스틱회귀111
10.2나이브베이즈116
10.3서포트벡터머신118
10.4K-최근접이웃122
10.5디시전트리125
10.6랜덤포레스트134
10.7XGBoost139
10.8LightGBM을사용한그래디언트부스팅150
10.9TPOT156

CHAPTER11모델선택
11.1검증곡선161
11.2학습곡선163

CHAPTER12분류용평가지표로평가하기
12.1오차행렬165
12.2평가지표168
12.3정확도170
12.4재현율171
12.5정밀도171
12.6F1171
12.7분류보고서172
12.8ROC173
12.9정밀도-재현율곡선174
12.10누적이득도표175
12.11리프트곡선177
12.12범주의균형179
12.13범주예측오류180
12.14차별임계치181

CHAPTER13모델설명
13.1회귀계수183
13.2특징중요도184
13.3LIME184
13.4트리기반모델의해석186
13.5부분의존성도표187
13.6대리모델191
13.7SHAP192

CHAPTER14회귀
14.1베이스라인모델200
14.2선형회귀200
14.3SVM204
14.4K-최근접이웃207
14.5디시전트리209
14.6랜덤포레스트216
14.7XGBoost회귀220
14.8LightGBM회귀분석227

CHAPTER15회귀용평가지표로평가하기
15.1평가지표233
15.2잔차도표236
15.3이분산성237
15.4정규잔차238
15.5예측오차도표240

CHAPTER16회귀모델의해석
16.1SHAP243

CHAPTER17차원성감소
17.1PCA250
17.2UMAP269
17.3t-SNE275
17.4PHATE279

CHAPTER18클러스터링
18.1K-평균285
18.2응집클러스터링293
18.3클러스터의이해296

CHAPTER19파이프라인
19.1분류파이프라인303
19.2회귀파이프라인306
19.3PCA파이프라인307

출판사 서평

이책의특징
머신러닝을배울때참고하며읽기좋은책
도구의종류,사용방법,각종파라미터등을빠르게훑으며기억을상기할수있는좋은레퍼런스자료
머신러닝모델의구성요소,데이터와모델의평가및분석을다양한도구로접근해다각적으로바라보는방법을제시

이책의대상독자
머신러닝에관심있는프로그래머
머신러닝의방법론을정립하고싶은분
머신러닝의개념을다시한번정리하고싶은분
머신러닝의다양한라이브러리와시각화방법을알고싶은분